[go: up one dir, main page]

CZ254797A3 - Kinasa příbuzná PIK kontrolního prvku buněčného cyklu, látky a způsoby - Google Patents

Kinasa příbuzná PIK kontrolního prvku buněčného cyklu, látky a způsoby Download PDF

Info

Publication number
CZ254797A3
CZ254797A3 CZ972547A CZ254797A CZ254797A3 CZ 254797 A3 CZ254797 A3 CZ 254797A3 CZ 972547 A CZ972547 A CZ 972547A CZ 254797 A CZ254797 A CZ 254797A CZ 254797 A3 CZ254797 A3 CZ 254797A3
Authority
CZ
Czechia
Prior art keywords
dna
mccs1
kinase
seq
cell
Prior art date
Application number
CZ972547A
Other languages
English (en)
Inventor
Merl F. Hoekstra
Doug A. Holtzman
Kathleen S. Keegan
Original Assignee
Icos Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Icos Corporation filed Critical Icos Corporation
Publication of CZ254797A3 publication Critical patent/CZ254797A3/cs

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

Oblast techniky
Vynález se obecně týká genů kódujících kinasu příbuznou fosfatidylinositol kinase (PIK) kontrolního prvku buněčného cyklu a proteinů, které jsou důležité pro odpověd buněk na poškození DNA. Kinasy kontrolního prvku mají důležitou úlohu při dozoru nad poškozením DNA, k němuž dochází v důsledku replikačních chyb, chybného párování DNA, léčby ozařováním a podávání chemoterapeutik. Tyto kinasy musí být přítomny v regulačních drahách zajištujících zastavení buněčného cyklu, jež poskytuje buňkám upozornění, že došlo k poškození DNA a čas, aby byly léze opraveny před zahájením replikace DNA. Konkrétně se vynález týká nové kinasy příbuzné PIK člověka, Mammalian Cell Cycle Surveillance 1 (MCCS1) (v překladu dozor nad cyklem savčích buněk č. 1), polynukleotidů kódujících tuto kinasu příbuznou PIK a způsobů stanovení a modulace enzymatické aktivity této a příbuzných kinas.
Dosavadní stav techniky
Proces růstu a dělení eukaryontní buňky představuje somatický nebo mitotický buněčný cyklus, který se skládá ze čtyř fází: fáze Gj, fáze S, fáze G2 a fáze M. Fáze Gx, S a G2 se kolektivně označují jako interfáze buněčného cyklu.
Ve všech druzích eukaryontních buněk je buněčný cyklus strukturně a funkčně konzervován, pokud se týče jeho základního průběhu a způsobu regulace. Během fáze G^ (mezera - gap) postupují biosyntetické aktivity v buňce vysokou rychlostí. Fáze S (syntéza) začíná při zahájení syntézy DNA a končí, když byl obsah DNA v jádře buňky replikován a vytvořily se dva totožné soubory chromosomů. Potom buňky vstupují do fáze G2 (mezera - gap), která pokračuje tak dlouho, dokud nezačne mitóza. Během mitózy dochází k párování a separaci chromosomů za vzniku dvou nových jader. Při cytokinese se samotná buňka štěpí na dvě dceřinné buňky, z nichž každá obdrží jedno jádro obsahující jeden ze dvou souborů chromosomů. Mitosa a cytokinesa dohromady tvoří fázi M (mitosa) buněčného cyklu. Cytokinesa ukončuje fázi M a označuje začátek interfáze následujícího buněčného cyklu. Pořadí, v němž probíhají jednotlivé procesy v buněčném cyklu je přísně regulováno tak, že začátek jednoho procesu buněčného cyklu je závislý na dokončení předchozího procesu buněčného cyklu. Tím je zaručena věrnost duplikace a segregace genetického materiálu z jedné generace na druhou.
Pod označením kontrolní prvky (checkpoints) buněčného cyklu se rozumějí proteiny, signály, procesy a regulátory zpětné vazby, které integrují diskontinuální procesy probíhající při replikaci buněk, aby se zachovaly podstatné závislosti v rámci buněčného cyklu. Tento vynález se specificky týká kontrolního prvku buněčného cyklu, který zajištuje, že mitosa je odložena do té doby, dokud není ukončena syntéza DNA a/nebo přesná oprava poškození DNA.
Selhání kontrolních prvků buněčného cyklu predisponuje individua pro mnohé chorobné stavy, jako jsou rakovina, ataxia telangiectasia, abnormality embrya a různé imunologické poruchy spojené s vývojem aberantních B- a Tbuněk nebo přímo takové chorobné stavy vyvolává. Výše uvedené imunologické poruchy jsou spojeny s patologickými stavy jako jsou lupus, arthritis a autoimunitní choroby. Proto se intenzivní výzkum zaměřil na identifikaci kontrol• · · · · ·
« · nich prvků buněčného cyklu a proteinů, které jsou podstatné pro funkci těchto kontrolních prvků.
Při genetické analýze kvasinek Schizosaccharomyces pombe a Saccharomyces cerevisiae byla indentifikována řada genů, které jsou důležité pro zastavení buněčného cyklu a opravy DNA v odpovědi na ionizující záření (přehled viz Carr a Hoekstra, Trends in Cell Biology, 5: 32 až 40 (1995)). Jeden z takových genů, který byl identifikován v obou kvasinkách, je potřebný pro kontrolní prvek poškození DNA, který zastavuje buněčný cyklus ve fázi G2 a také pro příbuzný kontrolní prvek, který monitoruje dokončení syntézy DNA a zastavuje buněčný cyklus ve fázi S. Tento gen, který byl označen jako rad3+ v S. pombe [Seaton et al., Gene,
119: 83 až 89 (1992)] a MEC1/ESR1 v S. cerevisiae [Kato et al., Nuc. Acids Res. 22 (15): 3104 až 3112 (1994)], je v tomto popisu dále označován názvem rad3+. Buňky obsahující mutace genu rad3+ nejsou schopny zaznamenat nebo řádně odpovědět na poškození DNA a po expozici klastogenním činidlům nebo procesům (například ionizačnímu záření, činidlům poškozujícím DNA a mutacím ovlivňujícím integritu chromosomu, ztrácejí svou životaschopnost rychleji než buňky divokého typu [viz Weinert et al., Genes & Development, 8: 652 až 665 (1994) a Al-Khodairy et al., Embo. J. 11(4): 1343 až 1350 (1992)]. Citlivost vůči ionizačnímu záření (radiosensitivita) může být vyvolána defekty v odpovědích kontrolních prvků nebo defekty přímo při reakcích opravy DNA.
Produktem genu rad3+ je přibližně 270kDa protein, který spadá do rostoucí třídy vysokomolekulárních kinas příbuzných PIK. Diskuse vztahující se k této třídě kinas je uvedena v publikaci Hunter, Cell, 83: 1 až 4 (1995). Primární struktury katalytických domén, které se vyskytují v členech této třídy genů mají těsný vztah k dobře • · · · · · charakterizovaným fosfatidylinositol kinasám. Tento strukturní vztah stál na počátku předpokladu, že kinasy příbuzné PIK by mohly být schopny fosforylovat lipidy. Když se však u kinas příbuzných PIK zkouší substrátová specificita, zdá se, že tyto enzymy působí jako protein kinasy a okolnost, zda fosforylují fosfatidylinositidy, je teprve třeba prokázat. Hartley et al. (Cell 82: 849 až 856 (1995) oznámili, že purifikované přípravky s vysokou protein kinasovou aktivitou nevykazují lipid kinasovou aktivitu. Další identifikované kinasy příbuzné PIK zahrnují produkt genu TELÍ z S. cerevisiae, který ovlivňuje délku telomeru, Greenwell et al., Cell 82: 823 až 829 (1995) a produkt genu Mei41+ z Drosophila melanogaster, který je důležitý pro kontrolní prvek ve fázi G2 a pro miotický vývoj (Hari et al., Cell 82: 815 až 821 (1995)), produkt genu DNA-PK z myši, který je důležitý při přesmycích imunoglobulinu a při zpracování zlomů dvouřetězcové DNA a produkt genu FRAP, který je důležitý při přechodu z fáze do fáze S [Brown E. et al., Nátuře, 377: 441 až 446 (1995)]. Mutace genu DNA-PK mohou mít za následek syndrom prudké kombinované imunitní nedostatečnosti (Severe Combined Immunodeficiency Syndrome SCID) (Hartley et al., výše uvedená citace).
U člověka, je známo méně o molekulárních složkách potřebných pro funkci kontrolních prvků. Jedna složka mechanismu kontrolního prvku u savce byla identifikována analýzou syndromu choroby člověka ataxia-telangiectasia (AT). Pacienti postižení AT vykazují rozmanitý soubor klinických symptomů, včetně predispozice k různým typům nádorů. Fibroblasty pacientů postižených AT jsou radiosensitivní a po ošetření ionizačním zářením u nich nedochází k zastavení buněčného cyklu, což vede k jevu označovanému názvem radioresistentní syntéza DNA. Existuje zde jasná reminiscence na poruchu rad3 u S. pombe, kde buňky nejsou schopny zaznamenat nebo správně odpovídat na poškození DNA. Zajímavé je, že • · · · · · nedávno byl popsán (Savitsky et al., Science, 268: 1749 až 1753 (1995)) lokus zodpovědný za AT, mutovaný gen ataxietelangiectasie (ATM), přičemž parciální cDNA kóduje protein s aminokyselinovou podobností vzhledem ke genu rad3+. V citaci Savitsky et al., Human Molecular Genetics, 4 (11): 2025 až 2032 (1995) je popsána izolace cDNA kódující ATM o plné délce. Zvýšená radiosenzitivita rad3+ kvansinkových mutantů a savčích buněk postrádajících funkční ATM ukazuje, že tyto proteiny by mohly zahrnovat třídu proteinových kontrolních prvků.
Kuerbitz et al., Proč. Nati. Acad. Sci. USA 89:
7492 až 7495 (1992) tvrdí, že pro kontrolní prvek ve fázi Gj a pro zastavení buněčného cyklu pozorované po poškození DNA je potřebný nádorový supresor p53. Ozáření buněk má za následek zvýšení hladiny p53, které vede k transkripční aktivaci p53 responsivních genů. Jedním takovým p53-indukovaným cílem je produkt genu WAF1 (také nazývaného p21, CIP1 a sdil). WAF1 je členem rozšiřující se třídy regulátorů buněčného cyklu, které jsou označovány názvem proteiny inhibující cyklin-dependentní kinasu. Aktivity cyklin-dependentních kinas řídí přechody v buněčném cyklu. Transkripční aktivace WAF1 tedy zajištuje přímou vazbu mezi indukcí p53, jež je závislá na poškození buněk a inhibici kinas, které jsou podstatné pro pokračování buněčného cyklu (viz Elledge a Harper, Current Opinion in Cell Biology 6:
847 až 852 (1994)). Mutace genu p53 jsou jedněmi z nejčastějších genetických změn při rakovinách u člověka. Tak například Baker et al. (Science, 244: 217 až 221 (1989)) uvádějí, že přibližně 70 % karcinomů kolorekta obsahuje delece v genu p53 nebo mutantní kopie tohoto genu. Kromě toho Fearon et al. (Cell 61: 759 až 767 (1990)) uvádějí, že nádory prsu, plic, močového měchýře a mozku jsou spojeny se ztrátou chromosomu 17p, což je oblast, v níž je gen p53 umístěn.
• · ·· ·· ····
V současné době je poměrně málo známo o molekulárních složkách kontrolních prvků fáze G2 v savčích buňkách. Kofein je chemická látka, která eliminuje řízení kontrolním prvkem fáze G2· Russell et al. (Cancer Res., 55: 1639 až 1642 (1995) a Powell et al. (Cancer Res., 55: 1643 až 1648, (1955)) uvádějí, že analýza buněčných linií lišících se jen přítomnosti nebo nepřítomností funkčního genu p53 ukázala přednostní sensitizaci vůči ionizačnímu záření zvýšenou kofeinem u buněk postrádajících p53-dependentní kontrolní prvek fáze G-^. Konverze potenciálně letálního poškození na letální poškození je tedy větší v buňkách postrádajících kontrolní prvky fáze Gj a G2 ve srovnání s buňkami, v nichž je kontrolní prvek fáze G·^ neporušen.
Zatímco u některých buněk dochází k zastavení buněčného cyklu v odpovědi na poškození DNA, jiné buňky zřejmě odpovídají na poškození DNA zahájením vnitřního sebevražedného programu označovaného názvem apoptosa nebo programovaná smrt buněk. Faktory určující, ke kterému z těchto procesů dojde, nejsou dosud plně objasněny. Nedávná práce ukázala na důležitou úlohu genu p53 jak při regulaci přechodů buněčného cyklu ve fázi Gj, tak při apoptose. Symonds et al. (Cell 78, 703 až 711 (1994)) uvádějí, že p53 dependentní apoptosa potlačuje růst nádorů a jejich progresi in vivo.
Při léčení nádorů se na nádorové buňky aplikují vysoké dávky záření a chemoterapie, aby se jejich DNA do té míry poškodila, aby buňky zahynuly. Přestože však nádorové buňky obsahující mutace v genu p53 jsou defektní z hlediska kontrolního prvku ve fázi G^, jsou stále ještě schopny opravit si poškození DNA vyvolané radiací nebo chemoterapií. Tento vynález je založen na předpokladu, že by inhibice kontrolního prvku ve fázi G2 u nádorových buněk měla vést ke • · · · · stavu, kdy by byly nádorové buňky neschopné opravit si poškození DNA, čímž by tedy byly nádorové buňky sensitizovány vůči činidlům poškozujícím DNA. Normální buňky obsahující neporušené kontrolní prvky Gj a G2 by měly být schopny opravit si poškození DNA za přítomnosti inhibitoru specifického vůči kontrolnímu prvku G2. Léčení nádorových onemocnění podáváním inhibitoru specifického vůči kontrolnímu prvku G2 s následující aplikací radiace nebo chemoterapie by tedy mělo zvýšit účinnost usmrcování buněk a tím zajistit možnost snížení požadované dávky toxických činidel poškozujících DNA.
Přetrvává tedy potřeba identifikovat savčí proteiny, které slouží jako kontrolní prvky buněčného cyklu, aby bylo možno vyvinout terapie chorobných stavů člověka, které jsou spojeny s defektními kontrolními prvky buněčného cyklu. Přetrvává i potřeba izolovat geny kódující tyto proteiny, které by mohly být samy užitečné jako léčiva nebo které by umožnily vývoj terapeuticky užitečných modulátorů proteinů kódovaných těmito geny.
Podstata vynálezu
Předmětem vynálezu jsou nové humánní kinasy příbuzné PIK, které jsou důležité pro kontrolní prvek buněčného cyklu, jenž responduje ve fázi G2 buněčného cyklu na poškozenou a nereplikovanou DNA.
Jedním z aspektů tohoto vynálezu jsou purifikované a izolované polynukleotidy (například DNA a RNA, a to jak kódující, tak nekódující řetězce těchto DNA a RNA), které kódují kinasu příbuznou PIK kontrolního prvku buněčného cyklu, MCCS1, a polynukleotidy kódující jiné kinasy příbuzné PIK kontrolního prvku buněčného cyklu, které vykazují asi 50%, asi 60% nebo asi 65% nukleotidovou shodu s oblastí • · polynukleotidu MCCS1, jež kódují MCCS1 kinasovou doménu (MCCSla nukleotidy 6579 až 7562 ze SEQ ID NO: 30 nebo MCCSip nukleotidy 6457 až 7440 ze SEQ ID NO: 32). Alternativně vykazují kinasy příbuzné PIK typu MCCS1 asi 40%, asi 45% nebo asi 50% aminokyselinovou shodu s MCCS1 kinasovou doménu (MCCSla aminokyseliny 2083 až 2410 ze SEQ ID NO: 31 nebo MCCSip aminokyseliny 2152 až 2480 ze SEQ ID NO: 33). Polynukleotidy spadající do rozsahu tohoto vynálezu zahrnují genomové DNA, RNA, cDNA a úplně nebo zčásti chemicky syntetizované DNA. Přednostní polynukleotidy podle vynálezu zahrnují sekvenci DNA MCCSla znázorněnou v SEQ ID NO: 30, částečnou sekvenci DNA MCCSip znázorněnou v SEQ ID NO: 3, sekvenci DNA MCCSip o plné délce znázorněnou v SEQ ID NO. 32 a sekvence DNA, které hybridizují k nekódujícím řetězcům takových sekvencí za striňgentních podmínek, nebo které by takto hybridizovaly, nebýt redundance genetického kódu. Jako příklad stringentních hybridizačních podmínek je možno uvést hybridizaci při 65°C v 3X SSC, 20mM fosforečnanu sodném o pH 6,8 a promývání při 65°C v 0,2X SSC. Odborníkům v tomto oboru je zřejmé, že tyto podmínky je možno obměňovat v závislosti na délce a obsahu nukleotidové báze GC v sekvencích, které mají být hybridizovány. Pro stanovení přesných hybridizačních podmínek je možno použít standardních postupů tohoto oboru, viz Sambrook et al., 9.47 až 9.51 v Molecular Cloning, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, USA (1989). DNA MCCSla mající sekvenci SEQ ID NO: 30 byla uložena ve sbírce ATCC (American Type Culture Collection, 12301, Parklawn Drive, Rockvile, Maryland 20852, USA 3. listopadu 1995, jakožto insert v plasmidu pBSHFB/HT2-27 v E. coli DH5a a bylo jí přiděleno přírůstkové číslo sbírky ATCC 69951. DNA MCCSip mající sekvenci SEQ ID NO: 32 byla uložena ve sbírce ATCC 7. listopadu 1995, jakožto insert v plasmidu 517 v E. coli DH5a a bylo jí přiděleno přírůstkové číslo sbírky ATCC 69950.
• · ·· ···
Informace o sekvencích DNA uvedené v popisu tohoto vynálezu umožňují identifikovat a izolovat DNA kódující příbuzné molekuly dobře známými technikami, jako je hybridizace DNA/DNA popsaná výše a klonování za použití řetězové reakce katalyzované polymerasou (PCR). Jak ukazuje jedna série příkladů, znalost sekvence cDNA kódující MCCS1 umožňuje izolaci DNA/DNA hybridizací sekvencí genomové DNA kódujících kinasu a regulačních sekvencí řídících expresi, jako jsou promotory, operátory apod. Podobně také znalost částečné sekvence cDNA kódující MCCS18 umožňuje izolovat úplnou cDNA. Podobně se také očekává, že DNA/DNA hybridizační postupy prováděné za použití sekvencí DNA podle tohoto vynálezu za stringentních podmínek umožní izolovat DNA kódující alelové varianty kinasy příbuzné PIK; nehumánních druhů enzymů homologických vzhledem ke kinase příbuzné PIK a jiných strukturně příbuzných proteinů vykazujících jednu nebo více jejich enzymatických účinností nebo schopností reagovat se členy nebo regulátory v dráze kontrolního prvku buněčného cyklu, na níž se MCCS1 podílí. Detegovatelně označené polynukleotidy podle vynálezu budou také užitečné při hybridizačnich stanoveních za účelem detekce schopnosti buněk syntetizovat MCCS1. Informace o sekvencích DNA uvedené v tomto popisu také umožňují za použití strategií homologní rekombinace nebo knockout (viz Capecchi,
Science, 244: 1288 až 1292 (1989)) vyvinout hlodavce, kteří nejsou schopni exprimovat funkční MCCS1 nebo kteří exprimují variantní MCSS1. Takoví hlodavci jsou užiteční jako modely pro studium aktivit MCCS1 a modulátorů MCCS1 in vivo. O polynukleotidy podle vynálezu se také mohou opírat diagnostické metody užitečné pro identifikaci genetických změn v místě MCCS1, které jsou příčinou chorobného stavu nebo stavů. Za použití vynálezu se také stanou dostupnými kódující polynukleotidy, jež jsou schopny regulovat expresi MCCS1, v takových buňkách, které tuto látku obvykle exprimuj í.
Předmětem vynálezu jsou také autonomně se replikující rekombinantní konstrukty, jako jsou vektory plasmidové a virové DNA, které obsahují polynukleotidy podle vynálezu, zejména vektory, v nichž jsou polynukleotidy funkčně vázány k endogenní nebo heterologní expresní kontrolní sekvenci DNA a transkripčnímu terminátoru.
Dalším aspektem vynálezu jsou hostitelské buňky, zvláště unicelulární hostitelské buňky, jako prokaryontní a eukaryontní buňky, které jsou stabilně transformovány nebo transfekovány DNA podle vynálezu způsobem umožňujícím expresi kinasy příbuzné PIK v těchto buňkách. Hostitelské buňky podle vynálezu jsou vysoce užitečné při mnoha způsobech produkce MCCS1 ve velkém měřítku, při nichž se buňky pěstují ve vhodném kultivačním médiu a požadované enzymy se izolují z buněk nebo média, v němž buňky rostou.
Do rozsahu vynálezu spadají také MCCS1 produkty obsahující část nebo celou aminokyselinovou sekvenci, která je znázorněna v SEQ ID NO: 31, SEQ ID NO: 4 nebo SEQ ID NO: 33. Očekává se, že za použití savčích hostitelských buněk dojde k post-translačním modifikacím (například myristoylaci, glykosylaci, zkrácení, lipidaci a fosforylaci tyrosinu, šeřinu nebo threoninu), jež mohou být potřebné pro udělení optimální biologické účinnosti rekombinantním expresním produktům podle vynálezu. Enzymovými produkty podle vynálezu mohou být polypeptidy o plné délce, jejich fragmenty nebo varianty. Varianty zahrnují produkty MCCS1, v nichž je jedna nebo více specifikovaných (tj. přirozeně kódovaných) aminokyselin deletována nebo nahrazena, nebo v nichž je jedna nebo více nespecifikovaných aminokyselin přidána: 1. beze ztráty kinasové aktivity specifické pro MCCS1; nebo 2. s eliminací kinasové aktivity specifické pro MCCS1; nebo 3. s eliminací schopnosti interakce se členy nebo regulátory dráhy kontrolního prvku buněčného cyklu.
• · · · · · • · · · ·
Substráty pro MCCS1 a proteiny interagující s MCCS1 je možno identifikovat různými zkouškami.
Substráty pro MCCS1 se mohou identifikovat zkouškou kinasové aktivity za použití zkoušených sloučenin.
Kinasa MCCS1 se resuspenduje v kinasovém pufru a inkubuje buď za přítomnosti nebo za nepřítomnosti zkoušené sloučeniny (například kaseinu, histonu H1 nebo vhodného substrátového peptidu). Molární množství fosfátu převedeného kinasou na zkoušenou sloučeninu se stanoví autoradiografií nebo scintilací. Převod fosfátu na zkoušenou sloučeninu ukazuje, že zkoušená sloučenina je substrátem pro kinasu.
Interagující proteiny je možno stanovit následujícími zkouškami:
První zkouška, které se používá podle vynálezu, představuje dvouhybridový screening. Dvouhybridový systém byl vyvinut u kvasinek (Chien et al., Proč. Nati. Acad. Sci. USA, 88: 9578 až 9582 (1991)) a je založen na funkční in vivo rekonstituci transkripčního faktoru, který aktivuje reporterový gen. Konkrétně se polynukleotid kódující protein vykazující interakci s MCCS1 izoluje následujícím způsobem: Vhodná hostitelská buňka se transformuje nebo transfekuje konstruktem DNA zahrnujícím reporterový gen, který je pod kontrolou promotoru regulovaného transkripčním faktorem obsahujícím vazebnou doménu DNA a aktivační doménu; v hostitelských buňkách se exprimuje první hybridní sekvence DNA kódující první fúzovaný produkt části nebo celé MCCS1 a buď vazebné domény DNA nebo aktivační domény transkripčního faktoru; v hostitelských buňkách se exprimuje knihovna sekvencí druhé hybridní DNA kódující druhý fúzovaný produkt části nebo všech vazebných proteinů putativní MCCS1 a vazebné domény DNA nebo aktivační domény transkripčního faktoru, jež nebyla zavedena do prvního fúzovaného produktu;
deteguje se vazba proteinu interagujícího s MCCS1 k MCCS1 v konkrétní hostitelské buňce detekcí produkce produktu reporterového genu v hostitelské buňce; a z této konkrétní hostitelské buňky se izolují sekvence druhé hybridní DNA kódující interagující protein. V současné době se při provádění této zkoušky přednostně používá promotoru lexA pro pohánění exprese reporterového genu, lacZ reporterového genu, transkripčního faktoru obsahujícího DNA vazebnou doménu lexA a transaktivační doménu GAL4 a kvasinkových hostitelských buněk.
Jiná stanovení pro identifikaci proteinů, které interagují s MCCS1, mohou zahrnovat imobilizaci MCCS1 nebo zkušebního proteinu, detegovatělně značení neimobilizovaného vazebného partnera, společnou inkubaci vazebných partnerů a stanovení množství navázaného značícího činidla. Navázané značící činidlo ukazuje, že zkoušený protein interagu je s MCCS1.
Jiný typ stanovení, kterým se identifikují proteiny interagující s MCCS1, zahrnuje imobilizaci MCCS1 nebo jejího fragmentu na pevném nosiči, který je potažen (nebo který je napuštěn) fluorescentním činidlem, značení zkoušeného proteinu sloučeninou schopnou excitovat fluorescentní činidlo, kontaktování imobilizovaného MCCS1 se značeným zkoušeným proteinem, detekci světelné emise fluorescentního činidla a identifikaci interagujících proteinů, jakožto zkoušených proteinů vyvolávajících emisi světla fluorescentního činidla. Alternativně je při této zkoušce možno imobilizovat putativní interagující protein a značit MCCS1.
Do rozsahu tohoto vynálezu spadají také protilátky (například monoklonální a polyklonální protilátky, jednořetězcové protilátky, chimérické protilátky, CDR-roubované protilátky apod.) a jiné vazebné proteiny (jako jsou pro• · · · teiny identifikované při výše uvedených zkouškách, které jsou specifické vůči MCCS1 kinasám podle tohoto vynálezu. Vazebné proteiny je možno vyvinout za použití izolovaných přírodních nebo rekombinantních enzymů. Vazebné proteiny jsou samy dále užitečné pro purifikaci rekombinantních a přirozeně se vyskytujících enzymů a pro identifikaci buněk produkujících tyto enzymy. Konkrétními ilustrativními monoklonálními protilátkami podle tohoto vynálezu jsou monoklonální protilátky produkované hybridomálními buněčnými liniemi 224C a 224F, které byly uloženy ve sbírce kultur ATCC (American Type Culture Collection, 12301, Parklawn Drive, Rockvile, Maryland 20852, USA) 7. listopadu 1996, přičemž jim byla přidělena přírůstková čísla HB12233 (linie 224C) a HB 12234 (linie 224F). Zkoušky zaměřené na detekci a kvantifikaci proteinů v buňkách a tekutinách mohou zahrnovat jedinou protilátku nebo několik protilátek (sendvičové stanovení). Vazebné proteiny jsou také zjevně užitečné při modulaci (tj. blokování, inhibici nebo stimulaci) interakcí enzym/substrát nebo enzym/regulátor. Do rozsahu vynálezu spadají také anti-idiotypické protilátky, které jsou specifické vůči vazebným proteinům pro kinasu příbuznou PIK.
Vynález je založen na předpokladu, že mutace genu MCCS1 mající za následek ztrátu normální funkce produktu genu MCCS1 jsou příčinou chorobných stavů člověka, na nichž se podílí selhání kontrolního prvku fáze G2 buněčného cyklu. Genová terapie zaměřená na restauraci aktivity MCCS1 by tedy byla indikována při léčení takových chorobných stavů (jako je například rakovina varlat). Doprava funkčního genu MCCS1 do vhodných buněk se provádí in vivo nebo ex vivo za použití virálních vektorů (například za použití vektorů odvozených od adenoviru, adenoasociovaného viru nebo retroviru) nebo ex vivo za použití fyzikálních metod přenosu DNA (například za použití liposomů nebo chemického působení). Přehled technologie genové terapie je možno nalézt v publikacích • · • · ·
Friedmann, Science, 244: 1275 až 1281 (1989); Verma, Scientific American: 68 až 84 (1990) a Miller, Nátuře, 357: 455 až 460 (1992). Také se předpokládá, že výše uvedená genová terapie by mohla být užitečná i při léčení jiných chorobných stavů člověka, při nichž dochází k bránění exprese nebo inhibici aktivity MCCS1. Předpokládá se, že terapie antisense nebo genová terapie by mohla být aplikována za účelem negativní regulace exprese MCCS1. Kódující (antisense) nukleové kyseliny (přednostně 10 až 20bp oligonukleotidy) schopné specificky vázat kontrolní sekvence exprese MCCS1 nebo MCCS1 RNA se zavedou do buněk (například prostřednictvím virálního vektoru nebo koloidního dispersního systému, jako je liposom). Kódující nukleová kyselina se naváže k cílové MCCS1 sekvenci v buňce a zabrání transkripci nebo translaci této cílové sekvence. Pro terapeutické využití tohoto vynálezu jsou konkrétně uvažovány fosfothioátové a methylfosfátové kódující oligonukleotidy. Kódující oligonukleotidy mohou být dále modifikovány polyLysinem, transferrin polylysinem nebo cholesterolovými skupinami u 5' konce.
Kromě toho, je-li například určitá konkrétní forma rakoviny důsledkem mutace v jiném genu než genu MCCS1, jako v genu p53, může se použít činidla inhibujícího transkripci enzymatické aktivity MCCS1 a tedy kontrolního prvku fáze G2 buněčného cyklu pro sensitizaci rakovinných buněk vůči chemoterapii nebo radiační terapii. Terapeutickou hodnotu takového činidla je možno osvětlit dále uvedeným způsobem: Současná radiační terapie nebo chemoterapie ve většině případů nijak nečelí schopnosti p53 mutantní rakovinné buňky zaznamenat a opravit poškození DNA, jež je důsledkem léčení. Díky tomu si může rakovinná buňka jednoduše opravit poškozenou DNA. Modulační činidla podle tohoto vynálezu mohou tedy sloužit jako adjuvanty při chemoterapii a radiační • · · · · ·
terapii nebo mohou být přímo účinná jako chemoterapeutická léčiva.
Činidla modulující MCCS1 kinasovou aktivitu je možno identifikovat inkubací zkoušené sloučeniny s MCCS1 imunopurifikovanou z buněk přirozeně exprimujících tuto kinasu příbuznou PIK, s MCCS1 získanou z rekombinantních prokaryontních nebo eukaryontních hostitelských buněk exprimujících tento enzym nebo s purifikovanou MCCS1, přičemž se stanovuje účinek zkoušené sloučeniny na aktivitu MCCS1. Aktivita kinasy příbuzné PIK se může měřit stanovením počtu 32P-fosfátu přeneseného kinasou z gamma-32P-ATP bud na sebe samou (autofosforylace) nebo na exogenní substrát, jako je lipid nebo protein. Množství fosfátu zavedeného do substrátu se měří scintilací nebo autoradiografií. Zvýšení počtu molů fosfátu přeneseného na substrát za přítomnosti zkoušené sloučeniny ve srovnání s počtem molů fosfátu přeneseného na substrát za nepřítomnosti zkoušené sloučeniny ukazuje, že zkoušená sloučenina je aktivátorem kinasy MCCS1. Naopak, snížení počtu molů fosfátu přeneseného na substrát za přítomnosti zkoušené sloučeniny ve srovnání s počtem molů fosfátu přeneseného na substrát za nepřítomnosti zkoušené sloučeniny ukazuje, že modulátor je inhibitorem MCCS1 kinasy. Modulátory mohou modulovat jak MCCS1, tak ATM, nebo mohou modulovat pouze jeden z těchto enzymů. Činidla modulující MCCS1 se hledají screeningem při stanovení kinasy, které je popsáno výše, při němž je fosforylačním enzymem ATM.
Při zkoušce, které se dává v současné době přednost, se MCCS1 - specifická protilátka navázaná na agarosové perly inkubuje s buněčným lysátem připraveným z hostitelských buněk exprimujících tuto kinasu. Perly se promyji, aby se odstranily proteiny nespecificky navázané na perly a potom se perly resuspendují v kinasovém pufru. Reakce se
« ·· 9· ······ · • · · · · zahájí přídavkem gamma-32P-ATP a vhodného exogenního substrátu, jako lipidu nebo peptidu. Aktivita kinasy se měří stanovením počtu molů 32P-fosfátu přeneseného buď na samotnou kinasu nebo na přidaný substrát. V přednostním provedení se používá hostitelských buněk, které neobsahují endogenní MCCS1 a/nebo ATM kinasovou aktivitu. Selektivita sloučeniny jež moduluje kinasovou aktivitu MCCS1 se může vyhodnotit porovnáním jejího účinku na MCCS1 s účinkem na jiné známé kinasy příbuzné PIK. Kombinace rekombinantních produktů MCCS1 podle vynálezu s produkty jiných kinas příbuzných PIK v sérii nezávislých stanovení představuje systém pro vývoj selektivních modulátorů MCCS1.
Za použití stanovení výše popsaného typu se mohou na modulační aktivitu zkoušet dále také kombinatoriální knihovny, peptidy a mimetika peptidů, definované chemické látky, oligonukleotidy a knihovny přírodních produktů.
Zkouška zaměřená na identifikaci modulátorů aktivity kinasy MCCS1 se například provádí tak, že se přípravek obsahující kinasu MCCS1 v kinasovém pufru inkubuje s gamma-32P-ATP a exogenním substrátem pro kinasu jednak za přítomnosti a jednak za nepřítomnosti zkoušené sloučeniny a měří se počet molů fosfátu přeneseného na substrát. Zvýšení počtu molů fosfátu přeneseného na substrát za přítomnosti zkoušené sloučeniny ve srovnání s počtem molů fosfátu přeneseného na substrát za nepřítomnosti zkoušené sloučeniny ukazuje, že zkoušená sloučenina je aktivátorem této kinasy MCCS1. Naopak, snížení počtu molů fosfátu přeneseného na substrát za přítomnosti zkoušené sloučeniny ve srovnání s počtem molů fosfátu přeneseného na substrát za nepřítomnosti zkoušené sloučeniny ukazuje, že modulátor je inhibitorem této kinasy MCCS1.
Zkoušení zaměřené na identifikaci sloučenin, které modulují interakci MCCS1 s jinými proteiny se může provést dále uvedeným způsobem: Vhodná hostitelská buňka se transformuje nebo transfekuje konstruktem DNA zahrnujícím reporterový gen, který je pod kontrolou promotoru regulovaného transkripčním faktorem obsahujícím vazebnou doménu DNA a aktivační doménu; v hostitelských buňkách se exprimuje první hybridní sekvence DNA kódující první fúzovaný produkt části nebo celé MCCS1 a vazebné domény DNA nebo aktivační domény transkripčního faktoru; v hostitelských buňkách se exprimuje sekvence druhé hybridní DNA kódující část nebo celý protein, který interaguje s MCCS1 a vazebnou doménu DNA nebo aktivační doménu transkripčního faktoru, jež nebyla zavedena do prvního fúzovaného produktu. Účinek zkoušené sloučeniny na interakci mezi MCCS1 a proteinem se provádí detekcí vazby proteinu interagujícího s MCCS1 k MCCS1 v konkrétní hostitelské buňce měřením produkce produktu reporterového genu v hostitelské buňce za přítomnosti nebo za nepřítomnosti zkoušené sloučeniny; a identifikují se modulační sloučeniny, jako ty sloučeniny, které mění produkci produktu reporterového genu ve srovnání s produkcí produktu reporterového genu za nepřítomnosti modulační sloučeniny. V současné době se při provádění této zkoušky přednostně používá promotoru lexA pro pohánění exprese reporterového genu, lacZ reporterového genu, transkripčního faktoru obsahujícího DNA vazebnou doménu lexA a transaktivační doménu GAL4 a kvasinkových hostitelských buněk.
Jiný typ stanovení pro identifikaci sloučenin, které modulují interakci MCCS1 a interagujícím proteinem, mohou zahrnovat imobilizaci MCCS1 nebo přírodního proteinu interagu jícího s MCCS1, detegovatelné značení neimobilizovaného vazebného partnera, společnou inkubaci vazebných partnerů a stanovení účinku zkoušené sloučeniny na množství navázaného značícího činidla. Snížení množství navázaného • « • · · · · · ·
- 18 - ··· ·· ....... ·· · značícího činidla za přítomnosti zkoušené sloučeniny ve srovnání s množstvím navázaného značícího činidla za nepřítomnosti zkoušené sloučeniny ukazuje, že zkoušené činidlo je inhibitorem interakce mezi MCCS1 a proteinem. Naopak, zvýšení množství navázaného značícího činidla za přítomnosti zkoušené sloučeniny ve srovnání s množstvím navázaného značícího činidla za nepřítomnosti zkoušené sloučeniny ukazuje, že putativní modulátor je aktivátorem interakce mezi MCCS1 a proteinem.
Ještě další typ stanovení, kterého se podle vynálezu používá pro identifikaci sloučenin modulujících vazbu mezi MCCS1 a interagujícím proteinem, zahrnuje imobilizací MCCS1 nebo jejího fragmentu na pevném nosiči, který je potažen (nebo který je napuštěn) fluorescentním činidlem, značení interagujícího proteinu sloučeninou schopnou excitovat fluorescentní činidlo, kontaktování imobilizované MCCS1 se značeným interagujícím proteinem za přítomnosti nebo nepřítomnosti zkoušené sloučeniny, detekci světelné emise fluorescentního činidla a identifikaci modulujících sloučenin, jakožto zkoušených sloučenin, které ovlivňují emisi světla fluorescentního činidla ve srovnání s emisí světla fluorescentního činidla za nepřítomnosti zkoušené sloučeniny. Alternativně je při této zkoušce možno imobilizovat protein interagující s MCCS1 a značit MCCS1.
Podle vynálezu je také možno provádět komplementační stanovení založené na buňkách za účelem identifikace sloučenin modulujících aktivitu MCCS1 nebo ATM. Toto stanovení zahrnuje komplementaci fenotypového rysu spojeného s genetickou alterací buňky. Tak například genetická alterace identifikovaná jako esrl-1 má za následek citlivost buněk vůči poškození DNA v kvasinkových buňkách (Kato et al., Nuc. Acids Res. 22 (15): 3104 až 3112 (1994)). Buňky esrl-1 nejsou schopny zaznamenat poškození DNA po expozici DNA
škodlivým činidlům, jako je ionizační záření nebo klastogenní činidlo, nebo na toto poškození řádně reagovat. Fenotypový rys geneticky pozměněné buňky se doplní transformací a expresí MCCS1 nebo ATM v této buňce. Transformované buňky se exponují působení vlivu poškozujícího DNA (například ionizačního záření) za přítomnosti nebo nepřítomnosti zkoušené sloučeniny a měří se citlivost buněk na poškození DNA.
Činidla ovlivňující citlivost buněk na škodlivé působení MCCS1 a/nebo ATM se identifikují jako modulátory.
Modulátory MCCS1 mohou ovlivňovat její kinasovou aktivitu, její lokalizaci v buňce a/nebo její interakce se členy dráhy kontrolního prvku buněčného cyklu. Modulátory MCCSl je možno zpracovávat na prostředky obsahující farmaceuticky vhodné nosiče. Takové prostředky mohou přídavně obsahovat chemoterapeutická činidla. Dávková množství, která jsou ilustrována v tomto popisu postačují pro modulaci aktivity MCCSl in vivo. Selektivní modulátory mohou například zahrnovat polypeptidy nebo peptidy, které se specificky vážou k MCCSl nebo nukleové kyselině MCCSl, oligonukleotidy, které se specificky vážou ke kinase příbuzné PIK nebo nukleové kyselině kinasy příbuzné PIK a/nebo jiné nepeptidové sloučeniny (například izolované nebo syntetické organické molekuly, které specificky reagují s MCCSl nebo nukleovou kyselinou MCCSl). Do rozsahu tohoto vynálezu spadá také použití mutantních forem MCCSl, které ovlivňují enzymatickou aktivitu nebo buněčnou lokalizaci MCCSl divokého typu. V současné době jsou za přednostní oblasti kinas příbuzných PIK, které představují cíle pro vývoj selektivních modulátorů, považovány například následující čtyři oblasti: MCCSla aminoterminální efektorová doména (aminokyseliny 1 až 1081 ze SEQ ID NO: 31), MCCSip aminoterminální efektorová doména (aminokyseliny 1 až 1150 ze SEQ ID NO: 33), MCCSla rad3+ doména (aminokyseliny 1082 až 2082 ze SEQ ID NO: 31), MCCSip rad3+ doména (aminokyseliny • ·
• · · · · • · · · · · · • · · · ······· · · *
1151 až 2151 ze SEQ ID NO: 33), MCSSla PIK doména (aminokyseliny 2083 až 2410 ze SEQ ID NO: 31) a MCSSip PIK doména (aminokyseliny 2152 až 2480 ze SEQ ID NO: 33).
Příklady provedení vynálezu
Vynález je blíže ilustrován v následujících příkladech. Příklad 1 podrobně popisuje izolaci různých cDNA kódujících kinasy MCCS1. Příklad 2 popisu mapování genu MCCS1 člověka v lidském chromosomu 3. V příkladu 3 je popsána rekombinantní exprese MCCS1 v buňkách E. coli.
V příkladu 4 je popsána rekombinantní exprese MCCS1 v hmyzích buňkách. V příkladu 4 jsou kromě toho uvedena stanovení, kterými se měří aktivita kinasy MCCS1. Příklad 5 popisuje produkci MCCSl-specifické polyklonální a monoklonální protilátky. V příkladu 6 je popsána imunoprecipitace aktivity spojené s MCCS1 kinasou pocházející z myších varlat. V příkladu 7 se zkouší exprese MCCS1 mRNA v různých lidských tkáních a rakovinných buněčných liniích. V příkladu 8 jsou popsány analýzy MCCS1 mRNA a exprese proteinu v myších varlatech. V příkladu 9 jsou popsány analýzy exprese MCCS1 proteinu v miotických buňkách. V příkladu 10 jsou popsána stanovení substrátů a interagujících proteinů MCCS1. V příkladu 11 jsou popsány modulátory a stanovení používaná v případě modulátorů kinasové aktivity MCCS1.
V příkladu 12 je popsáno komplementační stanovení založené na buňkách zaměřené na identifikaci modulátorů MCCS1 a/nebo ATM a příklad 13 popisuje kinasovou aktivitu ATM.
Příklad 1
Různé cDNA kódující kinasu příbuznou PIK MCCS1 byly izolovány za použití série PCR reakcí.
Přiřazení aminokyselinových sekvencí S. pombe rad3+ (Hari et al., výše uvedená citace) a S. cerevisiae MEČI (Kato et al., výše uvedená citace) se stalo základem pro konstrukci sedmi denegerovaných oligonukleotidů kódujících oblasti nejvyšší homologie/nejnižší degenerace mezi sekvencemi (nebo komplementárních k těmto oblastem) a obsahujících vhodná restrikční místa pro usnadnění klonování amplifikačních produktů. Těchto oligonukleotidů bylo potom použito pro stanovení založené na PCR zaměřené na izolaci příbuzné sekvence člověka.
Nejprve byly PCR amplifikace provedeny na přípravcích cDNA pocházejících z krysích T-buněk, lidských jednojaderných buněk periferní krve (PBMC) a genomové DNA z S. cerevisiae. Pro prvotní amplifikace bylo použito 5 oligonukleotidových párů: oDH15a/oDH16, oDH15b/oDH16, oDH17a/ 0DHI6, oDH15a/oDH17b a oDH15b/oDH17b. Sekvence oligonukleotidových primérů zahrnují inosiny a jsou uvedeny dále, přičemž pro polohy degenerovaných polynukleotidů je použito názvosloví IUPAC.
oDH15a (SEQ ID NO: 5)
5' GCA GAC GGA TCC GGI WCI GAY GGI AAY ΗΊΊ TAY 3' oDH15b (SEQ ID NO: 6)
5' GCA GAC GGA TCC GGI WCI GAY GGI AAY 3'
0DHI6 (SEQ ID NO: 7)
5' GCA GAC GAA TTC RCA RTY RAA RTC IAC RTG 3' oDH17a (SEQ ID NO: 8)
5' GCA GAC GGA TCC AAR TTY
CCI CCI RTI YTI TAY SAR TGG TT 3' oDHI7b (SEQ ID NO: 9)
5' GCA GAC GAA TCC AAC CAY
TSR TAI ARI AYI GGI GGR AAY TT 3’ • ·
Pro PCR se použije reakční směsi skládající se z IX PCR pufru (Perkin Elmer Cetus, Emeryville, Kalifornie, USA), 2 až 3μΜ oDH primerů, l,5mM chloridu manganatého,
200μΜ fosfátů dNTP a 0,5μΜ polymerasy Amplitaq. Reakce se provádí v zařízení Perkin-Elmer Cetus Thermocycler Model 480 za následujících podmínek: denaturace při 94°C po dobu 1 minuty, teplotní hybridizace při 64C po dobu 2 minut a prodlužování při 72°C po dobu 1 minuty (3 cykly). Poté se postup opakuje s teplotní hybridizací při 60°C (3 cykly), při 56°C (3 cykly), dokončí se denaturací při 94°C podobu minuty. Následuje teplotní hybridizace při 54°C po dobu minut a prodlužování při 72C po dobu 1 minuty (30 cyklů). Produkty PCR se oddělí na 2 nebo 4% Tris Acetátu EDTA (TAE) agarosovém gelu a obarví ethidiumbromidem. DNA produkty se vizualizují UV fluorescencí.
Z primárních amplifikaci kvasinkové genomové DNA, cDNA krysích T-buněk a lidské PBMC cDNA, poskytne viditelný amplifikační produkt pouze jediná reakce, a to reakce kvasinkové genomové DNA (oDH17a/oDH16) za vzniku produktu, který má očekávanou velikost v oblasti genu S. cerevisiae MEČI mezi použitými primery. Proto byla provedena další analýza oDH17a/oDH16 amplifikaci za použití krysích T-buněk a PBMC cDNA. Pro odstranění oligonukleotidů a dimerních primerů, které by mohly interferovat s následující PCR reakcí byly primární reakční směsi před reamplifikací purifikovány.
Bylo použito hnízdové (nested) strategie PCR a amplifikace byly opakovány s dvojicemi primerů oDH18a/oDH16 a oDH18b/oDH16 za reakčních podmínek popsaných výše s následujícím uspořádáním cyklu: denaturace 1 minuta při 94°C, teplotní hybridizace 1 minuta při 55°C a prodlužování 30 sekund při 72°C (30 cyklů). Sekvence oligonukleotidových primerů oDH18a a oDH18b zahrnují inosiny a jsou
uvedeny dále, přičemž pro polohy degenerovaných polynukleotidů je použito názvosloví IUPAC.
oDH18a (SEQ ID NO: 10)
5' GCA GAC GGA TCC YTI GGI YTI GGI GAY CGI CA 3' oDH18b (SEQ ID NO: 11)
5' GCA GAC GGA TCC YTI GGI ΥΊΊ GGI GAY AGR CA 3’
Při reamplifikaci primárních reakčních produktů získaných za použití kvasinkové genomové a lidské PBMC cDNA byl pozorován přibližně 90bp produkt (což odpovídá očekávané velikosti amplifikačního produktu v případě použití těchto primerů. Žádný 90bp produkt nebyl pozorován v případě reamplif ikace primárního reakčního produktu cDNA z krysích T-buněk, a proto nebyla tato reakce dále analyzována.
Kromě přibližně 90bp produktu bylo také přítomno několik nespecifických pásů, přestože těchto nespecifických pásů bylo podstatně méně, než když byla reamplifikace provedena s primárním reakčním produktem získaným za použití oDH17a/oDH16. Zatímco přibližně 90bp produkt byl přítomen v reamplifikačních produktech získaných za použití jak oDH18a/oDH16, tak oDH18b/oDH16 a primárního reakčního produktu kvasinkové genomové DNA, fragment o vhodné velikosti byl v případě reamplifikace lidského primárního reakčního produktu PMBC cDNA získán pouze za použití oDH18a/oDH16. Předpokládá se, že tato skutečnost odráží využití kodonu v lidském genu (srovnej primery oDH18a a oDH18b). Přibližně 90bp produkt z reamplifikace primárního reakčního produktu lidské PMBC cDNA za použití oDH18a/oDH16 byl purifikován na gelu a subklonován do klonovacího vektoru pBluescript SKII+ (Stratagene, La Jolla, Kalifornie, USA) a sekvencován.
Analýza sekvence kódované 90bp produktem ukázala, že dedukovaná aminokyselinová sekvence byla podobná sekvenci S. cereviciae MEČI a S. pombe rad3+, ale nebyla s nimi identická. Pro identifikaci větší oblasti kódující sekvence a pro rozšíření porovnání sekvencí byl pro použití při přídavných amplifikačních reakcích syntetizován nedegenerovaný oligonukleotid, jehož sekvence byla označena jako SEQ ID NO; 12
ODH23 5' GACGCAGAATTCACCAGTCAAAGAATCAAAGAG 3'.
Reamplifikace primárního reakčního produktu PBMC cDNA s oDH17a/oDH23 vedla k tvorbě 174bp amplifikačního produktu. Tento fragment byl purifikován, subklonován a sekvencován, jak je to popsáno výše. Počítačová analýza konceptuálního translačního produktu potvrdila jeho vztah (podobnost, ale nikoliv identitu) k MEČI a rad3+. Tohoto fragmentu PCR se použije jako próby pro screening plasmidové knihovny obsahující makrofágovou cDNA za následujících hybridizačních podmínek: inkubace nitrocelulosových filtrů s radioizotopem značenými próbami v médiu 3X SSC, 5X Denhardtův roztok, 0,1% sarkosyl, 20mM pufr na bázi fosforečnanu sodného (pH 6,8), 100 μg/ml jednořetězcové DNA z lososího spermatu po dobu 18 až 24 hodin při 65°C. Promývání bylo prováděno třikrát v 0,2X SSC, 0,1% SDS při 65°C po dobu 30 minut (s výměnami promývacího pufru). Byly izolovány 4 pozitivní klony a u každého z nich byla stanovena nukleotidová sekvence. Počítačová analýza těchto 4 sekvencí ukázala, že se jedná o překrývající se klony pocházející z místa vykazujícího homologii vzhledem ke genu rad3+ z S. pombe. Klon 517 (ATCC 69950) obsahuje 2,8kbp insert. Jeho sekvence DNA je uvedena v SEQ ID NO: 3a příslušná dedukovaná aminokyselinová sekvence je uvedena v SEQ ID NO: 4. Tento klon obsahuje otevřený čtecí rámec kódující aminoterminální zkrácený proteinový produkt z 870 aminokyselin. Shoda • · • ·· · s C-terminální sekvencí rad3+ činí 39 %. Proteinový produkt tohoto cDNA insertu byl označen zkratkou MCCSip.
Sekvence klonu 517 bylo použito pro konstrukci oligonukleotidů mo3 5'-CTAGAGAGCCAAGGAG-3' (SEQ ID NO: 13) a mo6 5'-TCGAGCTATGCTACTAGTGGGC-3' (SEQ ID NO: 14).
Těchto oligonukleotidů bylo použito pro vytvoření próby za použití gelově purifikovaného fragmentu EcoRI pocházejícího z klonu 517, jako templátu. Bylo použito následujících podmínek PCR: 50 ng fragmentu DNA, IX PCR pufr (Perkin-Elmer Cetus), l,5mM chlorid hořečnatý, 200μΜ dATP, dGTP a TTP, ΙμΜ dCTP, 50 μθί a32P-dCTP, 10 ng/ml každého oligonukleotidů, 1U AmpliTaq (Perkin-Elmer Cetus). Reakce byla provedena v zařízení Perkin-Elmer Cetus Thermocycler Model 480, přičemž počáteční denaturační cyklus byl proveden při 94°C (4 minuty) a potom následovalo 20 cyklů při 94°C (15 sekund)
60°C (15 sekund) a 72°C (30 sekund). Neinkorporované nukleotidy byly odstraněny na sloupci Stratagene Nuc-trap, Push Column.
Jelikož analýzy Northern Blot ukázaly, že exprese mRNA odpovídající klonu 517 je nejvyšší ve varlatech, bylo 106 klonů z cDNA knihovny lidských varlat (Stratagene č. 939202) podrobeno screeningu s próbou vytvořenou pomocí PCR, přičemž bylo získáno 11 klonů. Pro analýzu byly zvoleny dva nejdelší klony HT2 a HT9. HT2 obsahuje 4,7kb insert (odpovídající sekvenci od nukleotidu 2974 ze SEQ ID NO: 30 za sekvencí SEQ ID NO: 1 s ohledem na směr exprese. HT9 obsahuje 5485bp insert (odpovídající nukleotidům 2152 až 7624 ze SEQ ID NO: 30). Analýza nukleotidové sekvence ukázala, že v oblasti společné pro oba dva klony cDNA je
- 26 vložen jediný pár bází T v nukleotidové poloze 3233 HT9. Vložení tohoto nukleotidu způsobuje posun a poté terminaci předvídaného aminokyselinového čtecího rámce a zdá se, že se jedná o omyl zavedený reversní transkriptasou do klonu HT9.
Za účelem izolace klonu obsahujícího přídavný 2,5kb byl podroben screeningu 1 milion klonů z každé ze tří přídavných cDNA knihoven. cDNa knihovna z fetálního lidského mozku (Stratagene č. 93206), cDNA knihovna z lidského srdce (Stratagene č. 936207) a cDNA knihovny z liské aorty (ClonTech Laboratories č. HL1136a, Palo Alto, Kalifornie, USA). Sekvence nejkrajnější 5' oblasti HT9 bylo použito pro konstrukci a syntézu dvou oligonukleotidů
OHT9-1 5'-CCTAGTCCAGTAAAACTTGC-3' (SEQ ID NO: 15) a
OHT9-4 5'-TTTGCGGCCCTTCCAATATC-3' (SEQ ID NO: 16).
Těchto oligonukleotidů bylo použito pro vytvoření 317bp PCR próby za podmínek, kterých bylo použito pro konstrukci próby uvedené výše. Z cDNA knihovny z lidského srdce ani aorty nebyly získány žádné pozitivní klony, zatímco z cDNA knihovny z fetálního liského mozku byly získány 2 pozitivní klony. Jeden z těchto klonů, HFB2, obsahuje 4,5kb cDNA insert zahrnující přibližně 2300 bp přídavné sekvence.
Insert HFB2 odpovídá nukleotidům 1 až 3194 ze SEQ ID NO: 30.
Z klonů HFB2, HT9 a HT2 byla zkonstruována kompozitní cDNA kódující MCCSla. Tyto tři klony byly spojeny. Rozštěpením HFB2 za použití restrikčních enzymů KpnI a Sáli byl vytvořen fragment zahrnující 5' konec tohoto kompozitního klonu. Štěpením HT9 pozicí restrikčních enzymů KpnI a Notl byl vytvořen fragment obsahující 3' konce tohoto kompozitního klonu. Tyto izolované fragmenty byly potom ligovány do • · vektoru pBS SK (Stratagene), který byl před tím rozštěpen restrikčními enyzma Sall a Notl. Oblast fragmentu NT9 obsahující jednonukleotidový insert byla nahrazena fragmentem EcorV obsahující nukleotidy 3174 až 5282 z klonu HT2. Výsledný plasmid obsahující 7621pb insert byl označen názvem pBSHFB2HT2-27 (ATCC 69951). Sekvence DNA tohoto insertu je uvedena v SEQ ID NO: 1 a odpovídající dedukovaná aminokyselinová sekvence je uvedena v SEQ ID NO: 2. Kódující doména této cDNA začíná s ATG v nukleotidové pozici 333 a končí terminačním kodonem v nukleotidové poloze 7560, což předvídá kódující sekvenci 2409 aminokyselin a 265kDa protein. Proteinový produkt tohoto cDNA insertu byl označen zkratkou MCCSla. Následná analýza sekvence tohoto insertu v plasmidu pBSHFB2HT2-27 (ATCC 69951) ukázala sekvenační omyly v SEQ ID NO: 1. Opravená sekvence DNA je uvedena v SEQ ID NO: 23 a odpovídající dedukovaná aminokyselinová sekvence se uvedena v SEQ ID NO: 24. I další analýza sekvence insertu v plasmidu pBSHFB2HT2-27 ukázala sekvenační omyl v SEQ ID NO: 23. V nukleotidové pozici 6317 (SEQ ID NO: 23) byl omylem uveden G a mezi polohami 6338 a 6339 sekvence chybí A. Opravená sekvence DNA MCCSla je uvedena v SEQ ID NO: 30 a příslušná dedukovaná aminokyselinová sekvence je uvedena v SEQ ID NO: 31.
Porovnání předvídané aminokyselinové sekvence MCCSla z částečnou aminokyselinovou sekvencí MCCSip předvídanou z klonu 517 ukázalo přítomnost 70aminokyselinové delece v produktu MCCSla. Aminokyselinová sekvence klonu 517 MCCSip odpovídá aminokyselinám MCCSla v rozmezí polož 1611 až 2410 ze SEQ ID NO: 31. K 70aminokyselinové deleci v MCCSla (tj. deleci 70 aminokyselin, které, pokud by byly vloženy, poskytly by produkt totožný s MCCSip) dochází mezi aminokyselinami 2065 a 2066 ze SEQ ID NO: 31, 17 aminokyselin před (s ohledem na směr exprese) kinasovou doménou. Jelikož si oba klony uchovávají otevřený čtecí rámec, byl klon cDNA • ·
pBSHFB2HT2-27 zřejmě vytvořen z alternativně sestřižené mRNA. Karboxyterminální domény obsahující kinasové domény jsou v klonu MCCSla (aminokyseliny 2083 až 2410 ze SEQ ID NO: 31 a klonu MCCSip (aminokyseliny 543 až 870 ze SEQ ID NO: 4) totožné.
Kompozitní klon obsahující úplnou kódující sekvenci MCCSip (se 70aminokyselinovým insertem) je uveden v SEQ ID NO: 32. Aminokyselinová sekvence dedukovaná z tohoto klonu je uvedena v SEQ ID NO: 33. Tento klon je zkonstruován nahrazením sekvence mezi místem BSTXI, které se štěpí za nukleotidem 3229 a místem Notl v polylinkerové sekvenci u 3'-konce pBSHFB2HT2-27 (SEQ ID NO: 1) sekvencí obsaženou v HT2 mezi místem BstXI a místem Notl u 3' konce HT2. Tento klon tedy obsahuje sekvence, jež jsou identické s nukleotidy MCCSla 1 až 5 159 ze SEQ ID NO: 1 (které kódují aminokyseliny 1 až 1609 ze SEQ ID NO: 2) připojené k sekvencím, jež jsou identické s nukleotidy klonu 517 v poloze 1 až 2610 v SEQ ID NO: 3 (které kódují aminokyseliny 1 až 870 ze SEQ ID NO: 4). Jak již bylo uvedeno výše, následná sekvenční analýza odhalila omyly v nukleotidech 1 až 5159 v SEQ ID NO: 1. Opravená DNA MCCSip a dedukované aminokyselinové sekvence zahrnující stejné opravy, jaké se vyskytují v sekvencích MCCSla SEQ ID NO: 23 a 24, jsou uvedeny jako sekvence SEQ ID NO: 25 a 26. Klon odpovídající SEQ ID NO: 25 představuje cDNA kódující MCCSip kinasu v úplné délce. Další sekvence MCCSip zahrnují opravy chyb, které byly identifikovány při novém sekvenování klonu MCCSla a jsou znázorněny v SEQ ID NO: 32 a 33.
Produkty MCCS1 je možno rozdělit do tří oblastí na základě podobnosti s jinými kinasami příbuznými PIK. Tyto oblasti zahrnují: aminoterminální doménu (MCCSla aminokyseliny 1 až 1081 ze SEQ ID NO: 31 a MCCSip aminokyseliny 1 až 1150 ze SEQ ID NO: 33), oblast, která je podobná rad3+
(MCCSla aminokyseliny 1082 až 2082 ze SEQ ID NO: 31 a MCCSip aminokyseliny 1151 až 2151 ze SEQ ID NO: 33) a doménu PIK (MCCSla aminokyseliny 2083 až 2410 ze SEQ ID NO: 31 a MCCSip aminokyseliny 2152 až 2480 ze SEQ ID NO: 33), která zahrnuje kinasovou doménu. Aminoterminální oblast a oblast rad3+ jsou regulační domény modulující kinasovou aktivitu enzymu a tyto oblasti se podílejí na interakcích s asociovanými proteiny.
Výsledky porovnání nukleotidových a aminokyselinových sekvencí MCCSla a MCCSip se sekvencemi jiných kinas příbuzných PIK a ne-příbuzných PIK je uvedeno v tabulce 1. Konkrétně byl porovnáván 3' konec MCCSla (nukleotidy 6579 až 7652 ze SEQ ID NO: 30, které kódují kinasovou doménu), 3' konec MCCSip (nukleotidy 1627 až 2379 ze SEQ ID NO: 32, které kódují kinasovou doménu), doména rad3+ MCCSla (nukleotidy 3576 až 6578 ze SEQ ID NO: 30) a doména rad3+ MCCSip (nukleotidy 1 až 1626 klonu 517 ze SEQ ID NO: 3) s analogickou oblastí lidského ATM [Savitski et al., výše uvedená citace], humánní DNA-PK [Huntley et al., Cell, 82: 849 až 856 (1995)], lidského FRAP [Brown et al., výše uvedená citace], lidského pllO [Hu et al., Mol. Cell. Biol. 13(12): 7677 až 7688 (1993)], S. cerevisiae MEČI [Weinert et al., Genes Def., 8(6): 652 až 665 (1994)], S. pombe rad3+ [Seaton et al., výše uvedená citace a Hari et al., Cell., 82: 815 až 821 (1995)] a cAMP dependentní protein kinasy (PKA) [Beebe et al., Mol. Endocrinol., 4(3): 465 až 475 (1990)]. V tabulce 1 je pro každou kinasu shoda (totožnost) nukleotidů v procentech uvedena na horní řádce, shoda (totožnost) aminokyselin je uvedena na prostřední řádce a podobnost aminokyselin v % (tj. identické aminokyseliny a konzervativní obměny aminokyselin včetně) je uvedena na spodní řádce. Označení konzervativní obměny, jak se ho používá v této souvislosti označuje biologicky podobné zbytky. Jako příklady konzervativních obměn je možno uvést nahrazení ·· ··· · • · · · · · « ·· · · · · · · · • · · · · · hydrofobního zbytku, jako je zbytek isoleucinu, valinu, leucinu nebo methioninu, jiným takovým zbytkem nebo nahrazení polárního zbytku jiným polárním zbytkem, jako například nahrazení lysinu argininem, kyseliny aspartové kyselinou glutamovou, asparaginu glutaminem apod. Zkratka NS uvedená v tabulce 1 znamená, že příslušná hodnota nebyla stanovena bud z toho důvodu, že nukleotidová sekvence kódující kinasu (tj. rad3+) nebyla veřejně dostupná nebo z toho důvodu, že kinasa (tj. FRAP, ρΙΙΟβ nebo PKA) neobsahuje konkrétně srovnávanou doménu.
····
Tabulka 1 ·· · ·· • « »9 β 9 · · • · · · · · · • « · · ····** • ♦ -· · · ·
Protein kinasa MCCSla/MCCSljS kinasová doména MCCSla rad3 + doména MCCS1/3 rad3+ doména
S. pombe rad3 + ND ND ND
56 22 30
72 46 53
S. cerevisiae MEČI 51 42 44
45 21 24
63 46 49
h - ATM 50 41 41
38 22 24
60 46 47
h - DNA-PK 43 39 43
29 19 20
53 45 49
h - FRAP 45 ND ND
37 ND ND
61 ND ND
h - pl 10/3 45 ND ND
24 ND ND
54 ND ND
h - PKA 39 ND ND
16 ND ND
39 ND ND
Příklad 2
Prostřednictvím stanovení založeného na PCR byl gen MCCS1 zamapován do chromosomu 3. Jako templátu bylo použito lidských/hlodavčích somatických buněčných hybridů obsahujících různé lidské chromosomální panely dostupné v NIGMS Human Genetic Mutant Cell Repository [Drwinga et al., Genomics, 16: 311 až 314 (1993)].
Pro amplifikací části tohoto genu bylo použito dvou oligonukleotidových primerů oDH23 (SEQ ID NO: 12) a
ODH26 5' TGGTTTCTGAGAACATTCCCTGA 3' (SEQ ID NO: 19), založených na cDNA sekvenci MCCSla. Tyto primery poskytnou 237bp PCR produkty. PCR se provádí za těchto podmínek: 50 ng genomové DNA, 0,5 gg každého z primerů, 200μΜ různé dNTP, l,5mM chlorid hořečnatý, IX PCR pufr (Perkin-Elmer Cetus) a jedna jednotka polymerasy Amplitaq (Perkin-Elmer Cetus) v reakčním objemu 25 μΐ. Vzorky byly denaturovány 4 minuty a potom bylo provedeno 35 cyklů denaturace (45 sekund), teplotní hybridizace (30 sekund) a prodlužování (45 sekund) v zařízení Model 480 Cetus Thermocycler. 5 μΐ výsledného produktu PCR bylo podrobeno elektroforéze na 3% agarosovém gelu a obarveno ethidiumbromidem. DNA odpovídající hybridu lidského/hlodavčího chromosomu 3 poskytla pozitivní amplifikační produkt.
Při druhém souboru amplifikačních reakcí bylo stejných oligonukleotidových primerů použito pro sublokalizaci genu MCCS1 do specifické oblasti chromosomu 3. Templáty pro tyto amplifikace zahrnovaly vzorky DNA od pacientů s omezeným chromosomem 3 [Leach et al., Genomics 24: 549 až 556 (1994)]. Amplifikace byly prováděny způsobem popsaným v předcházejícím odstavci. Profil pozitivních amplifikačních produktů zúžil lokalizaci do intervalu q21 až q25.1.
Příklad 3
Polynukleotidy kódující karboxyterminální části kinasy MCCSip příbuzné PIK byly exprimovány rekombinantními technikami v E. coli.
Byly zkonstruovány dva expresní plasmidy E. coli exprimující buď karboxyterminální aminokyselinový zbytek 423 nebo 571 kinasy v expresním/purifikačním systému s fúzovaným proteinem Pinpoint (Promega, Madison, Wisconsin, USA). Použitý postup lze v krátkosti popsat takto: sekvence DNA kódující karboxyterminální část kinasy (nukleotidy 1339 až 2630 nebo nukleotidy 898 až 2630 ze SEQ ID NO. 3) se fúzují do rámce s karboxylovým koncem 13kDa peptidu pocházejícího z transkarboxylasového komplexu Propionibacterium shermanii. Tato oblast podléhá biotinaci v E. coli, a tedy poskytuje prostředek pro monitorování exprese a purifikace fúzovaných proteinů. Exprese se pohání tac promotorem v pinpointu
Xa3. Exprese fúzovaného proteinu se indukuje 0,lmM IPTG a potvrdí za použití streptavidin alkalické fosfatasy za použití formátu pseudo-Western podle instrukcí výrobce.
Příklad 4
Rekombinantní verze MCCSl mohou být také exprimovány v kvasinkách nebo hmyzích buňkách SF9 za použití baculovirového expresního systému. Kinasa FRAP byla exprimována, purifikována a byla enzymaticky účinná po expresi v systému baculoviru (Brown et al., výše uvedená citace).
Kódující oblast MCCSl se fúzuje u aminokonce k heterologní peptidové sekvenci, jako značící (tag) sekvenci
FLAG • ·
·· ·
MDYKDDDDK (SEQ ID NO: 20) nebo šestihistidinové značce (tag) a rekonstruuje do vhodných vektorů. Po expresi v hmyzích buňkách se použije monoklonální protilátky rozpoznávající značku FLAG (Eastman Kodak, Rochester, New York, USA) pro purifikaci velkých množství fúzovaného proteinu FLAG-kinasa příbuzná PIK). Infikované hmyzí buňky se inkubují 48 hodin a potom podrobí lysí v lysačním pufru (25mM 2-glycerolfosfát, 50mM fosforečnan sodný o pH 7,2, 0,5% Triton-X 100, 2mM EDTA, 2mM EGTA, 25mM fluorid sodný, ΙΟΟμΜ vanadičnan sodný, lmM PMSF, 1 μg/ml leupeptin, 1 μg/ml pepstatin, lmM benzamidin a 2mM DTT). Exprimované fúzované proteiny FLAG se purifikují na sloupci afinitní pryskyřice M2 (Eastman Kodak) obsahující anti-FLAG protilátku. Sloupec se promyje 20 sloupcovými objemy lysačního pufru, 5 objemy 0,5M chloridu lithného, 50mM Tris o pH 7,6 a lmM DTT a potom se eluuje budf 0,lM glycinem o pH 3,0 s následující okamžitou neutralizací, nebo se provede kompetitivní eluce za použití peptidu FLAG. V případě proteinů značených 6 histidiny se pro purifikaci proteinu použije Ni-NTA agarosy (Qiagen).
Krátce po podání přihlášky USSN 08/558,666 popsali Antony M. Carr a jeho spolupracovníci (osobní sdělení) gen identifikovaný jako ATR. ATR zřejmě kóduje stejný nebo blízce příbuzný protein MCCS1, což vyplývá z porovnání aminokyselinových sekvencí ATR a MCCS1. Sekvence DNA ATR je uvedena jako SEQ ID NO: 28 a dedukovaná aminokyselinová sekence jako SEQ ID NO: 29. Rozdíly mezi ATR a MCCSip zahrnují: ATR obsahuje přídavně 98 aminokyselinových zbytků u N-konce, v nukleotidové poloze 1284 (SEQ ID NO: 32) se vyskytuje konzervativní změna báze z A (ΜΟΟβΙβ) na T (ATR) a v nukleotidové poloze 4176 je přítomna přídavná konzervativní změna báze z C (MCCSip) na T (ATR).
• · · ·
Značka FLAG byla fúzována k aminokonci zkrácené molekuly ATR postrádající prvních 66 aminokyselin ATR. Značka FLAG byla přidána PCR následujícím způsobem: pro PCR reakci se použije oligomerů FLAG-ATR
5'-CGGGATCCGCCATGGACTACAAGGACGATGACAAGATGTTGCTTGATTTC-3' a oligomerů HFB24
5'-CTTAAGCCGCATGAGCACACCGTC-3'.
PCR se provádí za následujících podmínek: 100 ng pcDNAATR (získáno od A. M. Carra) jako templát, IX PCR pufr (Perkin-Elmer Cetus), l,5mM chlorid hořečnatý, 200μΜ každý z dATP, dGTP, dCTP a TTP, 10 ng/μΐ každého z primerů, IU AmpliTaq (Perkin-Elmer Cetus). Reakční směs se denaturuje při 94°C (4 minuty) a potom se provede 30 cyklů při 94°C (30 sekund), 60eC (30 sekund) a 72°C (30 sekund). Výsledný, přibližně 800bp PCR produkt se štěpí BamHI a Nhel a liguje k lOkb fragmentu savčího ATR exprexního plasmidů, pcDNAATR rozštěpenému BamHI a BstXI spolu se zbytkem ATR kódujících sekvencí obsažených v 2,5kb BstXI až Nhel fragmentu. Sekvenční analýza potvrdí adici značky FLAG. Insertu obsaženého v tomto plasmidů se potom použije pro konstrukci baculovirového expresního plasmidů, který má exprimovat FLAG-značený ATR-trunkát. 5' konec ATR obsažený ve fragmentu BamHI až BstXI a 3' konec ATR obsažený ve fragmentu BstXI až Sáli pocházejícím z pBTM ATR se liguje k baculovirovému expresnímu vektoru, pFB (Gibco/BRL), který byl rozštěpen BamHI a Sáli. Tento plasmid byl označen zkratkou pFMBCCS/PFLAG.
Úplná kódující oblast ATR byla fúzována pomocí PCR u aminokonce k šestihistidinové značce. Při PCR reakci, jejímž účelem bylo přidat šestihistidinovou značku • · ··· ·
k sekvencím kódujícím aminokonec ATR, bylo použito oligonukleotidů MCCS6his
5'-CGGGATCCAGCATGCATCACCATCACCATCACATGGGGGAACATGGGC-3' a FrplR
5'-CATGACCACTGGCCATTCCACACG-3'
PCR byla prováděna za těchto podmínek: Jako templátu bylo použito 100 ng PstA 12ATR (získaného od Antony M. Carra); IX PCR pufr (Perkin-Elmer Cetus); l,5mM chlorid hořečnatý, vždy 200μΜ dATP, dGTP, dCTP a TTP; 10 ng/μΐ každý primer, 1U AmpliTag (Perkin-Elmer Cetus). Reakční směs byla denaturována 4 minut při 94°C a poté bylo provedeno 25 cyklů při 94°C (30 sekund), 60°C (30 sekund) a 72°C (30 sekund). Přibližně 800bp PCR produkt byl rozštěpe BamHI a MscI a ligován ke dvěma jiným fragmentům, lOkb fragmentu z pcDNAATR, rozštěpenému BamHI a BstXI a přibližně 3kb fragmentu MscI až BstXI obsahujícímu zbytek ATR kódující sekvence. Adice šestihistidinové značky byla ověřena analýzou sekvence. Výsledný plasmid kódující molekulu ATR o úplné délce označené šestihistidinovou značkou byl označen jako pcDNA6hísATR.
Pro sestrojení baculovirového expresního plasmidu exprimujícího celou kódující sekvenci ATR byl l,2kb BamHI až Agel fragment z pFBMCCS/PFLAG ligován k BamHI až Agel fragmentu z pcDNA6hisATR. Výsledný plasmid označený jako pFB/HisX6MCCSl byl transformován do E. coli kmene DH5a (Gibco/BRL) za účelem screeningu rekombinantů. Plasmid byl purifikován za použití soupravy Wizard Mini-Prep Kit (Promega) a potom transformován do buněk E. coli aSF9 (Invitrogen) za použití protokolu Cellfectin popsaného firmou Gibco/BRL.
• · · · hodin po transfekci se peleta buněk SF9 a baculovirus produkovaný tranfekovánými buňkami sklidí. Virus se skladuje při 4°C v Graceho úplném médiu s obsahem 10 % FBS, směsi penicilinu a streptomycinu a gentamicinu. Tohoto virového přípravku se použije pro vytvoření zásobního virového přípravku s vysokým titrem (P2). Zásobního virového přípravku P2 se použije pro infekci 50ml kultury buněk SF9. Buňky se shromáždí 48 hodin po infekci a odstředí při nízké rychlosti, aby došlo k peletizaci bez lyse. Buněčná peleta se před lysí skladuje 24 hodin při -20°C. Buňky se podrobí lysi v 5ml lysačním pufru (50mM Tris, pH 8,0; 500mM chlorid sodný, 1% NP40; ΙΟΟμΜ PMSF). Exprese ATR se potvrdí imunoblotem za použití polyklonální protilátky anti-AgDH2, jako próby. Baculovirus FBHisX6 ATR produkoval přibližně 300kDa protein, který byl imunoreaktivní s anti-AgDH2 protilátkami a společně migroval s proteinem v extraktu buněk z myších varlat.
Zásobního virového přípravku P2 bylo také použito pro infekci dvoulitrové kultury buněk SF9. Buňky byly shromážděny 48 hodin po infekci, odstředěny při nízké rychlosti, aby došlo k peletizaci bez lyse a peleta byla skladována při -20°C. Buněčná peleta ze 150 ml kultury byla podrobena lysi v 7,5 ml lysačního pufru (50mM fosforečnan sodný, pH 7,2; 0,5% NP-40; lOmM imidazol, 25mM fluorid sodný, ΙΟΟμΜ vanadičnan sodný; 0,5mM AEBSF; 1 μg/ml leupeptin; 1 μg/ml pepstatin A) a lysát byl inkubován na ledu po dobu 15 minut. Potom byl lysát 30 minut odstřelován při 10 000 x g. Supernatant byl odstraněn a všechna DNA v lysátu získaném z rozbitých jader byla podrobena smykovému namáhání odsátím jehlou číslo 20. Částicová látka byla odstraněna filtrací přes filtr s průměry pórů 0,8 μιη a poté přes filtr s průměry pórů 0,2 μιη. V čirém lysátu byla nastavena koncentrace β-merkaptoethanolu 5mM a chloridu sodného 0,4M. Sloupec Ni-NTA-agarosy o objemu 1 ml (Qiagen) • · · · byl ekvilibrován v pufru A (0,4M chlorid sodný; 5mM βmerkaptoethanol; 0,1% Triton X100, 50mM fosforečnan sodný; lOmM imidazol; 25mM fluorid sodný; ΙΟΟμΜ vanadičnan sodný; 0,5mM AEBSF; 1 μ9/ιη1 leupeptin a 1 μ9/πι1 pepstatin A) a potom byl na sloupec nanesen vyčeřený lysát. Nanášení vzorku bylo prováděno průtokovou rychlostí 0,25 ml/min. Potom byl sloupec promyt 5 ml purfu A a eluován 10 ml pufru A s imidazolovým gradientem 50 až 500mM. Byly sbírány frakce o objemu 0,5 ml a tyto frakce byly zkoušeny na kinasovou aktivitu následujícím způsobem: 5 μΐ každé frakce bylo inkubováno v kinasovém pufru, 10 μθί 32P-gammaATP, 10μΜ ATP a 5 μg substrátu PHAS-1 (Stratagene) a inkubováno 20 minut při 37°C. Reakční směs byla nanesena na fosfocelulosové rotační sloupce a centrifugována při 2500 x g. Sloupce byly dvakrát promyty 0,5 ml 75mM kyseliny fosforečné a jednou 0,5 ml absolutního ethanolu. Fosfocelulosové disky byly potom přeneseny do scintilačních nádob a byla zaznamenána radioaktivita přenesená do proteinů PHAS-1 v počtech rozpadů za minutu. Aktivita vůči PHAS-1 byla zjištěna ve frakcích 4 až 9 a imunoblotová analýza potvrdila, že také ATR byl přítomen ve stejných frakcích.
Plasmidová DNA kódující MCCS1 byla transformována do diploidního kvasinkového kmene esrl-1
Mata leu2-l his4-4canl ura3 cyh2 ade6 ade2 esrl-1/MAT a Ieu2-27his4 trpí met2 ade2 esrl-1 a buňky byly pěstovány do semilogaritmické fáze v médiu obsahujícím bud galaktosu nebo glukosu. Buňky byly peletizovány a promyty. Všechny stupně byly prováděny při 4°C. Buněčná pasta byla resuspendována v pufru (20mM Tris o pH 8,0, 300mM chlorid sodný, 10% glycerol, 0,lmM PMSF, 0,25 mg/ml pepstatin, leupeptin a aprotinin) a poté byly buňky podrobeny lysi ve francouzském lisu nebo za použití skleně39 • ·· '· ···· ných perel. Po nízkorychlostním otáčení (10K) a vysokorychlostním otáčení (100K) byla lyse ověřena mikroskopicky a supernatant byl nanesen na 1,5 ml sloupci Ni-NTA agarosy (Qiagen, lne., Chatsworth, Kalifornie, USA), který byl předběžně promyt IX pufrem. Sloupec byl promyt 6 objemy sloupce pufru a potom byl stupňovitě eluován 8 ml lOmM, 50mM, lOOmM a 250mM imidazolu v pufru. Frakce byly shromážděny a byla provedena analýza Western za použití 15 μΐ každého elučního píku. Kinasová aktivita byla měřena způsobem popsaným výše.
Příklad 5
Polyklonální a monoklonální protilátky specifické vůči MCCS1 byly vytvořeny za použití standardních technik tohoto oboru.
Byly zkonstruovány dva rozdílné bakteriální expresní plasmidy, pGEXl-MEC a pGEX3-MEC pro rekombinantní produkci částí polypeptidů MCCS1, jakožto produktů fúzovaných ke karboxylovému konci glutathion S-transferasy (GST). Obou plasmidů bylo použito pro vytvoření antigenů AgDH-2 (z pGEXl-MEC) a AgDH-3 (z pGEX3-MEC) pro použití při standardním imunizačním protokolu. p-GEXl-MEC obsahuje EcoRI fragment kódující aminokyselinové zbytky 566 až 870 ze SEQ ID NO: 4, který je fúzován k GST ve vektoru pGEXl (Pharmacia Biotech, Milwaukee, Wisconsin, USA); p-GEX3-MEC obsahuje EcoRI fragment kódující aminokyselinové zbytky 118 až 567 ze SEQ ID NO: 4, který je fúzován k GST ve vektoru pGEX3 (Pharmacia Biotech). Indukce promotoru pGEX tac 0,lmM IPTG vedla k vysoké úrovni exprese každého fúzovaného proteinu v nerozpustné formě (inkluzní tělesa). Po lysi indukovaných kultur ve francouzském lisu byly extrakty z AgDH-2 a AgDH-3 centrifugovány přes 35% roztok sacharosy obsahující O,1M chlorid sodný, 0,01M Tris o pH 7,5 a 0,001M EDTA (STE).
Pelety byly dvakrát promyty a poté resuspendovány v STE.
·· ····
Pro vytvoření polyklonálního antiséra v králících byly AgDH-2 a AgDH-3 dále purifikovány za použití preparativní elektroforézy na SDS polyakrylamidovém gelu a elektroelucí každého antígenu z plátků gelu. Primární imunizace samic novozélandského bílého králíka byla provedena vždy za použití 200 μg každého antígenu smíšeného s úplným Freundovým adjuvantem. Tento prostředek byl podán subkutánní injekcí v několika místech. Následné imunizace byly prováděny za použití 100 μg antígenu smíšeného s neúplným Freundovým adjuvantem přibližně v 21-denních intervalech. Odběry krve byly provedeny po 3., 4. a 5. imunizaci. Analýza Western blot extraktů tkáně lidských varlat ukazázala reaktivitu protilátky proti přibližně 270kDa proteinu v imunním, ale nikoliv preimunním antiséru. Imunní sérum kromě toho ukázalo reaktivitu proti MCCS pinpoint fúzovaným proteinům popsaným v příkladu 3, což představuje důkaz vytvoření MCCS1 specifických protilátek.
MCCSl-specifické protilátky byly purifikovány dále uvedeným způsobem. Přípravky s inkluzními tělesy z AgDH-2 a AgDH-3 byly kopulovány ke kyanogenbromidem (CNBr)-aktivované Sepharose (Pharmacia, Alameda, Kalifornie, USA).
Antigen (2 mg) byl solubilizován v 1% SDS (konečný objem 4 ml) a dialyzován přes noc proti kopulačnímu pufru (0,lM hydrogenuhličitan sodný/0,1% SDS). Ke každému antigenovému přípravku bylo před inkubací s CNBr Sepharose přidáno 0,5 ml 5M chloridu sodného. Lyofilizovaná CNBr Sepharose (0,4 g/ antigen) byla resupendována v lmM kyselině chlorovodíkové a promyta ve fritovém filtru 250 ml lmM kyseliny chlorovodíkové přidané v několika alikvotních dílech během 15 minut. CNBr-Sepharose promytá kyselinou chlorovodíkovou byla potom přenesena do 15ml zkumavky se zaklapovacím uzávěrem a promyta 2 x 5 ml kopulačního pufru. K promyté Sepharose byl potom přidán přípravek s dialyzovaným antigenem, načež následovala inkubace při teplotě místnosti po dobu 1,5 ·· ···· • ·· hodiny na pomalu se otáčejícím kotouči. Sepharose byla jednou promyta 5 ml kopulačního pufru, jednou 10 ml O,1M Tris o pH 8,0 a potom inkubována v 10 ml O,1M Tris o pH 8,0 2 hodiny při teplotě místnosti, aby byly blokovány všechny zbývající reaktivní skupiny pryskyřice. Kopulační účinnost byla podle analýzy SDS-PAGE 60 až 80%. Sloupce s antigenem byly potom promyty 15 ml 6M hydrochloridu guanidinu (pro odstranění nekopulovaného antigenu), 25 ml pufru A (50mM Tris, pH 7,4), 15 ml pufru B (4,5M chlorid hořečnatý/1 mg/ml BSA/50mM Tris o pH 7,4) a potom 50 ml pufru A. Potom bylo 30 ml králičího séra z imunizovaných zvířat (králík 4747 imunizovaný AgDH-3 a králík 4779 imunizovaný AgDH-2) necháno projít sloupcem s příslušným antigenem v průběhu 3 hodin. Potom byly sloupce promyty 20 ml pufru A, 40 ml ÍM hydrochloridu guanidinu a potom ekvilibrovány za použití dalších 20 ml pufru A. Eluce protilátek anti-AgDH-3 a anti-AgDH-2 z příslušných antigenových sloupců byla poté provedena 10 ml pufru B. Byly sbírány lml frakce. Frakce obsahující IgG byly spojeny a dialyzovány proti 1 litru fosforečnanem pufrovaného roztoku chloridu sodného (PBS) po dobu 3 hodin a potom přes noc proti 1 litru PBS s obsahem 35 % glycerolu.
Kopulací 15-aminokyselinového peptidů (zbytky 1359 až 1373) ke Keyhole Limpet Hemocyanin - s použitím EDC způsobem popsaným výrobcem (Pierce) a následujícím injekčním podáním kopulovaného imunogenu králíkům se vytvoří antipeptidové protilátky proti lidskému protenu ATM. Protilátky se nejrpve vysrážejí ze séra (# 6076) stejným objemem nasyceného roztoku chloridu amonného a poté se resupendují a diylazují proti PBS. Afinitní purifikace se provede za použití peptidového sloupce připraveného kopulací antigenního peptidů k Sepharose (Pharmacia) aktivované kyanogenbromidem (podle instrukcí výrobce). Potom se protilážky navážou na peptidový sloupec a promyjí 2M KC1-BPS. Eluce se ·· ····
provede 20 ml S m Nal (v lmM thiosíranu sodném) , který se ihned nato dialyzuje proti PBS.
Pro vytvoření monoklonálních protilátek se samice myši Balb/c imunizují 50 gg AgDH-2 nebo AgDH-3. Další myši se imunizují 25 až 50 gg AgDH-2 nebo AgDH-3 ve spojení se stejným molárním množstvím mAb 61F3B, což je monoklonální protilátka vykazující specifickou reaktivitu vůči GST. Třetí skupina myší se imunizuje plátky polyakrylamidového gelu s SDS, který obsahuje AgDH-2 nebo AgDH-3. Imunogen pro každou skupinu myší se připraví v kompletním Freundově adjuvans a následující posilovači dávky (25 gg) (podávané v intervalech přibližně 21 dnů) se připraví v nekompletním Freundově médiu. Buněčné linie produkující monoklonální protilátky byly izolovány způsobem, který lze v krátkosti popsat takto: Suspenze jednotlivých buněk se vytvoří rozmělněním sleziny imunizovaných myší v séraprostém RPMI 1640, které je doplněno L-glutaminem (2mM), pyrohroznanem sodným (lmM), penicilinem (10 U/ml) a streptomycinem (100 gg/ml) (RPMI, Gibco, Kanada). Suspenze buněk se přefiltruje přes sterilní buněčný cedák (Nitex, velikost otvoru 212 μιη) (Becton Dickinson, Parsippany, New Jersey, USA) a buňky se dvakrát promyj í centrifugací při 200 x g po dobu 5 minut s následným resuspendováním pelety ve 20 ml séraprostého RPMI. Tímto způsobem se připraví thymocyty odebrané třem naivním myším Balb/c.
Myelomární buňky NS-1 uchovávané v logaritmické fázi v RPMI s 11 % fetálního hovězího séra (FBS) (Hyclone Laboratories, lne., Logan, Utah, USA) po dobu 3 dnů před fúzí se 5 minut odstředují při 200 x g a vzniklá peleta se dvakrát promyje způsobem popsaným v předchozím odstavci. Po promytí se objem každé buněčné suspenze upraví na 10 ml séraprostým RPMI a 10 μί vzniklého přípravku se zředí v poměru 10 : 100. Z každého zředěného přípravku se odebere 20 ·· ··· ·
• ·· • · · μΐ a k tomuto vzorku se přidá vždy 20 μΐ 0,4% trypanové modři v 0,85% roztoku chloridu sodného (Gibco), směs se vnese do hemacytometru a změří.
Slezinné buňky (2 x 108) se smísí s 4 x 107 buněk NS-1, směs se odstředí a supernatant se odsaje. Buněčná peleta se rozdruží poklepem na zkumavku, k buňkám se za míchání v průběhu 1 minuty přidají 2 ml 50% roztoku polyethylenglykolu o molekulové hmotnosti 1500 v 75mM HEPES o pH 8,0 a teplotě 37°C (Boehringer Mannheim) a potom v průběhu 7 minut 14 ml séraprostého RPMI. Přidá se dalších 16 ml RPMI a buňky se 10 minut odstřeďují při 200 x g. Supernatant se zahodí a peleta se resuspenduje ve 200 ml RPMI s obsahem FBS (15%), hypoxanthinu sodného (ΙΟΟμΜ), aminopterinu (0,4μΜ), thymidinu (HAT, Gibco) (16μΜ), IL-6 (Mallinckrodt, Folcrost, Persylvánie, USA) (25 U/ml) a 1,5 x 106 thymocytů/ml. Suspenze se rozdělí do 10 96-jamkových ploten s plochým dnem pro tkáňové kultury v množství 200 μΐ/jamka. Buňkám v jamkách se v době mezi fúzí a screeningem 3 až 4 x odsaje přibližně polovina média pomocí jehly č. 18 a toto médium se nahradí výše popsaným médiem, které však obsahuje 10 U/ml IL-6 a neobsahuje thymocyty.
Screening na fúzi se provádí, když buňky dosáhnou 60 až 80% konfluenče (7. až 9. den) za použití ELISA na AgDH-2 versus AgDH-3. Misky Immunlon 4 (Dynatech, Cambridge, MA, USA) se při 4°C přes noc potahují proteinem v 30mM uhličitanovém pufru o pH 9,6. Na každou jamku případně 100 ng proteinu. Misky se blokují 0,5% želatinou z rybí kůže v PBS po dobu 1 hodiny při 37°C (100 μg želatiny na jamku), promyjí 3 x PBS s obsahem Tween 20 (0,05%) (PBST) a přidá se 50 μΐ supernatantu kultury. Po 30-minutové inkubaci při 37°C a promytí, které se provádí výše popsaným způsobem, se přidá 50 μΐ konjugátu křenové peroxidasy a kozího protimyšího IgG/fc (Jackson, ImmunoResearch, West Grove, PA, USA) zředě·· ·· ··· ·
- 44 ·· · ·· ného v poměru 1 : 10 000 pomocí PBST. Misky se inkubují výše popsaným způsobem, čtyřikrát promyjí PBST a přidá se 100 μΐ substrátu obsahujícího 100 μ9/πι1 tetramethylbenzidinu a 0,15 μΐ/ml peroxidu vodíku ve lOOmM octanu sodném o pH 5,5. Barevná reakce se zastaví za 5 až 10 minut přídavkem 50 μΐ 15% kyseliny sírové. Ve čtecím zařízení pro misky se zjistí hodnota A4go.
hybridomálních vzorků pozitivních při testu ELISA se podrobí screeningu na schopnost imunoblotovat a imunoprecipitovat MCCS z lysátu buněk myších varlat. Imunoblotová analýza za použití extraktu z myších varlat je popsána v příkladu 6. Imunoprecipitace se provádějí takto: Použije se 6% SDS polyakrylamidového gelu, následuje přenos na Immobilon-PVDF ve 192mM glycinu, 25mM Tris bázi, 0,1%
SDS, 20% methanolu a potom se provede blokování (1 hodina v 5% sušeném odtučněném mléku, 20mM Tris o pH 7,5, lOOmM chloridu sodném s 0,1 % Tween 20) a nastříhá se příslušný počet proužků. Primární protilátka (supernatant z jamky) se zředí výše uvedeným blokovacím roztokem a 1 hodinu inkubuje při teplotě místnosti, 4 x promyje v blokovacím roztoku bez mléka, inkubuje v kozím protimyším IgG (H+L) HRP (BioRad č. 170-6516), znovu promyje blokovacím roztokem bez mléka, přenese na reagens NEN Renaissance ECL a 5 minut vyvíjí.
Imunoprecipitace se provádí takto: 50 μΐ hybridomálního supernatantu se 1 hodinu inkubuje na ledu s 300 μg lysátu buněk z varlat (připraveného způsobem popsaným v příkladu 6). Přidá se 30 μΐ 50% suspenze protein A-agarosy (Pierce, Rockford, IL, USA) předem navázané na králičí protimyší můstkovou protilátku (5 μ9/Γβ3^β) (Pierce), načež následuje inkubace při 4’C za současného promíchávání kýváním. Imunitní komplexy se 3 x promyjí v lysačním pufru a potom se komplex antigen/protilátka eluuje vařením v SDS vzorkovém pufru (2% SDS, 20mM Tris, pH 6,8, 20% glycerol, »·»·
0,001% bromfenolová modř). Výsledný supernatant se oddělí na 6% SDS polyakrylamidovém gelu a přenese na Immobilon-PVDF (Millipore). Imunoblot se vytvoří za použití afinitně purifikovaného králičího anti-AgDH-2 polyklonálního antiséra. 4 hybridomy se klonují a charakterizují zkouškami zahrnujícími imunoblotování, imunoprecipitace a imunoprecipitace/působení kinasy způsoby popsanými v příkladu 6. 4 hybridomální buněčné linie se označí šiframi 224B,
224C (ATCC HB 12233), 224F (ATCC HB 12234) a 224G. Všechny čtyři monoklonální protilátky rozpoznávají MCCS1 při imunoblotování a imunoprecipitaci.
Příklad 6
Protein kinasová aktivita spojená s MCCS1 se imunoprecipituje za použití MCCSl-specifických polyklonálních protilátek popsaných v příkladu 5.
Z čerstvé tkáně varlat myší Balb/c se zhotoví extrakty. Rozmělněná varlata se homogenizují na ledu v lysačním pufru (50mM fosforečnan sodný, pH 7,2; 0,5% Triton X-100; 2mM EDTA; 2mM EGTA; 25mM fluorid sodný; 25mM 2-glycerofosfát; lmM fenylmethylsulfonylfluorid (PMSF); 1 μg/ml leupeptin; 1 μg/ml pepstatin A; 2mM DTT) za použití 10 až 15 zdvihů těsně uloženého homogenizátoru (dounce) a inkubují na ledu po dobu 30 minut. Lysát se odstředí při 13 000 x g (10 minut, 4°C, stolní ultracentrifuga TL-100, Beckman), aby se odstranily nerozbité buňky a jiné nerozpustné látky.
Alikvoty buněčného lysátu se zmrazí v kapalném dusíku a skladují při -70°C. 500 μg extraktu z varlat se inkubuje bud s 5 μg afinitně purifikované anti-AgDH-2 polyklonální protilátky nebo 5 μg purif ikovaného králičího IgG (Zymed, So.,
San Francisco, CA, USA) v 1 ml lysačního pufru po dobu 1 hodiny na ledu v mikrocentrifugačních zkumavkách. K extraktům se přidá 30 μΐ protein A Sepharosových perel (Repligen, Cambridge, MA, USA) (promytých lysačním pufrem) a následuje inkubace dalších 30 minut při 4°C na kyvné podložce. Imunitní komplex/protein A Sepharosové perly se promyjí 4 x 1 ml lysačního pufru, 1 x 1 ml kinasového pufru (25mM HEPES, pH 7,7; 50mM chlorid draselný; lOmM chlorid hořečnatý; 0,1% NP-40; 2% glycerol; lmM DTT) a potom inkubují ve 20 μΐ kinasového pufru s 10 μΰί ATP (50 Ci/ml) po dobu 20 minut při 37’C. Reakce s kinasou se zastaví 20 μΐ 2X SDS vzorkového pufru a směs se zahřeje na 100°C, načež se provede separace na 6% polyakrylamidovém gelu. Gely se fixují směsí 20% methanolu a 7% kyseliny octové a potom, před autoradiografií, vysuší na papíru Whatman 3MM. Zatímco při kontrolních imunoprecipitacích nebyla zjištěna žádná nebo byla zjištěna jen malá fosforylace, imunoprecipitace za použití anti-AgDH-2 protilátky vykazovaly dva hlavní fosforylační pásy přibližně při 300 kDa a 180 kDa. Kromě toho bylo přítomno několik vedlejších fosforylačních produktů, z nichž jeden migroval současně se samotným proteinem MCCS1, což se projevilo při analýze Western blot (popis analýzy Western blot je uveden v příkladu 8). Analýza 300kDa proteinu na fosfoaminokyseliny ukázala přítomnost fosfoserinových zbytků. Přídavkem 5 μg AgDH-2, ale nikoliv AgDH-3, se dramaticky snížila nebo vymizela kinasová aktivita spojená s MCCS1 nalezená v imunoprecipitátech.
Příklad 7
Profil exprese MCCS1 v různých lidských tkáních byl zjišťován pomocí hybridizace Northern blot.
Nylonové membrány obsahující 2 μg podle velikost frakcionované polyA+ RNA z různých lidských tkání byly získány od firmy Clontech Laboratories lne. Postupuje se přesně podle hybridizačniho protokolu dodaného výrobcem, pouze s tím rozdílem, že se poslední promývání provádí při • · · ·
55°C, a nikoliv při 50°C, aby se minimalizovala možnost křížové hybridizace k příbuzným sekvencím. 32P-značená DNA hybridizační próba se vytvoří pomocí PCR. DNA kódující 30 % karboxyterminálního MCCSla se použije jako templátu pro amplifikaci l,3kb fragmentu za přítomnosti 32P-dCTP za použití primerů 279-3
5'-TGGATGATGACAGCTGTGTC-3' (SEQ ID NO: 21) a 279-6
5'-TGTAGTCGCTGCTCAATGTC-3' (SEQ ID NO: 22)
Výsledky analýzy Northern blot ukazují, že se MCCS1 exprimuje jako přibližně 9kb mRNA v celé řadě lidských tkání. Nejvyšší hladinu MCCS1 mRNA obsahuje tkáň varlat, přestože se tento transkript také exprimuje v tenkém střevu, vaječnících, prostatě, brzlíku, slezině, srdci, lymfocytech periferní krve, tlustém střevu, mozku, placentě, kosterním svalstvi, ledvinách a slinivce břišní.
Také byla zkoumána exprese MCCS1 mRNA v buněčných liniích lidské rakoviny za použití RNA blotu buněčné linie lidské rakoviny od firmy Clontěch. Tento RNA blot obsahuje RNA z buněčných linií HL-60 (promyelocytická leukémie),
HeLa (karcinom děložního čípku), K562 (chronická myelogenní leukémie), MOLT-4 (lymfoblastová leukémie), Ráji (Burkittův lymfom), SW480 (kolorektální adenokarcinom), A549 (karcinom plic) a G361 (melanom). Analýza Northern blot byla prováděna podle instrukcí výrobce, přičemž hybridizace se prováděla při 65 °C za použití 2,0kb fragmentu Kpnl-Sall z MCCS1 parciálního klonu HFB2. Exprese byla pozorována u buněčných linií HL-60, HeLa, K-562, Ráji, SW480 a G361, přičemž nejvyšší hladina exprese byla zjištěna u buněčné linie G361.
• · ·
Detegovatelná, ale nízká hladina exprese byla pozorována v buněčných liniích MOLT-4 a A549.
Příklad 8
Exprese MCCSl mRNA a proteinu v normálních a ozařovaných myších varlatech a v myších embryích byla měřena in sítu hybridižací, imunobarvením a/nebo imunoblotováním.
In sítu hybridizace
Tkáň varlat normálních a ozářených myších samců Balb/c se nařeže na plátky o tlouštce 6 μιη a zpracuje na preparáty umístěním na sklíčka Superfrost Plus^R^ (VWR Scientific) a usušením na vzduchu při teplotě místnosti přes noc. Řezy se skladují při -70C, pokud se jich ihned nepoužije. Tkáňové řezy se fixují ve 4% paraformaldehydu (Sigma) v PBS po dobu 20 minut při 4°C, dehydratují se působením 70%, 95% a 100% ethanolu, vždy po dobu 1 minuty při 4°C a nakonec se usuší na vzduchu (30 minut při teplotě místnosti). Potom se preparáty acetylují v roztoku 0,25% (objemově) acetanhydridu (Sigma)/0,lM triethanolaminu o pH 8,0 za míchání při teplotě místnosti po dobu 10 minut, oplachují se 0,2X SSC po dobu 10 minut při teplotě místnosti a za míchání a nakonec se dehydratují způsobem popsaným výše a usuší se na vzduchu. Tkáň se hybridizuje in sítu s digoxigeninem značenou jednořetězcovou mRNA získanou z myší MCCSl DNA pomocí in vitro RNA transkripce, při níž se inkorporuje digoxigen-UTP (Boehringer Mannheim). Značená ribopróba (viz sekvence SEQ ID NO: 27) (1 μg/řez) a diethylpyrokarbonátem (depc)-ošetřená voda se přidá k hybridizačnímu pufru do konečné koncentrace formamidu 50%, chloridu sodného 0,3M, Tris o pH 7,5 20mM, dextransulfátu 10%, Denhardtova roztoku IX, dithiothreitolu (DTT) lOOmM a EDTA 5mM. Na každý řez se nanese 20 μΐ roztoku a preparát se zakryje sterilním
RNasy-prostým krycím proužkem 22 x 22. mRNA jak v řezu, tak v roztoku próby se denaturuje zahříváním preparátů na 85°C po dobu 10 minut v sušárně. Hybridizace se provádí přes noc (12 až 16 hodin) při 50°C.
Po hybridizaci se řezy 1 hodinu oplachují při teplotě místnosti 4X SSC/lOmM DTT, potom 30 minut při 50°C v 50% formamidu/2X SSC/lOmM DTT, 30 minut při 37°C v roztoku 500mM chloridu sodného, lOmM Tris-HCl, lmM EDTA o pH 7,5 (pufr ΝΤΕ), 30 minut při 37°C v lázni RNasy A (Boehringer Mannheim) o koncentraci 10 μg/ml v pufru NTE, 15 minut při 37’C v pufru NTE, 15 minut při teplotě místnosti v 2X SSC, minut při teplotě místnosti v 0,lX SSC a 2 minuty při teplotě místnosti ve lOOmM Tris-HCl, 150mM chloridu sodném o pH 7,5 (pufr 1). Pro detekci značených riboprób se asi 30 minut blokují při teplotě místnosti v roztoku normálního ovčího séra (Harlan Bioproducts for Science, Indianapolis,
IN, USA) (5%) a Tritonu X-100 (Sigma) (0,3%) v pufru 1 za mírného míchání. Poté se na tkáň nanese konjugát ovčí a-digoxigenin - zlato (Goldmark Biologicals, Philipburg, PA, USA) (150 μΐ/řez) a následuje dvouhodinová inkubace při teplotě místnosti. Preparáty se promývají pufrem 1 (3 x 5 minut), sterilní deionizovanou vodou (5x3 minuty), nadbytek kapaliny se z preparátu odstraní odsátím filtračním papírem a na každý řez se nanesou 2 kapky stříbrného zesilovacího roztoku a 2 kapky iniciačního roztoku (Goldmark Biologicals). Chemická reakce se nechá probíhat 23 minut při teplotě místnosti, potom se řezy důkladně opláchnou sterilní deionizovanou vodou, dobarví barvivém Nuclear Fast Red (Vector), znovu opláchnou sterilní deionizovanou vodou, usuší při teplotě místnosti na vzduchu přes noc a upevní těsnicím prostředkem Cytoseal 60 (VWR).
Jak ve varlatech normálních, tak ve varlatech ozářených myší byl pozorován signál v cytoplasmě sterma• · • · · · • ·· · ··· togonií a spermatocytů. Hladina exprese v ozářených varlatech nebyla zvýšena nad hladinu pozorovanou v normálních varlatech.
Imunobarvení
Tkáň varlat normálních myších samců Balb/c se nařeže na plátky o tloušťce 6 gm, zachytí na sklíčcích pro preparáty Superfrost Plus^R^ (VWR Scientific) a usuší se přes noc při teplotě místnosti. Pokud se řezů ihned nepoužívá, skladují se při -70°C. Řezy se fixují v chladném (4°C) acetonu 10 minut při teplotě místnosti. Když se preparáty vyjmou z acetonové lázně, nechá se aceton z řezů odpařit. Každý tkáňový řez se blokuje 150 μΐ roztoku normálního krysího séra (Harlan Bioproducts) (30%), normálního kozího séra (Vector Laboratories) (5%) a hovězího sérového albuminu (BSA) (Sigma) (1%) v IX TBS 30 minut při teplotě místnosti. Po blokování se roztok opatrně odsaje z řezů filtračním papírem. Blokovacím roztokem se jednotlivě zředí anti-AgDH-3 a anti-AgDH-2-polyklonální protilátka a preimunitní sérum ze stejných králíků v poměru 1 : 50 a 1 : 100 a 100 μΐ zředěného vzorku se nanese na každý tkáňový řez, načež se řezy inkubují při 37°C po dobu 30 minut. Roztok protilátky se opatrně z řezů odstraní odsátím filtračním papírem a nenavázaná protilátka se z řezů odstraní promýváním preparátů IX TBS (3x5 minut).
Nadbytek TBS se z preparátu odstraní odsátím filtračním papírem a na každý řez se nanese 100 μΐ biotinylované kozí protikráličí protilátky obsažení v kitu Elitě Rabbit IgG Vectastain ABC kit (Vector) připravené podle příbalového letáku a řezy se inkubují 15 minut při 37°C. Po inkubaci se preparáty dvakrát promyjí (vždy 5 minut) v IX TBS a na každý řez se nanese 100 μΐ konjugátu streptavidin-zlato (Goldmark Biologicals) zředěného v poměru 1 : 100 roztokem obsahujícím normální krysí sérum (5%) a BSA (1%). Řezy se inkubují 1
9 9 <9 hodinu při teplotě místnosti a potom se preparáty oplachují 3 x IX TBS (s každou lázni po dobu 5 minut) a na dobu 5 minut při teplotě místnosti nanese 100 μΐ 1% glutaraldehydu (Sigma) v pufru TBS. Potom se preparáty oplachují TBS (3 x 5 minut) a sterilní deionizovanou vodou (4x3 minuty). Nadbytek kapaliny se z každého preparátu odsaje filtračním papírem a na každý řez se nanesou 2 kapky stříbrného zesilovacího roztoku a 2 kapky iniciačního roztoku (Goldmark Biologicals). Chemická reakce se nechá probíhat 13 minut při teplotě místnosti, potom se řezy důkladně opláchnou sterilní deionizovanou vodou, dobarví barvivém Nuclear Fast Red (Vector), znovu opláchnou sterilní deionizovanou vodou, usuší se přes noc při teplotě místnosti na vzduchu a upevní těsnicím prostředkem Cytoseal 60 (VWR).
Signál byl detegován ve spermatogoniích a primárních spermatocytech v případě obou polyklonálních protilátek, ale nikoliv v případě preimunitního séra ze stejných zvířat.
Imunoblotování
Čerstvě získaná myší varlata se rozmělní holicí čepelkou v chladném PBS a rozmělněná tkáň se převede na buněčnou suspenzi za použití volně uloženého homogenizátoru (dounce). Buněčná suspenze se povaří se stejným objemem 2X SDS vzorkového pufru. Alikvoty (50 μg) každého extraktu se separují na 6% polyakrylamidovém gelu, následuje přenos na membrány Immobilon (Millipore, Bedford, MA, USA) a analýza na anti-MCCSl-reaktivitu za použití afinitně purifikovaných protilátek z příkladu 5 a HRP-konjugované kozí protikráličí sekundární protilátky a soupravy Renaissance Enhanced Chemiluminiscence Kit (DuPont/Nen, Boston, MA, USA). Extrakty připravené z čerstvých myších varlat obsahují vysokomolekulární látku (asi 294 kDa), která je rozpoznána oběma • · · · · · · ···· • · · · · · · «·« ·· ··· ···· · · afinitně purifikovanými antiséry. Žádná reaktivita vůči tomuto proteinu nebyla pozorována u kteréhokoliv preimunitního séra. Důležité je, že signál získaný z každého afinitně purifikovaného séra byl specificky blokován po preinkubaci protilátky s odpovídajícím imunogenem.
Je možno shrnout, že vysoká hladina MCCS1 mRNA a proteinu byla detegována v myších varlatech, a to ve spermatogoniích a primárních spermatocytěch, tedy buňkách, které jsou v časných stádiích miosy. To naznačuje, že MCCS1 hraje důležitou roli při meiotickém dělení buněk. Miosa je specializovaná forma dělení buněk, která produkuje germinální buňky u vyšších eukaryontů. Miosa se odlišuje od mitosy dvěma charakteristickými vlastnostmi. Zatímco při mitotickém dělení buněk vznikají geneticky totožné buňky obsahující dva od každého chromosomu, miotické dělení buněk má za následek tvorbu buněk obsahujících jeden od každého chromosomu. V časných stádiích miosy, během procesu redukčního dělení se sesterské chromatidy párují a v některých oblastech podléhají reciproční rekombinaci. Během tohoto procesu jsou tyto buňky exponovány zlomům v řetězci DNA. Je pravděpodobné, že buněčná odpověď na zlomy řetězce DNA během miosy je podobná, jako buněčná odpověď, která je pozorována u negerminálních buněk v odpovědi na poškození DNA indukované ozářením. Tato interpretace je dále opodstatněna studiemi, které ukazují, že MEČI je během sporulace regulována na 10- až 20-násobek, což ukazuje, že MCCS1 má, kromě úlohy při opravě DNA, také důležitou úlohu během miosy.
Příklad 9
Za účelem identifikace buněk ve vyvíjejících se varlatech myši, které exprimují MCCS1, byla provedena analýza Western blot na expresi MCCS1 v rámci populace miotických buněk. Extrakty purifikovaných pachytenických spermatocytú, kulatých spermatidů, kondenzujících spermatidů a epididymálních buněk spermatu byly zkoušeny na expresi MCCS1 způsobem popsaným v příkladu 8.
Pachytenické spermatocyty, kulaté a kondenzující spermatidy byly připraveny z vypouzdřených varlat dospělé myši postupnou disociací za použití kolagenasy a trypsinDNasy 1. Buňky byly separovány na oddělené populace na základě sedimentace při jednotkové gravitaci v 2% až 4% BSA gradientu v obohaceném Krebs-Ringerově hydrogenuhličitanovém médiu (Enriched Krebs Ringer Bicarbonate Medium - EKRB). Populace pachytenických spermatocytů a kulatých spermatidů vykazovala vždy alespoň 85% čistotu, zatímco populace kondenzujících spermatidů vykazovala čistotu asi 40 až 50 % (přičemž byla znečištěna především enukleovanými reziduálními tělesy a určitým množstvím kulatých spermatidů). Sperma bylo získáno z cauda epididymides. Purifikované populace spermatogenních buněk byly suspendovány přímo v SDS-vzorkovém pufru s obsahem DTT (40mM) zahřátém na 100°C (5 minut) a množství proteinu v každém vzorku bylo stanoveno postupem Amido-Black.
Nejvyšší hladina proteinu MCCS1 byla nalezena v pachytenických spermatocytech a podstatně nižší hladina byla zjištěna v kulatých spermatidech. V populaci kondenzujících spermatidů byla hladina MCCS1 proteinu ještě nižší, stěží detegovatelné, a to může odrážet přítomnosti kulatých spermatidů v tomto preparátu (viz výše). Analýza Western blot tedy potvrzuje imunocytochemická data a naznačuje roli MCCS1 v miotických buňkách.
» · A · · · · » · · * · · · ···· • · · · · · · ··· ·· ··· AAAA ·· A
Příklad 10
Substráty MCCS1 a proteiny, které interagují s MCCS1 (například členové dráhy kontrolního prvku buněčného cyklu a proteiny lokalizující MCCS1 v buňkách) je možno identifikovat různými zkouškami.
A) Identifikace substrátu
Substráty MCCS1 je možno identifikovat použitím zkoušených sloučenin při zkouškách na kinasovou aktivitu. Kinasa MCCS1 se resuspenduje ve 20 μΐ kinasového pufru (25mM HEPES, pH 7,4, 25mM chlorid draselný, lOmM chlorid hořečnatý, lmM DTT, 2% glycerol, 0,1% NP40, 0,5mM ATP, 10 μθΐ gamma-32P-ATP) a inkubuje 30 minut buď za přítomnosti nebo za nepřítomnosti 4 μg zkoušené sloučeniny (například kaseinu, histonu H1 nebo vhodného substrátového peptidů). Separace reakčních směsí se provádí na 12% gelu PAGE a potom se gel vysuší na papíru Whatman a provede se autoradiografie. Množství fosfátu (v molech) přeneseného kinasou na zkoušenou sloučeninu se měří autoradiografií nebo scintilací. Přenos fosfátu ukazuje, že zkoušená sloučenina je substrátem pro kinasu.
Protein PHAS-1 byl identifikován jako in vitro substrát pro ATR (příklad 4). PHAS-1 je za tepla a v kyselém prostředí stálý protein, který se fosforyluje na několika místech in vivo v odpovědi na inzulín a růstové faktory. PHAS-1 se váže k mRNA faktoru vázajícímu se na čepičku mRNA cap binding factor, EIF-4E a zabraňuje translaci mRNA upravených čepičkou. Fosforylace PHAS-1 na specifickém serinovém zbytku má za následek disociaci PHAS-1 formy EIF-4E, a tedy uvolnění inhibice translace mRNA upravených čepičkou. Tento mechanismus umožňuje rychlou syntézu proteinu v odpovědi na konkrétní stimul. PHAS-1 může být • · · fosforylován několika protein kinasami in vivo, včetně protein kinasy, která je citlivá na rapamycin. Jelikož je rapamycin-sensitivní protein kinasa, FRAP, příbuzná ATR, bylo by rozumné předpokládat, že bude docházet k překrývání substrátové specificity mezi FRAP a ATR a že PHAS-1 bude substrátem pro obě tyto proteinkinasy in vitro. Pro ověření této hypotézy byl ATR imunoprecipitován z buněčného extraktu myších varlat nebo His-označeného ATR purifikovaného z baculovirem infikovaných buněk SF9 (příklad 4) inkubován s 10 μg PHAS-1 (Stratagene) v kinasovém pufru (25mM HEPES, pH 7,4, 25mM chlorid draselný, lOmM chlorid hořečnatý, lmM DTT, 0,1% NM-40), ΙΟμΜ ATP a a 10 pCi 32P-gamma-ATP po dobu 20 minut při 37°C. Jelikož je známo, že fosforylovaný PHAS-1 se váže k papíru z fosfocelulosy, reakční směs byla nanesena na rotační sloupce z fosfocelulosy a podrobena centrifugaci při 2500 x g. Sloupce byly promyty 2 x 0,5 ml 75mM kyseliny fosforečné a 1 x 0,5 ml absolutního ethanolu. Disky z fosfocelulosy byly potom přeneseny do scintilačních nádob a byly změřeny a zaznamenány hodnoty reaktivity přenesené do proteinů PHAS-1 (rozpady za minutu). ATR snadno fosforyluje PHAS-1, zatímco negativní kontroly vykazují jen malou nebo nevykazují žádnou fosforylaci PHAS-1. Pro mapování, který zbytek byl fosforylován, byly syntetizovány následující peptidy reprezentující sekvence PHAS-1 obsahující serinové a threoninové zbytky.
Peptid PH-1
MSGGSSCQTPSRAIPATRR (SEQ ID NO: 36)
Peptid PH-2
GDYSTTPGGTLFSTTPGGTRR (SEQ ID NO: 37)
Peptid PH-3
ECRNSPVTKTRR (SEQ ID NO: 38)
Peptid PH-4
GVTSPSSDEPRR (SEQ ID NO: 39)
Peptid PH-5
MEASQSHLRR (SEQ ID NO: 40) ··· · · · · · »· · · · · · · · · · • · · · · · · *·♦ «· ··· ···· ·· ·
Peptid PH-6
RRNSPEDKJRAGG (SEQ ID NO; 41)
Peptid PH-7
GEESQFEMDIRR (SEQ ID NO: 42)
Tyto peptidy se zkoušely při stejné reakci s kinasou za účelem stanovení, který nebo které peptidy jsou fosforylovány ATR. Tohoto nebo těchto peptidů bylo potom použito jako substrátů pro ATR nebo MCCS1 při stanoveních, jako je stanovení popsané v příkladu 11, za účelem identifikace modulátorů.
Stejné reakce s kinasou bylo také použito pro stanovení, zda jsou proteiny, jako je histon H1 (Upstate Biotechnology lne., Waltham, NY, USA) a myelinový bázický protein (Gibco BRL, Gaithersburg, MD, USA), které jsou známými substráty jiných protein kinas, také substráty pro MCCS1 a ATR. Za podmínek tohoto stanovení nebyla zjištěna žádná fosforylace u histonu Hl, ani myelinového bázického proteinu. Kromě toho nebyl při této zkoušce fosforylován ani peptid z p53, o němž je známo, že je substrátem pro DNA-PK.
B) Identifikace interagujících proteinů
Interagující proteiny je možno identifikovat následujícími zkouškami:
První zkouška prováděná podle vynálezu představuje dvouhybridový screening. Dvouhybridový systém byl vyvinut v kvasinkách (Chien et al., Proč. Nati. Acad. Sci. USA 88: 9578 až 9582 (1991)) a je založen na funkční in vivo rekonstituci trankripčního faktoru, který aktivuje reporterový gen. Konkrétně se polynukleotid kódující protein, který • · ··· · interaguje s MCCS1 izoluje tak, že se vhodné hostitelské buňky transformují nebo transfekují DNA konstruktem zahrnujícím reporterový gen, který je pod kontrolou promotoru regulovaného transkripčním faktorem obsahujícím vazebnou doménu DNA a aktivační doménu; v hostitelských buňkách se exprimuje první hybridní sekvence DNA kódující první fúzovaný produkt části nebo celé MCCS1 a bud vazebné domény DNA nebo aktivační domény transkripčního faktoru; v hostitelských buňkách se exprimuje knihovna sekvencí druhé hybridní DNA kódující druhý fúzovaný produkt části nebo všech vazebných proteinů putativní MCCS1 a vazebné domény DNA nebo aktivační domény transkripčního faktoru, jež nebyla zavedena do prvního fúzovaného produktu; deteguje se vazba proteinu interagujícího s MCCS1 k MCCS1 v konkrétní hostitelské buňce detekcí produkce produktu reporterového genu v hostitelské buňce; a z této konkrétní hostitelské buňky se izolují sekvence druhé hybridní DNA kódující interagující protein.
V současné době se při provádění této zkoušky přednostně používá promotoru lexA pro pohánění exprese reporterového genu, lacZ reporterového genu, transkripčního faktoru obsahujícího vazebnou doménu DNA lexA a transaktivační doménu GAL4 a kvasinkových hostitelských buněk.
Jiná stanovení pro identifikaci proteinů, které interagují s MCCS1, mohou zahrnovat imobilizaci MCCS1 nebo zkušebního proteinu, detegovatelné značení neimobilizovaného vazebného partnera, společnou inkubaci vazebných partnerů a stanovení množství navázaného značícího činidla. Navázané značící činidlo ukazuje, že zkoušený protein interaguje s MCCS1.
Jiný typ stanovení, kterým se identifikují proteiny interagující s MCCS1, zahrnuje imobilizaci MCCS1 nebo jejího fragmentu na pevném nosiči, který je potažen (nebo který je napuštěn) fluorescentním činidlem, značení zkoušeného
proteinu sloučeninou schopnou excitovat fluorescentní činidlo, kontaktování imobilizovaného MCCS1 se značeným zkoušeným proteinem, detekci světelné emise fluorescentního činidla a identifikaci interagujících proteinů, jakožto zkoušených proteinů vyvolávajících emisi světla fluorescentního činidla. Alternativně je při této zkoušce možno imobilizovat putativní interagující protein a značit MCCS1.
Příklad 11
Modulátory MCCS1 zahrnují varianty MCCS1 a jiné molekuly. Tyto modulátory mohou ovlivňovat MCCS1 kinasovou aktivitu, její umístění v buňce a/nebo její interakci se členy dráhy kontrolního prvku buněčného cyklu. V současné době jsou za přednostní oblasti MCCS1, které představují cíle pro mutaci nebo vývoj selektivních modulátorů, považovány následující čtyři oblasti: MCCSla aminoterminální efektorová doména (aminokyseliny 1 až 1081 ze SEQ ID NO:
31), MCCSip aminoterminální efektorová doména (aminokyseliny 1 až 1150 ze SEQ ID NO: 33), MCCSla rad3+ doména (aminokyseliny 1082 až 2082 ze SEQ ID NO: 31), MCCSlp rad3+ doména (aminokyseliny 1151 až 2151 ze SEQ ID NO: 33), MCSSla PIK doména (aminokyseliny 2083 až 2410 ze SEQ ID NO: 31) a MCSSip PIK doména (aminokyseliny 2152 až 2480 ze SEQ ID NO: 33).
Varianty MCCS1 vykazující mutace v kinasové doméně mohou být užitečné jako radiosensitizační činidla. Do rozsahu vynálezu spadají především mutace spočívající v tom, že se v MCCSla nahradí kyselina aspartová v aminokyselinové poloze 2241, asparagin v aminokyselinové poloze 2246 a kyselina aspartová v aminokyselinové poloze 2260 SEQ ID NO: 31 alaninem nebo methioninem. Také sem spadají odpovídající mutace MCCSip. Analogické mutace v rad3+ genu mají za následek vznik kvasinek, které jsou hypersensitivní vůči radiaci.
·· ···· * ··
Kromě toho se mutace kinasové domény ATM vyskytují u pacientů s AT, což je choroba vyvolávající citlivost vůči ozáření.
Za použití podobných stanovení, jako jsou stanovení výše popsaného typu, se mohou na modulační aktivitu zkoušet dále také kombinatoriální knihovny, peptidy a mimetika peptidů, definované chemické látky, oligonukleotidy a knihovny přírodních produktů.
Zkouška zaměřená na identifikaci modulátorů aktivity kinasy MCCS1 se například provádí tak, že se přípravek obsahující kinasu MCCS1 v kinasovém pufru inkubuje s gamma-32P-ATP a exogenním substrátem pro kinasu jednak za přítomnosti a jednak za nepřítomnosti zkoušené sloučeniny a měří se počet molů fosfátu přeneseného na substrát. Tak například se 2 μί 50mM imidazolového elučního vzorku přidají ke kinasovému pufru (viz příklad 6), reakční směs se inkubuje při 37’C po dobu 20 minut, vzorky se analyzují SDS page a poté podrobí autoradiografii nebo analýze Western. Zvýšení počtu molů fosfátu přeneseného na substrát za přítomnosti zkoušené sloučeniny ve srovnání s počtem molů fosfátu přeneseného na substrát za nepřítomnosti zkoušené sloučeniny ukazuje, že zkoušená sloučenina je aktivátorem této kinasy MCCS1. Naopak, snížení počtu molů fosfátu přeneseného na substrát za přítomnosti zkoušené sloučeniny ve srovnání s počtem molů fosfátu přeneseného na substrát za nepřítomnosti zkoušené sloučeniny ukazuje, že modulátor je inhibitorem této kinasy MCCS1.
Zkoušení zaměřené na identifikaci sloučenin, které modulují interakci MCCS1 s jinými proteiny se může provést dále uvedeným způsobem: Vhodná hostitelská buňka se transformuje nebo transfekuje konstruktem DNA zahrnujícím reporterový gen, který je pod kontrolou promotoru regulo···· ·· · • · · · • · · · • · · · · • · • ·· · váného transkripčním faktorem obsahujícím vazebnou doménu DNA a aktivační doménu; v hostitelských buňkách se exprimuje první hybridní sekvence DNA kódující první fúzovaný produkt části nebo celé MCCS1 a vazebné domény DNA nebo aktivační domény transkripčního faktoru; v hostitelských buňkách se exprimuje sekvence druhé hybridní DNA kódující část nebo celý protein, který interaguje s MCCS1 a vazebnou doménu DNA nebo aktivační doménu transkripčního faktoru, jež nebyla zavedena do prvního fúzovaného produktu. Účinek zkoušené sloučeniny na interakci mezi MCCS1 a proteinem se provádí detekcí vazby proteinu interagujícího s MCCS1 k MCCS1 v konkrétní hostitelské buňce měřením produkce produktu reporterového genu v hostitelské buňce za přítomnosti nebo za nepřítomnosti zkoušené sloučeniny; a identifikují se modulační sloučeniny, jako ty sloučeniny, které mění produkci produktu reporterového genu ve srovnání s produkcí produktu reporterového genu za nepřítomnosti modulační sloučeniny. V současné době se při provádění této zkoušky přednostně používá promotoru lexA pro pohánění exprese reporterového genu, lacZ reporterového genu, transkripčního faktoru obsahujícího DNA vazebnou doménu lexA a transaktivační doménu GAL4 a kvasinkových hostitelských buněk.
Jiný typ stanovení pro identifikaci sloučenin, které modulují interakci MCCS1 s interagujícím proteinem, mohou zahrnovat imobilizaci MCCS1 nebo přírodního proteinu interaguj ícího s MCCS1, detegovatelné značení neimobilizovaného vazebného partnera, společnou inkubaci vazebných partnerů a stanovení účinku zkoušené sloučeniny na množství navázaného značícího činidla. Snížení množství navázaného značícího činidla za přítomnosti zkoušené sloučeniny ve srovnání s množstvím navázaného značícího činidla za nepřítomnosti zkoušené sloučeniny ukazuje, že zkoušené činidlo je inhibitorem interakce mezi MCCS1 a proteinem. Naopak, zvýšení množství navázaného značícího činidla za • · přítomnosti zkoušené sloučeniny ve srovnání s množstvím navázaného značícího činidla za nepřítomnosti zkoušené sloučeniny ukazuje, že putativní modulátor je aktivátorem interakce mezi MCCS1 a proteinem.
Ještě další typ stanovení, kterého se podle vynálezu používá pro identifikaci sloučenin modulujících vazbu mezi MCCS1 a interagujícím proteinem, zahrnuje imobilizaci MCCS1 nebo jejího fragmentu na pevném nosiči, který je potažen (nebo který je napuštěn) fluorescentním činidlem, značení interagujícího proteinu sloučeninou schopnou excitovat fluorescentní činidlo, kontaktování imobilizovaného MCCS1 se značeným interagujícím proteinem za přítomnosti nebo nepřítomnosti zkoušené sloučeniny, detekci světelné emise fluorescentního činidla a identifikaci modulujících sloučenin, jakožto zkoušených sloučeniny, které ovlivňují emisi světla fluorescentního činidla ve srovnání s emisí světla fluorescentního činidla za nepřítomnosti zkoušené sloučeniny. Alternativně je při této zkoušce možno imobilizovat protein interagující s MCCS1 a značit MCCS1.
Příklad 12
Komplementační zkoušky na bázi buněk pro identifikaci modulátorů MCCS1 nebo ATM jsou popsány dále.
Při jednom typu stanovení se hostitelské buňky (například kvasinkové buňky esrl-1) transformují DNA kódující MCCS1 způsobem popsaným v příkladu 4. Kvasinkový kmen esrl-1 je normálně citlivý vůči působení ultrafialového světla, ale kvasinkové buňky esrl-1 exprimující MCCS1 nebo ATR již citlivé vůči působení UV světla nejsou. Transformované kvansinkové buňky se exponují zkoušeným sloučeninám a stanovuje se účinek zkoušených sloučenin na UV sensitivitu transformovaných hostitelských buněk. Pokud jsou • · · · zkoušené sloučeniny inhibitory aktivity MCCS1 nebo ATR, vrací UV sensitivitu buňkám esrl-1 transformovaným v MCCSl. Alternativně se místo kvasinkových buněk esrl-1 používá jako hostitelských buněk dvojnásobných mutantních kvasinkových buněk esrl-1 telí. Gen TELÍ je homologní vzhledem k ATM.
TELÍ mutace je popsána v Morrow et al., Cell, 82: 831 až 840 (1995). Podle vynálezu je možno konkrétně také DNA kódující ATM (SEQ ID NO: 34) transformovat mutantní hostitelské kvasinky esrl-1 nebo dvojnásobně mutantní hostitelské kvasinky esrl-1 telí.
V alternativním provedení zahrnují tato stanovení použití klastogenních činidel nebo postupů místo ošetření UV zářením. Může se například použít zpracování infračerveným zářením, hydroxymočovinou nebo činidly poškozujícími DNA. Jako vhodné hostitelské buňky pro taková provedení přicházejí v úvahu buňky, které jsou citlivé vůči takovým alternativním klastogenním činidlům nebo postupům.
Při jiném typu komplementačního stanovení se používá savčích hostitelských buněk, jako jsou buněčné linie pocházející z buněk AT pacientů. Jak to bylo popsáno výše v souvislosti s kvasinkovými buňkami, savčí buňky se transfekují DNA kódující MCCSl, ATR nebo ATM a potom exponují zkoušeným sloučeninám. Pokud jsou zkoušené sloučeniny inhibitory aktivity MCCSl, ATR nebo ATM, navracejí buňkám příslušný fenotyp netransformovaných hostitelských buněk (například citlivost vůči infračervenému záření).
Výše uvedených stanovení se může použít pro identifikaci sloučenin, které inhibují aktivitu MCCSl, ATR a ATM nebo sloučenin, které inhibují aktivitu pouze jednoho z těchto enzymů.
Při alternativním typu stanovení se mohou kvasinkové nebo savčí hostitelské buňky transformovat DNA kódující chimérické polypeptidy zahrnující různé kombinace domén MCCS1 a ATM. MCCS1 a ATM vykazují strukturní podobnosti a chimérické polypeptidy obsahující části MCCS1 a ATM jsou užitečné pro objasnění aktivních míst a vazebných domén jak MCCS1, tak ATM. Polynukleotidy kódující tyto chimérické polypeptidy je možno připravit standardními technikami molekulární biologie, které jsou známy odborníkům v tomto oboru a jejichž příklady jsou uvedeny v tomto popisu. Chimérické polypeptidy se exprimují v hostitelských buňkách a modulátory těchto chimér je možno identifikovat za použití stanovení uvedených v tomto popisu.
Příklad 13
Jak MCCS1, tak ATM se podílí na kontrolních prvcích miosy I. Jelikož, jak bylo ukázáno, MCCS1 vykazuje kinasovou aktivitu, byly provedeny zkoušky zaměřené na zjištění, zda ATM také vykazuje kinasovou aktivitu. Pro stanovení kinasové aktivity ATM byl ATM imunoprecipitován z fibroblastů MRC-5 (ATCC # 171-CCL) polyklonálním antisérem 6076. Buňky MRC-5 jsou diploidní fibroblasty plic lidského embrya. Buňky MRC-5 byly získány od ATCC v pasáži 19 a uchovávány v minimálním esenciálním médiu (MEM) doplněném fetálním hovězím sérem (10%), penicilinem (100 U/ml), streptomycinem (100 mg/ml) a neesenciálními aminokyselinami (lOOmM). Médium a jeho doplňky byly získány od firmy Gibco Life Technologies. Buněčné linie byly uchovávány v inkubátoru nasyceném vodou o teplotě 37°C s 5 % C. Extrakty buněk MRC-5 byly připraveny v lOcm miskách lysí buněk v logaritmické fázi v 0,5 ml lysačního pufru I (50mM fosforečnan sodný, pH 7,2; 0,5% Triton X-100; 2mM EDTA; 2mM EGTA; 25mM fluorid sodný; 25mM 2-glycerofosfát; lmM fenylmethylsulfonylfluorid (PMSF); 1 μg/ml leupeptin, 1 μς/πιΐ pepstatin A; 2mM DTT) na ledu.
Buňky byly seškrabány z misek pomocí gumové špachtle a potom zpracovány ultrazvukem v zařízení Sonifier 250 (Branson Ultrasonics Corp., Danbury, CT, USA) při 100% výkonu po dobu 90 sekund. Lysáty byly vyčeřeny dvouminutovým odstřeďováním při 4°C v mikrocentrifuze. Předběžné čeření bylo provedeno za použití 10 μg purifikovaného králičího IgG (Zymed) a 30 μΐ suspenze Protein A - agarosy (Pierce). Poté následovala inkubace (60 minut při 4°C za protřepávání směsi). K předčeřeným lysátům bylo přidáno 10 μg afinitně purifikovaného antiséra 6076 (nebo 10 μg antiséra 6076 předběžně blokovaného po dobu 30 minut za použití 0,04 mg peptidu P45) a směs byla 60 minut inkubována na ledu. Imunoprecipitáty byly shromážděny přídavkem 30 μΐ suspenze Protein A - agarosy a následující inkubací (30 minut při 4eC za protřepávání směsi). Následovalo čtyřnásobné promytí v lysačním pufru I.
Reakce s kinasou byla provedena postupem, který lze v krátkosti popsat takto: imunoprecipitát se jednou promyje kinasovým pufrem (25μΜ HEPES, pH 7,7; 50mM chlorid draselný; lOmM chlorid hořečnatý; 0,1% NP-40; 2% glycerol; lmM DTT) a poté se provede inkubace ve 20 μΐ kinasového pufru obsahujícího 10μΜ ATP + 10 μΟί gamma-32P-ATP (50 Ci/mmol) během 20 minut při 37°C. Reakce se zastaví přídavkem 20 μΐ 2X SDS vzorkového pufru a pětiminutovým vařením. Provede se separace na 6% polyakrylamidovém gelu s SDS. Gely se vysuší a exponují na rentgenografický film (Kodak, XAR-5) při -80°C přes noc.
lOcm misky s buňkami MRC-5 v logaritmické fázi se jednou opláchnou PBS a potom inkubují v Dulbeccem modifikovaném Eaglově médiu (bez methioninu) s obsahem dialyzovaného fetálního hovězího séra (2 %) po dobu 30 minut. Buňky se označí přídavkem 200 μΟί 35S-methioninu (1000 Ci/mmol TRAN35S-LABEL, ICN Radiochemicals) po dobu 2 hodin. Ozna- 65 • · 9 999
999 9 • · ·· 9 čené buňky se jednou promyjí PBS a před imunoprecipitací se zmrazí při 80°C.
Inkubací imunoprecipitovaných komplexů v kinasovém pufru se získá fosforylovaný produkt s molekulovou hmotností přibližně 350 000, který v polyakrylamidových gelech migruje společně s ATM. Podobné výsledky se získají v případě imunitních komplexů ATR, které jsou imunoprecipitovány antiAgDH-2 (MCCS1) polyklonálním antisérem z příkladu 5. Zdá se tedy, že ATR a ATM jsou schopny aurofosforylace nebo asociace s protein kinasou.
Pro stanovení úlohy ATR a ATM při miose se pro lokalizaci ATR a ATM v miotických chromosomech použije techniky imunobarvení povrchu rozprostřených myších spermatocytů. Použije se protilátek rozpoznávajících ATR a ATM a myších protilátek proti Corl. Corl je složkou axiálních/laterálních prvků synapse chromosomů (Dobson et al., J. Cell. Sci., 107: 2749 až 2760 (1984)). K Corl chromosomálnímu barvení dochází, když se začínají formovat axiální prvky mezi sesterskými chromatidy každého homologu v leptonema nebo miotické profázi, před zahájením synapse. Při synapsi homologních bivalentů se k sobě přiřadí axiální prvky ze dvou homologů a mezi nimi se vytvoří centrální prvek doplňující tuto strukturu, která se označuje názvem synaptonemální komplex (SC).
Když se začínají objevovat krátké úseky Corl, před jakoukoliv známkou synapse, nelze detegovat ani ATR ani ATM. Když homology zahájí synapsi, oba tyto proteiny jsou pozorovány u párovacích vidliček (pairing forks); umístění a chování těchto dvou proteinů se však významně liší. U normálních zygotenních jader je ve stádiu, během kterého dochází k synapsi homologů, ATR pozorován v malých množstvím a přechodně v oddělených ohniscích podél asynaptických ·· ·· ···· • · · ··· · • · ·· · (nepárovaných) os. Když dojde k synapsi homologů, ATR z těchto míst vymizí. V oblastech, ve kterých je synapse zpožděna, je však často v blízkosti proximálních konců autosomálních bivalentů pozorována akumulace ohnisek ATR podél os, u nichž nedošlo k synapsi. ATR byl detegován v podobných místech u těchto dvou axiálních prvků. V jádrech, ve kterých celý autosom nenašel svého homologního pérovací ho partnera, jsou ohniska ATR detegovatelná podél celé délky těchto os, u nichž neproběhla synapse. U samců, u nichž chromosom X nemá žádný homolog, jsou ohniska ATR rozmístěna podél nepárované osy.
Také ATM byl vizualizován v podobě ohnisek a byl poprvé detegován během zygonema při synapsi homologů. Rozmístění ATM se však liší od rozmístění ATR. ATM byl poprvé pozorován podél synaptických os, když přišly do styku homologní autosomální axiální prvky. Během středního pachynema, po dokončení autosomální synapse byla však ohniska ATM pozorována na ose chromosomu X. Lokalizace ATM zůstala zachována v plně synaptovaných bivalentech i v pachynema, což je podstádium, které trvá 3 dny u myších oocytů a 6 dnů u myších spermatocytů. Během pachynema se počet ohnisek postupně snižuje, krátce se ustaluje ve středním pachynema a nakonec mizí ve středním až pozdním pachynema. ATR a ATM protein kinasy tedy hrají důležité a komplementární role v různých stádiích miosy I.
Účast ATR během časné miotické profáze je zřejmě přechodná, zatímto úloha ATM se zdá být delší. Jak ATR, tak ATM však koordinují různé procesy miotické profáze tím, že zajišťují podobné funkce kontrolních prvků.
Výše uvedené ilustrativní příklady se vztahují k provedení vynálezu, kterým se v současné době dává přednost. Odborníkům v tomto oboru je však zřejmé, že může ·· ····
existovat celá řada modifikací a variací vynálezu, přičemž všechny takové modifikace a variace spadají do rozsahu ochrany tohoto vynálezu, pokud se na ně vztahují dále uvedené patentové nároky.
·· ··· ·
SEZNAM SEKVENCÍ (1) OBECNÉ INFORMACE:
(i) PŘIHLAŠOVATEL: ICOS Corporation (ii) NÁZEV VYNÁLEZU: Kinasa příbuzná PIK kontrolního prvku buněčného cyklu, látky a způsoby (iii) POČET SEKVENCÍ: 42 (iv) ADRESA PRO KORESPONDENCI:
(A) ADRESÁT: Marshall, 0'Toole, Gerstein, Murray & Borun
(B) ULICE: 6300 Sears Tower, 233 S. Wacker Drive
(C) MĚSTO: Chicago
(D) STÁT: Illinois
(E) ZEMĚ: USA
(F) PSČ: 60606 (ZIP)
(v) STROJNĚ ČITELNÁ FORMA:
(A) TYP MEDIA: Disketa (B) POČÍTAČ: IBM PC kompatibilní (C) OPERAČNÍ SYSTÉM: PC-DOS/MS-DOS (D) SOFTWARE: Patentin Release #1.0, verze #1.30 (vi) DATA VZTAHUJÍCÍ SE K TÉTO PŘIHLÁŠCE:
(A) ČÍSLO PŘIHLÁŠKY: PV 2547-97 (B) DATUM PODÁNÍ: 11. 8. 1997 (C) ZATŘÍDĚNÍ:
(viii) INFORMACE O ZÁSTUPCI:
(A) JMÉNO: Advokátní a patentová kancelář
Čermák-Hořej š-Vrba (C) SPISOVÁ ZNAČKA: 01-1656-97-Če (ix) INFORMACE O TELEKOMUNIKAČNÍM SPOJENÍ (A) TELEFON: 02/24 211 678 (B) TELEFAX: 02/2421 4187 (C) TELEX: 122 991 APPC (2) INFORMACE O SEQ ID NO:1:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 7621 bázových párů (B) TYP: nukleová kyselina (C) ŘETÉZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: pBSHFB2HT2-27 (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 333..7559 (xi) POPIS SEKVENCE: SEQ ID NO: 1:
CTTGTGAAGA GAATGTTTTA CACTCTTGTT agtgaagttt ATTCTTTAAA AGTCAATCGT 60
CAAGGATTTA GCAKaTGAAT TAGCACTTCG gatatacttg TTTATTTAAT atcttttttg 120
TTTATTTCAA AGAATTCAGT AATTGGATCA taacgagact TCTGCGGATT GCAGCAACTC 180
CCTCCTGTCA TTTGTTACAC AAGAAAATCT gtgaagtcat CTGTTCATTA TTATTTCTTT 240
TTAAAAGCAA GAGTCCTGCT atttttgggg tactcacaaa AGAATTATTA CAACTTTTTG 300
AAGACTTGGT
TTACCTCCAT
AGAAGAAATG
TG ATG GGT
CAT GCT GTG
GAA TGG
Met 1 Gly His Ala Val 5 Glu Trp
CCA GTG GTC ATG AGC CGA TTT TTA AGT CAA TTA GAT GAA CAC ATG GGA
Pro Val Val Mec Ser Arg Phe Leu Ser Gin Leu Asp Glu His Met Gly
10 15 20
TAT TTA CAA TCA GCT CCT TTG CAG TTG ATG AGT ATG CAA AAA TTA GAA
Tyr Leu Gin Ser Ala Pro Leu Gin Leu Met Ser Met Gin Lys Leu Glu
25 30 35
TTT ATT GAA GTC ACT TTA TTA ACG GTT CTT ACT CGT ATT ATT GCA ATT
Phe Ile Glu Val Thr Leu Leu τη ι- Val Leu Thr Arg Ile Ile Ala Ile
4 0 45 50 55
GTG TTT TTT AGA AGG CAA GAA στό TTA CTT TGG CAG ATA GGT TGT GTT
Val Phe Phe Arg Arg Gin Glu Leu Leu Leu Trp Gin Ile Gly Cys Val
60 65 70
CTG CTA GAG TAT GGT AGT CCA AAA ATT AAA TCC CTA GCA ATT AGC TTT
Leu Leu Glu Tyr Gly Ser Pro Lys Ile Lys Ser Leu Ala Ile Ser Phe
75 80 85
TTA ACA GAA CTT TTT CAG CTT GGA GGA CTA CCA GCA CAA CCA GCT AGC
Leu Thr Glu Leu Phe Gin Leu Gly Gly Leu Pro Ala Gin Pro Ala Ser
90 95 100
ACT TTT TTC AGC TCA TTT TTG GAA TTA TTA AAA CAC CTT GTA GAA ATG
Thr Phe Phe Ser Ser Phe Leu Glu Leu Leu Lys His Leu Val Glu Met
105 110 115
GAT ACT GAC CAA TTG AAA CTC TAT GAA GAG CCA TTA TCA AAG CTG ATA
Asp Thr Asp Gin Leu Lys Leu Tyr Glu Glu Pro Leu Ser Lys Leu Ile
120 125 130 135
AAG ACA CTA TTT CCC TTT GAA GCA GAA GCT TAT AGA AAT ATT GAA CCT
Lys Thr Leu Phe Pro Phe Glu Ala Glu Ala Tyr Arg Asn Ile Glu Pro
140 145 150
GTC TAT TTA AAT ATG CTG CTG GAA AAA CTC TGT GTC ATG TTT GAA GAC
Val Tyr Leu Asn Met Leu Leu Glu Lys Leu Cys Val Met Phe Glu Asp
155 160 165
GGT GTG CTC ATG CGG CTT AAG TCT GAT TTG CTA AAA GCA GCT TTG TGC
Gly Val Leu Met Arg Leu Lys Ser Asp Leu Leu Lys Ala Ala Leu Cys
170 175 180
CAT TTA CTG CAG TAT TTC CTT AAA TTT GTG CCA GCT GGG TAT GAA TCT
His Leu Leu Gin Tyr Phe Leu Lys Phe Val Pro Ala Gly Tyr Glu Ser
185 190 195
GCT TTA CAA GTC AGG AAG GTC TAT GTG AGA AAT ATT TGT AAA GCT CTT
Ala Leu Gin Val Arg Lys Val Tyr Val Arg Asn Ile Cys Lys Ala Leu
200 205 210 215
353
401
449
497
545
593
641
689
737
785
833
881
929
977 • · · · · ·
TTG Leu GAT Asp GTG Val CTT Leu GGA Gly 220 ATT GAG GTA GAT GCA GAG TAC Tyr TTG TTG GGC CCA 1025
Ile Glu Val Asp Ala 225 Glu Leu Leu Gly 230 Pro
CTT TAT GCA GCT TTG AAA ATG GAA AGT ATG GAA ATC ATT GAG GAG ATT 1073
Leu Tyr Ala Ala 235 Leu Lys Met Glu Ser 240 Met Glu Ile Ile Glu 245 Glu Ile
CAA TGC CAA ACT CAA CAG GAA AAC CTC AGC AGT AAT AGT GAT GGA ATA 1121
Gin Cys Gin 250 Thr Gin Gin Glu Asn 255 Leu Ser Ser Asn Ser 260 Asp Gly Ile
TCA ccc AAA AGG CGT CGT CTC AGC TCG TCT CTA AAC CCT TCT AAA AGA 1169
Ser Pro 265 Lys Arg Arg Arg Leu 270 Ser Ser Ser Leu Asn 275 Pro Ser Lys Arg
GCA CCA AAA CAG ACT GAG GAA ATT AAA CAT GTG GAC ATG AAC CAA AAG 1217
Al 3 2Θ0 Pro Lys Gin Thr Glu 285 Glu Ile Lys His Val 290 Asp Met Asn Gin Lys 295
AGC ATA TTA TGG AGT GCA CTG AAA CAG AAA GCT GAA TCC CTT CAG ATT 1265
Ser Ile Leu Trp Ser 300 Ala Leu Lys Gin Lys 305 Ala Glu Ser Leu Gin 310 Ile
TCC CTT GAA TAC AGT GGC CTA AAG AAT CCT GTT ATT GAG ATG TTA GAA 1313
Ser Leu Glu Tyr 315 Ser Gly Leu Lys Asn 320 Pro Val Ile Glu Met 325 Leu Glu
GGA ATT GCT GTT GTC TTA CAA CTG ACT GCT CTG TGT ACT GTT CAT TGT 1361
Gly Ile Ala 330 Val Val Leu Gin Leu 335 Thr Ala Leu Cys Thr 340 Val His Cys
TCT CAT CAA AAC ATG AAC TGC CGT ACT TTC AAG GAC TGT CAA CAT AAA 1409
Ser His 345 Gin Asn Met Asn Cys 350 Arg Thr Phe Lys Asp 355 Cys Gin His Lys
TCC AAG AAG AAA CCT TCT GTA GTG ATA ACT TGG ATG TCA TTG GAT TTT 1457
Ser 360 Lys Lys Lys Pro Ser 365 Val Val Ile Thr Trp 370 Met Ser Leu Asp Phe 375
TAC ACA ACA GTG CTT AAG AGC TGT AGA AGG TTG TTA GAA TCT GTT CAG 1505
Tyr Thr Thr Val Leu 380 Lys Ser Cys Arg Arg 385 Leu Leu Glu Ser Val 390 Gin
AAA CGG ACT GGA GGC AAC ATT GAT AAG GTG GTG AAA ATT TAT GAT GCT 1553
Lys Arg Thr Gly 395 Gly Asn Ile Asp Lys 400 Val Val Lys Ile Tyr 405 Asp Ala
TTG ATT TAT ATG CAA GTA AAC AGT TCA TTT GAA GAT CAT ATC CTG GAA 1601
Leu Ile Tyr 410 Met Gin Val Asn Ser 415 Ser Phe Glu Asp His 420 Ile Leu Glu
GAT TTA TGT GGA ATG CTC TCA CTT CCA TGG ATT TAT TCC CAT TCT GAT 1649
Asp Leu 425 Cys Gly Met Leu Ser 430 Leu Pro Trp Ile Tyr 435 Ser His Ser Asp
GAT GGC TGT TTA AAG TTG ACC ACA TTT GCC GCT AAT CTT CTA ACA TTA 1697
Asp 440 Gly Cys Leu Lys Leu 445 Thr Thr Phe Ala Ala 450 Asn Leu Leu Thr Leu 455
AGC TGT AGG ATT TCA GAT AGC TAT TCA CCA CAG GCA CAA TCA CGA TGT 1745
Ser Cys Arg Ile Ser 460 Asp Ser Tyr Ser Pro 465 Gin Ala Gin Ser Arg 4 70 Cys
GTG TTT CTT CTG ACT CTG TTT CCA AGA AGA ATA TTC CTT GAG TGG AGA 1793
Val Phe Leu Leu 475 Thr Leu Phe Pro Arg 480 Arg Ile Phe Leu Glu 485 Trp Arg
• · ♦ · · ·
ACA GCA GTT TAC AAC Tyr Asn TGG Trp GCC Ala CTG Leu 495 CAG AGC TCC CAT GAA GTA ATC Ile CGG Arg 1841
Thr Ala Val 490 Gin Ser Ser His Glu 500 Val
GCT AGT TGT GTT AGT GGA TTT TTT ATC TTA TTG CAG CAG CAG AAT TCT 1889
Ala Ser Cys Val Ser Gly Phe Phe Ile Leu Leu Gin Gin Gin Asn Ser
505 510 515
TGT AAC AGA GTT CCC AAG ATT CTT ATA GAT AAA GTC AAA GAT GAT TCT 1937
Cys Asn Arg Val Pro Lys Ile Leu Ile Asp Lys Val Lys Asp Asp Ser
520 525 530 535
GAC ATT GTC AAG AAA GAA TTT GCT TCT ATA CTT GGT CAA CTT GTC TGT 1985
Asp Ile Val Lys Lys Glu Phe Ala Ser Ile Leu Gly Gin Leu Val Cys
540 545 550
ACT CTT CAC GGC ATG TTT TAT CTG ACA AGT TCT TTA ACA GAA CCT TTC 2033
Thr Leu His Gly Met Phe Tyr Leu Thr Ser Ser Leu Thr Glu Pro Phe
555 560 565
TCT GAA CAC GGA CAT GTG GAC CTC TTC TGT AGG AAC TTG AAA GCC ACT 2081
Ser Glu His Gly His Val Asp Leu Phe Cys Arg Asn Leu Lys Ala Thr
570 575 580
TCT CAA CAT GAA TGT TCA TCT TCT CAA CTA AAA GCT TCT GTC TGC AAG 2129
Ser Gin His Glu Cys Ser Ser Ser Gin Leu Lys Ala Ser Val Cys Lys
585 590 595
CCA TTC CTT TTC CTA CTG AAA AAA AAA ATA CCT AGT CCA GTA AAA CTT 2177
Pro Phe Leu Phe Leu Leu Lys Lys Lys Ile Pro Ser Pro Val Lys Leu
600 605 610 615
GCT TTC ATA GAT AAT CTA CAT CAT CTT TGT AAG CAT CTT GAT TTT AGA 2225
Ala Phe Ile Asp Asn Leu His His Leu Cys Lys His Leu Asp Phe Arg
620 625 630
GAA GAT GAA ACA GAT GTA AAA GCA GTT CTT GGA ACT TTA TTA AAT TTA 2273
Glu Asp Glu Thr Asp Val Lys Ala Val Leu Gly Thr Leu Leu Asn Leu
635 640 645
ATG GAA GAT CCA GAC AAA GAT GTT AGA GTG GCT TTT AGT GGA AAT ATC 2321
Met Glu Asp Pro Asp Lys Asp Val Arg Val Ala Phe Ser Gly Asn Ile
650 655 660
AAG CAC ATA TTG GAA TCC TTG GAC TCT GAA GAT GGA TTT ATA AAG GAG 2369
Lys His Ile Leu Glu Ser Leu Asp Ser Glu Asp Gly Phe Ile Lys Glu
665 670 675
CTT TTT GTC TTA AGA ATG AAG GAA GCA TAT ACA CAT GCC CAA ATA TCA 2417
Leu Phe Val Leu Arg Met Lys Glu Ala Tyr Thr His Ala Gin Ile Ser
680 685 690 695
AGA AAT AAT GAG CTG AAG GAT ACC TTG ATT CTT ACA ACA GGG GAT ATT 2465
Arg Asn Asn Glu Leu Lys Asp Thr Leu Ile Leu Thr Thr Gly Asp Ile
700 705 710
GGA AGG GCC GCA AAA GGA GAT TTG GTA CCA TTT GCA CTC TTA CAC TTA 2513
Gly Arg Ala Ala Lys Gly Asp Leu Val Pro Phe Ala Leu Leu His Leu
715 720 725
TTG CAT TGT TTG TTA TCC AAG TCA GCA TCT GTC TCT GGA GCA GCA TAC 2561
Leu His Cys Leu Leu Ser Lys Ser Ala Ser Val Ser Gly Ala Ala Tyr
730 735 740
ACA GAA ATT AGA GCT CTG GTT GCA GCT AAA AGT GTT AAA CTG CAA AGT 2609
Thr Glu Ile Arg Ala Leu Val Ala Ala Lys Ser Val Lys Leu Gin Ser
745 750 755
TTT TTC AGC CAG TAT AAG ΑΛΛ CCC ATC TGT CAG TTT TTG GTA GAA TCC 2657
Phe 760 Phe Ser Gin Tyr Lys 765 Lys Pro Ile Cys Gin 770 Phe Leu Val Glu Ser 775
CTT CAC TCT AGT CAG ATG ACA GCA CTT CCG AAT ACT CCA TGC CAG AAT 2705
Leu His Ser Ser Gin 780 Met Thr Ala Leu Pro 785 Asn Thr Pro Cys Gin 790 Asn
GCT GAC GTG CGA AAA CAA GAT GTG GCT CAC CAG AGA GAA ATG GCT TTA 2753
Ala Asp Val Arg 795 Lys Gin Asp Val Ala 800 His Gin Arg Glu Met 805 Ala Leu
AAT ACG TTG TCT GAA ATT GCC AAC GTT TTC GAC TTT CCT GAT CTT AAT 2801
Asn Thr Leu 810 Ser Glu Ile Ala Asn 815 Val Phe Asp Phe Pro 820 Asp Leu Asn
CGT TTT CTT ACT AGG ACA TTA CAA GTT CTA CTA CCT GAT CTT GCT GCC 2849
Arg Phe 825 Leu Thr Arg Thr Leu 830 Gin Val Leu Leu Pro 835 Asp Leu Ala Ala
AAA GCA AGC CCT GCA GCT TCT GCT CTC ATT CGA ACT TTA GGA AAA CAA 2897
Lys 840 Ala Ser Pro Ala Ala 845 Ser Ala Leu Ile Arg 850 Thr Leu Gly Lys Gin 855
TTA AAT GTC AAT CGT AGA GAG ATT TTA ATA AAC AAC TTC AAA TAT ATT 2945
Leu Asn Val Asn Arg 660 Arg Glu Ile Leu Ile 865 Asn Asn Phe Lys Tyr 870 Ile
TTT TCT CAT TTG GTC TGT TCT TGT TCC AAA GAT GAA TTA GAA CGT GCC 2993
Phe Ser His Leu 875 Val Cys Ser Cys Ser 880 Lys Asp Glu Leu Glu 885 Arg Ala
CTT CAT TAT CTG AAG AAT GAA ACA GAA ATT GAA CTG GGG AGC CTG TTG 3041
Leu His Tyr 890 Leu Lys Asn Glu Thr 895 Glu Ile Glu Leu Gly 900 Ser Leu Leu
AGA CAA GAT TTC CAA GGA TTG CAT AAT GAA TTA TTG CTG CGT ATT GGA 3089
Arg Gin 905 Asp Phe Gin Gly Leu 910 His Asn Glu Leu Leu 915 Leu Arg Ile Gly
GAA CAC TAT CAA CAG GTT TTT AAT GGT TTG TCA ATA CTT GCC TCA TTT 3137
Glu 920 His Tyr Gin Gin Val 925 Phe Asn Gly Leu Ser 930 Ile Leu Ala Ser Phe 935
GCA TCC AGT GAT GAT CCA TAT CAG GGC CCG AGA GAT ATC ATA TCA CCT 3185
Ala Ser Ser Asp Asp 940 Pro Tyr Gin Gly Pro 945 Arg Asp Ile Ile Ser 950 Pro
GAA CTG ATG GCT GAT TAT TTA CAA CCC AAA TTG TTG GGC ATT TTG GCT 3233
Glu Leu Met Ala 955 Asp Tyr Leu Gin Pro 960 Lys Leu Leu Gly Ile 965 Leu Ala
TTT TTT AAC ATG CAG TTA CTG AGC TCT AGT GTT GGC ATT GAA GAT AAG 3281
Phe Phe Asn 970 Met Gin Leu Leu Ser 975 Ser Ser Val Gly Ile 980 Glu Asp Lys
AAA ATG GCC TTG AAC AGT TTG ATG TCT TTG ATG AAG TTA ATG GGA CCC 3329
Lys Met 985 Ala Leu Asn Ser Leu 990 Met Ser Leu Met Lys 995 Leu Met Gly Pro
AAA CAT GTC AGT TCT GTG AGG GTG AAG ATG ATG ACC ACA CTG AGA ACT 3377
Lys 100C His 1 Val Ser Ser Val Arg 1005 Val Lys Met Met Thr 1010 Thr Leu Arg Thr 1015
GGC CTT CGA TTC AAG GAT GAT TTT CCT GAA TTG TGT TGC AGA GCT TGG 3425
Gly Leu Arg Phe Lys Asp 1020 Asp Phe Pro Glu Leu 1025 Cys Cys Arg Ala Trp 1030
·· ···· * a
GAC Asp TGC Cys TTT Phe GTT CGC Val Arg 1035 TGC Cys CTG Leu GAT CAT GCT TGT CTG Leu GGC Gly TCC CTT CTC Ser Leu Leu 1045 3473
Asp His 104C Ala ) Cys
AGT CAT GTA ATA GTA GCT TTG TTA CCT CTT ATA CAC ATC CAG CCT AAA 3521
Ser His Val Ile Val 1050 Ala Leu Leu 1055 Pro Leu Ile His Ile Gin Pro Lys 1060
GAA ACT GCA GCT ATC TTC CAC TAC CTC ATA ATT GAA AAC AGG GAT GCT 3569
Glu Thr Ala 1065 Ala Ile Phe His Tyr 1070 Leu Ile Ile Glu Asn 1075 Arg Asp Ala
GTG CAA GAT TTT CTT CAT GAA ATA TAT TTT TTA CCT GAT CAT CCA GAA 3617
Val Gin 1080 Asp Phe Leu His Glu 1085 Ile Tyr Phe Leu Pro 1090 Asp His Pro Glu 1095
TTA AAA AAG ATA AAA GCC GTT CTC CAG GAA TAC AGA AAG GAG ACC TCT 3665
Leu Lys Lys Ile Lys Ala 1100 Val Leu Gin Glu Tyr 1105 Arg Lys Glu Thr Ser 1110
GAG AGC ACT GAT CTT CAG ACA ACT CTT CAG CTC TCT ATG AAG GCC ATT 3713
Glu Ser Thr Asp Leu 1115 Gin Thr Thr Leu 112C Gin 1 Leu Ser Met Lys Ala Ile 1125
CAA CAT GAA AAT GTC GAT GTT CGT ATT CAT GCT CTT ACA AGC TTG AAG 3761
Gin His Glu Asn Val 1130 Asp Val Arg 1135 Ile His Ala Leu Thr Ser Leu Lys 1140
GAA ACC TTG TAT AW< AAT CAG GAA AAA CTG ATA AAG TAT GCA ACA GAC 3809
Glu Thr Leu 1145 Tyr Lys Asn Gin Glu 1150 Lys Leu Ile Lys Tyr 1155 Ala Thr Asp
AGT GAA ACA GTA GAA CCT ATT ATC TCA CAG TTG GTG ACA GTG CTT TTG 3857
Ser Glu 1160 Thr Val Glu Pro Ile 1165 Ile Ser Gin Leu Val 1170 Thr Val Leu Leu 1175
AAA GGT TGC CAA GAT GCA AAC TCT CAA GCT CGG TTG CTC TGT GGG GAA 3905
Lys Gly Cys Gin Asp Ala 1180 Asn Ser Gin Ala Arg 1185 Leu Leu Cys Gly Glu 1190
TGT TTA GGG GAA TTG GGG GCG ATA GAT CCA GGT CGA TTA GAT TTC TCA 3953
Cys Leu Gly Glu Leu 1195 Gly Ala Ile Asp Pro 1200 Gly Arg Leu Asp Phe Ser 1205
ACA ACT GAA ACT CAA GGA AAA GAT TTT ACA TTT GTG ACT GGA GTA GAA 4001
Thr Thr Glu Thr Gin 1210 Gly Lys Asp Phe 1215 Thr Phe Val Thr Gly Val Glu 1220
GAT TCA AGC TTT GCC TAT GGA TTA TTG ATG GAG CTA ACA AGA GCT TAC 4049
Asp Ser Ser 1225 Phe Ala Tyr Gly Leu 1230 Leu Met Glu Leu Thr 1235 Arg Ala Tyr
CTT GCG TAT GCT GAT AAT AGC CGA GCT CCA GAT TCA GCT GCC TAT GCC 4097
Leu 124( Ala 3 Tyr Ala Asp Asn Ser 1245 Arg Ala Pro Asp Ser 1250 Ala Ala Tyr Ala 1255
ATT CAG GAG TTG CTT TCT ATT TAT GAC TGT AGA GAG ATG GAG ACC AAC 4145
Ile Gin Glu Leu Leu Ser 1260 Ile Tyr Asp Cys Arg 1265 Glu Met Glu Thr Asn 1270
GGC CCA GGT CAC CAA TTG TGG AGG AGA TTT CCT GAG CAT GTT CGG GAA 4193
Gly Pro Gly His Gin 1275 Leu Trp Arg Arg Phe 1280 Pro Glu His Val Arg Glu 1285
ATA CTA GAA CCT CAT CTA AAT ACC AGA TAC AAG AGT TCT CAG AAG TCA 4241
Ile Leu Glu Pro His 1290 Leu Asn Thr Arg 1295 Tyr Lys Ser Ser Gin Lys Ser 1300
• · · · · ·
ACC GAT TGG Thr Asp Trp TCT Ser GGA GTA AAG AAG CCA ATT TAC TTA AGT AAA TTG GGT 4289
Gly Val Lys Lys 1310 Pro Ile Tyr Leu Ser 1315 Lys Leu Gly
1305
AGT AAC TTT GCA GAA TGG TCA GCA TCT TGG GCA GGT TAT CTT ATT ACA 4337
Ser Asn Phe 1320 Ala Glu Trp Ser Ala 1325 Ser Trp Ala Gly Tyr 1330 Leu Ile Thr 1335
AAG GTT CGA CAT GAT CTT GCC AGT AAA ATT TTC ACC TGC TGT AGC ATT 4385
Lys Val Arg His Asp Leu 1340 Ala Ser Lys Ile Phe 1345 Thr Cys Cys Ser Ile 1350
ATG ATG AAG CAT GAT TTC AAA GTG ACC ATC TAT CTT CTT CCA CAT ATT 4433
Met Met Lys His Asp 1355 Phe Lys Val Thr Ile 1360 Tyr Leu Leu Pro His 1365 Ile
CTG GTG TAT GTC TTA CTG GGT TGT AAT CAA GAA GAT CAG CAG GAG GTT 4481
Leu Val Tyr Val 1370 Leu Leu Gly Cys Asn 1375 Gin Glu Asp Gin Gin 1380 Glu Val
TAT GCA GAA ATT ATG GCA GTT CTA AAG CAT GAC GAT CAG CAT ACC ATA 4529
Tyr Ala Glu 1385 Ile Met Ala Val Leu 1390 Lys His Asp Asp Gin 1395 His Thr Ile
AAT ACC CAA GAC ATT GCA TCT GAT CTG TGT CAA CTC AGT ACA CAG ACT 4577
Asn Thr Gin 1400 Asp Ile Ala 1405 Ser Asp Leu Cys Gin Leu Ser 1410 Thr Gin Thr 1415
GTG TTC TCC ATG CTT GAC CAT CTC ACA CAG TGG GCA AGG CAC AAA TTT 4625
Val Phe Ser Met Leu Asp 1420 His Leu Thr Gin Trp 1425 Ala Arg His Lys Phe 1430
CAG GCA CTG AAA GCT GAG AAA TGT CCA CAC AGC AAA TCA AAC AGA AAT 4673
Gin Ala Leu Lys Ala 1435 Glu Lys Cys Pro His 1440 Ser Lys Ser Asn Arg 1445 Asn
AAG GTA GAC TCA ATG GTA TCT ACT GTG GAT TAT GAA GAC TAT CAG AGT 4721
Lys Val Asp Ser 1450 Met Val Ser Thr Val 1455 Asp Tyr Glu Asp Tyr 1460 Gin Ser
GTA ACC CGT TTT CTA GAC CTC ATA CCC CAG GAT ACT CTG GCA GTA GCT 4769
Val Thr Arg 1465 Phe Leu Asp Leu Ile 1470 Pro Gin Asp Thr Leu 1475 Ala Val Ala
TCC TTT CGC TCC AAA GCA TAC ACA CGA GCT GTA ATG CAC TTT GAA TCA 4817
Ser Phe Arg 14Θ0 Ser Lys Ala Tyr Thr 1485 Arg Ala Val Met His 1490 Phe Glu Ser 1495
TTT ATT ACA GAA AAG AAG CAA AAT ATT CAG GAA CAT CTT GGA TTT TTA 4865
Phe Ile Thr Glu Lys Lys 1500 Gin Asn Ile Gin Glu 1505 His Leu Gly Phe Leu 1510
CAG AAA TTG TAT GCT GCT ATG CAT GAA CCT GAT GGA GTG TCC GGA GTC 4913
Gin Lys Leu Tyr Ala 1515 Ala Met His Glu Pro 1520 Asp Gly Val Ser Gly 1525 Val
AGT GCA ATT AGA AAG GCA GAA CCA TCT CTA AAA GAA CAG ATC CTT GAA 4961
Ser Ala Ile Arg 1530 Lys Ala Glu Pro Ser 1535 Leu Lys Glu Gin Ile 1540 Leu Glu
CAT GAA AGC CTT GGC TTG CTG AGG GAT GCC ACT GCT TGT TAT GAC AGG 5009
His Glu Ser 1545 Leu Gly Leu Leu Arg 1550 Asp Ala Thr Ala Cys 1555 Tyr Asp Arg
GCT ATT CAG CTA GAA CCA GAC CAG ATC ATT CAT TAC CAT GGT GTA GTA 5057
Ala Ile Gin 1560 Leu Glu Pro 1565 Asp Gin Ile Ile His Tyr His 1570 Gly Val Val 1575
»· ·· · · · · • · · · · • · · · • · · · · ·
- 75 - • · « · ·
AAG TCC ATG TTA GGT CTT GGT CAG CTG TCT ACT GTT ATC ACT CAG GTG 5105
Lys Ser Met Leu Gly Leu Gly 1500 Gin Leu Ser Thr Val 1505 Ile Thr Gin Val 1590
AAT GGA GTG CAT GCT AAC AGG TCC GAG TGG ACA GAT GAA TTA AAC ACG 5153
Asn Gly Val His Ala Asn Arg 1595 Ser Glu Trp Thr Asp 1600 Glu Leu Asn Thr 1605
TAC AGA GTG GAA GCA GCT TGG AAA TTG TCA CAG TGG GAT TTG GTG GAA 5201
Tyr Arg Val Glu Ala Ala Trp 1610 Lys Leu Ser Gin Trp 1615 Asp Leu Val Glu 1620
AAC TAT TTG GCA GCA GAT GGA AAA TCT ACA ACA TGG AGT GTC AGA CTG 5249
Asn Tyr Leu Ala Ala Asp Gly Lys Ser Thr Thr Trp Ser Val Arg Leu 1625 1630 1635
GGA CAG CTA TTA TTA TCA GCC AAA AAA AGA GAT ATC ACA GCT TTT TAT 5297
Gly Gin Leu Leu Leu Ser Ala 1640 1645 Lys Lys Arg Asp Ile 1650 Thr Ala Phe Tyr 1655
GAC TCA CTG AAA CTA GTG AGA GCA GAA CAA ATT GTA CCT CTT TCA GCT 5345
Asp Ser Leu Lys Leu Val Arg 1660 Ala Glu Gin Ile Val 1665 Pro Leu Ser Ala 1670
GCA AGC TTT GAA AGA GGC TCC TAC CAA CGA GGA TAT GAA TAT ATT GTG 5393
Ala Ser Phe Glu Arg Gly Ser 1675 Tyr Gin Arg Gly Tyr 1600 Glu Tyr Ile Val 1605
AGA TTG CAC ATG TTA TGT GAG TTG GAG CAT AGC ATC AAA CCA CTT TTC 5441
Arg Leu His Met Leu Cys Glu 1690 Leu Glu His Ser Ile 1695 LyG Pro Leu Phe 1700
CAG CAT TCT CCA GGT GAC AGT TCT CAA GAA GAT TCT CTA AAC TGG GTA 5489
Gin His Ser Pro Gly Asp Ser Ser Gin Glu Asp Ser Leu Asn Trp Val 1705 1710 1715
GCT CGA CTA GAA ATG ACC CAG AAT TCC TAC AGA GCC AAG GAG CCT ATC 5537
Ala Arg Leu Glu Met Thr Gin 1720 1725 Asn Ser Tyr Arg Ala 1730 Lys Glu Pro Ile 1735
CTG GCT CTC CGG AGG GCT TTA CTA AGC CTC AAC AAA AGA CCA GAT TAC 5585
Leu Ala Leu Arg Arg Ala Leu 1740 Leu Ser Leu Asn Lys 1745 Arg Pro Asp Tyr 1750
AAT GAA ATG GTT GGA GAA TGC TGG CTG CAG AGT GCC AGG GTA GCT AGA 5633
Asn Glu Met Val Gly Glu Cys 1755 Trp Leu Gin Ser Ala 1760 Arg Val Ala Arg 1765
AAG GCT GGT CAC CAC CAG ACA GCC TAC AAT GCT CTC CTT AAT GCA GGG 5681
Lys Ala Gly His His Gin Thr 1770 Ala Tyr Asn Ala Leu 1775 Leu Asn Ala Gly 1780
GAA TCA CGA CTC GCT GAA CTG TAC GTG GAA AGG GCA AAG TGG CTC TGG 5729
Glu Ser Arg Leu Ala Glu Leu Tyr Val Glu Arg Ala Lys Trp Leu Trp 1785 1790 1795
TCC AAG GGT GAT GTT CAC CAG GCA CTA ATT GTT CTT CAA AAA GGT GTT 5777
Ser Lys Gly Asp Val His Gin 1800 1805 Ala Leu Ile Val Leu 1810 Gin Lys Gly Val 1815
GAA TTA TGT TTT CCT GAA AAT GAA ACC CCA CCT GAG GGT AAG AAC ATG 5825
Glu Leu Cys Phe Pro Glu Asn Glu Thr Pro Pro Glu Gly Lys Asn Met
1320 1825 1830
TTA ATC CAT GGT CGA GCT ATG CTA CTA GTG GGC CGA TTT ATG GAA GAA 5073
Leu Xle His Gly Arg Ala Met Leu Leu Val C-ly Arg Phe Met Glu Glu
1835 1840 1845 • · · · · 4
ACA Thr GCT Al a AA.C TTT Asn Phe 1850 GAA Glu AGC Se r AAT Asn GCA ATT Ala Ile 1855 ATG Met AAA Lys AAA Lys TAT AAG Tyr Lys 1860 GAT Asp GTG Val 5921
ACC GCG TGC CTG CCA GAA TGG GAG GAT GGG CAT TTT TAC CTT GCC AAG 5969
Thr Ala Cys Leu 1665 Pro Glu Trp Glu Asp 1870 Gly His Phe Tyr Leu 1875 Ala Lys
TAC TAT GAC AAA TTG ATG CCC ATG GTC ACA GAC AAC AAA ATG GAA AAG 6017
Tyr Tyr 1ΘΘ0 Asp Lys Leu Met Pro 1885 Met Val Thr Asp Asn 1890 Lys Met Glu Lys 1095
CAA GGT GAT CTC ATC CGG TAT ATA GTT CTT CAT TTT GGC AGA TCT CTA 6065
Gin Gly Asp Leu Ile Arg 1900 Tyr Ile Val Leu 1905 His Phe Gly Arg Ser Leu 1910
CAA TAT GGA AAT CAG TTC ATA TAT CAG TCA ATG CCA CGA ATG TTA ACT 6113
Gin Tyr Gly Asn Gin 1915 Phe Ile Tyr Gin 192C Ser ) Met Pro Arg Met 1925 Leu Thr
CTA TGG CTT GAT TAT GGT ACA AAG GCA TAT GAA TGG GAA AAA GCT GGC 6161
Leu Trp Leu Asp 1930 Tyr Gly Thr Lys Ala 1935 Tyr Glu Trp Glu Lys 1940 Ala Gly
CGC TCC GAT CGT GTA CAA ATG AGG AAT GAT TTG GGT AAA ATA AAC AAG 6209
Arg Ser Asp Arg 1945 Val Gin Met Arg Asn 1950 Asp Leu Gly Lys Ile 1955 Asn Lys
GTT ATC ACA GAG CAT ACA AAC TAT TTA GCT CCA TAT CAA TTT TTG ACT 6257
Val Ile 1960 Thr Glu His Thr Asn 1965 Tyr Leu Ala Pro Tyr 1970 Gin Phe Leu Thr 1975
GCT TTT TCA CAA TTG ATC TCT CGA ATT TGT CAT TCT CAC GAT GAA GTT 6305
Ala Phe Ser Gin Leu Ile 1980 Ser Arg Ile Cys 1985 His Ser His Asp Glu Val 1990
TTT GTT GTG CTT GAT GGA AAT AAT AGC CAA GTA TTT CTA GCC TAT CCT 6353
Phe Val Val Leu Asp 1995 Gly Asn Asn Ser Gin 2000 Val Phe Leu Ala 2005 Tyr Pro
CAA CAA GCA ATG TGG ATG ATG ACA GCT GTG TCA AAG TCA TCT TAT CCC 6401
Gin Gin Ala Met 2010 Trp Met Met Thr Ala 2015 Val Ser Lys Ser Ser 2020 Tyr Pro
ATG CGT GTG AAC AGA TGC AAG GAA ATC CTC AAT AAA GCT ATT CAT ATG 6449
Met Arg Val Asn 2025 Arg Cys Lys Glu Ile 2030 Leu Asn Lys Ala Ile 2035 His Met
AAA AAA TCC TTA GAG AAG TTT GTT GGA GAT GCA ACT CGC CTA ACA GAT 6497
Lys Lys 2040 Ser Leu Glu Lys Phe 2045 Val Gly Asp Ala Thr 2050 Arg Leu Thr Asp 2055
AAG CTT CTA GAA TTG TGC AAT AAA CCG GTG GAA ATT CTT GCT TCT CTT 6545
Lys Leu Leu Glu Leu Cys 2060 Asn Lys Pro Val Glu 2065 Ile Leu Ala Ser Leu 2070
CAG AAA CCA AAG AAG ATT TCT TTA AAA GGC TCA GAT GGA AAG TTC TAC 6593
Gin Lys Pro Lys 2075 Lys Ile Ser Leu Lys Gly 2080 Ser Asp Gly Lys Phe 2005 Tyr
ATC ATG ATG TGT AAG CCA AAA GAT GAC CTG AGA AAG GAT TGT AGA CTA 6641
Ile Met Met Cys 2090 Lys Pro Lys Asp Asp 2095 Leu Arg Lys Asp Cys 2100 Arg Leu
ATG GAA TTC AAT TCC TTG ATT AAT AAG TGC TTA AGA AAA GAT GCA GAG 6689
Met Glu 2105 Phe Asn Ser Leu Ile Asn Lys 2110 Cys Leu Arg Lys Asp 2115 Ala Glu
- 77 TCT CGT AGA AGA GAA CTT CAT ATT CGA ACA TAT GCA GTT ATT CCA
Ser Arg Arg Arg Glu Leu His Ile Arg Thr Tyr Ala Val Ile Pro
2120 2125 2130
ΖΛΤ GAT GAA TGT GGG ATT ATT GAA TGG GTG AAC AAC ACT GCT GGT
Asn Asp Glu Cys Gly Ile Ile Glu Trp Val Asn Asn Thr Ala Gly
2140 2145 2150
CTA
Leu
2135
6737
TTG
Leu
6785
AGA Arg CCT Pro ATT Ile CTG ACC AAA CTA TAT AAA GAA AAG GGA GTG TAT ATG ACA 6833
Leu Thr 2155 Lys Leu Tyr Lys Glu 2160 Lys Gly Val Tyr Met 2165 Thr
GGA AAA GAA CTT CGC CAG TGT ATG CTA CCA AAG TCA GCA GCT TTA TCT 6881
Gly Lys Glu Leu Arg 2170 Gin Cys Met Leu Pro 2175 Lys Ser Ala Ala Leu 2180·-- Ser
GAA AAA CTC AAA GTA TTC CGA GAA TTT CTC CTG CCC AGG CAT CCT CCT 6929
Glu Lys Leu 2185 Lys Val Phe Arg Glu 2190 Phe Leu Leu Pro Arg 2195 His Pro Pro
ATT TTT CAT GAG TGG TTT CTG AGA ACA TTC CCT GAT CCT ACA TCA TGG 6977
Ile Phe 2200 His Glu Trp Phe Leu 2205 Arg Thr Phe Pro Asp 2210 Pro Thr Ser Trp 2215
TAC AGT AGT AGA TCA GCT TAC TGC CGT TCC ACT GCA GTA ATG TCA ATG 7025
Tyr Ser Ser Arg Ser Ala 2220 Tyr Cys Arg Ser Thr 2225 Ala Val Met Ser Met 2230
GTT GGT TAT ATT CTG GGG CTT GGA GAC CGT CAT GGT GAA AAT ATT CTC 7073
Val Gly Tyr Ile Leu 2235 Gly Leu Gly Asp Arg 2240 His Gly Glu Asn Ile 224 5 Leu
TTT GAT TCT TTG ACT GGT GAA TGC GTA CAT GTA GAT TTC AAT TGT CTT 7121
Phe Asp Ser Leu Thr 2250 Gly Glu Cys Val His 2255 Val Asp Phe Asn Cys 2260 Leu
TTC AAT AAG GGA GAA ACC TTT GAA GTT CCA GAA ATT GTG CCA TTT CGC 7169
Phe Asn Lys 2265 Gly Glu Thr Phe Glu 2270 Val Pro Glu Ile 2275 Val Pro Phe Arg
CTG ACT CAT AAT ATG GTT AAT GGA ATG GGT CCT ATG GGA ACA GAG GGT 7217
Leu Thr 2280 His Asn Met Val Asn 2285 Gly Met Gly Pro Met 2290 Gly Thr Glu Gly 2295
CTT TTT CGA AGA GCA TGT GAA GTT ACA ATG AGG CTG ATG CGT GAT CAG 7265
Leu Phe Arg Arg Ala Cys 2300 Glu Val Thr Met Arg 2305 Leu Met Arg Asp Gin 2310
CGA GAG CCT TTA ATG AGT GTC TTA AAG ACT TTT CTA CAT GAT CCT CTT 7313
Arg Glu Pro Leu Met 2315 Ser Val Leu Lys Thr 2320 Phe Leu His Asp Pro 2325 Leu
GTG GAA TGG AGT AAA CCA GTG AAA GGG CAT TCC AAA GCG CCA CTG AAT 7361
Val Glu Trp Ser Lys 2330 Pro Val Lys 233 = Gly His Ser Lys Ala Pro Leu 2340 Asn
GAA ACT GGA GAA GTT GTC AAT GAA AAG GCC AAG ACC CAT GTT CTT GAC 7409
Glu Thr 2345 Gly Glu Val Val Asn Glu 2350 Lys Ala Lys Thr His 2355 Val Leu Asp
ATT GAG CAG CGA CTA CAA GGT GTA ATC AAG ACT CGA AAT AGA GTG ACA 7457
Ile Glu Gin Arg Leu Gin Gly Val Ile Lys Thr Arg Asn Arg Val Thr
2360 2365 2370 ) 2375
GGA CTG CCG TTA TCT ATT GAA GGA CAT GTG CAT TAC CTT ATA CAA GAA
Gly Leu Pro Leu Ser Ile Glu Gly His Val Hi6 Tyr Leu Ile Gin Glu
2380 2335 2390
7505 ·· • · • · · · ·
GCT ACT GAT GAA AAC TTA CTA TGC CAG ATG TAT CTT GGT TGG ACT CCA 7553
Ala Thr Asp Glu Asn Leu Leu Cys Gin Met Tyr Leu Gly Trp Thr Pro
2395 2400 2405
TAT ATG TGAAATGAAA TTATGTAAAA GAATATGTTA ATAATCTAAA AGTAAAAAAA 7 609
Tyr Met
AAAAAAAAAA AA 7621 (2) INFORMACE O SEQ ID NO:2:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 2409 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 2:
Met 1 Gly His Ala Val 5 Glu Trp Pro Val Val 10 Met Ser Arg Phe Leu 15 Ser
Gin Leu Asp Glu 20 His Met Gly Tyr Leu 25 Gin Ser Ala Pro Leu 30 Gin Leu
Met Ser Met 35 Gin Lys Leu Glu Phe 40 Ile Glu Val Thr Leu 45 Leu Thr Val
Leu Thr 50 Arg Ile Ile Ala Ile 55 Val Phe Phe Arg Arg 60 Gin Glu Leu Leu
Leu 65 Trp Gin Ile Gly Cys 70 Val Leu Leu Glu Tyr 75 Gly Ser Pro Lys Ile 80
Lys Ser Leu Ala Ile 85 Ser Phe Leu Thr Glu 90 Leu Phe Gin Leu Gly 95 Gly
Leu Pro Ala Gin 100 Pro Ala Ser Thr Phe 105 Phe Ser Ser Phe Leu 110 Glu Leu
Leu Lys His 115 Leu Val Glu Met Asp 120 Thr Asp Gin Leu Lys 125 Leu Tyr Glu
Glu Pro 130 Leu Ser Lys Leu Ile 135 Lys Thr· Leu Phe Pro 140 Phe Glu Ala Glu
Ala 145 Tyr Arg Asn Ile Glu 150 Pro Val Tyr Leu Asn 155 Met Leu Leu Glu Lys 160
Leu Cys Val Met Phe 165 Glu Asp Gly Val Leu 170 Met Arg Leu Lys Ser 175 Asp
Leu Leu Lys Ala 180 Ala Leu Cys His Leu 185 Leu Gin Tyr Phe Leu 190 Lys Phe
Val Pro Ala 195 Gly Tyr Glu Ser Ala 200 Leu Gin Val Arg Lys 205 Val Tyr Val
Arg Asn 210 Ile Cys Lys Ala Leu 215 Leu Asp Val Leu Gly 220 Ile Glu Val Asp
Ala 225 Glu Tyr Leu Leu Gly 230 Pro Leu Tyr Ala Ala 235 Leu Lys Met Glu Ser 240
• ♦ ·· ·
Met Glu Ile Ile Glu 245 Glu Ile Gin Cys Gin Thr Gin Gin 250 Glu Asn 255 Leu
Ser Ser Asn Ser Asp Gly Ile Ser Pro Lys Arg Arg Arg Leu Ser Ser
260 265 270
Ser Leu Asn Pro Ser Lys Arg Ala Pro Lys Gin Thr Glu Glu Ile Lys
275 280 285
His Val Asp Met Asn Gin Lys Ser Ile Leu Trp Ser Ala Leu Lys Gin
290 295 300
Lys Ala Glu Ser Leu Gin Ile Ser Leu Glu Tyr Ser Gly Leu Lys Asn
305 310 315 320
Pro Val Ile Glu Met Leu Glu Gly Ile Ala Val Val Leu Gin Leu Thr
325 330 335
Ala Leu Cys Thr Val His Cys Ser His Gin Asn Met Asn Cys Arg Thr
340 345 350
Phe Lys Asp Cys Gin His Lys Ser Lys Lys Lys Pro Ser Val Val Ile
355 360 365
Thr Trp Met Ser Leu Asp Phe Tyr Thr Thr Val Leu Lys Ser Cys Arg
370 375 380
Arg Leu Leu Glu Ser Val Gin Lys Arg Thr Gly Gly Asn Ile Asp Lys
385 390 395 400
Val Val Lys Ile Tyr Asp Ala Leu Ile Tyr Met Gin Val Asn Ser Ser
405 410 415
Phe Glu Asp His Ile Leu Glu Asp Leu Cys Gly Met Leu Ser Leu Pro
420 425 430
Trp Ile Tyr Ser His Ser Asp Asp Gly Cys Leu Lys Leu Thr Thr Phe
435 440 445
Al a Ala Asn Leu Leu Thr Leu Ser Cys Arg Ile Ser Asp Ser Tyr Ser
450 455 460
Pro Gin Ala Gin Ser Arg Cys Val Phe Leu Leu Thr Leu Phe Pro Arg
465 470 475 480
Arg Ile Phe Leu Glu Trp Arg Thr Ala Val Tyr Asn Trp Ala Leu Gin
485 490 495
Ser Ser His Glu Val Ile Arg Ala Ser Cys Val Ser Gly Phe Phe Ile
500 505 510
Leu Leu Gin Gin Gin Asn Ser Cys Asn Arg Val Pro Lys Ile Leu Ile
515 520 525
Asp Lys Val Lys Asp Asp Ser Asp Ile Val Lys Lys Glu Phe Ala Ser
53 0 535 540
Ile Leu Gly Gin Leu Val Cys Thr Leu His Gly Met Phe Tyr Leu Thr
545 550 555 560
Ser Ser Leu Thr Glu Pro Phe Ser Glu His Gly His Val Asp Leu Phe
565 570 575
Cys Arg Asn Leu Lys Ala Thr Ser Gin His Glu Cys Ser Ser Ser Gin
580 585 590
·· ··<
• fl • · ·· ·
Leu Lys Ala 595 Ser Val Cys Lys Pro 600 Phe Leu Phe Leu Leu 605 Lys Lys Lys
Ile Pro 610 Ser Pro Val Lys Leu 615 Ala Phe Ile Asp Asn 620 Leu His His Leu
Cys 625 Lys His Leu Asp Phe 630 Arg Glu Asp Glu Thr 635 Asp Val Lys Ala Val 640
Leu Gly Thr Leu Leu 645 Asn Leu Mat Glu Asp 650 Pro Asp Lys Asp Val 655 Arg
Val Ala Phe Ser 660 Gly Asn Ile Lys His 665 Ile Leu Glu Ser Leu 670 Asp Ser
Glu Asp Gly 675 Phe Ile Lys Glu Leu 680 Phe Val Leu Arg Met 685 Lys Glu Ala
Tyr Thr 690 His Ala Gin Ile Ser 695 Arg Asn Asn Glu Leu 700 Lys Asp Thr Leu
Ile 705 Leu Thr Thr Gly Asp 710 Ile Gly Arg Ala Ala 715 Lys Gly Asp Leu Val 720
Pro Phe Ala Leu Leu 725 His Leu Leu His Cys 730 Leu Leu Ser Lys Ser 735 Ala
Ser Val Ser Gly 740 Ala Ala Tyr Thr Glu 745 Ile Arg Ala Leu Val 750 Ala Ala
Lys Ser Val 755 Lys Leu Gin Ser Phe 760 Phe Ser Gin Tyr Lys 765 Lys Pro Ile
Cys Gin 770 Phe Leu Val Glu Ser 775 Leu His Ser Ser Gin 780 Met Thr Ala Leu
Pro 785 Asn Thr Pro Cys Gin 790 Asn Ala Asp Val Arg 795 Lys Gin Asp Val Ala 800
His Gin Arg Glu Met 805 Al a Leu Asn Thr Leu 810 Ser Glu Ile Ala Asn 815 Val
Phe Asp Phe Pro 820 Asp Leu Asn Arg Phe 825 Leu Thr Arg Thr Leu 830 Gin Val
Leu Leu Pro 835 Asp Leu Ala Ala Lys 840 Ala Ser Pro Ala Ala 845 Ser Ala Leu
Ile Arg 850 Thr Leu Gly Lys Gin 855 Leu Asn Val Asn Arg 860 Arg Glu Ile Leu
Ile 865 Asn Asn Phe Lys Tyr 870 Ile Phe Ser His Leu 875 Val Cys Ser Cys Ser 880
Lys Asp Glu Leu Glu 885 Arg Ala Leu His Tyr 890 Leu Lys Asn Glu Thr 895 Glu
Ile Glu Leu Gly 900 Ser Leu Leu Arg Gin 905 Asp Phe Gin Gly Leu 910 His Asn
Glu Leu Leu 915 Leu Arg Ile Gly Glu 920 His Tyr Gin Gin Val 925 Phe Asn Gly
Leu Ser 930 Ile Leu Ala Ser Phe 935 Ala Ser Ser Asp Asp 940 Pro Tyr Gin Gly
• ·
9 ·
Pro 945 Arg Asp Ile Ile Ser 950 Pro Glu Leu Met Ala 955 Asp Tyr Leu Gin Pro 960
Lys Leu Leu Gly Ile Leu Ala Phe Phe Asn Met Gin Leu Leu Ser Ser
965 970 975
Ser Val Gly Ile Glu Asp Lys Lys Met Ala Leu Asn Ser Leu Met Ser
980 985 990
Leu Met LVS Leu Met Gly Pro Lys His Val Ser Ser Val Arg Val Lys
995 1000 1005
Met Met Thr Thr Leu Arg Thr Gly Leu Arg Phe Lys Asp Asp Phe Pro
1010 1015 1020
Glu Leu Cys Cys Arg Ala Trp Asp Cys Phe Val Arg Cys Leu Asp His
102S 1030 1035 1040
Ala Cys Leu Gly Ser Leu Leu Ser His Val Ile Val Ala Leu Leu Pro
1045 1050 1055
Leu Ile His Ile Gin Pro Lys Glu Thr Ala Ala Ile Phe His Tyr Leu
1060 1065 1070
Ile Ile Glu Asn Arg Asp Ala Val Gin Asp Phe Leu His Glu Ile Tyr
1075 1080 1085
Phe Leu Pro Asp His Pro Glu Leu Lys Lys Ile Lys Ala Val Leu Gin
1090 1095 1100
Glu Tyr Arg Lys Glu Thr Ser Glu Ser Thr Asp Leu Gin Thr Thr Leu
1105 1110 1115 1120
Gin Leu Ser Met Lys Ala Ile Gin His Glu Asn Val Asp Val Arg Ile
1125 1130 1135
His Ala Leu Thr Ser Leu Lys Glu Thr Leu Tyr Lys Asn Gin Glu Lys
1140 1145 1150
Leu Ile Lys Tyr Ala Thr Asp Ser Glu Thr Val Glu Pro Ile Ile Ser
1155 1160 1165
Gin Leu Val Thr Val Leu Leu Lys Gly Cys Gin Asp Ala Asn Ser Gin
1170 1175 1180
Ala Arg Leu Leu Cys Gly Glu Cys Leu Gly Glu Leu Gly Ala Ile Asp
1185 1190 1195 1200
Pro Gly Arg Leu Asp Phe Ser Thr Thr Glu Thr Gin Gly Lys Asp Phe
1205 1210 1215
Thr Phe Val Thr Gly Val Glu Asp Ser Ser Phe Ala Tyr Gly Leu Leu
1220 1225 1230
Met Glu Leu Thr Arg Ala Tyr Leu Ala Tyr Ala Asp Asn Ser Arg Ala
1235 1240 1245
Pro Asp Ser Ala Ala Tyr Ala Ile Gin Glu Leu Leu Ser Ile Tyr Asp
1250 1255 1260
Cys Arg Glu Met Glu Thr Asn Gly Pro Gly His Gin Leu Trp Arg Arg
1265 1270 1275 1280
Phe Pro Glu His Val Arg Glu Ile Leu Glu Pro His Leu Asn Thr Arg
1285 1290 1295
Tyr Lys Ser Ser Gin Lys Ser Thr Asp Trp Ser Gly Val LyG Lys Pro 1300 1305 1310
Ile Tyr Leu Ser 1315 Lys Leu Gly Ser Asn 1320 Phe Ala Glu Trp Ser 1325 Ala Ser
Trp Ala Gly Tyr 1330 Leu Ile Thr Lys Val 1335 Arg His Asp Leu Ala 1340 Ser Lys
Ile Phe Thr Cys Cys Ser Ile Met Met Lys His Asp Phe Lys Val Thr
1345 1350 1355 1360
Ile Tyr Leu Leu Pro His Ile Leu Val 1365 Tyr Val Leu Leu Gly 1370 Cys Asn 1375
Gin Glu Asp Gin Gin Glu Val Tyr Ala 1380 1386 Glu Ile Met Ala Val Leu Lys i 1390
His Asp Asp Gin 1395 His Thr Ile Asn Thr 1400 Gin Asp Ile Ala Ser 1405 Asp Leu
Cys Gin Leu Ser 1410 Thr Gin Thr Val Phe 1415 Ser Met Leu Asp His 1420 Leu Thr
Gin Trp Ala Arg His Lys Phe Gin Ala Leu Lys Ala Glu Lys Cys Pro
1425 1430 1435 1440
His Ser Lys Ser Asn Arg Asn Lys Val 1445 Asp Ser Met Val Ser 1450 Thr Val 1455
Asp Tyr Glu Asp Tyr Gin Ser Val Thr 1460 1465 Arg Phe Leu Asp Leu , 147C Ile Pro 1
Gin Asp Thr Leu 1475 Ala Val Ala Ser Phe 1480 Arg Ser Lys Ala Tyr 1485 Thr Arg
Ala Va1 Met His 1490 Phe Glu Ser Phe Ile 1495 Thr Glu Lvs Lys Gin 1500 Asn Ile
Gin Glu His Leu Gly Phe Leu Gin Lys Leu Tyr Ala Ala Met His Glu
1505 1510 1515 1520
Pro Asp Gly Val Ser Gly Val Ser Ala 1525 Ile Arg Lys Ala Glu 1530 Pro Ser 1535
Leu Ly s Glu Gin 1540 Ile Leu Glu His Glu ' 1545 Ser Leu Gly Leu Leu • 1550 Arg Asp 1
Ala Thr Ala Cys 1555 Tyr Asp Arg Ala Ile 1560 Gin Leu Glu Pro Asp 1565 Gin Ile
Ile His Tyr His 1570 Gly Val Val Lys Ser 1575 Met Leu Gly Leu Gly 1580 Gin Leu
Ser 1565 Thr Val Ile Thr Gin Val Asn Gly 1590 Val His Ala Asn Arg 1595 Ser Glu 1600
Trp Thr Asp Glu Leu Asn Thr Tyr Arg 1605 Val Glu Ala Ala Trp 1610 Lys Leu 1615
Ser Gin Trp Asp 1620 Leu Val Glu Asn Tyr 1625 Leu Ala Ala Asp Gly 1630 Lys Ser (
Thr Thr Trp Ser Val Arg Leu Gly Gin Leu Leu Leu Ser Ala Lys Lys 1635 1640 1645 • · · • · 1 ····· ·· <
Arg Asp 165C Ile 1 Thr Ala Phe Tyr Asp 1655 Ser Leu Lys Leu Val Arg Ala Glu 1660
Gin Ile Val Pro Leu Ser Ala Ala Ser Phe Glu Arg Gly Ser Tyr Gin
1665 1670 1675 1680
Arg Gly Tyr Glu Tyr Ile Val Arg Leu His Met Leu Cys Glu Leu Glu
1685 1690 1695
His Ser Ile Lys Pro Leu Phe Gin His Ser Pro Gly Asp Ser Ser Gin
1700 1705 1710
Glu Asp Ser Leu Asn Trp Val Ala Arg Leu Glu Met Thr Gin Asn Ser
1715 1720 1725
Tyr Arg Ala Lys Glu Pro Ile Leu Ala Leu Arg Arg Ala Leu Leu Ser
1730 1735 1740
Leu Asn Lys Arg Pro Asp Tyr Asn Glu Met Val Gly Glu Cys Trp Leu
1745 1750 1755 ; 1760
Gin Ser Ala Arg Val Ala Arg Lys Ala Gly His His Gin Thr Ala Tyr
1765 1770 1775
Asn Ala Leu Leu Asn Ala Gly Glu Ser Arg Leu Ala Glu Leu Tyr Val
1780 1785 1790
Glu Arg Ala Lys Trp Leu Trp Ser Lys Gly Asp Val His Gin Ala Leu
1795 1800 1805
Ile Val Leu Gin Lys Gly Val Glu Leu Cys Phe Pro Glu Asn Glu Thr
1810 1815 1820
Pro Pro Glu Gly Lys Asn Met Leu Ile His Gly Arg Ala Met Leu Leu
1825 1830 1835 ' 1840
Val Gly Arg Phe Met Glu Glu Tnr Ala Asn Phe Glu Ser Asn Ala Ile
1845 1850 1855
Met Lys Lys Tyr Lys Asp Val Thr Ala Cys Leu Pro Glu Trp Glu Asp
1860 1865 1870
Gly His Phe Tyr Leu Ala Lys Tyr Tyr Asp Lys Leu Met Pro Met Val
1875 1880 1885
Thr Asp Asn Lys Met Glu Lys Gin Gly Asp Leu Ile Arg Tyr Ile Val
1890 1895 1900
Leu His Phe Gly Arg Ser Leu Gin Tyr Gly Asn Gin Phe Ile Tyr Gin
1905 1910 1915 i 1920
Ser Met Pro Arg Met Leu Thr Leu Trp Leu Asp Tyr Gly Thr Lys Ala
1925 1930 1935
Tyr Glu Trp Glu Lys Ala Gly Arg Ser Asp Arg Val Gin Met Arg Asn
1940 1945 1950
Asp Leu Gly Lys Ile Asn Lys Val Ile Thr Glu His Thr Asn Tyr Leu
1955 1960 1965
Ala Pro Tyr Gin Phe Leu Thr Ala Phe Ser Gin Leu Ile Ser Arg Ile
1970 1975 1980
Cys His Ser His Asp Glu Val Phe Val Val Leu Asp Gly Asn Asn Ser
1985 1990 1995 2000
·· ···<
Gin Val Phe Leu Ala Tyr Pro Gin Gin Ala Met Trp Met Met Thr Ala
2005 i 201C ) 2015
Val Ser Lys Ser Ser 2020 Tyr Pro Met Arg Val 2025 Asn Arg Cys Lys Glu 2030 Ile
Leu Asn Lys Ala Ile 2035 His Met Lys Lys Ser 2040 Leu Glu Lys Phe Val 2045 Gly
Asp Ala Thr Arg Leu 2050 Thr Asp Lys Leu Leu 2055 Glu Leu Cys Asn Lys 2060 Pro
Val Glu Ile Leu Ala Ser Leu Gin Lys Pro Lys Lys Ile Ser Leu Lys
2065 2070 2075 2080
Gly Ser Asp Gly Lys Phe Tyr Ile Met Met Cys Lys Pro Lys Asp Asp
2085 - 209C 1 2095
Leu Arg Lys Asp Cys 2100 Arg Leu Met Glu Phe 2105 Asn Ser Leu Ile Asn 2110 Lys
Cys Leu Arg Lys Asp 2115 Ala Glu Ser Arg Arg 1 o q Arg Glu Leu His Ile 2125 Arg
Thr Tyr Ala Val Ile 2130 Pro Leu Asn Asp Glu 2135 Cys Gly Ile Ile Glu 2140 Trp
Val Asn Asn Thr Ala Gly Leu Arg Pro Ile Leu Thr Lys Leu Tyr Lys
2145 2150 2155 2160
Glu Lys Gly Val Tyr Met Thr Gly Lys Glu Leu Arg Gin Cys Met Leu
2165 - 217C i 2175
Pro Lys Ser Ala Ala 2180 Leu Ser Glu Lys Leu 2185 Lys Val Phe Arg Glu 2190 Phe
Leu Leu Pro Arq His 2195 Pro Pro Ile Phe His 2200 Glu Trp Phe Leu Arg 2205 Thr
Phe Pro Asp Pro Thr 2210 Ser Trp Tyr Ser Ser 2215 Arg Ser Ala Tyr Cys 2220 Arg
Ser Thr Ala Val Met Ser Met Val Gly Tyr Ile Leu Gly Leu Gly Asp
2225 2230 2235 2240
Arg His Gly Glu Asn Ile Leu Phe Asp Ser Leu Thr Gly Glu Cys Val
2245 225C l 2255
His Val Asp Phe Asn 2260 Cys Leu Phe Asn Lys 2265 Gly Glu Thr Phe Glu 2270 Val
Pro Glu Ile Val Pro 2275 Phe Arg Leu Thr His 2280 Asn Met Val Asn Gly 2285 Met
Gly Pro Met Gly Thr 2290 Glu Gly Leu Phe Arg 2295 Arg Ala Cys Glu Val 2300 Thr
Met Arg Leu Met Arg Asp Gin Arg Glu Pro Leu Met Ser Val Leu Lys
2305 2310 2315 2320
Thr Phe Leu His Asp Pro Leu Val Glu Trp Ser Lys Pro Val Lys Gly 1
2325 233C i .2335
His Ser Lys Ala Pro Leu Asn Glu Thr Gly Glu Val Val Asn Glu Lys 2340 2345 2350 ·· 999
·· β · · · • · ♦ · • · 999 · • · · ·»·· ·· ·
Ala Lys Thr His 2355 Val Leu Asp Ile 236C Glu l Gin Arg Leu Gin 2365 Gly Val Ile
Lys Thr 237C Arg Asn 1 Arg Val Thr 2375 Gly Leu Pro Leu Ser 2380 Ile Glu Gly His
Val 2385 His Tyr Leu Ile Gin 2390 Glu 1 Ala Thr Asp Glu 2395 Asn Leu Leu Cys Gin 2400
Met Tyr Leu Gly Trp 2405 Thr Pro Tyr Met
(2) INFORMACE Ο SEQ ID NO:3:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 2835 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: 517 (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 1..2610 (xi) POPIS SEKVENCE: SEQ ID NO: 3:
GTG GAA GCA GCT TGG AAA TTG TCA CAG TGG GAT TTG GTG GAA AAC TAT
Val 1 Glu Ala Ala Trp 5 Lys Leu Ser Gin Trp 10 Asp Leu Val Glu Asn 15 Tyr
TTG GCA GCA GAT GGA AAA TCT ACA ACA TGG AGT GTC AGA CTG GGA CAG
Leu Ala Ala Asp 20 Gly Lys Ser Thr Thr 25 Trp Ser Val Arg Leu 30 Gly Gin
CTA TTA TTA TCA GCC AAA AAA AGA GAT ATC ACA GCT TTT TAT GAC TCA
Leu Leu Leu 35 Ser Ala Lys Lys Arg 40 Asp Ile Thr Ala Phe 45 Tyr Asp Ser
CTG AAA CTA GTG AGA GCA GAA CAA ATT GTA CCT CTT TCA GCT GCA AGC
Leu Lys 50 Leu Val Arg Ala Glu 55 Gin Ile Val Pro Leu 60 Ser Ala Ala Ser
TTT GAA AGA GGC TCC TAC CAA CGA GGA TAT GAA TAT ATT GTG AGA TTG
Phe 65 Glu Arg Gly Ser Tyr 70 Gin Arg Gly Tyr Glu 75 Tyr Ile Val Arg Leu 80
CAC ATG TTA TGT GAG TTG GAG CAT AGC ATC AAA CCA CTT TTC CAG CAT
His Met Leu Cys Glu 65 Leu Glu His Ser Ile 90 Lys Pro Leu Phe Gin 95 His
TCT CCA GGT GAC AGT TCT CAA GAA GAT TCT CTA AAC TGG GTA GCT CGA
Ser Pro Gly Asp 100 Ser Ser Gin Glu Asp 105 Ser Leu Asn Trp Val 110 Ala Arg
CTA GAA ATG ACC CAG AAT TCC TAC AGA GCC AAG GAG CCT ATC CTG GCT
Leu Glu Met 115 Thr Gin Asn Ser Tyr 120 Arg Ala Lys Glu Pro 125 Ile Leu Ala
144
192
240
288
336
384 ·· 999 • ··
9 ·
9 · ·
9 ·
999 ··
9 9
9
9
9
999 9999
9
9 9
999 9
9
9
CTC CGG AGG GCT TTA CTA AGC CTC AAC AAA AGA CCA GAT TAC AAT GAA 432
Leu Arg Arg Ala Leu Leu Ser Leu Asn Lys Arg Pro Asp Tyr Asn Glu
130 135 140
ATG Met 145 GTT Val GGA GAA Gly Glu TGC TGG CTG CAG AGT GCC AGG GTA GCT AGA AAG GCT Ala 160 480
Cys Trp 150 Leu Gin Ser Ala Arg 155 Val Ala Arg Lys
GGT CAC CAC CAG ACA GCC TAC AAT GCT CTC CTT AAT GCA GGG GAA TCA 528
Gly His His Gin Thr Ala Tyr Asn Ala Leu Leu Asn Ala Gly Glu Ser
165 170 175
CGA CTC GCT GAA CTG TAC GTG GAA AGG GCA AAG TGG CTC TGG TCC AAG 576
Arg Leu Ala Glu Leu Tyr Val Glu Arg Ala Lys Trp Leu Trp Ser Lys
180 185 190
GGT GAT GTT CAC CAG GCA CTA ATT GTT CTT CAA AAA GGT GTT GAA TTA 624
Gly Asp Val His Gin Ala Leu Ile Val Leu Gin Lys Gly Val Glu Leu
195 200 205
TGT TTT CCT GAA AAT GAA ACC CCA CCT GAG GGT AAG AAC ATG TTA ATC 672
Cys Phe Pro Glu Asn Glu Thr Pro Pro Glu Gly Lys Asn Met Leu Ile
210 215 220
CAT GGT CGA GCT ATG CTA CTA GTG GGC CGA TTT ATG GAA GAA ACA GCT 720
His Gly Arg Ala Met Leu Leu Val Gly Arg Phe Met Glu Glu Thr Ala
225 230 235 240
AAC TTT GAA AGC AAT GCA ATT ATG AAA AAA TAT AAG GAT GTG ACC GCG 768
Asn Phe Glu Ser Asn Ala Ile Met Lys Lys Tyr Lys Asp Val Thr Ala
245 250 255
TGC CTG CCA GAA TGG GAG GAT GGG CAT TTT TAC CTT GCC AAG TAC TAT 816
Cys Leu Pro Glu Trp Glu Asp Gly His Phe Tyr Leu Ala Lys Tyr Tyr
260 265 270
GAC AAA TTG ATG CCC ATG GTC ACA GAC AAC AAA ATG GAA AAG CAA GGT 864
Asp' Lys Leu Met Pro Met Val Thr Asp Asn Lys Met Glu Lys Gin Gly
275 280 285
GAT CTC ATC CGG TAT ATA GTT CTT CAT TTT GGC AGA TCT CTA CAA TAT 912
Asp Leu Ile Arg Tyr Ile Val Leu His Phe Gly Arg Ser Leu Gin Tyr
290 295 300
GGA AAT CAG TTC ATA TAT CAG TCA ATG CCA CGA ATG TTA ACT CTA TGG 960
Gly Asn Gin Phe Ile Tyr Gin Ser Met Pro Arg Met Leu Thr Leu Trp
305 310 315 320
CTT GAT TAT GGT ACA AAG TCA TAT GAA TGG GAA AAA GCT GGC CGC TCC 1008
Leu Asp Tyr Gly Thr Lys Ser Tyr Glu Trp Glu Lys Ala Gly Arg Ser
325 330 335
GAT CGT GTA CAA ATG AGG AAT GAT TTG GGT AAA ATA AAC AAG GTT ATC 1056
Asp Arg Val Gin Met Arg Asn Asp Leu Gly Lys Ile Asn Lys Val Ile
340 345 350
ACA GAG CAT ACA AAC TAT TTA GCT CCA TAT CAA TTT TTG ACT GCT TTT 1104
Thr Glu His Thr Asn Tyr Leu Ala Pro Tyr Gin Phe Leu Thr Ala Phe
355 360 365
TCA CAA TTG ATC TCT CGA ATT TGT CAT TCT CAC GAT GAA GTT TTT GTT 1152
Ser Gin Leu Ile Ser Arg Ile Cys His Ser His Asp Glu Val Phe Val
370 375 380
• 9 • * · · · ·♦ ··· ···· «· ·
GTC Val 385 TTG ATG GAA Glu ATA ATA GCC AAA GTA TTT CTA Leu 395 GCC TAT CCT CAA CAA 1200
Leu Met Ile Ile 390 Ala Lys Val Phe Ala Tyr Pro Gin Gin 400
GCA ATG TGG ATG ATG ACA GCT GTG TCA AAG TCA TCT TAT CCC ATG CGT 1248
Ala Met Trp Met Met 405 Thr Ala Val Ser Lys 410 Ser Ser Tyr Pro Met 415 Arg
GTG AAC AGA TGC AAG GAA ATC CTC AAT AAA GCT ATT CAT ATG AAA AAA 1296
Val Asn Arg Cys 420 Lys Glu Ile Leu Asn 425 Lys Ala Ile His Met 430 Lýs Lys
TCC TTA GAG AAG TTT GTT GGA GAT GCA ACT CGC CTA ACA GAT AAG CTT 1344
Ser Leu Glu 435 Lys Phe Val Gly Asp 440 Ala Thr Arg Leu Thr 445 Asp Lys Leu
CTA GAA TTG TGC AAT AAA CCG GTT GAT GGA AGT AGT TCC ACA TTA AGC 1392
Leu Glu 450 Leu Cys Asn Lys Pro 455 Val Asp Gly Ser Ser 460 Ser Thr Leu Ser
ATG AGC ACT CAT TTT AAA ATG CTT AAA AAG CTG GTA GAA GAA GCA ACA 1440
Met 465 Ser Thr His Phe Lys 470 Met Leu Lys Lys Leu 475 Val Glu Glu Ala Thr 480
·£·ρ»ρ AGT GAA ATC CTC ATT CCT CTA CAA TCA GTC ATG ATA CCT ACA CTT 1488
Phe Ser Glu Ile Leu 485 Ile Pro Leu Gin Ser 490 Val Met Ile Pro Thr 495 Leu
CCA TCA ATT CTG GGT ACC CAT GCT AAC CAT GCT AGC CAT GAA CCA TTT 1536
Pro Ser Ile Leu 500 Gly Thr His Ala Asn 505 His Ala Ser His Glu 510 Pro Phe
CCT GGA CAT TGG GCC TAT ATT GCA GGG TTT GAT GAT ATG GTG GAA ATT 1584
Pro Gly His 515 Trp Ala Tyr Ile Ala 520 Gly Phe Asp Asp Met 525 Val Glu Ile
CTT GCT TCT CTT CAG AAA CCA AAG AAG ATT TCT TTA AAA GGC TCA GAT 1632
Leu Ala 530 Ser Leu Gin Lys Pro 535 Lys Lys Ile Se i Leu 540 Lys Gly Ser Asp
GGA AAG TTC TAC ATC ATG ATG TGT AAG CCA AAA GAT GAC CTG AGA AAG 1680
Gly 545 Lys Phe Tyr Ile Met 550 Met Cys Lys Pro Lys 555 Asp Asp Leu Arg Lys 560
GAT TGT AGA CTA ATG GAA TTC AAT TCC TTG ATT AAT AAG TGC TTA AGA 1728
Asp Cys Arg Leu Met 565 Glu Phe Asn Ser Leu 570 Ile Asn Lys Cys Leu 575 Arg
AAA GAT GCA GAG TCT CGT AGA AGA GAA CTT CAT ATT CGA ACA TAT GCA 1776
Lys Asp Ala Glu 580 Ser Arg Arg Arg Glu 585 Leu His Ile Arg Thr 590 Tyr Ala
GTT ATT CCA CTA AAT GAT GAA TGT GGG ATT ATT GAA TGG GTG AAC AAC 1824
Val Ile Pro 595 Leu Asn Asp Glu Cys 600 Gly Ile Ile Glu Trp 605 Val Asn Asn
ACT GCT GGT TTG AGA CCT ATT CTG ACC AAA CTA TAT AAA GAA AAG GGA 1872
Thr Ala 610 Gly Leu Arg Pro Ile 615 Leu Thr Lys Leu Tyr 620 Lys Glu Lys Gly
GTG TAT ATG ACA GGA AAA GAA CTT CGC CAG TGT ATG CTA CCA AAG TCA 1920
Val 625 Tyr Met Thr Gly Lys 630 Glu Leu Arg Gin CVS 635 Met Leu Pro Lys Ser 640
GCA GCT TTA TCT GAA AAA CTC AAA GTA TTC CGA GAA TTT CTC CTG CCC 1968
Ala Ala Leu Ser Glu Lys Leu Lys Val Phe Arg Glu Phe Leu Leu Pro
645 650 655 » · » · · · · · • · • · > · · »
AGG CAT CCT CCT ATT TTT
Arg His Pro Pro 660 Ile Phe
CCT ACA TCA TGG TAC AGT
Pro Thr Ser 675 Trp Tyr Ser
GTA ATG TCA ATG GTT GGT
Val Met 690 Ser Met Val Gly
GAA AAT ATT CTC TTT GAT
Glu 705 Asn Ile Leu Phe Asp 710
TTC AAT TGT CTT TTC AAT
Phe Asn Cys Leu Phe 725 Asn
GTG CCA TTT CGC CTG ACT
Val Pro Phe Arg 740 Leu Thr
GGA ACA GAG GGT CTT TTT
Gly Thr Glu 755 Gly Leu Phe
ATG CGT GAT CAG CGA GAG
Met Arg 770 Asp Gin Arg Glu
CAT GAT CCT CTT GTG GAA
Kis 785 Asp Pro Leu Val Glu 790
GCG CCA CTG AAT GAA ACT
Ala Pro Leu Asn Glu 805 Thr
CAT GTT CTT GAC ATT GAG
His Val Leu Asp 820 Ile Glu
AAT AGA GTG ACA GGA CTG
Asn Arg Val 835 Thr Gly Leu
CTT ATA CAA GAA GCT ACT
Leu Ile 850 Gin Glu Ala Thr
GGT TGG ACT CCA TAT ATG
Gly 865 Trp Thr Pro Tyr Met 870
CAT GAG TGG TTT CTG AGA ACA TTC CCT GAT
His Glu Tro 6 65 Phe Leu Arg Thr Phe 670 Pro Asp
AGT AGA TCA GCT TAC TGC CGT TCC ACT GCA
Ser Arg 680 Ser Ala Tyr Cys Arg 685 Ser Thr Ala
TAT ATT CTG GGG CTT GGA GAC CGT CAT GGT
Tyr 695 Ile Leu Gly Leu Gly 700 Asp Arg His Gly
TCT TTG ACT GGT GAA TGC GTA CAT GTA GAT
Ser Leu Thr Gly Glu 715 Cys Val His Val Asp 720
AAG GGA GAA ACC TTT GAA GTT CCA GAA ATT
Lys Gly Glu Thr 730 Phe Glu Val Pro Glu 735 Ile
CAT AAT ATG GTT AAT GGA ATG GGT CCT ATG
His Asn Met 745 Val Asn Gly Met Gly 750 Pro Met
CGA AGA GCA TGT GAA GTT ACA ATG AGG CTG
Arg Arg 760 Ala Cys Glu Val Thr 765 Met Arg Leu
CCT TTA ATG AGT GTC TTA AAG ACT TTT CTA
Pro 775 Leu Mec Ser Val Leu 780 Lys Thr Phe Leu
TGG AGT AAA CCA GTG AAA GGG CAT TCC AAA
Trp Ser Lys Pro Val 795 Lys Gly His Ser Lys 800
GGA GAA GTT GTC AAT GAA AAG GCC AAG ACC
Gly Glu Val Val 810 Asn Glu Lys Ala Lys 815 Thr
CAG CGA CTA CAA GGT GTA ATC AAG ACT CGA
Gin Arg Leu 825 Gin Gly Val Ile Lys 830 Thr Arg
CCG TTA TCT ATT GAA GGA CAT GTG CAT TAC
Pro Leu 840 Ser Ile Glu Gly His 845 Val His Tyr
GAT GAA AAC TTA CTA TGC CAG ATG TAT CTT
Asp 855 Glu Asn Leu Leu Cys 860 Gin Met Tyr Leu
TGAAATGAAA TTATGTAAAA GAATATGTTA
ATAATCTAAA
ACAACATAAA
AATAATATAC
AGTAATGCAT
TTTACGTTCT
ATTCAGTTAT
TTGGTATGAA
CAGCAACTGT
TAAGAAATAA
TCTGTGGTTG
TATTTCTCTC actgctttct
TATCTGTTCA
TGATCATTAA
TAATAAAAAA
ATTCTAAAGT
TTATATGTAA
AAAAAAAAAA
2016
2064
2112
2160
2208
2256
2304
2352
2400
2448
2496
2544
2592
2640
2700
2760
2820
AAAAAAAAAA AAAAA
2835 • · ··· · (2) INFORMACE O SEQ ID NO:4:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 870 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 4:
Val 1 Glu Ala Ala Trp 5 Lys Leu Ser Gin Trp 10 Asp Leu Val Glu Asn 15 Tyr
Leu Ala Ala Asp 20 Gly Lys Ser Thr Thr 25 Trp Ser Val Arg Leu 30 Gly Gin
Leu Leu Leu 35 Ser Ala Lys Lys Arg 40 Asp Ile Thr Ala Phe 45 Tyr Asp Ser
Leu Lys 50 Leu Val Arg Ala Glu 55 Gin Ile Val Pro Leu 60 Ser Ala Ala Ser
Phe 65 Glu Arg Gly Ser Tyr 70 Gin Arg Gly Tyr Glu 75 Tyr Ile Val Arg Leu 80
His Met Leu Cys Glu 85 Leu Glu His Ser Ile 90 Lys Pro Leu Phe Gin 95 His
Ser Pro Gly Asp 100 Ser Ser Gin Glu Asp 105 Ser Leu Asn Trp Val 110 Ala Arg
Leu Glu Met 115 Thr Gin Asn Ser Tyr 120 Arg Ala Lys Glu Pro 125 Ile Leu Ala
Leu Arg 130 Arg Ala Leu Leu Ser 135 Leu Asn Lys Arg Pro 140 Asp Tyr Asn Glu
Met 145 Val Gly Glu Cys Trp 150 Leu Gin Ser Ala Arg 155 Val Ala Arg Lys Ala 160
Gly His His Gin Thr 165 Ala Tyr Asn Ala Leu 170 Leu Asn Ala Gly Glu 175 Ser
Arg Leu Ala Glu 1Θ0 Leu Tyr Val Glu Arg 185 Ala Lys Trp Leu Trp 190 Ser Lys
Gly Asp Val 195 His Gin Ala Leu Ile 200 Val Leu Gin Lys Gly 205 Val Glu Leu
Cys Phe 210 Pro Glu Asn Glu Thr 215 Pro Pro Glu Gly Lys 220 Asn Met Leu Ile
His 225 Gly Arg Ala Met Leu 230 Leu Val Gly Arg Phe 235 Met Glu Glu Thr Ala 240
Asn Phe Glu Ser Asn 245 Ala Ile Met Lys Lys 250 Tyr Lys Asp Val Thr 255 Ala
Cys Leu Pro Glu 260 Trp Glu Asp Gly His 265 Phe Tyr Leu Ala Lys 270 Tyr Tyr
Asp Lys Leu 275 Met Pro Met Val Thr 280 Asp Asn Lys Met Glu 285 Lys Gin Gly
• · · ·
Asp Leu Ile Arg Tyr Ile Val Leu His Phe Gly Arg Ser Leu Gin Tyr
290 295 300
Gly Asn Gin Phe Ile Tyr Gin Ser Met Pro Arg Met Leu Thr Leu Trp
305 310 315 320
Leu Asp Tyr Gly Thr Lys Ser Tyr Glu Trp Glu Lys Ala Gly Arg Ser
325 330 335
Asp Arg Val Gin Met Arg Asn Asp Leu Gly Lys Ile Asn Lys Val Ile
340 345 350
Thr Glu His Thr Asn Tyr Leu Ala Pro Tyr Gin Phe Leu Thr Ala Phe
355 360 365
Ser- Gin Leu Ile Ser Arg Ile Cys His Ser His Asp Glu Val Phe Val
370 375 380
val Leu Met Glu Ile Ile Ala Lys Val Phe Leu Ala Tyr Pro Gin Gin
385 390 395 400
Ala Met Trp Met Met Thr Ala Val Ser Lys Ser Ser Tyr Pro Met Arg
405 410 415
Val Asn Arg Cys Lys Glu Ile Leu Asn Lys Ala Ile His Met Lys Lys
420 425 430
Ser Leu Glu Lys Phe Val Gly Asp Ala Thr Arg Leu Thr Asp Lys Leu
435 44 0 445
Leu Glu Leu Cys Asn Lys Pro Val Asp Gly Ser Ser Ser Thr Leu Ser
450 455 460
Met Ser Thr His Phe Lys Met Leu Lys Lys Leu Val Glu Glu Ala Thr
465 470 475 480
Phe Ser Glu Ile Leu Ile Pro Leu Gin Ser Val Met Ile Pro Thr Leu
485 490 495
Pro Ser Ile Leu Gly Thr His Ala Asn His Ala Ser His Glu Pro Phe
500 505 510
Pro Gly His Trp Ala Tyr Ile Ala Gly Phe Asp Asp Met Val Glu Ile
515 520 525
Leu Ala Ser Leu Gin Lys Pro Lys Lys Ile Ser Leu Lys Gly Ser Asp
530 535 540
Gly Lys Phe Tyr Ile Met Met Cys Lys Pro Lys Asp Asp Leu Arg Lys
545 550 555 560
Asp Cys Arg Leu Met Glu Phe Asn Ser Leu Ile Asn Lys Cys Leu Arg
565 570 575
Lys Asp Ala Glu Ser Arg Arg Arg Glu Leu His Ile Arg Thr Tyr Ala
580 585 590
Val Ile Pro Leu Asn Asp Glu Cys Gly Ile Ile Glu Trp Val Asn Asn
595 600 605
Thr Ala Gly Leu Arg Pro Ile Leu Tlir Lys Leu Tyr Lys Glu Lys Gly
610 615 620
Val Tyr Met Thr Gly Lys Glu Leu Arg Gin Cys Met Leu Pro Lys Ser
625 630 635 640
Ala Ala Leu Ser Glu 645 Lys Leu Lys Val Phe 650 Arg Glu Phe Leu Leu 655 Pro
Arg His Pro Pro Ile Phe His Glu Trp Phe Leu Arg Thr Phe Pro Asp
660 665 670
Pro Thr Ser Trp Tyr Ser Ser Arg Ser Ala Tyr Cys Arg Ser Thr Ala
675 680 685
Val Met Ser Met Val Gly Tyr Ile Leu Gly Leu Gly Asp Arg His Gly
690 695 700
Glu Asn Ile Leu Phe Asp Ser Leu Thr Gly Glu Cys Val His Val Asp
705 710 715 720
Phe Asn Cys Leu Phe Asn Lys Gly Glu Thr Phe Glu Val Pro Glu Ile
725 730 735
Val Pro Phe Arg Leu Thr His Asn Met Val Asn Gly Met Gly Pro Met
740 745 750
Gly Thr Glu Gly Leu Phe Arg Arg Ala Cys Glu Val Thr Met Arg Leu
755 760 765
Met Arg Asp Gin Arg Glu Pro Leu Met Ser Val Leu Lys Thr Phe Leu
770 775 780
His Asp Pro Leu Val Glu Trp Ser Lys Pro Val Lys Gly His Ser Lys
785 790 795 800
Ala Pro Leu Asn Glu Thr Gly Glu Val Val Asn Glu Lys Ala Lys Thr
805 810 815
His Val Leu Asp Ile Glu Gin Arg Leu Gin Gly Val Ile Lys Thr Arg
820 825 830
Asn Arg Val Thr Gly Leu Pro Leu Ser Ile Glu Gly His Val His Tyr
835 840 845
Leu Ile Gin Glu Ala Thr Asp Glu Asn Leu Leu Cys Gin Met Tyr Leu
850 855 860
Gly Trp Thr Pro Tyr Met
865 870 (2) INFORMACE O SEQ ID NO:5:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 33 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: primer oDH15a (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: modifikovaná báze (B) UMÍSTĚNÍ: skupina (15, 18, 24, 30) (D) JINÉ INFORMACE: Nukleotidy v těchto polohách jsou inosiny
..... ::
_ 92 - * ” ··· ···· ·· ί (Xi) POPIS SEKVENCE: SEQ ID NO: 5:
GCAGACGGAT CCGGNWCNGA YGGNAAYHTN TAY 33 (2) INFORMACE O SEQ ID NO:6:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 27 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: modifikovaná báze (B) UMÍSTĚNÍ: skupina (15, 18, 24) (D) JINÉ INFORMACE: Nukleotidy v těchto polohách jsou inosiny (xi) POPIS SEKVENCE: SEQ ID NO: 6:
GCAGACGGAT CCGGNWCNGA YGGNAAY 27 (2) INFORMACE O SEQ ID NO:7:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 30 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: primer 0DHI6 (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: modifikovaná báze (B) UMÍSTĚNÍ: 24 (D) JINÉ INFORMACE: Nukleotidy v těchto polohách jsou inosiny (xi) POPIS SEKVENCE: SEQ ID NO: 7:
GCAGACGAAT TCRCARTYRA ARTCNACRTG 30 (2) INFORMACE O SEQ ID NO:8:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 41 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: primer oDH17a • · · · · · (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: modifikovaná báze (B) UMÍSTĚNÍ: skupina (21, 24, 27, 30) (D) JINÉ INFORMACE: Nukleotidy v těchto polohách jsou inosiny (xi) POPIS SEKVENCE: SEQ ID NO: 8:
GCAGACGGAT CCAARTTYCC NCCNRTNYTN TAYSARTGGT T 41 (2) INFORMACE O SEQ ID NO:9:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 41 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: primer oDH17b (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: modifikovaná báze (B) UMÍSTĚNÍ: skupina (24, 27, 30, 33) (D) JINÉ INFORMACE: Nukleotidy v těchto polohách jsou inosiny (xi) POPIS SEKVENCE: SEQ ID NO: 9:
GCAGACGAAT CCAACCAYTS RTANARNAYN GGNGGRAAYT T 41 (2) INFORMACE O SEQ ID NO:10:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 32 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: primer oDH18a (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: modifikovaná báze (B) UMÍSTĚNÍ: skupina (15, 18, 21, 24, 30) (D) JINÉ INFORMACE: Nukleotidy v těchto polohách jsou inosiny (xi) POPIS SEKVENCE: SEQ ID NO: 10:
GCAGACGGAT CCYTNGGNYT NGGNGAYCGN CA • · · · · ·
(2) INFORMACE O SEQ ID NO:11:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 32 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: primer oDH18b (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: modifikovaná báze (B) UMÍSTĚNÍ: skupina (15, 18, 21) (D) JINÉ INFORMACE: Nukleotidy v těchto polohách jsou inosiny (xi) POPIS SEKVENCE: SEQ ID NO: 11:
GCAGACGGAT CCYTNGGNYT NGGNGAYAGR CA 32 (2) INFORMACE O SEQ ID NO:12:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 33 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: primer oDH23 (xi) POPIS SEKVENCE: SEQ ID NO: 12:
GACGCAGAAT TCACCAGTCA AAGAATCAAA GAG 33 (2) INFORMACE O SEQ ID NO:13:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 16 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: primer mo3 (xi) POPIS SEKVENCE: SEQ ID NO: 13:
CTACAGAGCC AAGGAG
• ·· (2) INFORMACE O SEQ ID NO:14:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 22 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (Vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: primer mo6 (xi) POPIS SEKVENCE: SEQ ID NO: 14:
TCGAGCTATG CTACTAGTGTG GC 22 (2) INFORMACE O SEQ ID NO:15:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 17 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: primer oHT9-l (xi) POPIS SEKVENCE: SEQ ID NO: 15:
CCAGTAAACT TGCTTTC 17 (2) INFORMACE O SEQ ID NO:16:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 20 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: primer OHT9-4 (xi) POPIS SEKVENCE: SEQ ID NO: 16:
TTTGCGGCCC TTCCAATATC 20 (2) INFORMACE O SEQ ID NO:17:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 7440 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární
- 96 « · • · · · · ·
(ii) TYP MOLEKULY: CDNA (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: MCCSlbeta (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 1..7437
(Xi) POPIS SEKVENCE: SEQ ID NO: 17:
ATG GGT CAT GCT GTG GAA TGG CCA GTG GTC ATG AGC CGA TTT TTA AGT 48
Met 1 Gly His Ala Val 5 Glu Trp Pro Val Val 10 Met Ser Arg Phe Leu 15 Ser
CAA TTA GAT GAA CAC ATG GGA TAT TTA CAA TCA GCT CCT TTG CAG TTG 96
Gin Leu Asp Glu 20 His Met Gly Tyr Leu 25 Gin Ser Ala Pro Leu 30 Gin Leu
ATG AGT ATG CAA AAA TTA GAA TTT ATT GAA GTC ACT TTA TTA ACG GTT 144
Met Ser Met 35 Gin Lys Leu Glu Phe 40 Ile Glu Val Thr Leu 45 Leu Thr Val
CTT ACT CGT ATT ATT GCA ATT GTG TTT TTT AGA AGG CAA GAA CTC TTA 192
Leu Thr 50 Arg Ile Ile Al a Ile 55 Val Phe Phe Arg Arg 60 Gin Glu Leu Leu
CTT TGG CAG ATA GGT TGT GTT CTG CTA GAG TAT GGT AGT CCA AAA ATT 240
Leu 65 Trp Gin Ile Gly Cys 70 Val Leu Leu Glu Tyr 75 Gly Ser Pro Lys Ile 80
AAA TCC CTA GCA ATT AGC TTT TTA ACA GAA CTT TTT CAG CTT GGA GGA 288
Lys Ser Leu Ala Ile 85 Ser Phe Leu Thr Glu 90 Leu Phe Gin Leu Gly 95 Gly
CTA CCA GCA CAA CCA GCT AGC ACT TTT TTC AGC TCA TTT TTG GAA TTA 336
Leu Pro Ala Gin 100 Pro Ala Ser Thr Phe 105 Phe Ser Ser Phe Leu 110 Glu Leu
TTA AAA CAC CTT GTA GAA ATG GAT ACT GAC CAA TTG AAA CTC TAT GAA 384
Leu Lys His 115 Leu Val Glu Met Asp 120 Thr Asp Gin Leu Lys 125 Leu Tyr Glu
GAG CCA TTA TCA AAG CTG ATA AAG ACA CTA TTT CCC TTT GAA GCA GAA 432
Glu Pro 130 Leu Ser Lys Leu Ile 135 Lys Thr Leu Phe t-ro 140 Phe Glu Ala Glu
GCT TAT AGA AAT ATT GAA CCT GTC TAT TTA AAT ATG CTG CTG GAA AAA 480
Ala 145 Tyr Arg Asn Ile Glu 150 Pro Val Tyr Leu Asn 155 Met Leu Leu Glu Lys 160
CTC TGT GTC ATG TTT GAA GAC GGT GTG CTC ATG CGG CTT AAG TCT GAT 528
Leu Cys Val Met Phe 165 Glu Asp Gly Val Leu 170 Met Arg Leu Lys Ser 175 Asp
TTG CTA AAA GCA GCT TTG TGC CAT TTA CTG CAG TAT TTC CTT AAA TTT 576
Leu Leu Lys Ala 180 Ala Leu Cys His Leu 185 Leu Gin Tyr Phe Leu 190 Lys Phe
GTG CCA GCT GGG TAT GAA TCT GCT TTA CAA GTC AGG AAG GTC TAT GTG 624
Val Pro Ala 195 Gly Tyr Glu Ser Ala 200 Leu Gin Val Arg Lys 205 Val Tyr Val
AGA AAT ATT TGT AAA GCT CTT TTG GAT GTG CTT GGA ATT GAG. GTA GAT 672
Arg Asn 210 Ile Cys Lys Ala Leu 215 Leu Asp Val Leu Gly 220 Ile Glu Val Asp
GCA GAG TAC TTG Leu TTG GGC CCA CTT TAT GCA GCT TTG AAA Lys ATG Met GAA Glu AGT Ser 240 720
Ala 225 Glu Tyr Leu Gly 230 Pro Leu Tyr Ala Ala 235 Leu
ATG GAA ATC ATT GAG GAG ATT CAA TGC CAA ACT CAA CAG GAA AAC CTC 768
Met Glu Ile Ile Glu 245 Glu Ile Gin Cys Gin 250 Thr Gin Gin Glu Asn 255 Leu
AGC AGT AAT AGT GAT GGA ATA TCA CCC AAA AGG CGT CGT CTC AGC TCG 816
Ser Ser Asn Ser 260 Asp Gly Ile Ser Pro 265 Lys Arg Arg Arg Leu 270 Ser Ser
TCT CTA AAC CCT TCT AAA AGA GCA CCA AAA CAG ACT GAG GAA ATT AAA 864
Ser Leu Asn 275 Pro Ser Lys Arg Ala 280 Pro Lys Gin Thr Glu 285 Glu Ile Lys
CAT GTG GAC ATG AAC CAA AAG AGC ATA TTA TGG AGT GCA CTG AAA CAG 912
His Val 290 Asp Met Asn Gin Lys 295 Ser Ile Leu Trp Ser 300 Ala Leu Lys Gin
AAA GCT GAA TCC CTT CAG ATT TCC CTT GAA TAC AGT GGC CTA AAG AAT 960
Lys 305 Ala Glu Ser Leu Gin 310 Ile Ser Leu Glu Tyr 315 Ser Gly Leu Lys Asn 320
CCT GTT ATT GAG ATG TTA GAA GGA ATT GCT GTT GTC TTA CAA CTG ACT 1008
Pro Val Ile Glu Met 325 Leu Glu Gly Ile Ala 330 Val Val Leu Gin Leu 335 Thr
GCT CTG TGT ACT GTT CAT TGT TCT CAT CAA AAC ATG AAC TGC CGT ACT 1056
Ala Leu Cys Thr 340 Val His Cys Ser His 345 Gin Asn Met Asn Cys 350 Arg Thr
TTC AAG GAC TGT CAA CAT AAA TCC AAG AAG AAA CCT TCT GTA GTG ATA 1104
Phe Lys Asp 355 Cys Gin His Lys Ser 360 Lys Lys Lys Pro Ser 365 Val Val Ile
ACT TGG ATG TCA TTG GAT TTT TAC ACA ACA GTG CTT AAG AGC TGT AGA 1152
Thr Trp 370 Met Ser Leu Asp Phe 375 Tyr Thr Thr Val Leu 380 Lys Ser Cys Arg
AGG TTG TTA GAA TCT GTT CAG AAA CGG ACT GGA GGC AAC ATT GAT AAG 1200
Arg 385 Leu Leu Glu Ser Val 390 Gin Lys Arg Thr Gly 395 Gly Asn Ile Asp Lys 400
GTG GTG AAA ATT TAT GAT GCT TTG ATT TAT ATG CAA GTA AAC AGT TCA 1248
Val Val Lys Ile Tyr 405 Asp Ala Leu Ile Tyr 410 Met Gin Val Asn Ser 415 Ser
TTT GAA GAT CAT ATC CTG GAA GAT TTA TGT GGA ATG CTC TCA CTT CCA 1296
Phe Glu Asp His 420 Ile Leu Glu Asp Leu 425 Cys Gly Met Leu Ser 430 Leu Pro
TGG ATT TAT TCC CAT TCT GAT GAT GGC TGT TTA AAG TTG ACC ACA TTT 1344
Trp Ile Tyr 435 Ser His Ser Asp Asp 440 Gly Cys Leu Lys Leu 445 Thr Thr Phe
GCC GCT AAT CTT CTA ACA TTA AGC TGT AGG ATT TCA GAT AGC TAT TCA 1392
Ala Ala 450 Asn Leu Leu Thr Leu 455 Ser Cys Arg Ile Ser 460 Asp Ser Tyr Ser
CCA CAG GCA CAA TCA CGA TGT GTG TTT CTT CTG ACT CTG TTT CCA AGA 1440
Pro 465 Gin Ala Gin Ser Arg 470 Cys Val Phe Leu Leu 475 Thr Leu Phe Pro Arg 480
AGA ATA TTC CTT GAG TGG AGA ACA GCA GTT TAC AAC TGG GCC CTG CAG 1488
Arg Ile Phe Leu Glu 485 Trp Arg Thr Ala Val 490 Tyr Asn Trp Ala Leu 495 Gin
• » · · · ···»·» • · · · · · · • ·· ·· ··· ···· *· ·
AGC TCC CAT His GAA GTA ATC Ile CGG GCT Arg Ala AGT TGT GTT AGT GGA TTT Phe 510 TTT Phe ATC Ile 1536
Ser Ser Glu 500 Val Ser 505 Cys Val Ser Gly
TTA TTG CAG CAG CAG AAT TCT TGT AAC AGA GTT CCC AAG ATT CTT ATA 1584
Leu Leu Gin Gin Gin Asn Ser Cys Asn Arg Val Pro Lys Ile Leu Ile
515 520 525
GAT AAA GTC AAA GAT GAT TCT GAC ATT GTC AAG AAA GAA TTT GCT TCT 1632
Asp Lys Val Lys Asp Asp Ser Asp Ile Val Lys Lys Glu Phe Ala Ser
530 535 540
ATA CTT GGT CAA CTT GTC TGT ACT CTT CAC GGC ATG TTT TAT CTG ACA 1680
Ile Leu Gly Gin Leu Val Cys Thr Leu His Gly Met Phe Tyr Leu Thr
545 550 555 560
AGT TCT TTA ACA GAA CCT TTC TCT GAA CAC GGA CAT GTG GAC CTC TTC 1728
Ser Ser Leu Thr Glu Pro Phe Ser Glu His Gly His Val Asp Leu Phe
565 570 575
TGT AGG AAC TTG AAA GCC ACT TCT CAA CAT GAA TGT TCA TCT TCT CAA 1776
Cys Arg Asn Leu Lys Ala Thr Ser Gin His Glu Cys Ser Ser Ser Gin
560 585 590
CTA AAA GCT TCT GTC TGC AAG CCA TTC CTT TTC CTA CTG AAA AAA AAA 1824
Leu Lys Ala Ser Val Cys Lys Pro Phe Leu Phe Leu Leu Lys Lys Lys
595 600 605
ATA CCT AGT CCA GTA AAA CTT GCT TTC ATA GAT AAT CTA CAT CAT CTT 1872
Ile Pro Ser Pro Val Lys Leu Ala Phe Ile Asp Asn Leu His His Leu
610 615 620
TGT AAG CAT CTT GAT TTT AGA GAA GAT GAA ACA GAT GTA AAA GCA GTT 1920
Cys Lys His Leu Asp Phe Arg Glu Asp Glu Thr Asp Val Lys Ala Val
625 630 635 640
CTT GGA ACT TTA TTA AAT TTA ATG GAA GAT CCA GAC AAA GAT GTT AGA 1968
Leu Gly Thr Leu Leu Asn Leu Met Glu Asp Pro Asp Lys Asp Val Arg
645 650 655
GTG GCT TTT AGT GGA AAT ATC AAG CAC ATA TTG GAA TCC TTG GAC TCT 2016
Val Ala Phe Ser Gly Asn Ile Lys His Ile Leu Glu Ser Leu Asp Ser
660 665 670
GAA GAT GGA TTT ATA AAG GAG CTT TTT GTC TTA AGA ATG AAG GAA GCA 2064
Glu Asp Gly Phe Ile Lys Glu Leu Phe Val Leu Arg Met Lys Glu Ala
675 680 685
TAT ACA CAT GCC CAA ATA TCA AGA AAT AAT GAG CTG AAG GAT ACC TTG 2112
Tyr Thr His Ala Gin Ile Ser Arg Asn Asn Glu Leu Lys Asp Thr Leu
690 695 700
ATT CTT ACA ACA GGG GAT ATT GGA AGG GCC GCA AAA GGA GAT TTG GTA 2160
Ile Leu Thr Thr Gly Asp Ile Gly Arg Ala Ala Lys Gly Asp Leu Val
705 710 715 720
CCA TTT GCA CTC TTA CAC TTA TTG CAT TGT TTG TTA TCC AAG TCA GCA 2208
Pro Phe Ala Leu Leu His Leu Leu His Cys Leu Leu Ser Lys Ser Ala
725 730 735
TCT GTC TCT GGA GCA GCA TAC ACA GAA ATT AGA GCT CTG GTT GCA GCT 2256
Ser Val Ser Gly Ala Ala Tyr Thr Glu Ile Arg Ala Leu Val Ala Ala
740 745 750
AAA AGT GTT AAA CTG CAA AGT TTT TTC AGC CAG TAT AAG AAA CCC ATC 2304
Lys Ser Val Lys Leu Gin Ser Phe Phe Ser Gin Tyr Lys Lys Pro Ile
755 760 765 • ·
99 « > · · ·' • · · · ·
TGT CAG TTT TTG GTA GAA TCC CTT CAC TCT AGT CAG ATG ACA GCA CTT 2352
Cys Gin 770 Phe Leu Val Glu Ser 775 Leu His Ser Ser Gin 780 Met Thr Ala Leu
CCG AAT ACT CCA TGC CAG AAT GCT GAC GTG CGA AAA CAA GAT GTG GCT 2400
Pro 785 Asn Thr Pro Cys Gin 790 Asn Ala Asp Val Arg 795 Lys Gin Asp Val Ala 800
CAC CAG AGA GAA ATG GCT TTA AAT ACG TTG TCT GAA ATT GCC AAC GTT 2448
His Gin Arg Glu Met 805 Ala Leu Asn Thr Leu 810 Ser Glu Ile Ala Asn 815 Val
TTC GAC TTT CCT GAT CTT AAT CGT TTT CTT ACT AGG ACA TTA CAA GTT 2496
Phe Asp Phe Pro 820 Asp Leu Asn Arg Phe 825 Leu Thr Arg Thr Leu 830 Gin Val
CTA CTA CCT GAT CTT GCT GCC AAA GCA AGC CCT GCA GCT TCT GCT CTC 2544
Leu Leu Pro 835 Asp Leu Ala Ala Lys 840 Ala Ser Pro Ala Ala 845 Ser Ala Leu
ATT CGA ACT TTA GGA AAA CAA TTA AAT GTC AAT CGT AGA GAG ATT TTA 2592
Ile Arg 850 Thr Leu Gly Lys Gin 855 Leu Asn Val Asn Arg 860 Arg Glu Ile Leu
ATA AAC AAC TTC AAA TAT ATT TTT TCT CAT TTG GTC TGT TCT TGT TCC 2640
Ile 665 Asn Asn Phe Lys Tyr 870 Ile Phe Ser His Leu 875 Val Cys Ser Cys Ser 880
AAA GAT GAA TTA GAA CGT GCC CTT CAT TAT CTG AAG AAT GAA ACA GAA 2688
Lys Asp Glu Leu Glu 885 Arg Ala Leu His Tyr 890 Leu Lys Asn Glu Thr 895 Glu
ATT GAA CTG GGG AGC CTG TTG AGA CAA GAT TTC CAA GGA TTG CAT AAT 2736
Ile Glu Leu Gly 900 Ser Leu Leu Arg Gin 905 Asp Phe Gin Gly Leu 910 His Asn
GAA TTA TTG CTG CGT ATT GGA GAA CAC TAT CAA CAG GTT TTT AAT GGT 2784
Glu Leu Leu 915 Leu Arg Ile Gly Glu 920 His Tyr Gin Gin Val 925 Phe Asn Gly
TTG TCA ATA CTT GCC TCA TTT GCA TCC AGT GAT GAT CCA TAT CAG GGC 2832
Leu Ser 930 Ile Leu Ala Ser Phe 935 Ala Ser Ser Asp Asp 940 Pro Tyr Gin Gly
CCG AGA GAT ATC ATA TCA CCT GAA CTG ATG GCT GAT TAT TTA CAA CCC 2880
Pro 945 Arg Asp Ile Ile Ser 950 Pro Glu Leu Met Ala 955 Asp Tyr Leu Gin Pro 960
AAA TTG TTG GGC ATT TTG GCT TTT TTT AAC ATG CAG TTA CTG AGC TCT 2928
Lys Leu Leu Gly Ile 965 Leu Ala Phe Phe Asn 970 Met Gin Leu Leu Ser 975 Ser
AGT GTT GGC ATT GAA GAT AAG AAA ATG GCC TTG AAC AGT TTG ATG TCT 2976
Ser Val Gly Ile 980 Glu Asp Lys Lys Met 985 Ala Leu Asn Ser Leu 990 Met Ser
TTG ATG AAG TTA ATG GGA CCC AAA CAT GTC AGT TCT GTG AGG GTG AAG 3024
Leu Met Lys 995 Leu Met Gly Pro Lys His 1000 Val Ser Ser Val Arg 1005 Val Lys
ATG ATG ACC ACA CTG AGA ACT GGC CTT CGA TTC AAG GAT GAT TTT CCT 3072
Met Met Thr 1010 Thr Leu Arg Thr Gly 1015 Leu Arg Phe Lys Asp 1020 Asp Phe Pro
GAA TTG TGT TGC AGA GCT TGG GAC TGC TTT GTT CGC TGC CTG GAT CAT 3120
Glu Leu 1025 Cys Cys Arg Ala Trp 1030 Asp Cys Phe Val Arg 1035 Cys Leu Asp His 1040
100 ····· · · *
GCT TGT CTG GGC TCC CTT CTC AGT CAT GTA ATA GTA GCT TTG
Ala Cys Leu Gly Ser Leu Leu Ser His Val Ile Val Ala Leu
1045 1050
CTT ATA CAC ATC CAG CCT AAA GAA ACT GCA GCT ATC TTC CAC
Leu Ile His Ile Gin Pro Lys Glu Thr Ala Ala Ile Phe His
1060 1065 1070
ATA ATT GAA AAC AGG GAT GCT GTG CAA GAT TTT CTT CAT GAA ATA TAT 3264
Ile Ile Glu Asn Arg Asp Ala Val Gin Asp Phe Leu His Glu Ile Tyr
1075 1080 1085
TTA CCT Leu Pro 1055
TAC CTC Tvr Leu
3168
3216
TTT Phe TTA CCT Leu Pro 1090 GAT Asp CAT His CCA GAA TTA AAA Lys AAG Lys ATA Ile AAA GCC GTT Lys Ala Val 1100 CTC Leu CAG Gin 3312
Pro Glu Leu 1095
GAA TAC AGA AAG GAG ACC TCT GAG AGC ACT GAT CTT CAG ACA ACT CTT 3360
Glu 110: Tyr Arg ) Lys Glu Thr Ser Glu 1110 Ser Thr Asp 1115 Leu Gin Thr Thr Leu 1120
CAG CTC TCT ATG AAG GCC ATT CAA CAT GAA AAT GTC GAT GTT CGT ATT 3408
Gin Leu Sex- Met Lys Ala 1125 Ile Gin His Glu Asn 1130 Val Asp Val Arg 1135 Ile
CAT GCT CTT ACA AGC TTG AAG GAA ACC TTG TAT AAA AAT CAG GAA AAA 3456
His Ala Leu Thr Ser 1140 Leu Lys Glu Thr 1145 Leu Tyr Lys Asn Gin Glu 1150 Lys
CTG ATA AAG TAT GCA ACA GAC AGT GAA ACA GTA GAA CCT ATT ATC TCA 3504
Leu Ile Lys Tyr 1155 Ala Thr Asp Ser Glu 1160 Thr Val Glu Pro Ile 1165 Ile Ser
CAG TTG GTG ACA GTG CTT TTG AAA GGT TGC CAA GAT GCA AAC TCT CAA 3552
Gin Leu Val 1170 Thr Val Leu Leu Lys 1175 Gly Cys Gin Asp Ala Asn 1180 Ser Gin
GCT CGG TTG CTC TGT GGG GAA TGT TTA GGG GAA TTG GGG GCG ATA GAT 3600
Ala Arg Leu 1185 Leu Cys Gly Glu Cys 1190 Leu Gly Glu Leu Gly Ala 1195 Ile Asp 1200
CCA GGT CGA TTA GAT TTC TCA ACA ACT GAA ACT CAA GGA AAA GAT TTT 3648
Pro Gly Arg Leu Asp Phe 1205 Ser Thr Thr Glu Thr 1210 Gin Gly Lys Asp Phe 1215
ACA TTT GTG ACT GGA GTA GAA GAT TCA AGC TTT GCC TAT GGA TTA TTG 3696
Thr Phe Val Thr Gly 1220 Val Glu Asp Ser Ser 1225 Phe Ala Tyr Gly Leu 1230 Leu
ATG GAG CTA ACA AGA GCT TAC CTT GCG TAT GCT GAT AAT AGC CGA GCT 3744
Met Glu Leu Thr 1235 Arg Ala Tyr Leu Ala 1240 Tyr Ala Asp Asn Ser 1245 Arg Ala
CCA GAT TCA GCT GCC TAT GCC ATT CAG GAG TTG CTT TCT ATT TAT GAC 3792
Pro Asp Ser 1250 Ala Ala Tyr Ala Ile 1255 Gin Glu Leu Leu Ser Ile 1260 Tyr Asp
TGT AGA GAG ATG GAG ACC AAC GGC CCA GGT CAC CAA TTG TGG AGG AGA 3840
Cys Arg Glu 1265 Met Glu Thr Asn Gly 1270 Pro Gly His Gin Leu Trp 1275 Arg Arg 1280
TTT CCT GAG CAT GTT CGG GAA ATA CTA GAA CCT CAT CTA AAT ACC AGA 3888
Phe Pro Glu His Val 1285 Arg Glu Ile Leu Glu Pro 1290 His Leu Asn Thr Arg 1295
TAC AAG AGT TCT CAG AAG TCA ACC GAT TGG TCT GGA GTA AAG AAG CCA 3936
Tyr Lys Ser Ser 130C Gin 1 Lys Ser Thr Asp Trp 1305 Ser Gly Val Lys Lys 1310 Pro
- 101 -
ATT Ile TAC Tyr TTA AGT Leu Ser 1315 AAA Lys TTG Leu GGT Gly AGT AAC Ser Asn 1320 TTT Phe GCA Ala GAA Glu TGG TCA Trp Ser 1325 GCA Ala TCT Ser 3984
TGG GCA GGT TAT CTT ATT ACA AAG GTT CGA CAT GAT CTT GCC AGT AAA 4032
Trp Ala Gly Tyr 1330 Leu Ile Thr Lys Val 1335 Arg His Asp Leu Ala 1340 Ser Lys
ATT TTC ACC TGC TGT AGC ATT ATG ATG AAG CAT GAT TTC AAA GTG ACC 4080
Ile Phe 1345 Thr Cys Cys Ser Ile 1350 Met Met Lys His Asp 1355 Phe Lys Val Thr 1360
ATC TAT CTT CTT CCA CAT ATT CTG GTG TAT GTC TTA CTG GGT TGT AAT 4128
Ile Tyr Leu Leu Pro His 1365 Ile Leu Val Tyr Val 1370 Leu Leu Gly Cys 1375 Asn
CAA GAA GAT CAG CAG GAG GTT TAT GCA GAA ATT ATG GCA GTT CTA AAG 4176
Gin Glu Asp Gin Gin 1380 Glu Val Tyi’ Ala 1385 Glu Ile Met Ala Val Leu 1390 Lys
CAT GAC GAT CAG CAT ACC ATA AAT ACC CAA GAC ATT GCA TCT GAT CTG 4224
His Asp Asp Gin 1395 His Thr Ile Asn Thr 1400 Gin Asp Ile Ala Ser 1405 Asp Leu
TGT CAA CTC AGT ACA CAG ACT GTG TTC TCC ATG CTT GAC CAT CTC ACA 4272
Cys Gin 141C Leu Ser ) Thr Gin Thr 1415 Val Phe Ser Met Leu Asp His 1420 Leu Thr
CAG TGG GCA AGG CAC AAA TTT CAG GCA CTG AAA GCT GAG AAA TGT CCA 4320
Gin Trp 1425 Ala Arg His Lys Phe 1430 Gin Ala Leu Lys Ala 1435 Glu Lys Cys Pro 1440
CAC AGC AAA TCA AAC AGA AAT AAG GTA GAC TCA ATG GTA TCT ACT GTG 4368
His Ser Lys Ser Asn Arg 1445 Asn Lys Val Asp Ser 1450 Met Val Ser Thr 1455 Val
GAT TAT GAA GAC TAT CAG AGT GTA ACC CGT TTT CTA GAC CTC ATA CCC 4416
Asp Tyr Glu Asp Tyr 1460 Gin Ser Val Thr Arg 1465 Phe Leu Asp Leu Ile 1470 Pro
CAG GAT ACT CTG GCA GTA GCT TCC TTT CGC TCC AAA GCA TAC ACA CGA 4464
Gin Asp Thr Leu 1475 Ala Val Ala Ser Phe 1480 Arg Ser Lys Ala Tyr 1485 Thr Arg
GCT GTA ATG CAC TTT GAA TCA TTT ATT ACA GAA AAG AAG CAA AAT ATT 4512
Ala Val Met His 1490 Phe Glu Ser Phe Ile 1495 Thr Glu Lys Lys Gin 1500 Asn Ile
CAG GAA CAT CTT GGA TTT TTA CAG AAA TTG TAT GCT GCT ATG CAT GAA 4560
Gin Glu 1505 His Leu Gly Phe Leu 1510 Gin Lys Leu Tyr Ala 1515 Ala Met His Glu 1520
CCT GAT GGA GTG TCC GGA GTC AGT GCA ATT AGA AAG GCA GAA CCA TCT 4608
Pro Asp Gly Val Ser Gly 1525 Val Ser Ala Ile Arg 1530 Lys Ala Glu Pro Ser 1535
CTA AAA GAA CAG ATC CTT GAA CAT GAA AGC CTT GGC TTG CTG AGG GAT 4656
Leu Lys Glu Gin Ile 1540 Leu Glu His Glu Ser 1545 Leu Gly Leu Leu Arg 1550 Asp
GCC ACT GCT TGT TAT GAC AGG GCT ATT CAG CTA GAA CCA GAC CAG ATC 4704
Ala Thr Ala Cys 1555 Tyr Asp Arg Ala Ile 1560 Gin Leu Glu Pro Asp 1565 Gin Ile
ATT CAT TAC CAT GGT GTA GTA AAG TCC ATG TTA GGT CTT GGT CAG CTG 4752
Ile His 157C Tyr His 1 Gly Val Val Lys Ser 1575 Met Leu Gly Leu Gly 1580 Gin Leu
- 102 ·· · ·· ··· ···· • · ····
TCT ACT Ser Thr 1585 GTT Val ATC Ile ACT Thr CAG GTG Gin Val 1590 AAT Asn GGA Gly GTG Val CAT GCT His Ala 1595 AAC Asn AGG Arg TCC Ser GAG Glu 1600 4800
TGG ACA GAT GAA TTA AAC ACG TAC AGA GTG GAA GCA GCT TGG AAA TTG 4848
Trp Thr Asp Glu Leu Asn Thr Tyr Arg Val Glu Ala Ala Trp Lys Leu
1605 1610 1615
TCA CAG TGG GAT TTG GTG GAA AAC TAT TTG GCA GCA GAT GGA AAA TCT 4896
Ser Gin Trp Asp Leu Val Glu Asn Tyr Leu Ala Ala Asp Gly Lve Ser
1620 1625 1630
ACA ACA TGG AGT GTC AGA CTG GGA CAG CTA TTA TTA TCA GCC AAA AAA 4944
Thr Thr Trp Ser Val Arg Leu Gly Gin Leu Leu Leu Ser Ala Lys Lys
1635 1 64 C ) 1645
AGA GAT ATC ACA GCT TTT TAT GAC TCA CTG AAA CTA GTG AGA GCA GAA 4992
Arg Asp Ile Thr Ala Phe Tyr Asp Ser Leu Lys Leu Val Arg Ala Glu
1650 1655 1660
CAA ATT GTA CCT CTT TCA GCT GCA AGC TTT GAA AGA GGC TCC TAC CAA 5040
Gin Ile Val Pro Leu Ser Ala Ala Ser Phe Glu Arg Gly Ser Tyr Gin
1665 1670 1675 1660
CGA GGA TAT GAA TAT ATT GTG AGA TTG CAC ATG TTA TGT GAG TTG GAG 5088
Arg Gly Tyr Glu Tyr Ile Val Arg Leu His Met Leu Cys Glu Leu Glu
1685 1690 1695
CAT AGC ATC AAA CCA CTT TTC CAG CAT TCT CCA GGT GAC AGT TCT CAA 5136
His Ser Ile Lys Pro Leu Phe Gin His Ser Pro Gly Asp Ser Ser Gin
1700 1705 1710
GAA GAT TCT CTA AAC TGG GTA GCT CGA CTA GAA ATG ACC CAG AAT TCC 5184
Glu Asp Ser Leu Asn Trp Val Ala Arg Leu Glu Met Thr Gin Asn Ser
1715 1720 1725
TAC AGA GCC AAG GAG CCT ATC CTG GCT CTC CGG AGG GCT TTA CTA AGC 5232
Tyr Arg Ala Lys Glu Pro Ile Leu Ala Leu Arg Arg Ala Leu Leu Ser
1730 1735 1740
CTC AAC AAA AGA CCA GAT TAC AAT GAA ATG GTT GGA GAA TGC TGG CTG 5280
Leu Asn Lys Arg Pro Asp Tyr Asn Glu Met Val Gly Glu Cys Trp Leu
1745 1750 1755 1760
CAG AGT GCC AGG GTA GCT AGA AAG GCT GGT CAC CAC CAG ACA GCC TAC 5328
Gin S e i' Ala Arg Val Ala Arg Lys Ala Gly His His Gin Thr Ala Tyr
1765 1770 1775
AAT GCT CTC CTT AAT GCA GGG GAA TCA CGA CTC GCT GAA CTG TAC GTG 5376
Asn Ala Leu Leu Asn Ala Gly Glu Ser Arg Leu Ala Glu Leu Tyr Val
1780 1785 1790
GAA AGG GCA AAG TGG CTC TGG TCC AAG GGT GAT GTT CAC CAG GCA CTA 5424
Glu Arg Ala Lys Trp Leu Trp Ser Lys Gly Asp Val His Gin Ala Leu
1795 1800 1805
ATT GTT CTT CAA AAA GGT GTT GAA TTA TGT TTT CCT GAA AAT GAA ACC 5472
Ile Val Leu Gin Lys Gly Val Glu Leu Cys Phe Pro Glu Asn Glu Thr
1810 1615 1820
CCA CCT GAG GGT AAG AAC ATG TTA ATC CAT GGT CGA GCT ATG CTA CTA 5520
Pro Pro Glu Gly Lys Asn Met Leu Ile His Gly Arg Ala Met Leu Leu
1825 1830 1835 1840
GTG GGC CGA TTT ATG GAA GAA ACA GCT AAC TTT GAA AGC AAT GCA ATT 5568
Val Gly Arg Phe Met Glu Glu Thr Ala Asn Phe Glu Ser Asn Ala Ile
1845
1850
1855
- 103 ····
ATG Met AAA Lys AAA Lys TAT AAG Tyr Lys 1860 GAT Ásp GTG Val ACC Thr GCG TGC Ala Cys 1865 CTG Leu CCA Pro GAA Glu TGG GAG Trp Glu 1870 GAT Asp 5616
GGG CAT TTT TAC CTT GCC AAG TAC TAT GAC AAA TTG ATG CCC ATG GTC 5664
Gly HiS Phe 1875 Tyr Leu Ala Lys Tyr Tyr Asp 1880 Lys Leu Met Pro Met 1885 Val
ACA GAC AAC AAA ATG GAA AAG CAA GGT GAT CTC ATC CGG TAT ATA GTT 5712
Thr Asp 189C Asn 1 Lys Met Glu Lys 1895 Gin Gly Asp Leu Ile Arg 1900 Tyr Ile Val
CTT CAT TTT GGC AGA TCT CTA CAA TAT GGA AAT CAG TTC ATA TAT CAG 5760
Leu His 1905 Phe Gly Arg Ser Leu 1910 Gin Tyr Gly Asn Gin 1915 Phe Ile Tyr Gin 1920
TCA ATG CCA CGA ATG TTA ACT CTA TGG CTT GAT TAT GGT ACA AAG GCA 5808
Ser Met Pro Arg Met 1925 Leu Thr Leu Trp Leu Asp 1930 Tyr Gly Thr Lys Ala 1935
TAT GAA TGG GAA AAA GCT GGC CGC TCC GAT CGT GTA CAA ATG AGG AAT 5856
Tyr Glu Trp Glu Lys 1940 Ala Gly Arg Ser Asp 1945 Arg Val Gin Met Arg 1950 Asn
GAT TTG GGT AAA ATA AAC AAG GTT ATC ACA GAG CAT ACA AAC TAT TTA 5904
Asp Leu Gly Lys Ile 1955 Asn Lys Val Ile Thr 1960 Glu His Thr 1965 Asn Tyr Leu
GCT CCA TAT CAA TTT TTG ACT GCT TTT TCA CAA TTG ATC TCT CGA ATT 5952
Ala Pro Tyr 1970 Gin Phe Leu Thr 1975 Ala Phe Ser Gin Leu Ile 1980 Ser Arg Ile
TGT CAT TCT CAC GAT GAA GTT TTT GTT GTG CTT GAT GGA AAT AAT AGC 6000
Cys His 19E5 Ser His Asp Glu Val 1990 Phe Val Val Leu Asp 1995 Gly Asn Asn Ser 2000
CAA GTA TTT CTA GCC TAT CCT CAA CAA GCA ATG TGG ATG ATG ACA GCT 6048
Gin Val Phe Leu Ala Tyr 2005 Pro Gin Gin Ala Met 2010 Trp Met Met Thr Ala 2015
GTG TCA AAG TCA TCT TAT CCC ATG CGT GTG AAC AGA TGC AAG GAA ATC 6096
Val Ser Lys Ser Ser 2020 Tyr Pro Met Arg Val 2025 Asn Arg Cys Lys Glu 2030 Ile
CTC AAT AAA GCT ATT CAT ATG AAA AAA TCC TTA GAG AAG TTT GTT GGA 6144
Leu Asn Lys Ala Ile 2035 His Met Lys Lys Ser 2040 Leu Glu Lys Phe Val 2045 Gly
GAT GCA ACT CGC CTA ACA GAT AAG CIT CTA GAA TTG TGC AAT AAA CCG 6192
Asp Ala Thr 2050 Arg Leu Thr Asp Lys 2055 Leu Leu Glu Leu Cys 2060 Asn Lys Pro
GTT GAT GGA AGT AGT TCC ACA TTA AGC ATG AGC ACT CAT TTT AAA ATG 6240
Val Asp 2065 Gly Ser Ser Ser Thr 2070 Leu Sex Met Ser Thr 2075 His Phe Lys Met 2080
CTT AAA AAG CTG GTA GAA GAA GCA ACA TTT AGT GAA ATC CTC ATT CCT 6288
Leu Lys Lys Leu Val Glu 2085 Glu Ala Thr Phe Ser 2090 Glu Ile Leu Ile Pro 2095
CTA CAA TCA GTC ATG ATA CCT ACA CTT CCA TCA ATT CTG GGT ACC CAT 6336
Leu Gin Ser Val Met 2100 Ile Pro Thr Leu Pro 2105 Ser Ile Leu Gly Thr 2110 His
GCT AAC CAT GCT AGC CAT GAA CCA TTT CCT GGA CAT .TGG GCC TAT ATT 6384
Ala Asn His Ala Ser His Glu Pro Phe Pro Gly His Trp Ala Tyr Ile
2115 2120 2125
- 104 - • • · · • · • · • · ·· · ·· • • • · • • · • · · ·· · · • · 9 · · • · ··· 9999
GCA GGG TTT GAT GAT ATG GTG GAA ATT CTT GCT TCT CTT CAG AAA CCA 6432
Ala Gly Phe Asp Asp Met Val Glu Ile Leu Ala Ser Leu 2130 2135 2140 Gin Lys Pro
AAG AAG ATT TCT TTA AAA GGC TCA GAT GGA AAG TTC TAC ATC ATG ATG 6480
Lys 2145 Lys Ile Ser Leu Lys Gly Ser Asp Gly Lys Phe Tyr 2150 2155 Ile Met Met 2160
TGT AAG CCA AAA GAT GAC CTG AGA AAG GAT TGT AGA CTA ATG GAA TTC 6528
Cys Lys Pro Lys Asp Asp Leu Arg Lys Asp Cys Arg Leu 2165 2170 Met Glu Phe 2175
AAT TCC TTG ATT AAT AAG TGC TTA AGA AAA GAT GCA GAG TCT CGT AGA 6576
Asn Ser Leu Ile Asn Lys Cys Leu Arg Lys Asp Ala Glu 2180 2185 Ser Arg 2190 Arg
AGA GAA CTT CAT ATT CGA ACA TAT GCA GTT ATT CCA CTA AAT GAT GAA 6624
Arg Glu Leu His Ile Arg Thr Tyr Ala Val Ile Pro Leu Asn Asp 2195 2200 2205 Glu
TGT GGG ATT ATT GAA TGG GTG AAC AAC ACT GCT GGT TTG AGA CCT ATT 6672
Cys Gly Ile Ile Glu Trp Val Asn Asn Thr Ala Gly Leu 2210 2215 2220 Arg Pro Ile
CTG ACC AAA CTA TAT AAA GAA AAG GGA GTG TAT ATG ACA GGA AAA GAA 6720
Leu Thr Lys Leu Tyr Lys Glu Lys Gly Val Tyr Met Thr 2225 2230 2235 Gly Lys Glu 2240
CTT CGC CAG TGT ATG CTA CCA AAG TCA GCA GCT TTA TCT GAA AAA CTC 6768
Leu Arg Gin Cys Met Leu Pro Lys Ser Ala Ala Leu Ser 2245 2250 Glu Lys Leu 2255
AAA GTA TTC CGA GAA TTT CTC CTG CCC AGG CAT CCT CCT ATT TTT CAT 6816
Lys Val Phe Arg Glu Phe Leu Leu Pro Arg His Pro Pro 2260 2265 Ile Phe 2270 His
GAG TGG TTT CTG AGA ACA TTC CCT GAT CCT ACA TCA TGG TAC AGT AGT 6864
Glu Trp Phe Leu Arg Thr Phe Pro Asp Pro Thr Ser Trp Tyr Ser 2275 2280 2285 Ser
AGA TCA GCT TAC TGC CGT TCC ACT GCA GTA ATG TCA ATG GTT GGT TAT 6912
Arg Ser Ala Tyr Cys Arg Ser Thr Ala Val Met Ser Met 2290 2295 2300 Val Gly Tyr
ATT CTG GGG CTT GGA GAC CGT CAT GGT GAA AAT ATT CTC TTT GAT TCT 6960
Ile Leu Gly Leu Gly Asp Arg His Gly Glu Asn Ile Leu 2305 2310 2315 Phe Asp Ser 2320
TTG ACT GGT GAA TGC GTA CAT GTA GAT TTC AAT TGT CTT TTC AAT AAG 7008
Leu Thr Gly Glu Cys Val His Val Asp Phe Asn Cys Leu 2325 2330 Phe Asn Lys 2335
GGA GAA ACC TTT GAA GTT CCA GAA ATT GTG CCA TTT CGC CTG ACT CAT 7056
Gly Glu Thr Phe Glu Val Pro Glu Ile Val Pro Phe Arg 2340 2345 Leu Thr 2350 His
AAT ATG GTT AAT GGA ATG GGT CCT ATG GGA ACA GAG GGT CTT TTT CGA 7104
Asn Met Val Asn Gly Met Gly Pro Met Gly Thr Glu Gly 2355 2360 236 Leu Phe j Arg
AGA GCA TGT GAA GTT ACA ATG AGG CTG ATG CGT GAT CAG CGA GAG CCT 7152
Arg Ala Cys Glu Val Thr Met Arg Leu Met Arg Asp Gin 2370 2375 2380 Arg Glu Pro
TTA ATG AGT GTC TTA AAG ACT TTT CTA CAT GAT CCT CTT GTG GAA TGG 7200
Leu Met Ser Val Leu Lys Thr Phe Leu His Asp Pro Leu 2305 2390 2395 Val Glu Trp 2400
- 105 - • · ·· · · · • • • • · * · ·
AGT AAA CCA GTG AAA GGG CAT TCC AAA GCG CCA CTG AAT GAA ACT GGA 7248
Ser Lys Pro Val Lys Gly His Ser Lys Ala Pro Leu Asn Glu Thr Gly
2405 2410 2415
GAA GTT GTC AAT GAA AAG GCC AAG ACC CAT GTT CTT GAC ATT GAG CAG 7296
Glu Val Val Asn Glu Lys Ala Lys Thr His Val Leu Asp Ile Glu Gin
2420 2425 2430
CGA CTA CAA GGT GTA ATC AAG ACT CGA AAT AGA GTG ACA GGA CTG CCG 7344
Arg Leu Gin Gly Val Ile Lys Thr Arg Asn Arg Val Thr Gly Leu Pro
2435 2440 2445
TTA TCT ATT GAA GGA CAT GTG CAT TAC CTT ATA CAA GAA GCT ACT GAT 7392
Leu Ser Ile Glu Gly His Val His Tyr Leu Ile Gin Glu Ala Thr Asp
2450 2455 2460
GAA AAC TTA CTA TGC CAG ATG TAT CTT GGT TGG ACT CCA TAT ATG 7437
Glu Asn Leu Leu Cys Gin Met Tyr Leu Gly Trp Thr Pro Tyr Met
2465 2470 2475
TGA 7440
(2) INFORMACE 0 SEQ ID NO:18:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 2479 aminokyselin
(B) TYP: aminokyselina
(D) TOPOLOGIE : lineární
(ii) TYP MOLEKULY: protein
(xi) POPIS SEKVENCE: SEQ ID NO: 18:
Met Gly His Ala Val Glu Trp Pro Val Val Met Ser Arg Phe Leu Ser
1 5 10 15
Gin Leu Asp Glu His Met Gly Tyr Leu Gin Ser Ala Pro Leu Gin Leu
20 25 30
Met Ser Met Gin Lys Leu Glu Phe Ile Glu Val Thr Leu Leu Thr Val
35 40 45
Leu Thr Arg Ile Ile Ala Ile Val Phe Phe Arg Arg Gin Glu Leu Leu
50 55 60
Leu Trp Gin Ile Gly Cys Val Leu Leu Glu Tyr Gly Ser Pro Lys Ile
65 70 75 80
Lys Ser Leu Ala Ile Ser Phe Leu Thr Glu Leu Phe Gin Leu Gly Gly
85 90 95
Leu Pro Ala Gin Pro Ala Ser Thr Phe Phe Ser Ser Phe Leu Glu Leu
100 105 110
Leu Lys His Leu Val Glu Met Asp Thr Asp Gin Leu Lys Leu Tyr Glu
115 120 125
Glu Pro Leu Ser Lys Leu Ile Lys Thr Leu Phe Pro Phe Glu Ala Glu
130 135 140
Ala Tyr Arg Asn Ile Glu Pro Val Tyr Leu Asn Met Leu Leu Glu Lys
145 150 155 160
Leu Cys Val Met Phe Glu Asp Gly Val Leu Met Arg Leu Lys Ser Asp
165 170 175
• · · 1
- 106 - • · • · · · • •
Leu Leu Lys Ala Ala Leu Cys His Leu Leu Gin Tyr Phe Leu Lys Phe
180 185 190
Val Pro Ala Gly Tyr Glu Ser Ala Leu Gin Val Arg Lys Val Tyr Val
195 200 205
Arg Asn Ile Cys Lys Ala Leu Leu Asp Val Leu Gly Ile Glu Val Asp
210 215 220
Ala Glu Tyr Leu Leu Gly Pro Leu Tyr Ala Ala Leu Lys Met Glu Ser
225 230 235 240
Met Glu Ile Ile Glu Glu Ile Gin Cys Gin Thr Gin Gin Glu Asn Leu
245 250 255
Ser Ser Asn Ser Asp Gly Ile Ser Pro Lys Arg Arg Arg Leu Ser Ser
260 265 270
Ser Leu Asn Pro Ser Lys Arg Ala Pro Lys Gin Thr Glu Glu Ile Lys
275 280 285
His Val Asp Met Asn Gin Lys Ser Ile Leu Trp Ser Ala Leu Lys Gin
290 295 300
Lys Ala Glu Ser Leu Gin Ile Ser Leu Glu Tyr Ser Gly Leu Lys Asn
305 310 315 320
Pro Val Ile Glu Met Leu Glu Gly Ile Ala Val Val Leu Gin Leu Thr
325 330 335
Ala Leu Cys Thr Val His Cys Ser His Gin Asn Met Asn Cys Arg Thr
340 345 350
Phe Lys Asp Cys Gin His Lys Ser Lys Lys Lys Pro Ser Val Val Ile
355 360 365
Thr Trp Met Ser Leu Asp Phe Tyr Thr Thr Val Leu Lys Ser Cys Arg
370 375 380
Arg Leu Leu Glu Ser Val Gin Lys Arg Thr Gly Gly Asn Ile Asp Lys
385 390 395 400
Val Val Lys Ile Tyr Asp Ala Leu Ile Tyr Met Gin Val Asn Ser Ser
405 410 415
Phe Glu Asp His Ile Leu Glu Asp Leu Cys Gly Met Leu Ser Leu Pro
420 425 430
Trp Ile Tyr Ser His Ser Asp Asp Gly Cys Leu Lys Leu Thr Thr Phe
435 440 445
Ala Ala Asn Leu Leu Thr Leu Ser Cys Arg Ile Ser Asp Ser Tyr Ser
450 455 460
Pro Gin Ala Gin Ser Arg Cys Val Phe Leu Leu Thr Leu Phe Pro Arg
465 470 475 480
Arg Ile Phe Leu Glu Trp Arg Thr Ala Val Tyr Asn Trp Ala Leu Gin
485 490 495
Ser Ser His Glu Val Ile Arg Ala Ser Cys Val Ser Gly Phe Phe Ile
500 505 510
Leu Leu Gin Gin Gin Asn Ser Cys Asn Arg Val Pro Lys Ile Leu Ile
515 520 525
107 • · · · ·
Asp Lys 530 Val Lys Asp Asp Ser 535 Asp Ile Val Lys Lys 540 Glu Phe Ala Ser
Ile 545 Leu Gly Gin Leu Val 550 Cys Thr Leu His Gly 555 Met Phe Tyr Leu Thr 560
Ser Ser Leu Thr Glu 565 Pro Phe Ser Glu His 570 Gly His Val Asp Leu 575 Phe
Cys Arg Asn Leu 580 Lys Ala Thr Ser Gin 585 His Glu Cys Ser Ser 590 Ser Gin
Leu Lys Ala 5S5 Ser Val Cys Lys Pro 600 Phe Leu Phe Leu Leu 605 Lys Lys Lys
Ile Pro 610 Ser Pro Val Lys Leu 615 Ala Phe Ile Asp Asn 620 Leu His His Leu
Cys 625 Lys His Leu Asp Phe 630 Arg Glu Asp Glu Thr 635 Asp Val Lys Ala Val 640
Leu Gly Thr Leu Leu 645 Asn Leu Met Glu Asp 650 Pro Asp Lys Asp Val 655 Arg
Val Ala Phe Ser 660 Gly Asn Ile Lys His 665 Ile Leu Glu Ser Leu 670 Asp Ser
Glu Asp Gly 675 Phe Ile Lys Glu Leu 680 Phe Val Leu Arg Met 685 Lys Glu Ala
Tyr Thr 690 His Ala Gin Ile Ser 695 Arg Asn Asn Glu Leu 700 Lys Asp Thr Leu
Ile 705 Leu Thr Thr Gly Asp 710 Ile Gly Arg Ala Ala 715 Lys Gly Asp Leu Val 720
Pro Phe Ala Leu Leu 725 His Leu Leu His Cys 730 Leu Leu Ser Lys Ser 735 Ala
Ser Val Ser Gly 740 Ala Ala Tyr Thr Glu 745 Ile Arg Ala Leu Val 750 Ala Ala
Lys Ser Val 755 Lys Leu Gin Ser Phe 760 Phe Ser Gin Tyr Lys 765 Lys Pro Ile
Cys Gin 770 Phe Leu Val Glu Ser 775 Leu His Ser Ser Gin 780 Met Thr Ala Leu
Pro 7Θ5 Asn Thr Pro Cys Gin 790 Asn Ala Asp Val Arg 795 Lys Gin Asp Val Ala 800
His Gin Arg Glu Met 805 Ala Leu Asn Thr Leu 810 Ser Glu Ile Ala Asn 815 Val
Phe Asp Phe Pro 820 Asp Leu Asn Arg Phe 825 Leu Thr Arg Thr Leu 830 Gin Val
Leu Leu Pro 835 Asp Leu Ala Ala Lys 840 Ala Ser Pro Ala Ala 845 Ser Ala Leu
Ile Arg 850 Thr Leu Gly Lys Gin 855 Leu Asn Val Asn Arg 860 Arg Glu Ile Leu
Ile 865 Asn Asn Phe Lys Tyr 870 Ile Phe Ser His Leu 875 Val Cys Ser Cys Ser 880
- 108 - • · ·· · · ·
Lys Asp Glu Leu Glu Arg Ala Leu His Tyr Leu Ly6 Asn Glu Thr Glu
885 890 895
Ile Glu Leu Gly Ser Leu Leu Arg Gin Asp Phe Gin Gly Leu His Asn
900 905 910
Glu Leu Leu Leu Arg Ile Gly Glu His Tyr Gin Gin Val Phe Asn Gly
915 920 925
Leu Ser Ile Leu Ala Ser Phe Ala Ser Ser Asp Asp Pro Tyr Gin Gly
930 935 940
Pro Arg Asp Ile Ile Ser Pro Glu Leu Met Ala Asp Tyr Leu Gin Pro
945 950 955 960
Lys Leu Leu Gly Ile Leu Ala Phe Phe Asn Met Gin Leu Leu Ser Ser
965 970 975
Ser Val Gly Ile Glu Asp Lys Lys Met Ala Leu Asn Ser Leu Met Ser
980 985 990
Leu Met Lys Leu Met Gly Pro Lys His Val Ser Ser Val Arg Val Lys
995 1000 1005
Met Met Thr Thr Leu Arg Thr Gly Leu Arg Phe Lys Asp Asp Phe Pro
1010 1015 1020
Glu Leu Cys Cys Arg Ala Trp Asp Cys Phe Val Arg Cys Leu Asp His
1025 1030 1035 1040
Ala Cys Leu Gly Ser Leu Leu Ser His Val Ile Val Ala Leu Leu Pro
1045 1050 1055
Leu Ile His Ile Gin Pro Lys Glu Thr Ala Ala Ile Phe His Tyr Leu
1060 1065 1070
Ile Ile Glu Asn Arg Asp Ala Val Gin Asp Phe Leu His Glu Ile Tyr
1075 1080 1085
Phe Leu Pro Asp His Pro Glu Leu Lys Lys Ile Lys Ala Val Leu Gin
1090 1095 1100
Glu Tyr Arg Lys Glu Thr Ser Glu Ser Thr Asp Leu Gin Thr Thr Leu
1105 1110 1115 1120
Gin Leu Ser Met Lys Ala Ile Gin His Glu Asn Val Asp Val Arg Ile
1125 1130 1135
His Ala Leu Thr Ser Leu Lys Glu Thr Leu Tyr Lys Asn Gin Glu Lys
1140 1145 1150
Leu Ile Lys Tyr Ala Thr Asp Ser Glu Thr Val Glu Pro Ile Ile Ser
1155 1160 1165
Gin Leu Val Thr Val Leu Leu Lys Gly Cys Gin Asp Ala Asn Ser Gin
1170 1175 1180
Ala Arg Leu Leu Cys Gly Glu Cys Leu Gly Glu Leu Gly Ala Ile Asp
1185 1190 1195 1200
Pro Gly Arg Leu Asp Phe Ser Thr Thr Glu Thr Gin Gly Lys Asp Phe
1205 1210 1215
Thr Phe Val Thr Gly Val Glu Asp Ser Ser Phe Ala Tyr Gly Leu Leu 1220 1225 1230
- 109 • · · ·· ·»·· ·« · · • · ·* ·
Met Glu Leu Thr 1235 Arg Ala Tyr Leu Ala 124 0 Tyr Ala Asp Asn Ser 1245 Arg Ala
Pro Asp Ser Ala Ala Tyr Ala Ile Gin Glu Leu Leu Ser Ile Tyr Asp
1250 1255 1260
Cys Arg Glu Met Glu Thr Asn Gly Pro Gly His Gin Leu Trp Arg Arg
1265 1270 1275 1280
Phe Pro Glu His Val Arg Glu Ile Leu Glu Pro His Leu Asn Thr Arg
1285 1290 1295
Tyr Lys Ser Ser Gin Lys Ser Thr Asp Trp Ser Gly Val Lys Lys Pro
1300 1305 1310
Ile Tyr Leu Ser Lys Leu Gly Ser Asn Phe Ala Glu Trp Ser Ala Ser
1315 1320 1325
Trp Ala Gly Tyr Leu Ile Thr Lys Val Arg His Asp Leu Ala Ser Lys
1330 i 1335 1340
Ile Phe Thr Cys Cys Ser Ile Me t Me c Lys His Asp Phe Lys Val Thr
1345 1350 1355 1360
Ile Tyr Leu Leu Pro His Ile Leu Val Tyr Val Leu Leu Gly Cys Asn
1365 1370 1375
Gin Glu Asp Gin Gin Glu Val Tyr Ala Glu Ile Met Ala Val Leu Lys
1380 1385 1390
Hi s Asp Asp Gin His Thr Ile Asn Thr Gin Asp Ile Ala Ser Asp Leu
1395 1400 1405
Cys Gin Leu Ser Thr Gin Thr Val Phe Ser Met Leu Asp His Leu Thr
1410 1415 1420
Gin Trp Ala Arg His Lys Phe Gin Ala Leu Lys Ala Glu Lys Cys Pro
1425 1430 1435 1440
His Ser Lys Ser Asn Arg Asn Lys Val Asp Ser Met Val Ser Thr Val
1445 1450 1455
Asp Tyr Glu Asp Tyr Gin Ser Val Thr Arg Phe Leu Asp Leu Ile Pro
1460 1465 1470
Gin Asp Thr Leu Ala Val Ala Ser Phe Arg Ser Lys Ala Tyr Thr Arg
1475 1480 1485
Ala Val Met His Phe Glu Ser Phe Ile Thr Glu Lys Lys Gin Asn Ile
1490 1495 1500
Gin Glu His Leu Gly Phe Leu Gin Lys Leu Tyr Ala Ala Met His Glu
1505 1510 1515 1520
Pro Asp Gly Val Ser Gly Val Ser Ala Ile Arg Lys Ala Glu Pro Ser
1525 1530 1535
Leu Lys Glu Gin Ile Leu Glu His Glu Ser Leu Gly Leu Leu Arg Asp
1540 1545 1550
Ala Thr Ala Cys Tyr Asp Arg Ala Ile Gin Leu Glu Pro Asp Gin Ile
1555 1560 1565
Ile His Tyr His Gly Val Val Lys Ser Met Leu Gly Leu Gly Gin Leu
1570 1575 1580
- 110 • ·* ·· · · • · · • · · * · · ·· · ·· ·· • · • ···· ·· ···· • · • · ··· ··
Ser Thr 1585 Val Ile Thr Gin Val 1590 Asn Gly Val His Ala Asn Arg Ser Glu
1595 1600
Trp Thr Asp Glu Leu Asn Thr Tyr Arg Val Glu Ala Ala Trp Lys Leu
1605 1610 1615
Ser Gin Trp Asp Leu Val Glu Asn Tyr Leu Ala Ala Asp Gly Lys Ser
1620 1625 1630
Thr Thr Trp Ser Val Arg Leu Gly Gin Leu Leu Leu Ser Ala Lys Lys
1635 1640 1645
Arg Asp Ile Thr Ala Phe Tyr Asp Ser Leu Lys Leu Val Arg Ala Glu
1650 1655 1660
Gin Ile Val Pro Leu Ser Ala Ala Ser Phe Glu Arg Gly Ser Tyr Gin
1665 1670 1675 1680
Arg Gly Tyr Glu Tyr Ile Val Arg Leu His Met Leu Cys Glu Leu Glu
1685 1690 1695
His Ser Ile Lys Pro Leu Phe Gin His Ser Pro Gly Asp Ser Ser Gin
1700 1705 , 1710
Glu Asp Ser Leu Asn Trp Val Ala Arg Leu Glu Met Thr Gin Asn Ser
1715 1720 1725
Tyr Arg Ala Lys Glu Pro Ile Leu Ala Leu Arg Arg Ala Leu Leu Ser
1730 1735 1740
Leu Asn Lys Arg Pro Asp Tyr Asn Glu Met Val Gly Glu Cys Trp Leu
1745 1750 1755 1760
Gin Ser Ala Arg Val Ala Arg Lys Ala Gly His His Gin Thr Ala Tyr
1765 1770 1775
Asn Ala Leu Leu Asn Ala Gly Glu Ser Arg Leu Ala Glu Leu Tyr Val
1780 1785 i 1790
Glu Arg Ala Lys Trp Leu Trp Ser Lys Gly Asp Val His Gin Ala Leu
1795 1800 1805
Ile Val Leu Gin Lys Gly Val Glu Leu Cys Phe Pro Glu Asn Glu Thr
1810 1815 1820
Pro Pro Glu Gly Lys Asn Met Leu Ile His Gly Arg Ala Met Leu Leu
1825 1830 1835 1840
Val Gly Arg Phe Met Glu Glu Thr Ala Asn Phe Glu Ser Asn Ala Ile
1845 1850 1855
Met Lys Lys Tyr Lys Asp Val Thr Ala Cys Leu Pro Glu Trp Glu Asp
1860 1865 i 1870
Gly His Phe Tyr Leu Ala Lys Tyr Tyr Asp Lys Leu Met Pro Met Val
1875 1880 1885
Thr Asp Asn Lys Met Glu Lys Gin Gly Asp Leu Ile Arg Tyr Ile Val
1890 1 1895 1900
Leu His Phe Gly Arg Ser Leu Gin Tyr Gly Asn Gin Phe Ile Tyr Gin
1905 1910 1915 1920
Ser Met Pro Arg Met Leu Thr Leu Trp Leu Asp Tyr Gly Thr Lys Ala
1925 1930 1935
- 111
Tyr Glu Trp Glu Lys Ala 1940 Gly Arg Ser Asp Arg Val 1945 Gin Met Arg 1950 Asn
Asp Leu Gly Lys Ile Asn Lys Val Ile Thr Glu His Thr Asn Tyr Leu
1955 1960 1965
Ala Pro Tyr Gin Phe Leu Thr Ala Phe Ser Gin Leu Ile Ser Arg Ile
1970 1975 1980
Cys His Ser His Asp Glu Val Phe Val Val Leu Asp Gly Asn Asn Ser
1985 1990 1995 2000
Gin Val Phe Leu Ala Tyr Pro Gin Gin Ala Met Trp Met Met Thr Ala
2005 2010 2015
Val Ser' Lys Ser Ser Tyr Pro Met Arg Val Asn Arg Cys Lys Glu Ile
2020 2025 2030
Leu Asn Lys Ala Ile His Met Lys Lys Ser Leu Glu Lys Phe Val Gly
2035 2040 2045
Asp Ala Thr Arg Leu Thr Asp Lys Leu Leu Glu Leu Cys Asn Lys Pro
2050 2055 2060
Val Asp Gly Ser Ser Ser Thr Leu Ser Met Ser Thr His Phe Lys Met
2065 2070 2075 2080
Leu Lys Lys Leu Val Glu Glu Ala Thr Phe Ser Glu Ile Leu Ile Pro
2085 2090 2095
Leu Gin Ser Val Met Ile Pro Thr Leu Pro Ser Ile Leu Gly Thr His
2100 2105 2110
Ala Asn His Ala Ser His Glu Pro Phe Pro Gly His Trp Ala Tyr Ile
2115 2120 2125
Ala Gly Phe Asp Asp Met Val Glu Ile Leu Ala Ser Leu Gin Lys Pro
2130 2135 2140
Lys Lys Ile Ser Leu Lys Gly Ser Asp Gly Lys Phe Tyr Ile Met Met
2145 2150 2155 2160
Cys Lys Pro Lys Asp Asp Leu Arg Lys Asp Cys Arg Leu Met Glu Phe
2165 2170 2175
Asn Ser Leu Ile Asn Lys Cys Leu Arg Lys Asp Ala Glu Ser Arg Arg
2180 2185 2190
Arg Glu Leu His Ile Arg Thr Tyr Ala Val Ile Pro Leu Asn Asp Glu
2195 2200 2205
Cys Gly Ile Ile Glu Trp Val Asn Asn Thr Ala Gly Leu Arg Pro Ile
2210 2215 2220
Leu Thr Lys Leu Tyr Lys Glu Lys Gly Val Tyr Met Thr Gly Lys Glu
2225 2230 2235 2240
Leu Arg Gin Cys Met Leu Pro Lys Ser Ala Ala Leu Ser Glu Lys Leu
2245 2250 2255
Lys Val Phe Arg Glu Phe Leu Leu Pro Arg His Pro Pro Ile Phe His
2260 2265 2270
Glu Trp Phe Leu Arg Thr Phe Pro Asp Pro Thr Ser Trp Tyr Ser Ser 2275 2280 2285 • ·· ·
Arg Ser Ala Tyr Cys Arg Ser Thr Ala Val Met Ser Met 2300 Val Gly Tyr
2290 2295
Ile Leu Gly 2305 Leu Gly Asp Arg His Gly Glu Asn Ile Leu 2310 2315 Phe Asp Ser 2320
Leu Thr Gly Glu Cys Val His Val Asp Phe Asn 2325 2330 Cys Leu Phe Asn Lys 2335
Gly Glu Thr Phe Glu Val Pro Glu Ile Val Pro 2340 2345 Phe Arg Leu Thr 2350 His
Asn Met Val 2355 Asn Gly Met Gly Pro Met Gly Thr i 2360 Glu Gly Leu 2365 Phe Arg
Arg Ala Cys 2370 Glu Val Thr Met Arg Leu Met Arg 2375 Asp Gin 2380 Arg Glu Pro
Leu 2385 Met Ser Val Leu Lys Thr Phe Leu His Asp 2390 2395 Pro Leu Val Glu Trp 2400
Ser Lys Pro Val Lys Gly His Ser Lys Ala Pro 2405 2410 Leu Asn Glu Thr 2415 Gly
Glu Val Val Asn Glu Lys Ala Lys Thr His Val 2420 ' 2425 Leu Asp Ile 243C Glu 1 Gin
Arg Leu Gin 2435 Gly Val Ile Lys Thr Arg Asn Arg 2440 Val Thr 2445 Gly Leu Pro
Leu Ser Ile 2450 Glu Gly His Val His Tyr Leu Ile 2455 Gin Glu 2460 Ala Thr Asp
Glu 2465 Asn Leu Leu Cys Gin Met Tyr Leu Gly Trp 2470 2475 Thr Pro Tyr Met
(2) INFORMACE O SEQ ID NO:19:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 23 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: primer oDH26 (xi) POPIS SEKVENCE: SEQ ID NO: 19:
TGGTTTCTGA GAACATTCCC TGA 23 (2) INFORMACE O SEQ ID NO:20:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 9 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: peptid (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: FLAG tag
113 (xi) POPIS SEKVENCE: SEQ ID NO: 20:
Met Asp Tyr Lys Asp Asp Asp Asp Lys
5 (2) INFORMACE O SEQ ID NO:21:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 20 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (Vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: primer 279-3 (xi) POPIS SEKVENCE: SEQ ID NO: 21:
TGGATGATGA CAGCTGTGTC 20 (2) INFORMACE O SEQ ID NO:22:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 20 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (vii) BEZPROSTŘEDNÍ ZDROJ:
(B) KLON: primer 279-6 (xi) POPIS SEKVENCE: SEQ ID NO: 22:
TGTAGTCGCT GCTCAATGTC 20 (2) INFORMACE O SEQ ID NO:23:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 7624 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 333..7562 (xi) POPIS SEKVENCE: SEQ ID NO: 23:
CTTGTGAAGA GAATGTTTTA CACTCTTGTT AGTGAAGTTT ATTCTTTAAA AGTCAATCGT
CAAGGATTTA GCAAATGAAT TAGCACTTCG GATATACTTG TTTATTTAAT ATCTTTTTTG
120
114
TTTATTTCAA
CCTCCTGTCA
AGAATTCAGT
TTTGTTACAC
AATTGGATCA
AAGAAAATCT
TAACGAGACT
GTGAAGTCAT
TCTGCGGATT
CTGTTCATTA
GCAGCAACTC
TTATTTCTTT
180
240
TTAAAAGCAA
GAGTCCTGCT
ATTTTTGGGG
TACTCACAAA
AGAATTATTA
CAACTTTTTG
300
353
AAGACTTGGT TTACCTCCAT AGAAGAAATG TG ATG GGT CAT GCT GTG GAA TGG
Met T Gly His Ala Val 5 Glu Trp
CCA GTG GTC ATG AGC CGA TTT TTA AGT CAA TTA GAT GAA CAC ATG GGA
Pro Val Val 10 Met Ser Arg Phe Leu 15 Ser Gin Leu Asp Glu 20 His Met Gly
TAT TTA CAA TCA GCT CCT TTG CAG TTG ATG AGT ATG CAA AAT TTA GAA
Tyr Leu 25 Gin Ser Ala Pro Leu 30 Gin Leu Met Ser Met 35 Gin Asn Leu Glu
TTT ATT GAA GTC ACT TTA TTA ATG GTT CTT ACT CGT ATT ATT GCA ATT
Phe 40 Ile Glu Val Thr Leu 45 Leu Met Val Leu Thr 50 Arg Ile Ile Ala Ile 55
GTG TTT TTT AGA AGG CAA GAA CTC TTA CTT TGG CAG ATA GGT TGT GTT
Val Phe Phe Arg Arg 60 Gin Glu Leu Leu Leu 65 Trp Gin Ile Gly Cys 70 Val
CTG CTA GAG TAT GGT AGT CCA AAA ATT AAA TCC CTA GCA ATT AGC TTT
Leu Leu Glu Tyr 75 Gly Ser Pro Lys Ile 80 Lys Ser Leu Ala Ile 85 Ser Phe
TTA ACA GAA CTT TTT CAG CTT GGA GGA CTA CCA GCA CAA CCA GCT AGC
Leu Thr Glu 90 Leu Phe Gin Leu Gly 95 Gly Leu Pro Ala Gin 100 Pro Ala Ser
ACT TTT TTC AGC TCA TTT TTG GAA TTA TTA AAA CAC CTT GTA GAA ATG
Thr Phe 105 Phe Ser Ser Phe Leu 110 Glu Leu Leu Lys His 115 Leu Val Glu Met
GAT ACT GAC CAA TTG AAA CTC TAT GAA GAG CCA TTA TCA AAG CTG ATA
Asp 120 Thr Asp Gin Leu Lys 125 Leu T>'r Glu Glu Pro 130 Leu Ser Lys Leu Ile 135
AAG ACA CTA TTT CCC TTT GAA GCA GAA GCT TAT AGA AAT ATT GAA CCT
Lys Thr Leu Phe Pro 140 Phe Glu Ala Glu Ala 145 Tyr Arg Asn Ile Glu 150 Pro
GTC TAT TTA AAT ATG CTG CTG GAA AAA CTC TGT GTC ATG TTT GAA GAC
Val Tyr Leu Asn 155 Met Leu Leu Glu Lys 160 Leu Cys Val Met Phe 165 Glu Asp
GGT GTG CTC ATG CGG CTT AAG TCT GAT TTG CTA AAA GCA GCT TTG TGC
Gly Val Leu 170 Met Arg Leu Lys Ser 175 Asp Leu Leu Lys Ala 180 Ala Leu Cys
CAT TTA CTG CAG TAT TTC CTT AAA TTT GTG CCA GCT GGG TAT GAA TCT
His Leu 185 Leu Gin Tyr Phe Leu 190 Lys Phe Val Pro Ala 195 Gly Tyr Glu Ser
GCT TTA CAA GTC AGG AAG GTC TAT GTG AGA AAT ATT TGT AAA GCT CTT
Ala 200 Leu Gin Val Arg Lys 205 Val Tyr Val Arg Asn 210 Ile Cys Lys Ala Leu 215
TTG GAT GTG CTT GGA ATT GAG GTA GAT GCA GAG TAC TTG TTG GGC CCA
Leu Asp Val Leu Gly 220 Ile Glu Val Asp Ala 225 Glu Tyr Leu Leu Gly 230 Pro
401
449
497
545
593
641
689
737
785
833
881
929
977
1025
115 • . · · · · · ···· • · · · · · ·
,.* .. ······· ·· »
CTT TAT GCA GCT TTG Leu AAA ' Lys ATG Met GAA Glu AGT ATG GAA ATC ATT Ile GAG Glu 245 GAG Glu ATT Ile 1073
Leu Tyr Ala Ala 235 Ser 240 Met Glu Ile
CAA TGC CAA ACT CAA CAG GAA AAC CTC AGC AGT AAT AGT GAT GGA ATA 1121
Gin Cys Gin Thr Gin Gin Glu Asn Leu Ser Ser Asn Ser Asp Gly Ile
250 255 260
TCA CCC AAA AGG CGT CGT CTC AGC TCG TCT CTA AAC CCT TCT AAA AGA 1169
Ser Pro Lys Arg Arg Arg Leu Ser Ser Ser Leu Asn Pro Ser Lys Arg
265 270 275
GCA CCA AAA CAG ACT GAG GAA ATT AAA CAT GTG GAC ATG AAC CAA AAG 1217
Ala Pro Lys Gin Thr Glu Glu Ile Lys His Val Asp Met Asn Gin Lys
280 285 290 295
AGC ATA TTA TGG AGT GCA CTG AAA CAG AAA GCT GAA TCC CTT CAG ATT 1265
Ser Ile Leu Trp Ser Ala Leu Lys Gin Lys Ala Glu Ser Leu Gin Ile
300 305 310
TCC CTT GAA TAC AGT GGC CTA AAG AAT CCT GTT ATT GAG ATG TTA GAA 1313
Ser Leu Glu Tyr Ser Gly Leu Lys Asn Pro Val Ile Glu Met Leu Glu
315 320 325
GGA ATT GCT GTT GTC TTA CAA CTG ACT GCT CTG TGT ACT GTT CAT TGT 1361
Gly Ile Ala Val Val Leu Gin Leu Thr Ala Leu Cys Thr Val His Cys
330 335 340
TCT CAT CAA AAC ATG AAC TGC CGT ACT TTC AAG GAC TGT CAA CAT AAA 1409
Ser His Gin Asn Met Asn Cys Arg Thr Phe Lys Asp Cys Gin His Lys
345 350 355
TCC AAG AAG AAA CCT TCT GTA GTG ATA ACT TGG ATG TCA TTG GAT TTT 1457
Ser Lys Lys Lys Pro Ser Val Val Ile Thr Trp Met Ser Leu Asp Phe
360 365 370 375
TAC ACA AAA GTG CTT AAG AGC TGT AGA AGT TTG TTA GAA TCT GTT CAG 1505
Tyr Thr Lys Val Leu Lys Ser Cys Arg Ser Leu Leu Glu Ser Val Gin
380 385 390
AAA CTG GAC CTG GAG C-CA ACC ATT GAT AAG GTG GTG AAA ATT TAT GAT 1553
Lys Leu Asp Leu Glu Ala Thr Ile Asp Lys Val Val Lys Ile Tyr Asp
395 400 405
GCT TTG ATT TAT ATG CAA GTA AAC AGT TCA TTT GAA GAT CAT ATC CTG 1601
Ala Leu Ile Tyr Met Gin Val Asn Ser Ser Phe Glu Asp His Ile Leu
410 415 420
GAA GAT TTA TGT GGA ATG CTC TCA CTT CCA TGG ATT TAT TCC CAT TCT 1649
Glu Asp Leu Cys Gly Met Leu Ser Leu Pro Trp Ile Tyr Ser His Ser
425 430 435
GAT GAT GGC TGT TTA AAG TTG ACC ACA TTT GCC GCT AAT CTT CTA ACA 1697
Asp Asp Gly Cys Leu Lys Leu Thr Thr Phe Ala Ala Asn Leu Leu Thr
440 445 450 455
TTA AGC TGT AGG ATT TCA GAT AGC TAT TCA CCA CAG GCA CAA TCA CGA 1745
Leu Ser Cys Arg Ile Ser Asp Ser Tyr Ser Pro Gin Ala Gin Ser Arg
460 465 470
TGT GTG TTT CTT CTG ACT CTG TTT CCA AGA AGA ATA TTC CTT GAG TGG 1793
Cys Val Phe Leu Leu Thr Leu Phe Pro Arg Arg Ile Phe Leu Glu Trp
475 480 485
AGA ACA GCA GTT TAC AAC TGG GCC CTG CAG AGC tcc CAT GAA GTA ATC 1841
Arg Thr Ala Val Tyr Asn Trp Ala Leu Gin Ser Ser His Glu Val Ile
490 495 500
116 • · w · ···· • · · · · · · ··· · • · · · -· · · ··· ·· ··· ···» *· ·
CGG GCT AGT TGT GTT AGT Ser GGA TTT TTT Phe ATC Ile TTA Leu TTG Leu 515 CAG Gin CAG Gin CAG Gin AAT Asn 1889
Arg Ala Ser Cys Val Gly 510 Phe
505
TCT TGT AAC AGA GTT CCC AAG ATT CTT ATA GAT AAA GTC AAA GAT GAT 1937
Ser 520 Cys Asn Arg Val Pro 525 Lys Ile Leu Ile Asp 530 Lys Val Lys Asp Asp 535
TCT GAC ATT GTC AAG AAA GAA TTT GCT TCT ATA CTT GGT CAA CTT GTC 1985
Ser Asp Ile Val Lys 540 Lys Glu Phe Ala Ser 545 Ile Leu Gly Gin Leu 550 Val
TGT ACT CTT CAC GGC ATG TTT TAT CTG ACA AGT TCT TTA ACA GAA CCT 2033
Cys Thr Leu His 555 Gly Met Phe Tyr Leu 560 Thr Ser Ser Leu Thr 565 Glu Pro
TTC TCT GAA CAC GGA CAT GTG GAC CTC TTC TGT AGG AAC TTG AAA GCC 2081
Phe Ser Glu 570 His Gly Hi s Val Asp 575 Leu Phe Cys Arg Asn 580 Leu Lys Ala
ACT TCT CAA CAT GAA TGT TCA TCT TCT CAA CTA AAA GCT TCT GTC TGC 2129
Thr Ser 585 Gin His Glu Cys Ser 590 Ser Ser Gin Leu Lys 595 Ala Ser Val Cys
AAG CCA TTC CTT TTC CTA CTG AAA AAA AAA ATA CCT AGT CCA GTA AAA 2177
Lys 600 Pro Phe Leu Phe Leu 605 Leu Lys Lys Lys Ile 610 Pro Ser Pro Val Lys 615
CTT GCT TTC ATA GAT AAT CTA CAT CAT CTT TGT AAG CAT CTT GAT TTT 2225
Leu Ala Phe Ile Asp 620 Asn Leu His His Leu 625 Cys Lys His Leu Asp 630 Phe
AGA GAA GAT GAA ACA GAT GTA AAA GCA GTT CTT GGA ACT TTA TTA AAT 2273
Arg Glu Asp Glu 635 Thr Asp Val Lys Ala 640 Val Leu Gly Thr Leu 645 Leu Asn
TTA ATG GAA GAT CCA GAC AAA GAT GTT AGA GTG GCT TTT AGT GGA AAT 2321
Leu Met Glu 650 Asp Pro Asp Lys Asp 655 Val Arg Val Ala Phe 660 Ser Gly Asn
ATC AAG CAC ATA TTG GAA TCC TTG GAC TCT GAA GAT GGA TTT ATA AAG 2369
Ile Lys 665 His Ile Leu Glu Ser 670 Leu Asp Ser Glu Asp 675 Gly Phe Ile Lys
GAG CTT TTT GTC TTA AGA ATG AAG GAA GCA TAT ACA CAT GCC CAA ATA 2417
Glu 680 Leu Phe Val Leu Arg 685 Met Lys Glu Ala Tyr 690 Thr His Ala Gin Ile 695
TCA AGA AAT AAT GAG CTG AAG GAT ACC TTG ATT CTT ACA ACA GGG GAT 2465
Ser Arg Asn Asn Glu 700 Leu Lys Asp Thr Leu 705 Ile Leu Thr Thr Gly 710 Asp
ATT GGA AGG GCC GCA AAA GGA GAT TTG GTA CCA TTT GCA CTC TTA CAC 2513
Ile Gly Arg Ala 715 Ala Lys Gly Asp Leu 720 Val Pro Phe Ala Leu 725 Leu His
TTA TTG CAT TGT TTG TTA TCC AAG TCA GCA TCT GTC TCT GGA GCA GCA 2561
Leu Leu His 730 Cys Leu Leu Ser Lys 735 Ser Ala Ser Val Ser 740 Gly Ala Ala
TAC ACA GAA ATT AGA GCT CTG GTT GCA GCT AAA AGT GTT AAA CTG CAA 2609
Tyr Thr Glu Ile Arg Ala Leu Val Ala Ala Lys Ser Val Lys Leu Gin
745 750 755
AGT TTT TTC AGC CAG TAT AAG AAA CCC ATC TGT CAG TTT TTG GTA GAA 2657
Ser Phe Phe Ser Gin Tyr Lys Lys Pro Ile Cys Gin Phe Leu Val Glu
760 765 770 775
TCC CTT CAC TCT AGT CAG ATG ACA GCA
Ser Leu His Ser Ser 780 Gin Met Thr Ala
AAT GCT GAC GTG CGA AAA CAA GAT GTG
Asn Ala Asp Val 795 Arg Lys Gin Asp Val 800
TTA AAT ACG TTG TCT GAA ATT GCC AAC
Leu Asn Thr 810 Leu Ser Glu Ile Ala 815 Asn
AAT CGT TTT CTT ACT AGG ACA TTA CAA
Asn Arg 825 Phe Leu Thr Arg Thr 830 Leu Gin
GCC AAA GCA AGC CCT GCA GCT TCT GCT
Ala 84 0 Lys Ala Ser Pro Ala 845 Ala Ser Ala
CAA TTA AAT GTC AAT CGT AGA GAG ATT
Gin Leu Asn Val Asn 860 Arg Arg Glu Ile
ATT TTT TCT CAT TTG GTC TGT TCT TGT
Ile Phe Ser His 875 Leu Val Cys Ser Cys 880
GCC CTT CAT TAT CTG AAG AAT GAA ACA
Ala Leu Hi s 890 Tyr Leu Lys Asn Glu 895 Thr
TTG AGA CAA GAT TTC CAA GGA TTG CAT
Leu Arg 905 Gin Asp Phe Gin Gly 910 Leu His
GGA GAA CAC TAT CAA CAG GTT TTT AAT
Gly 920 Glu His Tyr Gin Gin 925 Val Phe Asn
TTT GCA TCC AGT GAT GAT CCA TAT CAG
Phe Ala Ser Ser Asp 940 Asp Pro Tyr Gin
CCT GAA CTG ATG GCT GAT TAT TTA CAA
Pro Glu Leu Met 955 Ala Asp Tyr Leu Gin 960
GCT TTT TTT AAC ATG CAG TTA CTG AGC
Ala Phe Phe 970 Asn Met Gin Leu Leu 975 Ser
AAG AAA ATG GCC TTG AAC AGT TTG ATG
Lys Lys 985 Met Ala Leu Asn Ser 990 Leu Met
CCC AAA CAT GTC AGT TCT GTG AGG GTG
Pro Lys 1000 His Val Ser Ser Val 1005 Arg Val
ACT GGC CTT CGA TTC AAG GAT GAT TTT
Thr Gly Leu Arg Phe Lys Asp Asp Phe
1020
_ 117 AAT Asn ACT Thr * CCA Pro • » · * TGC Cys 790 • · CAG Gin
CTT Leu 785 CCG Pro 2705
GCT CAC CAG AGA GAA ATG GCT 2753
Ala His Gin Arg Glu 805 Met Ala
GTT TTC GAC TTT CCT GAT CTT 2801
Val Phe Asp Phe 820 Pro Asp Leu
GTT CTA CTA CCT GAT CTT GCT 2849
Val Leu Leu 835 Pro Asp Leu Ala
CTC ATT CGA ACT TTA GGA AAA 2 89 7
Leu Ile 850 Arg Thr Leu Gly Lys 855
TTA ATA AAC AAC TTC AAA TAT 2945
Leu 865 Ile Asn Asn Phe Lys 870 Tyr
TCC AAA GAT GAA TTA GAA CGT 2993
Ser Lys Asp Glu Leu 885 Glu Arg
GAA ATT GAA CTG GGG AGC CTG 3041
Glu Ile Glu Leu 900 Gly Ser Leu
AAT GAA TTA TTG CTG CGT ATT 3089
Asn Glu Leu 915 Leu Leu Arg Ile
GGT TTG TCA ATA CTT GCC TCA 3137
Gly Leu 930 Ser Ile Leu Ala Ser 935
GGC CCG AGA GAT ATC ATA TCA 3185
Gly 945 Pro Arg Asp Ile Ile 950 Ser
CCC AAA TTG TTG GGC ATT TTG 3233
Pro Lys Leu Leu Gly 965 Ile Leu
TCT AGT GTT GGC ATT GAA GAT 3281
Ser Ser Val Gly 980 Ile Glu Asp
TCT TTG ATG AAG TTA ATG GGA 3329
Ser Leu Met 995 Lys Leu Met Gly
AAG ATG ATG ACC ACA CTG AGA 3377
Lys Met Met 1010 Thr Thr Leu Arg 1015
CCT GAA TTG TGT TGC AGA GCT 3425
Pro Glu Leu Cys Cys Arg Ala
TGG GAC TGC TTT GTT CGC TGC CTG GAT Trp Asp Cys Phe Val Arg Cys Leu Asp
1035 104
1025 10.30
CAT GCT TGT CTG GGC TCC CTT 3473
His Ala Cys Leu Gly Ser Leu
1045
118
CTC Leu AGT Ser CAT GTA His Val 1050 ATA Ile GTÁ Val GCT Ala TTG TTA Leu Leu 1055 CCT Pro CTT Leu ATA Ile CAC ATC His Ile 1060 CAG Gin CCT Pro 3521
AAA GAA ACT GCA GCT ATC TTC CAC TAC CTC ATA ATT GAA AAC AGG GAT 3569
Lys Glu 1065 Thr Ala Ala Ile Phe His Tyr 1070 Leu Ile Ile Glu Asn 1075 Arg Asp
GCT GTG CAA GAT TTT CTT CAT GAA ATA TAT TTT TTA CCT GAT CAT CCA 3617
Ala Val 1080 Gin Asp Phe Leu 1085 His Glu Ile Tyr Phe Leu 1090 Pro Asp His Pro 1095
GAA TTA AAA AAG ATA AAA GCC GTT CTC CAG GAA TAC AGA AAG GAG ACC 3665
Glu Leu Lys Lys Ile Lys 1100 Ala Val Leu Gin Glu 1105 Tyr Arg Lys Glu Thr 1110
TCT GAG AGC ACT GAT CTT CAG ACA ACT CTT CAG CTC TCT ATG AAG GCC 3713
Ser Glu Ser Thr Asp 1115 Leu Gin Thr Thr Leu 1120 Gin Leu Ser Met Lys 1125 Ala
ATT CAA CAT GAA AAT GTC GAT GTT CGT ATT CAT GCT CTT ACA AGC TTG 3761
Ile Gin His Glu 1130 Asn Val Asp Val Arg 1135 Ile His Ala Leu Thr 1140 Ser Leu
ZaAG GAA ACC TTG TAT AAA AAT CAG GAA AAA CTG ATA AAG TAT GCA ACA 3809
Lys Glu 1145 Thr Leu Tyr Lys Asn Gin Glu 1150 Lys Leu Ile 1155 Lys Tyr Ala Thr
GAC AGT GAA ACA GTA GAA CCT ATT ATC TCA CAG TTG GTG ACA GTG CTT 3857
Asp Ser 1160 Glu Thr Val Glu 1165 Pro Ile Ile Ser Gin Leu 1170 Val Thr Val Leu 1175
TTG AAA GGT TGC CAA GAT GCA AAC TCT CAA GCT CGG TTG CTC TGT GGG 3905
Leu Lys Gly Cys Gin Asp 1180 Ala Asn Ser Gin 1185 Ala Arg Leu Leu Cys 119C Gly 1
GAA TGT TTA GGG GAA TTG GGG GCG ATA GAT CCA GGT CGA TTA GAT TTC 3953
Glu Cys Leu Gly Glu 1195 Leu Gly Ala Ile Asp 1200 Pro Gly Arg Leu Asp 1205 Phe
TCA ACA ACT GAA ACT CAA GGA AZA GAT TTT ACA TTT GTG ACT GGA GTA 4001
Ser Thr Thr Glu 1210 Thr Gin Gly Lys Asp 1215 Phe Thr Phe Val Thr 1220 Gly Val
GAA GAT TCA AGC TTT GCC TAT GGA TTA TTG ATG GAG CTA ACA AGA GCT 4049
Glu Asp 1225 Ser Ser Phe Ala Tyr Gly Leu 1230 Leu Met Glu Leu Thr 1235 Arg Ala
TAC CTT GCG TAT GCT GAT AAT AGC CGA GCT CAA GAT TCA GCT GCC TAT 4097
Tyr Leu 1240 Ala Tyr Ala Asp Asn 1245 Ser Arg Ala Gin Asp 1250 Ser Ala Ala Tyr 1255
GCC ATT CAG GAG TTG CTT TCT ATT TAT GAC TGT AGA GAG ATG GAG ACC 4145
Ala Ile Gin Glu Leu Leu 1260 Ser Ile Tyr Asp Cys 1265 Arg Glu Met Glu Thr 1270
AAC GGC CCA GGT CAC CAA TTG TGG AGG AGA TTT CCT GAG CAT GTT CGG 4193
Asn Gly Pro Gly His 1275 Gin Leu Trp Arg Arg 1280 Phe Pro Glu His Val 1285 Arg
GZkA ATA CTA GAA CCT CAT CTA AAT ACC AGA TAC AAG AGT TCT CAG AAG 4241
Glu Ile Leu Glu 1290 Pro His Leu Asn Thr 1295 Arg Tyr Lys Ser Ser 1300 Gin Lys
TCA ACC GAT TGG TCT GGA GTA AAG AAG CCA ATT TAC TTA AGT AAA TTG 4289
Ser Thr Asp Trp 1305 Ser Gly Val Lys Lys 1310 Pro Ile Tyr Leu Ser 1315 Lys Leu
GGT AGT Gly Ser 1320 AAC Asn TTT GCA GAA TGG TCA GCA TCT TGG GCA GGT TAT CTT Leu ATT Ile 1335 4337
Phe Ala Glu Trp 1325 Ser Ala Ser Trp Ala 1330 Gly Tyr
ACA AAG GTT CGA CAT GAT CTT GCC AGT AAA ATT TTC ACC TGC TGT AGC 4385
Thr Lys Val Arg His Asp Leu 1340 Ala Ser Lys Ile Phe 1345 Thr Cys Cys Ser 1350
ATT ATG ATG AAG CAT GAT TTC AAA GTG ACC ATC TAT CTT CTT CCA CAT 4433
Ile Met Met Lys His 1355 Asp Phe Lys Val Thr 1360 Ile Tyr Leu Leu Pro 1365 His
ATT CTG GTG TAT GTC TTA CTG GGT TGT AAT CAA GAA GAT CAG CAG GAG 4481
Ile Leu Val Tyr 1370 Val Leu Leu Gly Cys 1375 Asn Gin Glu Asp Gin 1380 Gin Glu
GTT TAT GCA GAA ATT ATG GCA GTT CTA AAG CAT GAC GAT CAG CAT ACC 4529
Val Tyr 13 85 Ala Glu Ile Met Ala Val 1390 Leu Lys His Asp 1395 Asp Gin His Thr
ATA AAT ACC CAA GAC ATT GCA TCT GAT CTG TGT CAA CTC AGT ACA CAG 4577
Ile Asn 1400 Thr Gin Asp Ile Ala 1405 Ser Asp Leu Cys Gin 1410 Leu Ser Thr Gin 1415
ACT GTG TTC TCC ATG CTT GAC CAT CTC ACA CAG TGG GCA AGG CAC AAA 4625
Thr Val Phe Ser Met Leu Asp 1420 His Leu Thr 1425 Gin Trp Ala Arg His Lys 1430
TTT CAG GCA CTG AAA GCT GAG AAA TGT CCA CAC AGC AAA TCA AAC AGA 4673
Phe Gin Ala Leu Lys 1435 Ala Glu Lys Cys 144C Pro 1 His Ser Lys Ser Asn 1445 Arg
AAT AAG GTA GAC TCA ATG GTA TCT ACT GTG GAT TAT GAA GAC TAT CAG 4721
Asn Lys Val Asp 1450 Ser Met Val Ser 1455 Thr 1 Val Asp Tyr Glu 146C Asp 1 Tyr Gin
AGT GTA ACC CGT TTT CTA GAC CTC ATA CCC CAG GAT ACT CTG GCA GTA 4769
Ser Val 1465 Thr Arg Phe Leu Asp Leu 1470 Ile Pro Gin Asp 1475 Thr Leu Ala Val
GCT TCC TTT CGC TCC AAA GCA TAC ACA CGA GCT GTA ATG CAC TTT GAA 4817
Ala Ser 1480 Phe Arg Ser Lys Ala 1485 Tyr Thr Arg Ala Val 1490 Met His Phe Glu 1495
TCA TTT ATT ACA GAA AAG AAG CAA AAT ATT CAG GAA CAT CTT GGA TTT 4865
Ser Phe Ile Thr Glu Lys Lys 1500 Gin Asn Ile 1505 Gin Glu His Leu Gly Phe 1510
TTA CAG AAA TTG TAT GCT GCT ATG CAT GAA CCT GAT GGA GTG GCC GGA 4913
Leu Gin Lys Leu Tyr 1515 Ala Ala Met His Glu 1520 Pro Asp Gly Val Ala 1525 Gly
GTC AGT GCA ATT AGA AAG GCA GAA CCA TCT CTA AAA GAA CAG ATC CTT 4961
Val Ser Ala Ile 1530 Arg Lys Ala Glu 1535 Pro Ser Leu Lys Glu Gin 1540 Ile Leu
GAA CAT GAA AGC CTT GGC TTG CTG AGG GAT GCC ACT GCT TGT TAT GAC 5009
Glu His 1545 Glu Ser Leu Gly Leu Leu 1550 Arg Asp Ala Thr Ala 1555 Cys Tyr Asp
AGG GCT ATT CAG CTA GAA CCA GAC CAG ATC ATT CAT TAC CAT GGT GTA 5057
Arg Ala 1560 Ile Gin Leu Glu Pro 1565 Asp Gin Ile Ile His 1570 Tyr His Gly Val 1575
GTA AAG TCC ATG TTA GGT CTT GGT CAG CTG TCT ACT GTT ATC ACT CAG 5105
Val Lys Ser Met Leu 158C Gly Leu 1 Gly Gin Leu Ser Thr 1585 Val Ile Thr Gin 1590
120
GTG Val AAT Asn GGA Gly GTG CAT Val His 1595 GCT Ala AAC Asn AGG Arg TCC GAG Ser Glu 1600 TGG Trp ACA Thr GAT Asp GAA TTA Glu Leu 1605 AAC Asn 5153
ACG TAC AGA GTG GAA GCA GCT TGG AAA TTG TCA CAG TGG GAT TTG GTG 5201
Thr Tyr Arg Val Glu 1610 Ala Ala Trp Lys Leu 1615 Ser Gin Trp I62i Asp Leu 0 Val
GAA AAC TAT TTG GCA GCA GAT GGA AAA TCT ACA ACA TGG AGT GTC AGA 5249
Glu Asn 1625 Tyr Leu Ala Ala Asp Gly 1630 Lys Ser Thr Thr Trp 1635 Ser Val Arg
CTG GGA CAG CTA TTA TTA TCA GCC AAA AAA AGA GAT ATC ACA GCT TTT 5297
Leu Gly 1640 Gin Leu Leu Leu Ser 1645 Ala Lys Lys Arg Asp 1650 Ile Thr Ala Phe 1655
TAT GAC TCA CTG AAA CTA GTG AGA GCA GAA CAA ATT GTA CCT CTT TCA 5345
Tyr Asp Ser Leu Lys Leu 1660 Val Arg Ala Glu 1665 Gin Ile Val Pro Leu Ser 1670
GCT GCA AGC TTT GAA AGA GGC TCC TAC CAA CGA GGA TAT GAA TAT ATT 5393
Ala Ala Ser Phe Glu 1675 Arg Gly Ser Tyr Gin 1680 Arg Gly Tyr Glu Tyr 1685 Ile
GTG AGA TTG CAC ATG TTA TGT GAG TTG GAG CAT AGC ATC AAA CCA CTT 5441
Val Arg Leu His Met 1690 Leu Cys Glu 1695 Leu Glu His Ser Ile Lys Pro 1700 Leu
TTC CAG CAT TCT CCA GGT GAC AGT TCT CAA GAA GAT TCT CTA AAC TGG 5489
Phe Gin His 1705 Ser Pro Gly Asp Ser 1710 Ser Gin Glu Asp Ser 1715 Leu Asn Trp
GTA GCT CGA CTA GAA ATG ACC CAG AAT TCC TAC AGA GCC AAG GAG CCT 5537
Val Ala 1720 Arg Leu Glu Met Thr 1725 Gin Asn Ser Tyr Arg 1730 Ala Lys Glu Pro 1735
ATC CTG GCT CTC CGG AGG GCT TTA CTA AGC CTC AAC AAA AGA CCA GAT 5585
Ile Leu Ala Leu Arg Arg 1740 Ala Leu Leu Ser Leu 1745 Asn Lys Arg Pro Asp 1750
TAC AAT GAA ATG GTT GGA GAA TGC TGG CTG CAG AGT GCC AGG GTA GCT 5633
Tyr Asn Glu Met Val 1755 Gly Glu Cys Trp Leu 1760 Gin Ser Ala Arg Val 1765 Ala
AGA AAG GCT GGT CAC CAC CAG ACA GCC TAC AAT GCT CTC CTT AAT GCA 5681
Arg Lys Ala Gly His 1770 His Gin Thr 1775 Ala Tyr > Asn Ala Leu Leu Asn 1780 Ala
GGG GAA TCA CGA CTC GCT GAA CTG TAC GTG GAA AGG GCA AAG TGG CTC 5729
Gly Glu Ser 1785 Arg Leu Ala Glu Leu 1790 Tyr Val Glu Arg Ala 1795 Lys Trp Leu
TGG TCC AAG GGT GAT GTT CAC CAG GCA CTA ATT GTT CTT CAA AAA GGT 5777
Trp Ser 1800 Lys Gly Asp Val His 1805 Gin Ala Leu Ile Val 1810 Leu Gin Lys Gly 1815
GTT GAA TTA TGT TTT CCT GAA AAT GAA ACC CCA CCT GAG GGT AAG AAC 5825
Val Glu Leu Cys Phe Pro 1820 Glu Asn Glu Thr Pro 1825 Pro Glu Gly Lys Asn 1830
ATG TTA ATC CAT GGT CGA GCT ATG CTA CTA GTG GGC CGA TTT ATG GAA 5873
Met Leu Ile His Gly 1835 Arg Ala Met Leu Leu 1840 Val Gly Arg Phe Met 1845 . Glu
GAA ACA GCT AAC TTT GAA AGC AAT GCA ATT ATG AAA AAA TAT AAG GAT 5921
Glu Thr Ala 185C Asn Phe 1 Glu Ser Asn 1855 Ala Ile Met Lys Lys Tyr Lys 1860 Asp
- 121 -
GTG ACC GCG TGC CTG Leu CCA GAA TGG GAG GAT GGG Gly CAT His 1875 TTT Phe TAC Tyr CTT Leu GCC Ala 5969
Val Thr Ala 1865 Cys Pro Glu Trp 1870 Glu Asp
AAG TAC TAT GAC AAA TTG ATG CCC ATG GTC ACA GAC AAC AAA ATG GAA 6017
Lys Tyr Tyr 1880 Asp Lys Leu Met Pro 1885 Met Val Thr Asp 1890 Asn Lys Met Glu 1895
AAG CAA GGT GAT CTC ATC CGG TAT ATA GTT CTT CAT TTT GGC AGA TCT 6065
Lys Gin Gly Asp Leu Ile Arg Tyr 19 0 0 Ile Val 1905 Leu His Phe Gly Arg Ser 1910
CTA CAA TAT GGA AAT CAG TTC ATA TAT CAG TCA ATG CCA CGA ATG TTA 6113
Leu Gin Tyr Gly Asn 1915 Gin Phe Ile Tyr Gin 1920 Ser Met Pro Arg 1925 Met Leu
ACT CTA TGG CTT GAT TAT GGT ACA AAG GCA TAT GAA TGG GAA AAA GCT 6161
Thr Leu Trp Leu 1930 Asp Tyr Gly Thr 1935 Lys Ala Tyr Glu Trp Glu 1940 Lys Ala
GGC CGC TCC GAT CGT GTA CAA ATG AGG AAT GAT TTG GGT AAA ATA AAC 6209
Gly Arg Ser 1945 Asp Arg Val Gin Met 1950 Arg Asn Asp Leu 1955 Gly Lys Ile Asn
AAG GTT ATC ACA GAG CAT ACA AAC TAT TTA GCT CCA TAT CAA TTT TTG 6257
Lys Val Ile 1960 Thr Glu His Thr Asn 1965 Tyr Leu Ala Pro 1970 Tyr Gin Phe Leu 1975
ACT GCT TTT TCA CAA TTG ATC TCT CGA ATT TGT CAT TCT CAC GAT GAA 6305
Thr Ala Phe Ser Gin Leu Ile Ser 1980 Arg Ile Cys 1985 His Ser His Asp Glu 1990
GTT TTT GTT GTG CTT GAT GGA AAT AAT AGC CAA GTA TTT CTA GCC TAT 6353
Val Phe Val Val Leu 1995 Asp Gly Asn Asn Ser 2000 Gin Val Phe Leu Ala 2005 Tyr
CCT CAA CAA GCA ATG TGG ATG ATG ACA GCT GTG TCA AAG TCA TCT TAT 6401
Pro Gin Gin Ala 2010 Met Trp Met Met Thr 2015 Ala Val Ser Lys Ser 2020 Ser Tyr
CCC ATG CGT GTG AAC AGA TGC AAG GAA ATC CTC AAT AAA GCT ATT CAT 6449
Pro Met Arg 2025 Val Asn Arg Cys Lys 2030 Glu Ile Leu Asn Lys 2035 Ala Ile His
ATG AAA AAA TCC TTA GAG AAG TTT GTT GGA GAT GCA ACT CGC CTA ACA 6497
Met Lys Lys 2040 Ser Leu Glu Lys Phe 2045 Val Gly Asp Ala 2050 Thr Arg Leu Thr 2055
GAT AAG CTT CTA GAA TTG TGC AAT AAA CCG GTG GAA ATT CTT GCT TCT 6545
Asp Lys Leu Leu Glu Leu Cys Asn 2060 Lys Pro Val 2065 Glu Ile Leu Ala Ser 2070
CTT CAG AAA CCA AAG AAG ATT TCT TTA AAA GGC TCA GAT GGA AAG TTC 6593
Leu Gin Lys Pro Lys 2075 Lys Ile Ser Leu Lys 2080 Gly Ser Asp Gly Lys 2085 Phe
TAC ATC ATG ATG TGT AAG CCA AAA GAT GAC CTG AGA AAG GAT TGT AGA 6641
Tyr Ile Met Met 2090 Cys Lys Pro Lys Asp 2095 Asp Leu Arg Lys Asp 2100 Cys Arg
CTA ATG GAA TTC AAT TCC TTG ATT AAT AAG TGC TTA AGA AAA GAT GCA 6689
Leu Met Glu 2105 Phe Asn Ser Leu Ile 2110 Asn Lys Cys Leu Arg 2115 Lys Asp Ala
GAG TCT CGT AGA AGA GAA CTT CAT ATT CGA ACA TAT GCA GTT ATT CCA 6737
Glu Ser Arg 2120 Arg Arg Glu Leu His 2125 Ile Arg Thr Tyr 2130 Ala Val Ile Pro 2135
··
- 122 -
CTA Leu AAT Asn GAT Asp GAA Glu TGT GGG Cys Gly 2140 ATT Ile ATT Ile GAA Glu TGG GTG Trp Val 2145 AAC Asn AAC Asn ACT Thr GCT GGT Ala Gly 2150 6785
TTG AGA CCT ATT CTG ACC AAA CTA TAT AAA GAA AAG GGA GTG TAT ATG 6833
Leu Arg Pro Ile Leu Thr 2155 Lys Leu Tyr Lys Glu 2160 Lys Gly Val Tyr Met 2165
ACA GGA AAA GAA CTT CGC CAG TGT ATG CTA CCA AAG TCA GCA GCT TTA 6881
Thr Gly Lys Glu 2170 Leu Arg Gin Cys Met 2175 Leu Pro Lys Ser Ala 2180 Ala Leu
TCT GAA AAA CTC AAA GTA TTC CGA GAA TTT CTC CTG CCC AGG CAT CCT 6929
Ser Glu Lys 2185 Leu Lys Val Phe Arg 2190 Glu Phe Leu Leu Pro 2195 Arg His Pro
CCT ATT TTT CAT GAG TGG TTT CTG AGA ACA TTC CCT GAT CCT ACA TCA 6977
Pro Ile 2200 Phe His Glu Trp Phe 2205 Leu Arg Thr Phe Pro 2210 Asp Pro Thr Ser 2215
TGG TAC AGT AGT AGA TCA GCT TAC TGC CGT TCC ACT GCA GTA ATG TCA 7025
Trp Tyr Ser Ser Arg Ser 2220 Ala Tyr Cys Arg Ser 2225 Thr Ala Val Met Ser 2230
ATG GTT GGT TAT ATT CTG GGG CTT GGA GAC CGT CAT GGT GAA AAT ATT 7073
Met Val Gly Tyr Ile Leu 2235 Gly Leu Gly Asp Arg 2240 His Gly Glu Asn Ile 2245
CTC TTT GAT TCT TTG ACT GGT GAA TGC GTA CAT GTA GAT TTC AAT TGT 7121
Leu Phe Asp Ser 2250 Leu Thr Gly Glu 2255 Cys Val His Val Asp Phe 2260 Asn Cys
CTT TTC AAT AAG GGA GAA ACC TTT GAA GTT CCA GAA ATT GTG CCA TTT 7169
Leu Phe 2265 Asn Lys Gly Glu Thr Phe 2270 Glu Val Pro Glu Ile 2275 Val Pro Phe
CGC CTG ACT CAT AAT ATG GTT AAT GGA ATG GGT CCT ATG GGA ACA GAG 7217
Arg Leu 2280 Thr His Asn Met Val 2285 Asn Gly Met Gly Pro 2290 Met Gly Thr Glu 2295
GGT CTT TTT CGA AGA GCA TGT GAA GTT ACA ATG AGG CTG ATG CGT GAT 7265
Gly Leu Phe Arg Arg Ala 2300 Cys Glu Val Thr Met 2305 Arg Leu Met Arg Asp 2310
CAG CGA GAG CCT TTA ATG AGT GTC TTA AAG ACT TTT CTA CAT GAT CCT 7313
Gin Arg Glu Pro 2315 Leu Met Ser Val Leu Lys Thr 2320 Phe Leu His Asp Pro 2325
CTT GTG GAA TGG AGT AAA CCA GTG AAA GGG CAT TCC AAA GCG CCA CTG 7361
Leu Val Glu Trp 2330 Ser Lys Pro Val Lys 2335 Gly His Ser Lys Ala 2340 Pro Leu
AAT GAA ACT GGA GAA GTT GTC AAT GAA AAG GCC AAG ACC CAT GTT CTT 7409
Asn Glu Thr 2345 Gly Glu Val Val Asn 2350 Glu Lys Ala Lys Thr 2355 His Val Leu
GAC ATT GAG CAG CGA CTA CAA GGT GTA ATC AAG ACT CGA AAT AGA GTG 7457
Asp Ile 2360 Glu Gin Arg Leu Gin 2365 Gly Val Ile Lys Thr 2370 Arg Asn Arg Val 2375
ACA GGA CTG CCG TTA TCT ATT GAA GGA CAT GTG CAT TAC CTT ATA CAA 7505
Thr Gly Leu Pro Leu Ser 2380 Ile Glu Gly His Val 2385 His Tyr Leu Ile Gin 2390
GAA GCT ACT GAT GAA AAC TTA CTA TGC CAG ATG TAT CTT GGT TGG ACT 7553
Glu Ala Thr Asp 2395 Glu Asn Leu Leu Cys Gin Met 2400 Tyr Leu Gly Trp Thr 2405
123
CCA TAT ATG TGAAATGAAA. TTATGTAAAA GAATATGTTA ATAATCTAAA 7 602
Pro Tyr Met
2410
AGTAAAAAAA AAAAAAAAAA AA 7 624 (2) INFORMACE O SEQ ID NO:24:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 2410 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (Xi) POPIS SEKVENCE: SEQ ID NO: 24:
Met 1 Gly His Ala Val 5 Glu Trp Pro Val Val 10 Met Ser Arg Phe Leu 15 Ser
Gin Leu Asp Glu His Met Gly Tyr Leu Gin Ser Ala Pro Leu Gin Leu
20 25 30
Met Ser Met Gin Asn Leu Glu Phe Ile Glu Val Thr Leu Leu Met Val
35 40 45
Leu Thr Arg Ile Ile Ala Ile Val Phe Phe Arg Arg Gin Glu Leu Leu
50 55 60
Leu Trp Gin Ile Gly Cys Val Leu Leu Glu Tyr Gly Ser Pro Lys Ile
65 70 75 80
Lys Ser Leu Ala Ile Ser Phe Leu Thr Glu Leu Phe Gin Leu Gly Gly
85 90 95
Leu Pro Ala Gin Pro Ala Ser Thr Phe Phe Ser Ser Phe Leu Glu Leu
100 105 110
Leu Lys His Leu Val Glu Met Asp Thr Asp Gin Leu Lys Leu Tyr Glu
115 120 125
Glu Pro Leu Ser Lys Leu Ile Lys Thr Leu Phe Pro Phe Glu Ala Glu
130 135 140
Ala Tyr Arg Asn Ile Glu Pro Val Tyr Leu Asn Met Leu Leu Glu Lys
145 150 155 160
Leu Cys Val Met Phe Glu Asp Gly Val Leu Met Arg Leu Lys Ser Asp
165 170 175
Leu Leu Lys Ala Ala Leu Cys His Leu Leu Gin Tyr Phe Leu Lys Phe
180 185 190
Val Pro Ala Gly Tyr Glu Ser Ala Leu Gin Val Arg Lys Val Tyr Val
195 200 205
Arg Asn Ile Cys Lys Ala Leu Leu Asp Val Leu Gly Ile Glu Val Asp
210 215 220
Ala Glu Tyr Leu Leu Gly Pro Leu Tyr Ala Ala Leu Lys Met Glu Ser
225 230 235 240
Met Glu Ile Ile Glu Glu Ile Gin Cys Gin Thr Gin Gin Glu Asn Leu 245 250 255 • ·
- 124
Ser Ser Asn Ser Asp Gly 260 Ile Ser Pro 265 Lys Arg Arg Arg Leu 270 Ser Ser
Ser Leu Asn Pro Ser Lys Arg Ala Pro Lys Gin Thr Glu Glu Ile Lys
275 280 285
His Val Asp Met Asn Gin Lys Ser Ile Leu Trp Ser Ala Leu Lys Gin
290 295 300
Lys Ala Glu Ser Leu Gin Ile Ser Leu Glu Tyr Ser Gly Leu Lys Asn
305 310 315 320
Pro Val Ile Glu Met Leu Glu Gly Ile Ala Val Val Leu Gin Leu Thr
325 330 335
Ala Leu Cys Thr Val His Cys Ser His Gin Asn Met Asn Cys Arg Thr
340 345 350
Phe Lys Asp Cys Gin His Lys Ser Lys Lys Lys Pro Ser Val Val Ile
355 360 365
Thr Trp Met Ser Leu Asp Phe Tyr Thr Lys Val Leu Lys Ser Cys Arg
370 375 380
Ser Leu Leu Glu Ser Val Gin Lys Leu Asp Leu Glu Ala Thr Ile Asp
385 390 395 400
Lys Val Val Lys Ile Tyr Asp Ala Leu Ile Tyr Met Gin Val Asn Ser
405 410 415
Ser Phe Glu Asp His Ile Leu Glu Asp Leu Cys Gly Met Leu Ser Leu
420 425 430
Pro Trp Ile Tyr Ser His Ser Asp Asp Gly Cys Leu Lys Leu Thr Thr
435 440 445
Phe Ala Ala Asn Leu Leu Thr Leu Ser Cys Arg Ile Sei' Asp Ser Tyr
450 455 460
Ser Pro Gin Ala Gin Ser Arg Cys Val Phe Leu Leu Thr Leu Phe Pro
465 470 475 480
Arg Arg Ile Phe Leu Glu Trp Arg Thr Ala Val Tyr Asn Trp Ala Leu
485 490 495
Gin Ser Ser His Glu Val Ile Arg Ala Ser Cys Val Ser Gly Phe Phe
500 505 510
Ile Leu Leu Gin Gin Gin Asn Ser Cys Asn Arg Val Pro Lys Ile Leu
515 520 525
Ile Asp Lys Val Lys Asp Asp Ser Asp Ile Val Lys Lys Glu Phe Ala
530 535 540
Ser Ile Leu Gly Gin Leu Val Cys Thr Leu His Gly Met Phe Tyr Leu
545 550 555 560
Thr Ser Ser Leu Thr Glu Pro Phe Ser Glu His Gly His Val Asp Leu
565 570 575
Phe Cys Arg Asn Leu Lys Ala Thr Ser Gin His Glu Cys Ser Ser Ser
580 585 590
Gin Leu Lys Ala Ser Val Cys Lys Pro Phe Leu Phe Leu Leu Lys Lys
595 600 605
Lys Ile 610 Pro Ser Pro Val Lys 615 Leu
Leu 625 Cys Lys His Leu Asp 630 Phe Arg
Val Leu Gly Thr Leu 645 Leu Asn Leu
Arg Val Ala Phe 660 Ser Gly Asn Ile
Ser Glu Asp 675 Gly Phe Ile Lys Glu 680
Ala Tyr 690 Thr His Ala Gin Ile 695 Ser
Leu 705 Ile Leu Thr Thr Gly 710 Asp Ile
Val Pro Phe Ala Leu 725 Leu His Leu
Ala Ser Val Ser 740 Gly Ala Ala Tyr
Ala Lys Ser 755 Val Lys Leu Gin Ser 760
Ile cys 770 Gin Phe Leu Val Glu 775 Ser
Leu 785 Pro Asn Thr Pro Cys 790 Gin Asn
Ala His Gin Arg Glu 805 Met Ala Leu
Va 1 Phe Asp Phe 820 Pro Asp Leu Asn
Val Leu Leu 835 Pro Asp Leu Ala Ala 840
Leu Ile 850 Arg Thr Leu Gly Lys 855 Gin
Leu 865 Ile Asn Asn Phe Lys 870 Tyr Ile
Ser Lys Asp Glu Leu 885 Glu Arg Ala
Glu Ile Glu Leu 900 Gly Ser Leu Leu
Asn Glu Leu 915 Leu Leu Arg Ile Gly 920
Gly Leu 930 Ser Ile Leu Ala Ser 935 Phe
Gly 945 Pro Arg Asp Ile Ile 950 Ser Pro
125 • • ·«
Ala Phe Ile Asp 620 Asn Leu His His
Glu Asp Glu 635 Thr Asp Val Lys Ala 640
Met Glu 650 Asp Pro Asp Lys Asp 655 Val
Lys 665 His Ile Leu Glu Ser 670 Leu Asp
Leu Phe Val Leu Arg 685 Met Lys Glu
Arg Asn Asn Glu 700 Leu Lys Asp Thr
Gly Arg Ala 715 Ala Lys Gly Asp Leu 720
Leu His 730 Cys Leu Leu Ser Lys 735 Ser
Thr 745 Glu Ile Arg Ala Leu 750 Val Ala
Phe Phe Ser Gin Tyr 765 Lys Lys Pro
Leu His Ser Ser 780 Gin Met Thr Ala
Ala Asp Val 795 Arg Lys Gin Asp Val 800
Asn Thr 810 Leu Ser Glu Ile Ala 815 Asn
Arg 825 Phe Leu Thr Arg Thr 830 Leu Gin
Lys Ala Ser Pro Ala 845 Ala Ser Ala
Leu Asn Val Asn 860 Arg Arg Glu Ile
Phe Ser His 875 Leu Val Cys Ser Cys 880
Leu His 890 Tyr Leu Lys Asn Glu 895 Thr
Arg 905 Gin Asp Phe Gin Gly 910 Leu His
Glu His Tyr Gin Gin 925 Val Phe Asn
Ala Ser Ser Asp 940 Asp Pro Tyr Gin
Glu Leu Met 955 Ala Asp Tyr Leu Gin 960
126 • · · · · · · ··· *· ··· ···· ·· ·
Pro Ly6 Leu Leu Gly 9 65 Ile Leu Ala Phe Phe 970 Asn Met Gin Leu Leu 975 Ser
Ser Ser Val Gly Ile Glu Asp Lys Lys Met Ala Leu Asn Ser Leu Met
980 985 990
Ser Leu Met Lys Leu Me t Gly Pro Lys His Val Ser Ser Val Arg Val
995 1000 1005
Lys Met Met Thr Thr Leu Arg Thr Gly Leu Arg Phe Lys Asp Asp Phe
1010 1015 1020
Pro Glu Leu Cys Cys Arg Ala Trp Asp Cys Phe Val Arg Cys Leu Asp
1025 1030 1035 1040
His Ala Cys Leu Gly Ser Leu Leu Ser His Val Ile Val Ala Leu Leu
1045 1050 1055
Pro Leu Ile His Ile Gin Pro Lys Glu Thr Ala Ala Ile Phe His Tyr
1060 1065 1070
Leu Ile Ile Glu Asn Arg Asp Ala Val Gin Asp Phe Leu Hi s Glu Ile
1075 1080 1085
Tyr Phe Leu Pro Asp His Pro Glu Leu Lys Lys Ile Lys Ala Val Leu
1090 1095 1100
Gin Glu Tyr Arg Lys Glu Thr Ser Glu Ser Thr Asp Leu Gin Thr Thr
1105 1110 1115 1120
Leu Gin Leu Ser Met Lys Ala Ile Gin His Glu Asn Val Asp Val Arg
1125 1130 1135
Ile His Ala Leu Thr Ser Leu Lys Glu Thr Leu Tyr Lys Asn Gin Glu
1140 1145 1150
Lys Leu Ile Lys Tyr Ala Thr Asp Ser Glu Thr Val Glu Pro Ile Ile
1155 1160 1165
Ser Gin Leu Val Thr Val Leu Leu Lys Gly Cys Gin Asp Ala Asn Ser
1170 1175 1180
Gin Ala Arg Leu Leu Cys Gly Glu Cys Leu Gly Glu Leu Gly Ala Ile
1185 1190 1195 1200
Asp Pro Gly Arg Leu Asp Phe Ser Thr Thr Glu Thr Gin Gly Lys Asp
1205 1210 1215
Phe Thr Phe Val Thr Gly Val Glu Asp Ser Ser Phe Ala Tyr Glv Leu
1220 1225 1230
Leu Met Glu Leu Thr Arg Ala Tyr Leu Ala Tyr Ala Asp Asn Ser Arg
1235 1240 1245
Ala Gin Asp Ser Ala Ala Tyr Ala Ile Gin Glu Leu Leu Ser Ile Tyr
1250 1255 1260
Asp Cys Arg Glu Met Glu Thr Asn Gly Pro Gly His Gin Leu Trp Arg
12 65 1270 1275 1280
Arg Phe Pro Glu His Val Arg Glu Ile Leu Glu Pro His Leu Asn Thr
1265 1290 1295
Arg Tyr Lys Ser Ser Gin Lys Ser Thr Asp Trp Ser Gly Val Lys Lys 1300 1305 ‘ 1310 • ·
Pro Ile Tyr Leu 1315 Ser Lys Leu Gly Ser 1320 Asn Phe Ala Glu Trp 1325 Ser Ala
Ser Trp Ala Gly Tyr Leu Ile Thr Lys Val Arg His Asp Leu Ala Ser
1330 1335 1340
Lys Ile Phe Thr Cys Cys Ser Ile Met Met Lys His Asp Phe Lys Val
1345 1350 1355 1360
Thr Ile Tyr Leu Leu Pro His Ile Leu Val Tyr Val Leu Leu Gly Cys
1365 1370 1375
Asn Gin Glu Asp Gin Gin Glu Val Tyr Ala Glu Ile Met Ala Val Leu
1380 1385 1390
Lys His Asp Asp Gin His Thr Ile Asn Thr Gin Asp Ile Ala Ser Asp
1395 1400 1405
Leu Cys Gin Leu Ser Thr Gin Thr Val Phe Ser Met Leu Asp His Leu
1410 1415 1420
Thr Gin Trp Ala Arg His Lys Phe Gin Ala Leu Lys Ala Glu Lys Cys
1425 1430 1435 1440
Pro His Ser Lys Ser Asn Arg Asn Lys Val Asp Ser Met Val Ser Thr
1445 1450 1455
Val Asp Tyr Glu Asp Tyr Gin Ser Val Thr Arg Phe Leu Asp Leu Ile
1460 1465 1470
Pro Gin Asp Thr Leu Ala Val Ala Ser Phe Arg Ser Lys Ala Tyr Thr
1475 1480 1485
Arg Ala Val Met His Phe Glu Ser Phe Ile Thr Glu Lys Lys Gin Asn
1490 1495 1500
Ile Gin Glu His Leu Gly Phe Leu Gin Lys Leu Tyr Ala Ala Met His
1505 1510 1515 1520
Glu Pro Asp Gly Val Ala Gly Val Ser Ala Ile Arg Lys Ala Glu Pro
1525 1530 1535
Ser Leu Lys Glu Gin Ile Leu Glu His Glu Ser Leu Gly Leu Leu Arg
1540 1545 1550
Asp Ala Thr Ala Cys Tyr Asp Arg Ala Ile Gin Leu Glu Pro Asp Gin
1555 1560 1565
Ile Ile His Tyr His Gly Val Val Lys Ser Met Leu Gly Leu Gly Gin
1570 1575 1580
Leu Ser Thr Val Ile Thr Gin Val Asn Gly Val His Ala Asn Arg Ser
1585 1590 1595 1600
Glu Trp Thr Asp Glu Leu Asn Thr Tyr Arg Val Glu Ala Ala Trn Lys
1605 1610 1615
Leu Ser Gin Trp Asp Leu Val Glu Asn Tyr Leu Ala Ala Asp Gly Lys
1620 1625 1630
Ser Thr Thr Trp Ser Val Arg Leu Gly Gin Leu Leu Leu Ser Ala Lys
1635 1640 1645
Lys Arg Asp Ile Thr Ala Phe Tyr Asp Ser Leu Lys Leu Val Arg Ala
1650 1655 1660
128
Glu Gin Ile Val Pro Leu Ser Ala Ala Ser Phe Glu Arg Gly Ser Tyr
1665 167C 1 1675 i 1680
Gin Arg Gly Tyr Glu Tyr 1685 Ile Val Arg Leu His 1690 Met Leu Cys Glu Leu 1695
Glu His Ser Ile Lys Pro 1700 Leu Phe Gin His Ser 1705 Pro Gly Asp Ser Ser 1710
Gin Glu Asp Ser Leu Asn 1715 Trp Val Ala Arg Leu 1720 Glu Met Thr Gin Asn 1725
Ser Tyr Arg Ala Lys Glu 1730 Pro Ile Leu Ala Leu 1735 Arg Arg Ala Leu Leu 1740
Sex- Leu Asn Lys Arg Pro Asp Tyr Asn Glu Met Val Gly Glu Cys Trp
1745 , 175C i 1755 ; 1760
Leu Gin Sei Ala Arg Val 1765 Ala Arg Lys Ala Gly 1770 His His Gin Thr Ala 1775
Tyr Asn Ala Leu Leu Asn 1780 Ala Gly Glu Ser Arg 1785 Leu Ala Glu Leu Tyr 1790
Val Glu Arg Ala Lys Trp 1795 Leu Trp Ser Lys Gly 1800 Asp Val His Gin Ala 1805
Leu Ile Val Leu Gin Lys 1810 Gly Val Glu Leu Cys 1815 Phe Pro Glu Asn Glu 1820
Thr Pro Pro Glu Gly Lys Asn Met Leu Ile His Gly Arg Ala Met Leu
1825 , 183C i 1835 1840
Leu Val Gly Arg Phe Met 1845 Glu Glu Thr Ala Asn 1850 Phe Glu Ser Asn Ala 1855
Ile Met Lys Lys Tyr Lys 1860 Asp Val Thr Ala Cys 1865 Leu Pro Glu Trp Glu 1870
Asp Gly His Phe Tyr Leu 1875 Ala Lys Tyr Tyr Asp 1880 Lys Leu Met Pro Met 1885
Val Thr Asp Asn Lys Met 1890 Glu Lys Gin Gly Asp 1895 Leu Ile Arq Tyr Ile 1900
Val Leu His Phe Gly Arg Ser Leu Gin Tyr Gly Asn Gin Phe Ile Tyr
1905 ’ 191C i 1915 1920
Gin Ser Met Pro Arg Met 1925 Leu Thr Leu Trp Leu 1930 Asp Tyr Gly Thr Lys 1935
Ala Tyr Glu Trp Glu Lys 1940 Ala Gly Arg Ser Asp 1945 Arg Val Gin Met Arg 1950
Asn Asp Leu Gly Lys Ile 1955 Asn Lys Val Ile Thr 1960 Glu His Thr Asn Tyr 1965
Leu Ala Pro Tyr Gin Phe 1970 Leu Thr Ala Phe Ser 1975 Gin Leu Ile Ser Arg 1980
Ile Cys His Ser His Asp Glu Val Phe Val Val Leu Asp Gly Asn Asn
1985 19*9 0 i 1995 , 2000
Ser Gin Val Phe Leu Ala Tyr Pro Gin Gin Ala Met Trp Met Met Thr 2005 2010 2015 • · ftftft · • ftft • ftftftft ftft ·
- 129 • ft • · • · • ft ftftftft
Ala Val Ser Lys Ser 2020 Ser Tyr Pro Met Arg Val Asn Arg Cys Lys Glu
2025 2030
Ile Leu Asn Lys Ala Ile His Met Lys Lys Ser Leu Glu Lys Phe Val
2035 2040 2045
Gly Asp Ala Thr Arg Leu Thr Asp Lys Leu Leu Glu Leu Cys Asn Lys
2050 2055 2060
Pro Val Glu Ile Leu Ala Ser Leu Gin Lys Pro Lys Lys Ile Ser Leu
2065 2070 2075 2080
Lys Gly Ser Asp Gly Lys Phe Tyr Ile Met Met Cys Lys Pro Lvs Asp
2085 2090 2095
Asp Leu Arg Lys Asp Cys Arg Leu Met Glu Phe Asn Ser Leu Ile Asn
2100 2105 2110
Lys Cys Leu Arg Lys Asp Ala Glu Ser Arg Arg Arg Glu Leu His Ile
2115 2120 2125
Arg Thr T>'r Ala Val Ile Pro Leu Asn Asp Glu Cys Gly Ile Ile Glu
2130 2135 2140
Trp Val Asn Asn Thr Ala Gly Leu Arg Pro Ile Leu Thr Lys Leu Tyr
2145 2150 2155 2160
Lys Glu Lys Gly Val Tyr Met Thr Gly Lys Glu Leu Arg Gin Cys Met
2165 2170 2175
Leu Pro Lys Ser Ala Ala Leu Ser Glu Lys Leu Lys Val Phe Arg Glu
2180 2185 2190
Phe Leu Leu Pro Arg His Pro Pro Ile Phe His Glu Trp Phe Leu Arg
2195 2200 2205
Thr Phe Pro Asp Pro Thr Ser Trp Tyr Ser Ser Arg Ser Ala Tyr Cys
2210 2215 2220
Arg Ser Thr Ala Val Met Ser Met Val Gly Tyr Ile Leu Gly Leu Gly
2225 2230 2235 2240
Asp Arg His Gly Glu Asn Ile Leu Phe Asp Ser Leu Thr Gly Glu Cys
2245 2250 2255
Val His Val Asp Phe Asn Cys Leu Phe Asn Lys Gly Glu Thr Phe Glu
2260 2265 2270
Val Pro Glu Ile Val Pro Phe Arg Leu Thr His Asn Met Val Asn Gly
2275 2280 2285
Met Gly Pro Met Gly Thr Glu Gly Leu Phe Arg Arg Ala Cys Glu Val
2290 2295 2300
Thr Met Arg Leu Met Arg Asp Gin Arg Glu Pro Leu Met Ser Val Leu
2305 2310 2315 2320
Lys Thr Phe Leu His Asp Pro Leu Val Glu Trp Ser Lys Pro Val Lys
2325 2330 2335
Gly His Ser Lys Ala Pro Leu Asn Glu Thr Gly Glu Val Val Asn Glu
2340 2345 2350
Lys Ala Lys Thr His Val Leu Asp Ile Glu Gin Arg Leu Gin Gly Val 2355 2360 2365
- 130
Ile Lys Thr 2370 Arg Asn Arg Val 2375 Thr Gly Leu Pro Leu Ser 2380 Ile Glu Gly
His Val His Tyr Leu Ile Gin Glu Ala Thr Asp Glu Asn Leu Leu Cys
2385 2390 2395 2400
Gin Met Tyr Leu Gly Trp Thr Pro Tyr Met
2405 2410
(2) INFORMACE O SEQ ID NO:25:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 7502 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 1..7440 (xi) POPIS SEKVENCE: SEQ ID NO: 25:
ATG Met 1 GGT Gly CAT His GCT Ala GTG Val 5 GAA TGG CCA GTG GTC Val 10 ATG Met AGC Ser CGA TTT TTA Leu 15 AGT Ser 48
Glu Trp Pro Val Arg Phe
CAA TTA GAT GAA CAC ATG GGA TAT TTA CAA TCA GCT CCT TTG CAG TTG 96
Gin Leu Asp Glu 20 His Met Gly Tyr Leu 25 Gin Ser Ala Pro Leu 30 Gin Leu
ATG AGT ATG CAA AAT TTA GAA TTT ATT GAA GTC ACT TTA TTA ATG GTT 144
Me t Ser Met 35 Gin Asn Leu Glu Phe 40 Ile Glu Val Thr Leu 45 Leu Met Val
CTT ACT CGT ATT ATT GCA ATT GTG TTT TTT AGA AGG CAA GAA CTC TTA 192
Leu Thr 50 Arg Ile Ile Ala Ile 55 Val Phe Phe Arg Arg 60 Gin Glu Leu Leu
CTT TGG CAG ATA GGT TGT GTT CTG CTA GAG TAT GGT AGT CCA AAA ATT 240
Leu 65 Trp Gin Ile Gly Cys 70 Val Leu Leu Glu Tyr 75 Gly Ser Pro Lys Ile 80
AAA TCC CTA GCA ATT AGC TTT TTA ACA GAA CTT TTT CAG CTT GGA GGA 288
Lys Ser Leu Ala Ile 85 Ser Phe Leu Thr Glu 90 Leu Phe Gin Leu Gly 95 Gly
CTA CCA GCA CAA CCA GCT AGC ACT TTT TTC AGC TCA TTT TTG GAA TTA 336
Leu Pro Ala Gin 100 Pro Ala Ser Thr Phe 105 Phe Ser Ser Phe Leu 110 Glu Leu
TTA AAA CAC CTT GTA GAA ATG GAT ACT GAC CAA TTG AAA CTC TAT GAA 384
Leu Lys His 115 Leu Val Glu Met Asp 120 Thr Asp Gin Leu Lys 125 Leu Tyr Glu
GAG CCA TTA TCA AAG CTG ATA AAG ACA CTA TTT CCC TTT GAA GCA GAA 432
Glu Pro 130 Leu Ser Lys Leu Ile 135 Lys Thr Leu Phe Pro 140 Phe Glu Ala Glu
GCT TAT AGA AAT ATT GAA CCT GTC TAT TTA AAT ATG CTG CTG GAA AAA 480
Ala 145 Tyr Arg Asn Ile Glu 150 Pro Val Tyr Leu Asn 155 Met Leu Leu Glu Lys 160
- 131 ·· ··· <· ··
CTC TGT GTC ATG Met TTT GAA GAC GGT GTG CTC Leu 170 ATG Met CGG CTT AAG TCT Ser 175 GAT Asp 528
Leu Cys Val Phe 165 Glu Asp Gly Val Arg Leu Lys
TTG CTA AAA GCA GCT TTG TGC CAT TTA CTG CAG TAT TTC CTT AAA TTT 576
Leu Leu Lys Ala Ala Leu Cys His Leu Leu Gin Tyr Phe Leu Lys Phe
180 185 190
GTG CCA GCT GGG TAT GAA TCT GCT TTA CAA GTC AGG AAG GTC TAT GTG 624
Val Pro Al a Gly Tyr Glu Ser Ala Leu Gin Val Arg Lys Val Tyr Val
195 200 205
AGA AAT ATT TGT AAA GCT CTT TTG GAT GTG CTT GGA ATT GAG GTA GAT 672
Arg Asn Ile Cys Lys Ala Leu Leu Asp Val Leu Gly Ile Glu Val Asp
210 215 220
GCA GAG TAC TTG TTG GGC CCA CTT TAT GCA GCT TTG AAA ATG GAA AGT 720
Ala Glu Tyr Leu Leu Gly Pro Leu Tyr Ala Ala Leu Lys Met Glu Ser
2 2 5 230 235 240
ATG GAA ATC ATT GAG GAG ATT CAA TGC CAA ACT CAA CAG GAA AAC CTC 768
Met Glu Ile Ile Glu Glu Ile Gin Cys Gin Thr Gin Gin Glu Asn Leu
245 250 255
AGC AGT AAT AGT GAT GGA ATA TCA CCC AAA AGG CGT CGT CTC AGC TCG 816
Ser Ser Asn Ser Asp Gly Ile Ser Pro Lys Arg Arg Arg Leu Ser Ser
260 265 270
TCT CTA AAC CCT TCT AAA AGA GCA CCA AAA CAG ACT GAG GAA ATT AAA 864
Ser Leu Asn Pro Ser Lys Arg Ala Pro Lys Gin Thr Glu Glu Ile Lys
275 280 285
CAT GTG GAC ATG AAC CAA AAG AGC ATA TTA TGG AGT GCA CTG AAA CAG 912
His Val Asp Met Asn Gin Lys Ser Ile Leu Trp Ser Ala Leu Lys Gin
290 295 300
AAA GCT GAA TCC CTT CAG ATT TCC CTT GAA TAC AGT GGC CTA AAG AAT 960
Ly s Ala Glu Ser Leu Gin Ile Ser Leu Glu Tyr Ser Gly Leu Lys Asn
305 310 315 320
CCT GTT ATT GAG ATG TTA GAA GGA ATT GCT GTT GTC TTA CAA CTG ACT 1008
Pro Val Ile Glu Met Leu Glu Gly Ile Ala Val Val Leu Gin Leu Thr
325 330 335
GCT CTG TGT ACT GTT CAT TGT TCT CAT CAA AAC ATG AAC TGC CGT ACT 1056
Ala Leu Cys Thr Val His Cys Ser His Gin Asn Met Asn Cys Arg Thr
340 345 350
TTC AAG GAC TGT CAA CAT AAA TCC AAG AAG AAA CCT TCT GTA GTG ATA 1104
Phe Lys Asp Cys Gin His Lys Ser Lys Lys Lys Pro Ser Val Val Ile
355 360 365
ACT TGG ATG TCA TTG GAT TTT TAC ACA AAA GTG CTT AAG AGC TGT AGA 1152
Thr Trp Met Ser Leu Asp Phe Tyr Thr Lys Val Leu Lys Ser Cys Arg
370 375 380
AGT TTG TTA GAA TCT GTT CAG AAA CTG GAC CTG GAG GCA ACC ATT GAT 1200
Ser Leu Leu Glu Ser Val Gin Lys Leu Asp Leu Glu Ala Thr Ile Asp
3Θ5 390 395 400
AAG GTG GTG AAA ATT TAT GAT GCT TTG ATT TAT ATG CAA GTA AAC AGT 1248
Lys Val Val Lys Ile Tyr Asp Ala Leu Ile Tyr Met Gin Val Asn Ser
405 410 41.5
TCA TTT GAA GAT CAT ATC CTG GAA GAT TTA TGT GGA ATG CTC TCA CTT 1296
Ser Phe Glu Asp His Ile Leu Glu Asp Leu Cys Gly Met Leu Ser Leu
420 425 430
- 132 - • ’· • ·· « · · • · · • · · · • · · ·· · ·· « · « • · • • • ····
CCA TGG ATT TAT TCC CAT TCT GAT GAT GGC TGT TTA AAG TTG ACC ACA 1344
Pro Trp Ile 435 Tyr Ser His Ser Asp 440 Asp Gly Cys Leu Lys 445 Leu Thr Thr
TTT GCC GCT AAT CTT CTA ACA TTA AGC TGT AGG ATT TCA GAT AGC TAT 1392
Phe Ala 450 Ala Asn Leu Leu Thr 455 Leu Ser Cys Arg Ile 460 Ser Asp Ser Tyr
TCA CCA CAG GCA CAA TCA CGA TGT GTG TTT CTT CTG ACT CTG TTT CCA 1440
Ser 465 Pro Gin Ala Gin Ser 470 Arg Cys Val Phe Leu 475 Leu Thr Leu Phe Pro 480
AGA AGA ATA TTC CTT GAG TGG AGA ACA GCA GTT TAC AAC TGG GCC CTG 1488
Arg Arg Ile Phe Leu 485 Glu Trp Arg Thr Ala 490 Val Tyr Asn Trp Ala 495 Leu
CAG AGC TCC CAT GAA GTA ATC CGG GCT AGT TGT GTT AGT GGA TTT TTT 1536
Gin Ser Ser His 500 Glu Val Ile Arg Ala 505 Ser Cys Val Ser Gly 510 Phe Phe
ATC TTA TTG CAG CAG CAG AAT TCT TGT AAC AGA GTT CCC AAG ATT CTT 1584
Ile Leu Leu 515 Gin Gin Gin Asn Ser 520 Cys Asn Arg Val Pro 525 Lys Ile Leu
ATA GAT AAA GTC AAA GAT GAT TCT GAC ATT GTC AAG AAA GAA TTT GCT 1632
Ile Asp 530 Lys Val Lys Asp Asp 535 Ser Asp Ile Val Lys 540 Lys Glu Phe Ala
•p ATA CTT GGT CAA CTT GTC TGT ACT CTT CAC GGC ATG TTT TAT CTG 1680
Ser 545 Ile Leu Gly Gin Leu 550 Val Cys Thr Leu His 555 Gly Met Phe Tyr Leu 560
ACA AGT TCT TTA ACA GAA CCT TTC TCT GAA CAC GGA CAT GTG GAC CTC 1728
Thr Ser Ser Leu Thr 565 Glu Pro Phe Ser Glu 570 His Gly His Val Asp 575 Leu
TTC TGT AGG AAC TTG AAA GCC ACT TCT CAA CAT GAA TGT TCA TCT TCT 1776
Phe Cys Arg Asn 580 Leu Lys Ala Thr Ser 585 Gin His Glu Cys Ser 590 Ser Ser
CAA CTA AAA GCT TCT GTC TGC AAG CCA TTC CTT TTC CTA CTG AAA AAA 1824
Gin Leu Lys 595 Ala Ser Val Cys Lvs 600 Pro Phe Leu Phe Leu 605 Leu Lys Lys
AAA ATA CCT AGT CCA GTA AAA CTT GCT TTC ATA GAT AAT CTA CAT CAT 1872
Lys Ile 610 Pro Ser Pro Val Lys 615 Leu Ala Phe Ile Asp 620 Asn Leu His His
CTT TGT AAG CAT CTT GAT TTT AGA GAA GAT GAA ACA GAT GTA AAA GCA 1920
Leu 625 Cys Lys His Leu Asp 630 Phe Arg Glu Asp Glu 635 Thr Asp Val Lys Ala 640
GTT CTT GGA ACT TTA TTA AAT TTA ATG GAA GAT CCA GAC AAA GAT GTT 1968
Val Leu Gly Thr Leu 645 Leu Asn Leu Met Glu 650 Asp Pro Asp Lys Asp 655 Val
AGA GTG GCT TTT AGT GGA AAT ATC AAG CAC ATA TTG GAA TCC TTG GAC 2016
Arg Val Al a Phe 660 Ser Gly Asn Ile Lys 665 His Ile Leu Glu Ser 670 Leu Asp
TCT GAA GAT GGA TTT ATA AAG GAG CTT TTT GTC TTA AGA ATG AAG GAA 2064
Ser Glu Asp 675 Gly Phe Ile Lys Glu 680 Leu Phe Val Leu Arg 685 Met Lys Glu
GCA TAT ACA CAT GCC CAA ATA TCA AGA AAT AAT GAG CTG AAG GAT ACC 2112
Ala Tyr 690 Thr His Ala Gin Ile 695 Ser Arg Asn Asn Glu 700 Leu Lys Asp Thr
·· ····
- 133 ·· ···· • ·· · ·· ·· · · ·· · · · · • · · · · · · • · · · · · · ··· • · · · · · ·· ··· ···· ··
TTG ATT CTT ACA ACA GGG GAT ATT GGA AGG GCC GCA AAA GGA GAT TTG 2160
Leu 705 Ile Leu Thr Thr Gly 710 Asp Ile Gly Arg Ala 715 Ala Lys Gly Asp Leu 720
GTA CCA TTT GCA CTC TTA CAC TTA TTG CAT TGT TTG TTA TCC AAG TCA 2208
Val Pro Phe Ala Leu 725 Leu His Leu Leu His 730 Cys Leu Leu Ser Lys 735 Ser
GCA TCT GTC TCT GGA GCA GCA TAC ACA GAA ATT AGA GCT CTG GTT GCA 2256
Ala Ser Val Ser 740 Gly Ala Ala Tyr Thr 745 Glu Ile Arg Ala Leu 750 Val Ala
GCT AAA AGT GTT AAA CTG CAA AGT TTT TTC AGC CAG TAT AAG AAA CCC 2304
Ala Lys Ser 755 Val Lys Leu Gin Ser 760 Phe Phe Ser Gin Tyr 765 Lys Lys Pro
ATC TGT CAG TTT TTG GTA GAA TCC CTT CAC TCT AGT CAG ATG ACA GCA 2352
Ile Cys 770 Gin Phe Leu Val Glu 775 Ser Leu His Ser Ser 780 Gin Met Thr Ala
CTT CCG AAT ACT CCA TGC CAG AAT GCT GAC GTG CGA AAA CAA GAT GTG 2400
Leu 785 Pro Asn Thr Pro Cys 790 Gin Asn Ala Asp Val 795 Arg Lys Gin Asp Val 800
GCT CAC CAG AGA GAA ATG GCT TTA AAT ACG TTG TCT GAA ATT GCC AAC 2448
Ala His Gin Arg Glu 805 Met Ala Leu Asn Thr 810 Leu Ser Glu Ile Ala 815 Asn
GTT TTC GAC TTT CCT GAT CTT AAT CGT TTT CTT ACT AGG ACA TTA CAA 2496
Val Phe Asp Phe 820 Pro Asp Leu Asn Arg 825 Phe Leu Thr Arg Thr 830 Leu Gin
GTT CTA CTA CCT GAT CTT GCT GCC AAA GCA AGC CCT GCA GCT TCT GCT 2544
Val Leu Leu 835 Pro Asp Leu Ala Ala 840 Lys Ala Ser Pro Ala 845 Ala Ser Ala
CTC ATT CGA ACT TTA GGA AAA CAA TTA AAT GTC AAT CGT AGA GAG ATT 2592
Leu Ile 850 Arg Thr Leu Gly Lys 855 Gin Leu Asn Val Asn 860 Arg Arg Glu Ile
TTA ATA AAC AAC TTC AAA TAT ATT TTT TCT CAT TTG GTC TGT TCT TGT 2640
Leu 865 Ile Asn Asn Phe Lys 870 Tyr Ile Phe Ser Hi s 875 Leu Val Cys Ser Cys 880
TCC AAA GAT GAA TTA GAA CGT GCC CTT CAT TAT CTG AAG AAT GAA ACA 2688
Ser Lys Asp Glu Leu 885 Glu Arg Ala Leu His 890 Tyr Leu Lys Asn Glu 895 Thr
GAA ATT GAA CTG GGG AGC CTG TTG AGA CAA GAT TTC CAA GGA TTG CAT 2736
Glu Ile Glu Leu 900 Gly Ser Leu Leu Arg 905 Gin Asp Phe Gin Gly 910 Leu His
AAT GAA TTA TTG CTG CGT ATT GGA GAA CAC TAT CAA CAG GTT TTT AAT 2784
Asn Glu Leu 915 Leu Leu Arg Ile Gly 920 Glu His Tyr Gin Gin 925 Val Phe Asn
GGT TTG TCA ATA CTT GCC TCA TTT GCA TCC AGT GAT GAT CCA TAT CAG 2832
Gly Leu 930 Ser Ile Leu Ala Ser 935 Phe Ala Ser Ser Asp 940 Asp Pro Tyr Gin
GGC CCG AGA GAT ATC ATA TCA CCT GAA CTG ATG GCT GAT TAT TTA CAA 2880
Gly 945. Pro Arg Asp Ile Ile 950 Ser Pro Glu Leu Met 955 Ala Asp Tyr Leu Gin 960
CCC AAA TTG TTG GGC ATT TTG GCT TTT TTT AAC ATG CAG TTA CTG AGC 2928
Pro Lys Leu Leu Gly 965 Ile Leu Ala Phe Phe 970 Asn Met Gin Leu Leu 975 Ser
- 134 -
TCT Ser AGT GTT GGC ATT GAA GAT AAG AAA ATG GCC Ala TTG AAC AGT TTG Leu ATG Met 2976
Ser Val Gly 980 Ile Glu Asp Lys Lys 985 Met Leu Asn Ser 990
TCT TTG ATG AAG TTA ATG GGA CCC AAA CAT GTC AGT TCT GTG AGG GTG 3024
Ser Leu Met 995 Lys Leu Met Gly Pro Lys 1000 His Val Ser Ser Val 1005 Arg Val
AAG ATG ATG ACC ACA CTG AGA ACT GGC CTT CGA TTC AAG GAT GAT TTT 3072
Lys Met Met 1010 Thr Thr Leu Arg Thr 1015 Gly Leu Arg Phe Lys 1020 Asp Asp Phe
CCT GAA TTG TGT TGC AGA GCT TGG GAC TGC TTT GTT CGC TGC CTG GAT 3120
Pro Glu 1025 Leu Cys Cys Arg Ala 1030 Trp Asp Cys Phe Val 1035 Arg Cys Leu Asp 1040
CAT GCT TGT CTG GGC TCC CTT CTC AGT CAT GTA ATA GTA GCT TTG TTA 3168
His Ala Cys Leu Gly Ser 1045 Leu Leu Ser His Val 1050 Ile Val Ala Leu 1055 Leu
CCT ^'Τ’ψ ATA CAC ATC CAG CCT AAA GAA ACT GCA GCT ATC TTC CAC TAC 3216
Pro Leu Ile His Ile 1060 Gin Pro Lys Glu Thr 1065 Ala Ala Ile Phe His 1070 Tyr
CTC ATA ATT GAA AAC AGG GAT GCT GTG CAA GAT TTT CTT CAT GAA ATA 3264
Leu Ile Ile 1075 Glu Asn Arg Asp Ala Val 1080 Gin Asp Phe Leu 1085 His Glu Ile
TAT TTT TTA CCT GAT CAT CCA GAA TTA AAA AAG ATA AAA GCC GTT CTC 3312
Tyr Phe Leu 1090 Pro Asp His Pro Glu 1095 Leu Lys Lys Ile Lys 1100 Ala Val Leu
CAG GAA TAC AGA AAG GAG ACC TCT GAG AGC ACT GAT CTT CAG ACA ACT 3360
Gin Glu 1105 Tyr Arg Lys Glu Thr 1110 Ser Glu Ser Thr Asp 1115 Leu Gin Thr Thr 1120
CTT CAG CTC TCT ATG AAG GCC ATT CAA CAT GAA AAT GTC GAT GTT CGT 3408
Leu Gin Leu Ser Met Lys 1125 Ala Ile Gin His Glu 1130 Asn Val Asp Val Arg 1135
ATT CAT GCT CTT ACA AGC TTG AAG GAA ACC TTG TAT AAA AAT CAG GAA 3456
Ile His Ala Leu Tnr 1140 Ser Leu Lys Glu Thr 1145 Leu Tyr Lys Asn Gin 1150 Glu
AAA CTG ATA AAG TAT GCA ACA GAC AGT GAA ACA GTA GAA CCT ATT ATC 3504
Lys Leu Ile Lys 1155 Tyr Ala Thr Asp Ser 1160 Glu Thr Val Glu Pro 1165 Ile Ile
TCA CAG TTG GTG ACA GTG CTT TTG AAA GGT TGC CAA GAT GCA AAC TCT 3552
Ser Gin Leu 1170 Val Thr Val Leu Leu 1175 Lys Gly Cys Gin Asp 1180 Ala Asn Ser
CAA GCT CGG TTG CTC TGT GGG GAA TGT TTA GGG GAA TTG GGG GCG ATA 3600
Gin Ala 1185 Arg Leu Leu Cys Gly 1190 Glu Cys Leu Gly Glu 1195 Leu Gly Ala Ile 1200
GAT CCA GGT CGA TTA GAT TTC TCA ACA ACT GAA ACT CAA GGA AAA GAT 3648
Asp Pro Gly Arg Leu Asp 1205 Phe Ser Thr Thr Glu 1210 Thr Gin Gly Lys Asp 1215
TTT ACA TTT GTG ACT GGA GTA GAA GAT TCA AGC TTT GCC TAT GGA TTA 3696
Phe Thr Phe Val Thr 1220 Gly Val Glu Asp Ser 1225 Ser Phe Ala Tyr Gly 1230 Leu
TTG ATG GAG CTA ACA AGA GCT TAC CTT GCG TAT GCT GAT AAT AGC CGA 3744
Leu Met Glu 1235 Leu Thr Arg Ala Tyr Leu 1240 Ala Tyr Ala Asp Asn 1245 Ser Arg
• ·
- 135 - • · • • • • · · • · • · • · • · • 9 • · • • · • • · · • · · • · • · · · • • · · · · ·
GCT CAA GAT TCA GCT GCC TAT GCC ATT CAG GAG TTG CTT TCT ATT TAT 3792
Ala Gin Asp Ser Ala Ala Tyr Ala Ile Gin Glu Leu Leu Ser Ile Tyr
1250 1255 1260
GAC TGT AGA GAG ATG GAG ACC AAC GGC CCA GGT CAC CAA TTG TGG AGG 3840
Asp Cys Arg Glu Met Glu Thr Asn Gly Pro Gly His Gin Leu Trp Arg
1265 1270 1275 1280
AGA TTT CCT GAG CAT GTT CGG GAA ATA CTA GAA CCT CAT CTA AAT ACC 3888
Arg Phe Pro Glu His Val Arg Glu Ile Leu Glu Pro His Leu Asn Thr
1285 1290 1295
AGA TAC AAG AGT TCT CAG AAG TCA ACC GAT TGG TCT GGA GTA AAG AAG 3936
Arg Tyr Lys Ser Ser Gin Lys Ser Thr Asp Trp Ser Gly Val Lys Lys
1300 1305 1310
CCA ATT TAC TTA AGT AAA TTG GGT AGT AAC TTT GCA GAA TGG TCA GCA 3984
Pro Ile Tyr Leu Ser Lys Leu Gly Ser Asn Phe Ala Glu Trp Ser Ala
1315 1320 1325
TCT TGG GCA GGT TAT CTT ATT ACA AAG GTT CGA CAT GAT CTT GCC AGT 4032
Ser Trp Ala Gly Tyr Leu Ile Thr Lys Val Arg His Asp Leu Ala Ser
1330 1335 1340
AAA ATT TTC ACC TGC TGT AGC ATT ATG ATG AAG CAT GAT TTC AAA GTG 4080
Lys Ile Phe Thr Cys Cys Ser Ile Met Met Lys His Asp Phe Lys Val
1345 1350 1355 1360
ACC ATC TAT CTT CTT CCA CAT ATT CTG GTG TAT GTC TTA CTG GGT TGT 4128
Thr Ile Tyr Leu Leu Pro His Ile Leu Val Tyr Val Leu Leu Gly Cys
1365 1370 1375
AAT CAA GAA GAT CAG CAG GAG GTT TAT GCA GAA ATT ATG GCA GTT CTA 4176
Asn Gin Glu Asp Gin Gin Glu Val Tyr Ala Glu Ile Met Ala Val Leu
1380 1385 1390
AAG CAT GAC GAT CAG CAT ACC ATA AAT ACC CAA GAC ATT GCA TCT GAT 4224
Lys His Asp Asp Gin His Thr Ile Asn Thr Gin Asp Ile Ala Ser Asp
1395 1400 1405
CTG TGT CAA CTC AGT ACA CAG ACT GTG TTC TCC ATG CTT GAC CAT CTC 4272
Leu Cys Gin Leu Ser Thr Gin Thr Val Phe Ser Met Leu Asp His Leu
1410 1415 1420
ACA CAG TGG GCA AGG CAC AAA TTT CAG GCA CTG AAA GCT GAG AAA TGT 4320
Thr Gin Trp Ala Arg His Lys Phe Gin Ala Leu Lys Ala Glu Lys Cys
1425 1430 1435 1440
CCA CAC AGC AAA TCA AAC AGA AAT AAG GTA GAC TCA ATG GTA TCT ACT 4368
Pro His Ser Lys Ser Asn Arg Asn Lys Val Asp Ser Met Val Ser Thr
1445 1450 1455
GTG GAT TAT GAA GAC TAT CAG AGT GTA ACC CGT TTT CTA GAC CTC ATA 4416
Val Asp Tyr Glu Asp Tyr Gin Ser Val Thr Arg Phe Leu Asp Leu Ile
1460 1465 1470
CCC CAG GAT ACT CTG GCA GTA GCT TCC TTT CGC TCC AAA GCA TAC ACA 4464
Pro Gin Asp Thr Leu Ala Val Ala Ser Phe Arg Ser Lys Ala Tyr Thr
1475 1480 1485
CGA GCT GTA ATG CAC TTT GAA TCA TTT ATT ACA GAA AAG AAG CAA AAT 4512
Arg Ala Val Met His Phe Glu Ser Phe Ile Thr Glu Lys Lys Gin Asn
1490 1495 1500
ATT CAG GAA CAT CTT GGA TTT TTA CAG AAA TTG TAT GCT GCT ATG CAT 4560
Ile Gin Glu His Leu Gly Phe Leu Gin Lys Leu Tyr Ala Ala Met His
1505 151C 1515 1520
- 136 • · · · · c · ·
GAA Glu CCT Pro GAT Asp GGA Gly GTG GCC Val Ala 1525 GGA Gly GTC Val AGT Ser GCA ATT Ala Ile 1530 AGA Arg AAG Lys GCA Ala GAA CCA Glu Pro 1535 4608
TCT CTA AAA GAA CAG ATC CTT GAA CAT GAA AGC CTT GGC TTG CTG AGG 4656
Ser Leu Lys Glu 154C Gin Ile ) Leu Glu His Glu Ser 1545 Leu Gly Leu Leu Arg 1550
GAT C-CC ACT GCT TGT TAT GAC AGG GCT ATT CAG CTA GAA CCA GAC CAG 4704
Asp Ala Thr Ala 1555 Cys Tyr Asp Arg Ala 1560 Ile Gin Leu Glu Pro 1565 Asp Gin
ATC ATT CAT TAC CAT GGT GTA GTA AAG TCC ATG TTA GGT CTT GGT CAG 4752
Ile Ile His 1570 Tyr His Gly Val Val 1575 Lys Ser Met Leu Gly 1580 Leu Gly Gin
CTG TCT ACT GTT ATC ACT CAG GTG AAT GGA GTG CAT GCT AAC AGG TCC 4800
Leu 1585 Ser Thr Val Ile Thr Gin 1590 Val Asn Gly Val His 1595 Ala Asn Arg Ser 1600
GAG TGG ACA GAT GAA TTA AAC ACG TAC AGA GTG GAA GCA GCT TGG AAA 4848
Glu Trp Thr Asp Glu Leu 1605 Asn Thr Tyr Arg Val 1610 Glu Ala Ala Trp Lys 1615
TTG TCA CAG TGG GAT TTG GTG GAA AAC TAT TTG GCA GCA GAT GGA AAA 4896
Leu Ser Gin Trp Asp Leu 1620 Val Glu Asn 1625 Tyr Leu Ala Ala Asp Gly Lys 1630
TCT ACA ACA TGG AGT GTC AGA CTG GGA CAG CTA TTA TTA TCA GCC AAA 4944
Ser Thr Thr Trp 1635 Ser Val Arg Leu Gly 1640 Gin Leu Leu Leu Ser 1645 Ala Lys
AAA AGA GAT ATC ACA GCT TTT TAT GAC TCA CTG AAA CTA GTG AGA GCA 4992
Lys Arg Asp 1650 Ile Thr Ala Phe Tyr 1655 Asp Ser Leu Lys Leu 1660 Val Arg Ala
GAA CAA ATT GTA CCT CTT TCA GCT GCA AGC TTT GAA AGA GGC TCC TAC 5040
Glu Gin 1565 Ile Val Pro Leu Ser 1670 Ala Ala Ser Phe Glu 1675 Arg Gly Ser Tyr 1680
CAA CGA GGA TAT GAA TAT ATT GTG AGA TTG CAC ATG TTA TGT GAG TTG 5088
Glr. Arg Gly Tyr Glu Tyr 1685 Ile Val Arg Leu His 1690 Met Leu Cys Glu Leu 1695
GAG CAT AGC ATC AAA CCA CTT TTC CAG CAT TCT CCA GGT GAC AGT TCT 5136
Glu His Ser Ile Lys Pro 1700 Leu Phe Gin 1705 His Ser Pro Gly Asp Ser Ser 1710
CAA GAA GAT TCT CTA AAC TGG GTA GCT CGA CTA GAA ATG ACC CAG AAT 5184
Gin Glu Asp Ser 1715 Leu Asn Trp Val Ala 1720 Arg Leu Glu Met Thr 1725 Gin Asn
TCC TAC AGA GCC AAG GAG CCT ATC CTG GCT CTC CGG AGG GCT TTA CTA 5232
Ser Tyr Arg 1730 Ala Lys Glu Pro Ile 1735 Leu Ala Leu Arg Arg 1740 Ala Leu Leu
AGC CTC AAC AAA AGA CCA GAT TAC AAT GAA ATG GTT GGA GAA TGC TGG 5280
Ser 1745 Leu Asn Lys Arg Pro Asp 1750 Tyr Asn Glu Met 1755 Val Gly Glu Cys Trp 1760
CTG CAG AGT GCC AGG GTA GCT AGA AAG GCT GGT CAC CAC CAG ACA GCC 5328
Leu Gin Ser Ala Arg Val 1765 Ala Arg Lys Ala Gly 1770 His His Gin Thr Ala 177 5
TAC AAT GCT CTC CTT AAT GCA GGG GAA TCA CGA CTC GCT GAA CTG TAC 5376
Tyr Asn Ala Leu 178C Leu Asn 1 Ala Gly Glu 1785 Ser Arg Leu Ala Glu 179C Leu Tyr 1
• · · ·
- 137 - • · • 9 • · • · • · • · • · • · · • • · • • 9 9 99 9 • · · 9 9 9 9 · • · · • • · · · ·
GTG GAA AGG GCA AAG TGG CTC TGG TCC AAG GGT GAT GTT CAC CAG GCA 5424
Val Glu Arg Ala Lys 1795 Trp Leu Trp Ser Lys Gly Asp 1800 Val His 1805 Gin Ala
CTA ATT GTT CTT CAA AAA GGT GTT GAA TTA TGT TTT CCT GAA AAT GAA 5472
Leu Ile Val Leu Gin 1810 Lys Gly Val Glu Leu Cys Phe Pro Glu 1815 1820 Asn Glu
ACC CCA CCT GAG GGT AAG AAC ATG TTA ATC CAT GGT CGA GCT ATG CTA 5520
Thr Pro Pro Glu Gly 1825 Lys Asn Met Leu Ile His Gly 1830 1835 Arg Ala Met Leu 1840
CTA GTG GGC CGA TTT ATG GAA GAA ACA GCT AAC TTT GAA AGC AAT GCA 5568
Leu Val Gly Arg Phe Met Glu Glu Thr Ala Asn Phe 1845 1850 Glu Ser Asn 1855 Ala
ATT ATG AAA AAA TAT AAG GAT GTG ACC GCG TGC CTG CCA GAA TGG GAG 5616
Ile Met Lys Lys Tyr 1860 Lys Asp Val Thr Ala Cys Leu 1865 Pro Glu Trp 1870 Glu
GAT GGG CAT TTT TAC CTT GCC AAG TAC TAT GAC AAA TTG ATG CCC ATG 5664
Asp Gly His Phe Tyr 1875 Leu Ala Lys Tyr Tyr Asp Lys 1880 Leu Met 1885 Pro Met
GTC ACA GAC AAC AAA ATG GAA AAG CAA GGT GAT CTC ATC CGG TAT ATA 5712
Val Thr Asp Asn Lys 1890 Met Glu Lys Gin Gly Asp Leu Ile Arg 1895 1900 Tyr Ile
GTT CTT CAT TTT GGC AGA TCT CTA CAA TAT GGA AAT CAG TTC ATA TAT 5760
Val Leu His Phe Gly 1905 Arg Ser Leu Gin Tyr Gly Asn 1910 1915 Gin Phe Ile Tyr 1920
CAG TCA ATG CCA CGA ATG TTA ACT CTA TGG CTT GAT TAT GGT ACA AAG 5808
Gin Ser Met Pro Arg Met Leu Thr Leu Tx*p Leu Asp 1925 1930 Tyr Gly Thr 1935 Lys
GCA TAT GAA TGG GAA AAA GCT GGC CGC TCC GAT CGT GTA CAA ATG AGG 5856
Ala Tyr Glu Trp Glu 1940 Lys Ala Gly Arg Ser Asp Arg 1945 Val Gin Met 1950 Arg
AAT GAT TTG GGT AAA ATA AAC AAG GTT ATC ACA GAG CAT ACA AAC TAT 5904
Asn Asp Leu Gly Lys 1955 Ile Asn Lys Val Ile Thr Glu 19 60 His Thr 1965 Asn Tyr
TTA GCT CCA TAT CAA TTT TTG ACT GCT TTT TCA CAA TTG ATC TCT CGA 5952
Leu Ala Pro Tyr Gin 1970 Phe Leu Thr Ala Phe Ser Gin Leu Ile 1975 1980 Ser Arg
ATT TGT CAT TCT CAC GAT GAA GTT TTT GTT GTG CTT GAT GGA AAT AAT 6000
Ile Cys His Ser His 1985 Asp Glu Val Phe Val Val Leu 1990 1995 Asp Gly Asn Asn 2000
AGC CAA GTA TTT CTA GCC TAT CCT CAA CAA GCA ATG TGG ATG ATG ACA 6048
Ser Gin Val Phe Leu Ala Tyr Pro Gin Gin Ala Met 2005 2010 Trp Met Met Thr 2015
GCT GTG TCA AAG TCA TCT TAT CCC ATG CGT GTG AAC AGA TGC AAG GAA 6096
Ala Val Ser Lys Ser 2020 Ser Tyr Pro Met Arg Val Asn 2025 Arg Cys Lys 2030 Glu
ATC CTC AAT AAA GCT ATT CAT ATG AAA AAA TCC TTA GAG AAG TTT GTT 6144
Ile Leu Asn Lys Ala 2035 Ile His Met Lys Lys Ser Leu 2040 Glu Lys 2045 Phe Val
GGA GAT GCA ACT CGC CTA ACA GAT AAG CTT CTA GAA TTG TGC AAT AAA 6192
Gly Aso Ala Thr Arg 2050 Leu Thr Asp Lys Leu Leu Glu Leu Cys 2055 2060 Asn Lys
• · • · · ·
- 138
CCG GTT Pro Val 2065 GAT Asp GGA Gly AGT Ser AGT TCC Ser Ser 2070 ACA Thr TTA Leu AGC Ser ATG AGC Met Ser 2075 ACT Thr CAT His TTT Phe AAA Lys 2080 6240
ATG CTT AAA AAG CTG GTA GAA GAA GCA ACA TTT AGT GAA ATC CTC ATT 6288
Met Leu Lys Lys Leu Val Glu 2085 Glu Ala Thr Phe Ser 2090 Glu Ile Leu Ile 2095
CCT CTA CAA TCA GTC ATG ATA CCT ACA CTT CCA TCA ATT CTG GGT ACC 6336
Pro Leu Gin Ser Val 2100 Met Ile Pro Thr Leu 2105 Pro Ser Ile Leu Gly 2110 Thr
CAT GCT AAC CAT GCT AGC CAT GAA CCA TTT CCT GGA CAT TGG GCC TAT 6384
His Ala Asn His 2115 Ala Ser His Glu Pro 2120 Phe Pro Gly His Trp 2125 Ala Tyr
ATT GCA GGG TTT GAT GAT ATG GTG GAA ATT CTT GCT TCT CTT CAG AAA 6432
Ile Ala Gly 2130 Phe Asp Asp Met Val 2135 Glu Ile Leu Ala Ser 2140 Leu Gin Lys
CCA AAG AAG ATT TCT TTA AAA GGG TCA GAT GGA AAG TTC TAC ATC ATG 6480
Pro Lys 2145 Lys Ile Ser Leu Lys 2150 Gly Ser Asp Gly Lys 2155 Phe Tyr Ile Met 2160
ATG TGT AAG CCA AAA GAT GAC CTG AGA AAG GAT TGT AGA CTA ATG GAA 6528
Met Cys Lys Pro Lys Asp Asp 2165 Leu Arg Lys 217C Asp Cys I Arg Leu Met Glu 2175
TTC AAT TCC TTG ATT AAT AAG TGG TTA AGA AAA GAT GCA GAG TCT CGT 6576
Phe Asn Ser Leu Ile 21Θ0 Asn Lys Cys Leu 2185 Arg Lys Asp Ala Glu Ser 2190 Arg
AGA AGA GAA CTT CAT ATT CGA ACA TAT GCA GTT ATT CCA CTA AAT GAT 6624
Arg Arg Glu 2195 Leu His Ile Arg Thr 220C Tyr ) Ala Val Ile Pro 2205 Leu Asn Asp
GAA TGT GGG ATT ATT GAA TGG GTG AAC AAC ACT GCT GGT TTG AGA CCT 6672
Glu Cys Gly 2210 Ile Ile Glu Trp Val 2215 Asn Asn Thr Ala Gly 2220 Leu Arg Pro
ATT CTG ACC AAA CTA TAT AAA GAA AAG GGA GTG TAT ATG ACA GGA AAA ' 6720
Ile Leu 2 2 2 5 Thr Lys Leu Tyr Lys 2230 Glu Lys Gly Val Tyr 2235 Met Thr Gly Lys 2240
GAA CTT CGC CAG TGT ATG CTA CCA AAG TCA GCA GCT TTA TCT GAA AAA 6768
Glu Leu Arg Gin Cys Met Leu 2245 Pro Lys Ser Ala Ala 2250 Leu Ser Glu Lys 2255
CTC AAA GTA TTC CGA GAA TTT CTG CTG CCC AGG CAT CCT CCT ATT TTT 6816
Leu Lys Val Phe Arg 2260 Glu Phe Leu Leu Pro 2265 Arg His Pro Pro Ile 2270 Phe
CAT GAG TGG TTT CTG AGA ACA TTC CCT GAT CCT ACA TCA TGG TAC AGT 6864
His Glu Trp 2275 Phe Leu Arg Thr Phe 226C Pro 1 Asp Pro Thr Ser 2285 Trp Tyr Ser
AGT AGA TCA GCT TAC TGC CGT TCC ACT GCA GTA ATG TCA ATG GTT GGT 6912
Ser Ara Ser 2290 Ala Tyr Cys Arg 2295 Ser Thr Ala Val Met Ser 2300 Met Val Gly
TAT ATT CTG GGG CTT GGA GAC CGT CAT GGT GAA AAT ATT CTC TTT GAT 6960
Tyr Ile 2305 Leu Gly Leu Gly Asp 2310 Arg His Gly Glu Asn 2315 Ile Leu Phe Asp 2320
TCT TTG ACT GGT GAA TGC GTA CAT GTA GAT TTC AAT TGT CTT TTC AAT 7008
Ser Leu Thr Gly Glu Cys Val Hi s Val Asp Phe Asn Cys Leu Phe Asn
2325 2330 2335
- 139 - • · · · » ······· a
AAG GGA GAA ACC TTT GAA GTT CCA GAA ATT GTG CCA rrr cgc ctg ACT 7056
Lys Gly Glu Thr Phe Glu Val Pro Glu Ile Val Pro Phe Arg Leu Thr
2340 2345 2350
CAT AAT ATG GTT AAT GGA ATG GGT CCT ATG GGA ACA GAG GGT CTT TTT 7104
His Asn Met Val Asn Gly Met Gly Pro Met Gly Thr Glu Gly Leu Phe
2355 2360 2365
CGA AGA GCA TGT GAA GTT ACA ATG AGG CTG ATG CGT GAT CAG CGA GAG 7152
Arg Arg Ala Cys Glu Val Thr Met Arg Leu Met Arg Asp Gin Arg Glu
2370 2375 2380
CCT TTA ATG AGT GTC TTA AAG ACT TTT CTA CAT GAT CCT CTT GTG GAA 7200
Pro Leu Met Ser Val Leu Lys Thr Phe Leu His Asp Pro Leu Val Glu
2385 2390 2395 2400
TGG AGT AAA CCA GTG AAA GGG CAT TCC AAA GCG CCA CTG AAT GAA ACT 7248
Trp Ser Lys Pro Val Lys Gly His Ser Lys Ala Pro Leu Asn Glu Thr
2405 2410 2415
GGA GAA GTT GTC AAT GAA AAG GCC AAG ACC CAT GTT CTT GAC ATT GAG 7296
Gly Glu Val Val Asn Glu Lys Ala Lys Thr His Val Leu Asp Ile Glu
2420 2425 2430
CAG CGA CTA CAA GGT GTA ATC AAG ACT CGA AAT AGA GTG ACA GGA CTG 7344
Gin Arg Leu Gin Gly Val Ile Lys Thr Arg Asn Arg Val Thr Gly Leu
2435 2440 2445
CCG TTA TCT ATT GAA GGA CAT GTG CAT TAC CTT ATA CAA GAA GCT ACT 7392
Pro Leu Ser Ile Glu Gly His Val His Tyr Leu Ile Gin Glu Ala Thr
2450 2455 2460
GAT GAA AAC TTA CTA TGC CAG ATG TAT CTT GGT TGG ACT CCA TAT ATG 7440
Asp Glu Asn Leu Leu Cys Gin Met Tyr Leu Gly Trp Thr Pro Tyr Met
24 65 2470 2475 2480
TGAAATGAAA TTATGTAAAA GAATATGTTA ATAATCTAAA AGTAAAAAAA AAAAAAAAAA 7500 AA 7502 (2) INFORMACE O SEQ ID NO:26:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 2480 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 26:
Met 1 Gly His Ala Val 5 Glu Trp Pro Val Val 10 Met Ser Arg Phe Leu 15 Ser
Gin Leu Asp Glu 20 His Met Gly Tyr Leu 25 Gin Ser Ala Pro Leu 30 Gin Leu
Met Ser Met 35 Gin Asn Leu Glu Phe 40 Ile Glu Val Thr Leu 45 Leu Met Val
Leu Thr 50 Arg Ile Ile Ala Ile 55 Val Phe Phe Arg Arg 60 Gin Glu Leu Leu
Leu Trp Gin Ile Gly Cys Val Leu Leu Glu Tyr Gly Ser Pro Lys Ile 65 70 75 80
140
Lys Ser Leu Ala Ile 85 Ser Phe Leu Thr Glu Leu 90 Phe Gin Leu Gly 95 Gly
Leu Pro Ala Gin Pro Ala Ser Thr Phe Phe Ser Ser Phe Leu Glu Leu
100 105 110
Leu Lys Hi s Leu Val Glu Met Asp Thr Asp Gin Leu Lys Leu Tyr Glu
115 120 125
Glu Pro Leu Ser Lys Leu Ile Lys Thr Leu Phe Pro Phe Glu Ala Glu
130 135 140
Ala Tyr Arg Asn Ile Glu Pro Val Tyr Leu Asn Met Leu Leu Glu Lys
145 150 155 160
Leu Cys Val Met Phe Glu Asp Gly Val Leu Met Arg Leu Lys Ser Asp
165 170 175
Leu Leu Lys Ala Ala Leu Cys His Leu Leu Gin Tyr Phe Leu Lys Phe
180 185 190
Val Pro Ala Gly Tyr Glu Ser Ala Leu Gin Val Arg Lys Val Tyr Val
195 200 205
Arg Asn Ile Cys Lys Ala Leu Leu Asp Val Leu Gly Ile Glu Val Asp
210 215 220
Ala Glu Tyr Leu Leu Gly Pro Leu Tyr Ala Ala Leu Lys Met Glu Ser
225 230 235 240
Met Glu Ile Ile Glu Glu Ile Gin Cys Gin Thr Gin Gin Glu Asn Leu
245 250 255
Ser Ser Asn Ser Asp Gly Ile Ser Pro Lys Arg Arg Arg Leu Ser Ser
260 265 270
Ser Leu Asn Pro Ser Lys Arg Ala Pro Lys Gin Thr Glu Glu Ile Lys
275 260 285
His Val Asp Met Asn Gin Lys Ser Ile Leu Trp Ser Ala Leu Lys Gin
290 295 300
Lvs Ala Glu Ser Leu Gin Ile Ser Leu Glu Tyr Ser Gly Leu Lys Asn
305 310 315 320
Pro Val Ile Glu Met Leu Glu Gly Ile Ala Val Val Leu Gin Leu Thr
325 330 335
Ala Leu Cys Thr Val Hi s Cys Ser His Gin Asn Met Asn Cys Arg Thr
340 345 350
Phe Lys Asp Cys Gin His Lys Ser Lys Lys Lys Pro Ser Val Val Ile
355 360 365
Thr Trp Met Ser Leu Asp Phe Tyr Thr Lys Val Leu Lys Ser Cys Arg
370 375 380
Ser Leu Leu Glu Ser Val Gin Lys Leu Asp Leu Glu Ala Thr Ile Asp
385 390 395 400
Lys Val Val Lys Ile Tyr Asp Ala Leu Ile Tyr Met Gin Val Asn Ser
405 410 415
Ser Phe Glu Asp His Ile Leu Glu Asp Leu Cys Gly Met Leu Ser Leu
420 425 430
• ·
- 141 -
Pro Trp Ile Tyr 435 Ser His Ser Asp 440 Asp Gly Cys Leu Lys 445 Leu Thr Thr
Phe Ala Ala Asn Leu Leu Thr Leu Ser Cys Arg Ile Ser Asp Ser Tyr
450 455 460
Ser Pro Gin Ala Gin Ser Arg Cys Val Phe Leu Leu Thr Leu Phe Pro
465 470 475 480
Arg Arg Ile Phe Leu Glu Trp Arg Thr Ala Val Tyr Asn Trp Ala Leu
485 490 495
Gin Ser Ser His Glu Val Ile Arg Ala Ser Cys Val Ser Gly Phe Phe
500 505 510
Ile Leu Leu Gin Gin Gin Asn Ser Cys Asn Arg Val Pro Lys Ile Leu
515 520 525
Ile Asp Lys Val Lys Asp Asp Ser Asp Ile Val Lys Lys Glu Phe Ala
530 535 540
Ser Ile Leu Gly Gin Leu Val Cys Thr Leu His Gly Met Phe Tyr Leu
545 550 555 560
Thr Ser Ser Leu Thr Glu Pro Phe Ser Glu His Gly His Val Asp Leu
565 570 575
Phe Cys Arg Asn Leu Lys Ala Thr Ser Gin His Glu Cys Ser Ser Ser
580 585 590
Gin Leu Lys Ala Ser Val Cys Lys Pro Phe Leu Phe Leu Leu Lys Lys
595 600 605
Lys Ile Pro Ser Pro Val Lys Leu Ala Phe Ile Asp Asn Leu His His
610 615 620
Leu Cys Lys His Leu Asp Phe Arg Glu Asp Glu Thr Asp Val Lys Ala
625 630 635 640
Val Leu Gly Thr Leu Leu Asn Leu Met Glu Asp Pro Asp Lys Asp Val
645 650 655
Arg Val Ala Phe Ser Gly Asn Ile Lys His Ile Leu Glu Ser Leu Asp
660 665 670
Ser Glu Asp Gly Phe Ile Lys Glu Leu Phe Val Leu Arg Met Lys Glu
675 680 685
Ala Tyr Thr His Ala Gin Ile Ser Arg Asn Asn Glu Leu Lys Asp Thr
690 695 700
Leu Ile Leu Thr Thr Gly Asp Ile Gly Arg Ala Ala Lys Gly Asp Leu
705 710 715 720
Val Pro Phe Ala Leu Leu His Leu Leu His Cys Leu Leu Ser Lys Ser
725 730 735
Ala Ser Val Ser Gly Ala Ala Tyr Thr Glu Ile Arg Ala Leu Val Ala
740 745 750
Ala Lys Ser Val Lys Leu Gin Ser Phe Phe Ser Gin Tyr Lys Lys Pro
755 760 765
Ile Cys Gin Phe Leu Val Glu Ser Leu His Ser Ser Gin Met Thr Ala
770 775 780
• · · ·
- 142 - • ♦ · · · ··
Leu Pro Asn Thr Pro Cys Gin Asn Ala Asp Val Arg Lys Gin Asp Val
765 790 795 800
Ala His Gin Arg Glu Met Ala Leu Asn Thr Leu Ser Glu Ile Ala Asn
805 810 815
Val Phe Asp Phe Pro Asp Leu Asn Arg Phe Leu Thr Arg Thr Leu Gin
820 825 830
Val Leu Leu Pro Asp Leu Ala Ala Lys Ala Ser Pro Ala Ala Ser Ala
835 840 845
Leu Ile Arg Thr Leu Gly Lys Gin Leu Asn Val Asn Arg Arg Glu Ile
850 855 860
Leu Ile Asn Asn Phe Lys Tyr Ile Phe Ser His Leu Val Cys Ser Cys
865 870 875 880
Ser Lys Asp Glu Leu Glu Arg Ala Leu His Tyr Leu Lys Asn Glu Thr
885 890 895
Glu Ile Glu Leu Gly Ser Leu Leu Arg Gin Asp Phe Gin Gly Leu His
900 905 910
Asn Glu Leu Leu Leu Arg Ile Gly Glu His Tyr Gin Gin Val Phe Asn
915 920 925
Gly Leu Ser Ile Leu Ala Ser Phe Ala Ser Ser Asp Asp Pro Tyr Gin
930 935 940
Gly Pro Arg Asp Ile Ile Ser Pro Glu Leu Met Ala Asp Tyr Leu Gin
945 950 955 960
Pro Lys Leu Leu Gly Ile Leu Ala Phe Phe Asn Met Gin Leu Leu Ser
965 970 975
Ser Ser Val Gly Ile Glu Asp Lys Lys Met Ala Leu Asn Ser Leu Met
980 985 990
Ser Leu Met Lys Leu Met Gly Pro Lys His Val Ser Ser Val Arg Val
995 1000 1005
Lys Met Met Thr Thr Leu Arg Thr Gly Leu Arg Phe Lys Asp Asp Phe
1010 1015 1020
Pro Glu Leu Cys Cys Arg Ala Trp Asp Cys Phe Val Arg Cys Leu Asp
1025 1030 1035 1040
His Ala Cys Leu Gly Ser Leu Leu Ser His Val Ile Val Ala Leu Leu
1045 1050 1055
Pro Leu Ile His Ile Gin Pro Lys Glu Thr Ala Ala Ile Phe His Tyr
1050 1065 1070
Leu Ile Ile Glu Asn Arg Asp Ala Val Gin Asp Phe Leu His Glu Ile
1075 1080 1085
Tyr Phe Leu Pro Asp His Pro Glu Leu Lys Lys Ile Lys Ala Val Leu
1090 1095 1100
Gin Glu Tyr Arg Lys Glu Thr Ser Glu Ser Thr Asp Leu Gin Thr Thr
1105 1110 1115 1120
Leu Gin Leu Ser Met Lys Ala Ile Gin His Glu Asn Val Asp Val Arg 1125 1130 1135 • ·
- 143
Ile His Ala Leu Thr 1140 Ser Leu Lys Glu Thr Leu Tyr Lys Asn Gin Glu
1145 1150
Lys Leu Ile Lys Tyr Al a Thr Asp Ser Glu Thr Val Glu Pro Ile Ile
1155 1160 1165
Ser Gin Leu Val Thr Val Leu Leu Lys Gly Cys Gin Asp Ala Asn Ser
1170 1175 1180
Gin Ala Arg Leu Leu Cys Gly Glu Cys Leu Gly Glu Leu Gly Ala Ile
1185 1190 1195 1200
Asp Pro Gly Arg Leu Asp Phe Ser Thr Thr Glu Thr Gin Gly Lys Asp
1205 1210 1215
Phe Thr Phe Val Thr Gly Val Glu Asp Ser Ser Phe Ala Tyr Gly Leu
1220 1225 1230
Leu Met Glu Leu Thr Arg Ala Tyr Leu Ala Tyr Ala Asp Asn Ser Arg
1235 124C 1 1245
Ala Gin Asp Ser Ala Ala Tyr Ala Ile Gin Glu Leu Leu Ser Ile Tyr
1250 1255 1260
Asp Cys Arg Glu Met Glu Thr Asn Gly Pro Gly His Gin Leu Trp Arg
1265 1270 1275 1280
Arg Phe Pro Glu His Val Arg Glu Ile Leu Glu Pro His Leu Asn Thr
1285 1290 1295
Arg Tyr Lys Ser Ser Gin Lys Ser Thr Asp Trp Ser Gly Val Lys Lys
1300 1305 1310
Pro Ile Tyr Leu Ser Lys Leu Gly Ser Asn Phe Ala Glu Trp Ser Ala
1315 132C 1 1325
Ser Trp Ala Gly Tyr Leu Ile Thr Lys Val Arg His Asp Leu Ala Ser
1330 1335 1340
Lys Ile Phe Thr Cys Cys Ser Ile Met Met Lys His Asp Phe Lys Val
1345 1350 1355 1360
Thr Ile Tyr Leu Leu Pro His Ile Leu Val Tyr Val Leu Leu Gly Cys
1365 1370 1375
Asn Gin Glu Asp Gin Gin Glu Val Tyr Ala Glu Ile Met Ala Val Leu
1380 1385 1390
Lys His Asp Asp Gin His Thr Ile Asn Thr Gin Asp Ile Ala Ser Asp
1395 1400 1405
Leu Cys Gin Leu Ser Thr Gin Thr Val Phe Ser Met Leu Asp His Leu
1410 1415 1420
Thr Gin Trp Ala Arg His Lys Phe Gin Ala Leu Lys Ala Glu Lys Cys
1425 1430 1435 1440
Pro His Ser Lys Ser Asn Arg Asn Lys Val Asp Ser Met Val Ser Thr
1445 1450 1455
Val Asp Tyr Glu Asp Tyr Gin Ser Val Thr Arg Phe Leu Asp Leu Ile
1460 1465 1470 .
Pro Gin Asp Thr Leu Ala Val Ala Ser Phe Arg Ser Lys Ala Tyr Thr
1475 1480 1485
• · • · · ·
Arg Ala Val 1490 Met His Phe Glu Ser 1495 Phe Ile Thr Glu Lys 1500 Lys Gin Asn
Ile Gin Glu His Leu Gly Phe Leu Gin Lys Leu Tyr Ala Ala Met His
1505 1510 1515 1520
Glu Pro Asp Gly Val Ala Gly Val Ser Ala Ile Arg Lys Ala Glu Pro
1525 1530 1535
Ser Leu Lys Glu Gin Ile Leu Glu His Glu Ser Leu Gly Leu Leu Arg
1540 1545 1550
Asp Ala Thr Ala Cys Tyr Asp Arg Ala Ile Gin Leu Glu Pro Asp Gin
1555 1560 1565
Ile Ile His Tyr His Gly Val Val Lys Ser Met Leu Gly Leu Gly Gin
1570 1575 1580
Leu Ser Thr Val Ile Thr Gin Val Asn Gly Val His Ala Asn Arg Ser
1585 1590 1595 1600
Glu Trp Thr Asp Glu Leu Asn Thr Tyr Arg Val Glu Ala Ala Tro Lys
1605 1610 1615
Leu Ser Gin Trp Asp Leu Val Glu Asn Tyr Leu Ala Ala Asp Gly Lys
1620 1625 1 1630
Ser Thr Thr Trp Ser Val Arg Leu Gly Gin Leu Leu Leu Ser Ala Lys
1635 1640 1645
Lys Arg Asp Ile Thr Ala Phe Tyr Asp Ser Leu Lys Leu Val Arg Ala
1650 1655 1660
Glu Gin Ile Val Pro Leu Ser Ala Ala Ser Phe Glu Arg Gly Ser Tyr
1665 1670 1675 1680
Gin Arg Gly Tyr Glu Tyr Ile Val Arg Leu His Met Leu Cys Glu Leu
1685 1690 1695
Glu His Ser Ile Lys Pro Leu Phe Gin His Ser Pro Gly Asp Ser Ser
1700 1705 1710
Gin Glu Asp Ser Leu Asn Trp Val Ala Arg Leu Glu Met Thr Gin Asn
1715 1720 1725
Ser Tyr Arg Ala Lys Glu Pro Ile Leu Ala Leu Arg Arg Ala Leu Leu
1730 1735 1740
Ser Leu Asn Lys Arg Pro Asp Tyr Asn Glu Me t Val Gly Glu Cys Trp
1745 1750 1755 1760
Leu Gin Ser Ala Arg Val Ala Arg Lys Ala Gly His His Gin Thr Ala
1765 1770 1775
Tyr Asn Ala Leu Leu Asn Ala Gly Glu Ser Arg Leu Ala Glu Leu Tyr
1780 1785 1790
Val Glu Arg Ala Lys Trp Leu Trp Ser Lys Gly Asp Val His Gin Ala
1795 1800 1805
Leu Ile Val Leu Gin Lys Gly Val Glu Leu Cys Phe Pro Glu Asn Glu
1810 1815 1820
Thr Pro Pro Glu Gly Lys Asn Met Leu Ile His Gly Arg Ala Met Leu
1825 1830 1835 1840
145
Leu Val Gly Arg Phe Met 1845 Glu Glu Thr Ala Asn 1850 Phe Glu Ser Asn Ala 1855
Ile Met Lys Lys Tyr Lys Asp Val Thr Ala Cys Leu Pro Glu Trp Glu
1860 1865 1870
Asp Gly His Phe Tyr Leu Ala Lys Tyr Tyr Asp Lys Leu Met Pro Met
1875 1880 1885
Val Thr Asp Asn Lys Met Glu Lys Gin Gly Asp Leu Ile Arg Tyr Ile
1890 1895 1900
Val Leu His Phe Gly Arg Ser Leu Gin Tyr Gly Asn Gin Phe Ile Tyr
1905 1910 1915 1920
Gin Ser Met Pro Arg Met Leu Thr Leu Trp Leu Asp Tyr Gly Thr Lys
1925 1930 1935
Ala Tyr Glu Trp Glu Lys Ala Gly Arg Ser Asp Arg Val Gin Met Arg
1940 1945 1950
Asn Asp Leu Gly Lys Ile Asn Lys Val Ile Thr Glu His Thr Asn Tyr
1955 1960 1965
Leu Ala Pro Tyr Gin Phe Leu Thr Ala Phe Ser Gin Leu Ile Ser Arg
1970 1975 1980
Ile Cys His Ser His Asp Glu Val Phe Val Val Leu Asp Gly Asn Asn
1985 1990 1995 2000
Ser Gin Val Phe Leu Ala Tyr Pro Gin Gin Ala Met Trp Met Met Thr
2005 2010 2015
Ala Val Ser Lys Ser Ser Tyr Pro Met Arg Val Asn Arg Cys Lys Glu
2020 2025 2030
Ile Leu Asn Lys Ala Ile His Met Lys Lys Ser Leu Glu Lys Phe Val
2035 2040 2045
Gly Asp Al 3 Thr Arg Leu Thr Asp Lys Leu Leu Glu Leu Cys Asn Lys
2050 2055 2060
Pro Val Asp Gly Ser Ser Ser Thr Leu Ser Met Ser Thr His Phe Lys
2065 2070 2075 2080
Met Leu Lys Lys Leu Val Glu Glu Ala Thr Phe Ser Glu Ile Leu Ile
2085 2090 2095
Pro Leu Gin Ser Val Met Ile Pro Thr Leu Pro Ser Ile Leu Gly Thr
2100 2105 2110
His Ala Asn His Ala Ser His Glu Pro Phe Pro Gly His Trp Ala Tyr
2115 2120 2125
Ile Ala Gly Phe Asp Asp Met Val Glu Ile Leu Ala Ser Leu Gin Lys
2130 2135 2140
Pro Lys Lys Ile Ser Leu Lys Gly Ser Asp Gly Lys Phe Tyr Ile Met
2145 2150 2155 2160
Met Cys Lys Pro Lys Asp Asp Leu Arg Lys Asp Cys Arg Leu Met Glu
2165 2170 2175
Phe Asn Ser Leu Ile Asn Lys Cys Leu Arg Lys Asp Ala Glu Ser Arg
2180 2185 2190
• · • · · · ·
146
Arg Arg Glu Leu His 2195 Ile Arg Thr Tyr Ala 2200 Val Ile Pro Leu Asn Asp 2205
Glu Cys Gly Ile Ile Glu Trp Val Asn Asn Thr Ala Gly Leu Arg Pro
2210 2215 2220
Ile Leu Thr Lys Leu Tyr Lys Glu Lys Gly Val Tyr Met Thr Gly Lys
2225 2230 2235 2240
Glu Leu Arg Gin Cys Met Leu Pro Lys Ser Ala Ala Leu Ser Glu Lys
2245 2250 2255
Leu Lys Val Phe Arg Glu Phe Leu Leu Pro Arg His Pro Pro Ile Phe
2260 2265 2270
His Glu Trp Phe Leu Arg Thr Phe Pro Asp Pro Thr Ser Trp Tyr Ser
2275 2280 2285
Ser Arg Ser Ala Tyr Cys Arg Ser Thr Ala Val Met Ser Met Val Gly
2290 2295 2300
Tyr Ile Leu Gly Leu Gly Asp Arg His Gly Glu Asn Ile Leu Phe Asp
2305 2310 2315 2320
Ser Leu Thr Gly Glu Cys Val His Val Asp Phe Asn Cys Leu Phe Asn
2325 2330 2335
Lys Gly Glu Thr Phe Glu Val Pro Glu Ile Val Pro Phe Arg Leu Thr
2340 2345 2350
His Asn Met Val Asn Gly Met Gly Pro Met Gly Thr Glu Gly Leu Phe
2355 2360 2365
Arg Arg Ala Cys Glu Val Thr Met Arg Leu Met Arg Asp Gin Arg Glu
2370 2375 2380
Pro Leu Met Ser Val Leu Lys Thr Phe Leu His Asp Pro Leu Val Glu
2385 2390 2395 2400
Trp Ser Lys Pro Val Lys Gly His Ser Lys Ala Pro Leu Asn Glu Thr
2405 2410 2415
Gly Glu Val Val Asn Glu Lys Ala Lys Thr His Val Leu Asp Ile Glu
2420 2425 2430
Gin Arg Leu Gin Gly Val Ile Lys Thr Arg Asn Arg Val Thr Gly Leu
2435 2440 2445
Pro Leu Ser Ile Glu Gly His Val His Tyr Leu Ile Gin Glu Ala Thr
2450 2455 2460
Asp Glu Asn Leu Leu Cys Gin Met Tyr Leu Gly Trp Thr Pro Tyr Met
2465 2470 2475 2480
(2) INFORMACE O SEQ ID NO:27:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 878 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (Xi) POPIS SEKVENCE: SEQ ID NO: 27:
• · · ·
- · · • ·· ·······
- 147
ATCCATTGTG TTGGAAAGGA ATGATGAATG TGGGATTATT GAATGGGTGA ACAATACTGC 60
TGGCTTGAGA CCTATTCTGA CCAAAATATA TAAAGAAAAG GGAGTGTATA TGACAGGAAA 120
GGAGCTTCGC CAGTGTATGC TACCAAAGTC AGCAGCTTTA TCTGAAAAAC TCAAAGTATT 180
CCAAGAATTA CTCCTGCCCA GGCATCCTCC TGTTTTTCAT GAGTGGTTTC TGAGAACATT 240
CCCTGATCCT ACATCATGGT ACAGTAGCAG ATCTGCATAT TGCCGCTCTA CTGCAGTCAT 300
GTCAATGGTT GGCTACATCC TGGGGCTTGG AGACCGTCAT GGTGAAAACA TTCTTTTTGA 360
CTCTTTCACT GGTGAATGTG TACATGTAGA TTTCAACTGT CTTTTTAATA AGGGAGAAAC 420
GTTTGAAGTT CCGGAAATTG TACCATTTCG ACTGACTCAT AATATGGTTA ATGGAATGGG 480
TCCTATGGGA ACAGAGGGTC TATTTCGAAG AGCATGTGAA GTTACACTGA GACTGATGAG 540
GGATCAGAGA GAACCTTTAA TGAGTGTCTT AAAGACTTTT CTACACGATC CTCTAGTGGA 600
GTGGAGTAAA CCAGTGAAAG GACACTCCAA AGCACCACTG AATGAAACCG GGGAAGTTGT 660
CAATGAGAAG GCCAAGACCC ATGTTCTTGA CATTGAACAA CGACTACAAG GTGTGATCAA 720
AACCCGAAAT AGAGTAACAG GGCTGCCATT ATCTATTGAA GGACATGTGC ATTACCTCAT 780
ACAAGAAGCT ACTGATGAAA ACTTACTCTG TCAGATGTAC CTTGGTTGGA CCCCATATAT 840
GTAAAATAAA ATTATTTCAA AGAAAAAAAA AAAAAAAA 878
(2) INFORMACE O SEQ ID NO:28:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 7935 bázových párů (B) TYP: nukleová kyselina (C) ŘETÉZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 1..7932 (Xi) POPIS SEKVENCE: SEQ ID NO: 28:
ATG GGG GAA CAT GGC CTG GAG CTG GCT TCC ATG ATC CCC GCC CTG CGG
Met 1 Gly Glu His Gly 5 Leu Glu Leu Ala Ser 10 Met Ile Pro Ala Leu 15 Arg
GAG CTG GGC AGT GCC ACA CCA GAG GAA TAT AAT ACA GTT GTA CAG AAG
Glu Leu Gly Ser Ala Thr Pro Glu Glu Tyr Asn Thr Val Val Gin Lys
20 25 30
• · • ·· * • · ♦ ··· ·· ·
- 148 -
CCA AGA Pro Arg CAA Gin 35 ATT CTG TGT CAA TTC ATT GAC CGG ATA CTT ACA GAT Asp GTA Val 144
Ile Leu Cys Gin Phe 40 Ile Asp Arg Ile Leu 45 Thr
AAT GTT GTT GCT GTA GAA CTT GTA AAG AAA ACT GAC TCT CAG CCA ACC 192
Asn Val Val Ala Val Glu Leu Val Lys Lys Thr Asp Ser Gin Pro Thr
50 55 60
TCC GTG ATG TTG CTT GAT TTC ATC CAG CAT ATC ATG AAA TCC TCC CCA 240
Ser Val Met Leu Leu Asp Phe Ile Gin His Ile Met Lys Ser Ser Pro
65 70 75 80
CTT ATG TTT GTA AAT GTG AGT GGA AGC CAT GAG CGC AAA GGC AGT TGT 288
Leu Me t Phe Val Asn Val Ser Gly Ser His Glu Arg Lys Gly Ser Cys
85 90 95
ATT GAA TTC AGT AAT TGG ATC ATA ACG AGA CTT CTG CGG ATT GCA GCA 336
Ile Glu Phe Ser Asn Trp Ile Ile Thr Arg Leu Leu Arg Ile Ala Ala
100 105 110
ACT CCC TCC TGT CAT TTG TTA CAC AAG AAA ATC TGT GAA GTC ATC TGT 384
Thr Pro Ser Cys His Leu Leu His Lys Lys Ile Cys Glu Val Ile Cys
115 120 125
TCA TTA TTA TTT CTT TTT AAA AGC AAG AGT CCT GCT ATT TTT GGG GTA 432
Ser Leu Leu Phe Leu Phe Lys Ser Lys Ser Pro Ala Ile Phe Gly Val
130 135 140
CTC ACA AAA GAA TTA TTA CAA CTT TTT GAA GAC TTG GTT TAC CTC CAT 480
Leu Thr Lys Glu Leu Leu Gin Leu Phe Glu Asp Leu Val Tyr Leu His
145 150 155 160
AGA AGA AAT GTG ATG GGT CAT GCT GTG GAA TGG CCA GTG GTC ATG AGC 528
Arg Arg Asn Val Met Gly His Ala Val Glu Trp Pro Val Val Met Ser
165 170 175
CGA TTT TTA AGT CAA TTA GAT GAA CAC ATG GGA TAT TTA CAA TCA GCT 576
Arg Phe Leu Ser Gin Leu Asp Glu His Me t Gly Tyr Leu Gin Ser Ala
180 185 190
CCT TTG CAG TTG ATG AGT ATG CAA AAT TTA GAA TTT ATT GAA GTC ACT 624
Pro Leu Gin Leu Met Ser Met Gin Asn Leu Glu Phe Ile Glu Val Thr
195 200 205
TTA TTA ATG GTT CTT ACT CGT ATT ATT GCA ATT GTG TTT TTT AGA AGG 672
Leu Leu Met Val Leu Thr Arg Ile Ile Ala Ile Val Phe Phe Arg Arg
210 215 220
CAA GAA CTC TTA CTT TGG CAG ATA GGT TGT GTT CTG CTA GAG TAT GGT 720
Gin Glu Leu Leu Leu Trp Gin Ile Gly Cys Val Leu Leu Glu Tyr Gly
225 230 235 240
AGT CCA AAA ATT AAA TCC CTA GCA ATT AGC TTT TTA ACA GAA CTT TTT 768
Ser Pro Lys Ile Lys Ser Leu Ala Ile Ser Phe Leu Thr Glu Leu Phe
245 250 255
CAG CTT GGA GGA CTA CCA GCA CAA CCA GCT AGC ACT TTT TTC AGC TCA 816
Gin Leu Gly Gly Leu Pro Ala Gin Pro Ala Ser Thr Phe Phe Ser Ser
260 265 270
TTT TTG GAA TTA TTA AAA CAC CTT GTA GAA ATG GAT ACT GAC CAA TTG 864
Phe Leu Glu Leu Leu Lys His Leu Val Glu Met Asp Thr Asp Gin Leu
275 280 285
AAA CTC TAT GAA GAG CCA TTA TCA AAG CTG ATA AAG ACA CTA TTT CCC 912
Lys Leu Tyr Glu Glu Pro Leu Ser Lys Leu Ile Lys Thr Leu Phe Pro
290 295 300
• · · · » • ·· « «· • · · · t · · · ·· · • · · · ···· • · ·· · · · · · · ·
- 149 - »· · « · «·····» · ·
TTT GAA GCA GAA GCT TAT AGA AAT ATT GAA CCT GTC TAT TTA AAT ATG 960
Phe 305 Glu Ala Glu Ala Tyr 310 Arg Asn Ile Glu Pro 315 Val Tyr Leu Asn Met 320
CTG CTG GAA AAA CTC TGT GTC ATG TTT GAA GAC GGT GTG CTC ATG CGG 1008
Leu Leu Glu Lys Leu 325 Cys Val Met Phe Glu 330 Asp Gly Val Leu Met 335 Arg
CTT AAG TCT GAT TTG CTA AAA GCA GCT TTG TGC CAT TTA CTG CAG TAT 1056
Leu Lys Ser Asp 340 Leu Leu Lys Ala Ala 345 Leu Cys His Leu Leu 350 Gin Tyr
TTC CTT AAA TTT GTG CCA GCT GGG TAT GAA TCT GCT TTA CAA GTC AGG 1104
Phe Leu Lys 355 Phe Val Pro Ala Gly 360 Tyr Glu Ser Ala Leu 365 Gin Val Arg
AAG GTC TAT GTG AGA AAT ATT TGT AAA GCT CTT TTG GAT GTG CTT GGA 1152
Lys Val 370 Tyr Val Arg Asn Ile 375 Cys Lys Ala Leu Leu 380 Asp Val Leu Gly
ATT GAG GTA GAT GCA GAG TAC TTG TTG GGC CCA CTT TAT GCA GCT TTG 1200
Ile 385 Glu Val Asp Ala Glu 390 Tyr Leu Leu Gly Pro 395 Leu Tyr Ala Ala Leu 400
AAA ATG GAA AGT ATG GAA ATC ATT GAG GAG ATT CAA TGC CAA ACT CAA 1248
Lys Met Glu Ser Met 405 Glu Ile Ile Glu Glu 410 Ile Gin Cys Gin Thr 415 Gin
CAG GAA AAC CTC AGC AGT AAT AGT GAT GGA ATA TCA CCC AAA AGG CGT 1296
Glr. Glu Asn Leu 420 Ser Ser Asn Ser Asp 425 Gly Ile Ser Pro Lys 430 Arg Arg
CGT CTC AGC TCG TCT CTA AAC CCT TCT AAA AGA GCA CCA AAA CAG ACT 1344
Arg Leu Ser 435 Ser Ser Leu Asn Pro 440 Ser Lys Arg Ala Pro 445 Lys Gin Thr
GAG GAA ATT AAA CAT GTG GAC ATG AAC CAA AAG AGC ATA TTA TGG AGT 1392
Glu Glu 450 Ile Lys His Val Asp 455 Met Asn Gin Lys Ser 460 Ile Leu Trp Ser
GCA CTG AAA CAG AAA GCT GAA TCC CTT CAG ATT TCC CTT GAA TAC AGT 1440
Ala 465 Leu Lys Gin Lys Ala 470 Glu Ser Leu Gin Ile 475 Ser Leu Glu Tyr Ser 480
GGC CTA AAG AAT CCT GTT ATT GAG ATG TTA GAA GGA ATT GCT GTT GTC 1488
Gly Leu Lys Asn Pro 485 Val Ile Glu Met Leu 490 Glu Gly Ile Ala Val 495 Val
TTA CAA CTG ACT GCT CTG TGT ACT GTT CAT TGT TCT CAT CAA AAC ATG 1536
Leu Gin Leu Thr 500 Ala Leu Cys Thr Val 505 His Cys Ser His Gin 510 Asn Met
AAC TGC CGT ACT TTC AAG GAC TGT CAA CAT AAA TCC AAG AAG AAA CCT 1584
Asn Cys Arg 515 Thr Phe Lys Asp Cys 520 Gin His Lys Ser Lys 525 Lys Lys Pro
TCT GTA GTG ATA ACT TGG ATG TCA TTG GAT TTT TAC ACA AAA GTG CTT 1632
Ser Val 530 Val Ile Thr Trp Met 535 Ser Leu Asp Phe Tyr 540 Thr Lys Val Leu
AAG AGC TGT AGA AGT TTG TTA GAA TCT GTT CAG AAA CTG GAC CTG GAG 1680
Lys 545 Ser Cys Arg Ser Leu 550 Leu Glu Ser Val Gin 555 Lys Leu Asp Leu Glu 560
GCA ACC ATT GAT AAG GTG GTG AAA ATT TAT GAT GCT TTG ATT TAT ATG 1728
Ala Thr Ile Asp Lys 565 Val Val Lys Ile Tyr 570 Asp Ala Leu Ile Tyr 575 Met
·· · · • · · a · · a • « i
999 99 • ·· ·· ···· «····* · • · · · · • · » ··· · • · · · »·· ···· «· ·
CAA Gin GTA AAC AGT TCA Ser TTT Phe GAA Glu GAT CAT ATC Ile CTG Leu GAA Glu GAT Asp TTA Leu 590 TGT Cys GGT Gly 1776
Val Asn Ser 580 Asp His 565
ATG CTC TCA CTT CCA TGG ATT TAT TCC CAT TCT GAT GAT GGC TGT TTA 1824
Met Leu Ser 595 Leu Pro Trp Ile Tyr 600 Ser His Ser Asp Asp 605 Gly Cys Leu
AAG TTG ACC ACA TTT GCC GCT AAT CTT CTA ACA TTA AGC TGT AGG ATT 1872
Lys Leu 610 Thr Thr Phe Ala Ala 615 Asn Leu Leu Thr Leu 620 Ser Cys Arg Ile
TCA GAT AGC TAT TCA CCA CAG GCA CAA TCA CGA TGT GTG TTT CTT CTG 1920
Ser 625 Asp Ser Tyr Ser Pro 630 Gin Ala Gin Ser Arg 635 Cys Val Phe Leu Leu 640
ACT CTG TTT CCA AGA AGA ATA TTC CTT GAG TGG AGA ACA GCA GTT TAC 1968
Thr Leu Phe Pro Arg 645 Arg Ile Phe Leu Glu 650 Trp Arg Thr Ala Val 655 Tyr
AAC TGG GCC CTG CAG AGC TCC CAT GAA GTA ATC CGG GCT AGT TGT GTT 2016
Asr. Tip Ala Leu 660 Gin Ser Ser His Glu 665 Val Ile Arg Ala Ser 670 Cys Val
AGT GGA TTT TTT ATC TTA TTG CAG CAG CAG AAT TCT TGT AAC AGA GTT 2064
Ser Gly Phe 675 Phe Ile Leu Leu Gin 680 Gin Gin Asn Ser Cys 685 Asn Arg Val
CCC AAG ATT CTT ATA GAT AAA GTC AAA GAT GAT TCT GAC ATT GTC AAG 2112
Pro Lys 690 Ile Leu Ile Asp Lys 695 Val Lys Asp Asp Ser 700 Asp Ile Val Lys
AAA GAA TTT GCT TCT ATA CTT GGT CAA CTT GTC TGT ACT CTT CAC GGC 2160
Lys 705 Glu Phe Ala Ser Ile 710 Leu Gly Gin Leu Val 715 Cys Thr Leu His Gly 720
ATG TTT TAT CTG ACA AGT TCT TTA ACA GAA CCT TTC TCT GAA CAC GGA 2208
Me t Phe Tyr Leu Thr 725 Ser Ser Leu Thr Glu 730 Pro Phe Ser Glu His 735 Gly
CAT GTG GAC CTC TTC TGT AGG AAC TTG AAA GCC ACT TCT CAA CAT GAA 2256
His Val Asp Leu 740 Phe Cys Arg Asn Leu 745 Lys Ala Thr Ser Gin 750 His Glu
TGT TCA TCT TCT CAA CTA AAA GCT TCT GTC TGC AAG CCA TTC CTT TTC 2304
Cys Ser Ser 755 Ser Gin Leu Lys Ala 760 Ser Val Cys Lys Pro 765 Phe Leu Phe
CTA CTG AAA AAA AAA ATA CCT AGT CCA GTA AAA CTT GCT TTC ATA GAT 2352
Leu Leu 770 Lys Lys Lys Ile Pro 775 Ser Pro Val Lys Leu 780 Ala Phe Ile Asp
AAT CTA CAT CAT CTT TGT AAG CAT CTT GAT TTT AGA GAA GAT GAA ACA 2400
Asn 785 Leu His His Leu Cys 790 Lys His Leu Asp Phe 795 Arg Glu Asp Glu Thr 800
GAT GTA AAA GCA GTT CTT GGA ACT TTA TTA AAT TTA ATG GAA GAT CCA 2448
Asp Val Lys Ala Val 805 Leu Gly Thr Leu Leu BIO Asn Leu Met Glu Asp 815 Pro
GAC AAA GAT GTT AGA GTG GCT TTT AGT GGA AAT ATC AAG CAC ATA TTG 2496
Asp Lys Asp Val 820 Arg Val Ala Phe Ser 825 Gly Asn Ile Lys His 830 ií.e Leu
GAA TCC TTG GAC TCT GAA GAT GGA TTT ATA AAG GAG CTT TTT GTC TTA 2544
Glu Ser Leu 835 Asp Ser Glu Asp Gly 840 Phe Ile Lys Glu Leu 845 Phe Val Leu
• · · ·
- 151 - • · · • 9 • · · · · · ·
AGA ATG AAG GAA GCA TAT ACA CAT GCC CAA ATA TCA AGA AAT AAT GAG 2592
Arg Met Lys Glu Ala Tyr Thr His Ala Gin Ile Ser Arg Asn Asn Glu
850 855 860
CTG AAG GAT ACC TTG ATT CTT ACA ACA GGG GAT ATT GGA AGG GCC GCA 2640
Leu Lys Asp Thr Leu Ile Leu Thr Thr Gly Asp Ile Gly Arg Ala Ala
865 870 875 880
AAA GGA GAT TTG GTA CCA TTT GCA CTC TTA CAC TTA TTG CAT TGT TTG 2688
Lys Gly Asp Leu Val Pro Phe Ala Leu Leu His Leu Leu His Cys Leu
885 890 895
TTA TCC AAG TCA GCA TCT GTC TCT GGA GCA GCA TAC ACA GAA ATT AGA 2736
Leu Ser Lys Ser Ala Ser Val Ser Gly Ala Ala Tyr Thr Glu Ile Arg
900 905 910
GCT CTG GTT GCA GCT AAA AGT GTT AAA CTG CAA AGT TTT TTC AGC CAG 2784
Ala Leu Val Ala Ala Lys Ser Val Lys Leu Gin Ser Phe Phe Ser Gin
915 920 925
TAT AAG AAA CCC ATC TGT CAG TTT TTG GTA GAA TCC CTT CAC TCT AGT 2832
Tyr Lys Lys Pro Ile Cys Gin Phe Leu Val Glu Ser Leu His Ser Ser
930 935 940
CAG ATG ACA GCA CTT CCG AAT ACT CCA TGC CAG AAT GCT GAC GTG CGA 2880
Gin Met Thr Ala Leu Pro Asn Thr Pro Cys Gin Asn Ala Asp Val Arg
945 950 955 960
AAA CAA GAT GTG GCT CAC CAG AGA GAA ATG GCT TTA AAT ACG TTG TCT 2928
Lys Gin Asp Val Ala His Gin Arg Glu Met Ala Leu Asn Thr Leu Ser
965 970 975
GAA ATT GCC AAC GTT TTC GAC TTT CCT GAT CTT AAT CGT TTT CTT ACT 2976
Glu Ile Ala Asn Val Phe Asd Phe Pro Asp Leu Asn Arg Phe Leu Thr
980 985 990
AGG ACA TTA CAA GTT CTA CTA CCT GAT CTT GCT GCC AAA GCA AGC CCT 3024
Arg Thr Leu Gin Val Leu Leu Pro Asp Leu Ala Ala Lys Ala Ser Pro
995 1000 1005
GCA GCT TCT GCT CTC ATT CGA ACT TTA GGA AAA CAA TTA AAT GTC AAT 3072
Ala Ala Ser Ala Leu Ile Arg Thr Leu Gly Lys Gin Leu Asn Val Asn
1010 1015 1020
CGT AGA GAG ATT TTA ATA AAC AAC TTC AAA TAT ATT TTT TCT CAT TTG 3120
Arg Arg Glu Ile Leu Ile Asn Asn Phe Lys Tyr Ile Phe Ser His Leu
1025 1030 1035 1040
GTC TGT TCT TGT TCC AAA GAT GAA TTA GAA CGT GCC CTT CAT TAT CTG 3168
Val Cys Ser Cys Ser Lys Asp Glu Leu Glu Arg Ala Leu His Tyr Leu
1045 1050 1055
AAG AAT GAA ACA GAA ATT GAA CTG GGG AGC CTG TTG AGA CAA GAT TTC 3216
Lys Asn Glu Thr Glu Ile Glu Leu Gly Ser Leu Leu Arg Gin Asp Phe
1060 1065 1070
CAA GGA TTG CAT AAT GAA TTA TTG CTG CGT ATT GGA GAA CAC TAT CAA 3264
Glr. Gly Leu His Asn Glu Leu Leu Leu Arg Ile Gly Glu His Tyr Gin
1075 1080 1085
CAG GTT TTT AAT GGT TTG TCA ATA CTT GCC TCA TTT GCA TCC AGT GAT 3312
Gin Val Phe Asn Gly Leu Ser Ile Leu Ala Ser Phe Ala Ser Ser Asp
1090 1095 1100
GAT CCA TAT CAG GGC CCG AGA GAT ATC ATA TCA CCT GAA CTG ATG GCT 3360
Asp Pro Tyr Gin Gly Pro Arg Asp Ile Ile Ser Pro Glu Leu Met Ala
1105 1110 1115 1120
- 152 -
GAT Asp TAT Tyr TTA Leu CAA Gin CCC AAA Pro Lys 1125 TTG Leu TTG Leu GGC Gly ATT TTG Ile Leu 1130 GCT Ala TTT Phe TTT Phe AAC ATG Asn Met 1135
CAG TTA CTG AGC TCT AGT GTT GGC ATT GAA GAT AAG AAA ATG GCC TTG
Gin Leu Leu Ser 1140 Ser Ser 1 Val Gly Ile Glu Asp 1145 Lys Lys Met Ala Leu 1150
AAC AGT TTG ATG TCT TTG ATG AAG TTA ATG GGA CCC AAA CAT GTC AGT
Asn Ser Leu 1155 Met Ser Leu Met Lys 116C Leu 1 Met Gly Pro Lys His 1165 Val Ser
TCT GTG AGG GTG AAG ATG ATG ACC ACA CTG AGA ACT GGC CTT CGA TTC
Ser Val Arg 1170 Val Lys Me t Met 1175 Thr Thr Leu Arg Thr Gly 1180 Leu Arg Phe
AAG GAT GAT TTT CCT GAA TTG TGT TGC AGA GCT TGG GAC TGC TTT GTT
Lys Asp 1185 Asp Phe Pro Glu Leu 1190 Cys Cys Arg Ala Trp 1195 Asp Cys Phe Val 1200
CGC TGC CTG GAT CAT GCT TGT CTG GGC TCC CTT CTC AGT CAT GTA ATA
Arg Cys Leu Asp His Ala 1205 Cys Leu Gly Ser Leu 1210 Leu Ser His Val Ile 1215
GTA GCT TTG TTA CCT CTT ATA CAC ATC CAG CCT AAA GAA ACT GCA GCT
Val Ala Leu Leu 122C Pro Leu 1 Ile His Ile Gin Pro 1225 Lys Glu Thr Ala Ala 1230
ATC TTC CAC TAC CTC ATA ATT GAA AAC AGG GAT GCT GTG CAA GAT TTT
Ile Phe His 1235 Tyr Leu Ile Ile Glu Asn 1240 Arg Asp Ala Val Gin 124 5 Asp Phe
CTT CAT GAA ATA TAT TTT TTA CCT GAT CAT CCA GAA TTA AAA AAG ATA
Leu His Glu 1250 Ile Tyr Phe Leu Pro 1255 Asp His Pro Glu Leu 1260 Lys Lys Ile
AAA GCC GTT CTC CAG GAA TAC AGA AAG GAG ACC TCT GAG AGC ACT GAT
Lys Ala 1265 Val Leu Gin Glu Tyr 1270 Arg Lys Glu Thr Ser 1275 Glu Ser Thr Asp 1280
CTT CAG ACA ACT CTT CAG CTC TCT ATG AAG GCC ATT CAA CAT GAA AAT
Leu Gin Thr Thr Leu Gin 1285 Leu Ser Met Lys Ala 1290 Ile Gin His Glu Asn 1295
GTC GAT GTT CGT ATT CAT GCT CTT ACA AGC TTG AAG GAA ACC TTG TAT
Val Asp Val Arg Ile His 1300 Ala Leu Thr Ser Leu 1305 Lys Glu Thr Leu Tyr 1310
AAA AAT CAG GAA AAA CTG ATA AAG TAT GCA ACA GAC AGT GAA ACA GTA
Lys Asn Gin Glu 1315 Lys Leu Ile Lys Tyr 1320 Ala Thr Asp Ser Glu 1325 Thr Val
GAA CCT ATT ATC TCA CAG TTG GTG ACA GTG CTT TTG AAA GGT TGC CAA
Glu Pro Ile 1330 Ile Ser Gin Leu Val 1335 Thr Val Leu Leu Lys 1340 Gly Cys Gin
GAT GCA AAC TCT CAA GCT CGG TTG CTC TGT GGG GAA TGT TTA GGG GAA
Asp Ala 1345 Asn Ser Gin Ala Arg 1350 Leu Leu Cys Gly Glu 1355 Cys Leu Gly Glu 1360
TTG GGG GCG ATA GAT CCA GGT CGA TTA GAT TTC TCA ACA ACT GAA ACT
Leu Gly Ala Ile Asp Pro 1365 Gly Arg Leu Asp Phe 1370 Ser Thr Thr Glu Thr 1375
CAA GGA AAA GAT TTT ACA TTT GTG ACT GGA GTA GAA GAT TCA AGC TTT
Gin Gly Lys Asp Phe Thr Phe Val Thr Gly Val Glu Asp Ser Ser Phe
3408
3456
3504
3552
3600
3648
3696
3744
3792
3840
3888
3936
3984
4032
4080
4128
4176
1380 1385 1390 • · ····
- 153 -
GCC Ala TAT Tyr GGA TTA Gly Leu 1395 TTG Leu ATG Met GAG Glu CTA ACA Leu Thr 1400 AGA Arg GCT Ala TAC Tyr CTT GCG Leu Ala 1405 TAT Tyr GCT Ala 4224
GAT AAT AGC CGA GCT CAA GAT TCA GCT GCC TAT GCC ATT CAG GAG TTG 4272
Asp Asn Ser Arg Ala Gin Asp Ser Ala Ala Tyr Ala Ile Gin Glu Leu
1410 1415 1420
CTT TCT ATT TAT GAC TGT AGA GAG ATG GAG ACC AAC GGC CCA GGT CAC 4320
Leu Ser Ile Tyr Asp Cys Arg Glu Met Glu Thr Asn Gly Pro Gly His
1425 1430 1435 1440
CAA TTG TGG AGG AGA TTT CCT GAG CAT GTT CGG GAA ATA CTA GAA CCT 4368
Gin Leu Trp Arg Arg Phe Pro Glu His Val Arg Glu Ile Leu Glu Pro
1445 1450 1455
CAT CTA AAT ACC AGA TAC AAG AGT TCT CAG AAG TCA ACC GAT TGG TCT 4416
Hi s Leu Asn Thr Arg Tyr Lys Ser Ser Gin Lys Ser Thr Asp Trp Ser
1460 1465 1470
GGA GTA AAG AAG CCA ATT TAC TTA AGT AAA TTG GGT AGT AAC TTT GCA 4464
Gly Val Lys Lys Pro Ile Tyr Leu Ser Lys Leu Gly Ser Asn Phe Ala
1475 1480 1485
GAA TGG TCA GCA TCT TGG GCA GGT TAT CTT ATT ACA AAG GTT CGA CAT 4512
Glu Trp Ser Ala Ser Trp Ala Gly Tyr Leu Ile Thr Lys Val Arg His
1490 1495 1500
GAT CTT GCC AGT AAA ATT TTC ACC TGC TGT AGC ATT ATG ATG AAG CAT 4560
Asp Leu Ala Ser Lys Ile Phe Thr Cys Cys Ser Ile Met Met Lys His
1505 1510 1515 1520
GAT TTC AAA GTG ACC ATC TAT CTT CTT CCA CAT ATT CTG GTG TAT GTC 4608
Asp Phe Lys Val Thr Ile Tyr Leu Leu Pro His Ile Leu Val Tyr Val
1525 1530 1535
TTA CTG GGT TGT AAT CAA GAA GAT CAG CAG GAG GTT TAT GCA GAA ATT 4656
Leu Leu Gly Cys Asn Gin Glu Asp Gin Gin Glu Val Tyr Ala Glu Ile
1540 1545 1550
ATG GCA GTT CTA AAG CAT GAC GAT CAG CAT ACC ATA AAT ACC CAA GAC 4704
Met Ala Val Leu Lys His Asp Asp Gin His Thr Ile Asn Thr Gin Asp
1555 1560 1565
ATT GCA TCT GAT CTG TGT CAA CTC AGT ACA CAG ACT GTG TTC TCC ATG 4752
Ile Ala Ser Asp Leu Cys Gin Leu Ser Thr Gin Thr Val Phe Ser Met
1570 1575 1580
CTT GAC CAT CTC ACA CAG TGG GCA AGG CAC AAA TTT CAG GCA CTG AAA 4800
Leu Asp His Leu Thr Gin Trp Ala Arg His Lys Phe Gin Ala Leu Ly6
158; 1590 1595 1600
GCT GAG AAA TGT CCA CAC AGC AAA TCA AAC AGA AAT AAG GTA GAC TCA 4848
Ala Glu Lys Cys Pro His Ser Lys Ser Asn Arg Asn Lys Val Asp Ser
1605 1610 1615
ATG GTA TCT ACT GTG GAT TAT GAA GAC TAT CAG AGT GTA ACC CGT TTT 4896
Met Val Ser Thr Val Asp Tyr Glu Asp Tyr Gin Ser Val Thr Arg Phe
1620 1625 1630
CTA GAC CTC ATA CCC CAG GAT ACT CTG GCA GTA GCT TCC TTT CGC TCC 4944
Leu Asp Leu Ile Pro Gin Asp Thr Leu Ala Val Ala Ser Phe Arg Ser
1635 1640 1645
AAA GCA TAC ACA CGA GCT GTA ATG CAC TTT GAA TCA TTT ATT ACA GAA 4992
Lys Ala Tyr Thr Arg Ala Val Met His Phe Glu Ser Phe Ile Thr Glu
1655
1660
1650 • · · · · ·
- 154 - • · • · » · • · • · · • · • »· «· · · • · • · • · • · · · · ··
AAG AAG CAA AAT ATT CAG GAA CAT CTT GGA TTT TTA CAG AAA TTG TAT 5040
Lys Lys Gin Asn Xle Gin Glu His Leu Gly Phe Leu Gin Lys Leu Tyr
1665 1670 1675 1680
GCT GCT ATG CAT GAA CCT GAT GGA GTG GCC GGA GTC AGT GCA ATT AGA 5088
Ala Ala Met His Glu Pro Asp Gly Val Ala Gly Val Ser Ala Ile Arg
1685 1690 1695
AAG GCA GAA CCA TCT CTA AAA GAA CAG ATC CTT GAA CAT GAA AGC CTT 5136
Lys Ala Glu Pro Ser Leu Lys Glu Gin Ile Leu Glu His Glu Ser Leu
1700 1705 1710
GGC TTG CTG AGG GAT GCC ACT GCT TGT TAT GAC AGG GCT ATT CAG CTA 5184
Gly Leu Leu Arg Asp Ala Thr Ala Cys Tyr Asp Arg Ala Ile Gin Leu
1715 1720 1725
GAA CCA GAC CAG ATC ATT CAT TAT CAT GGT GTA GTA AAG TCC ATG TTA 5232
Glu Pro Asp Gin Ile Ile His Tyr His Gly Val Val Lys Ser Met Leu
1730 1735 1740
GGT CTT GGT CAG CTG TCT ACT GTT ATC ACT CAG GTG AAT GGA GTG CAT 5280
Gly Leu Gly Gin Leu Ser Thr Val Ile Thr Gin Val Asn Gly Val His
1745 1750 1755 1760
GCT AAC AGG TCC GAG TGG ACA GAT GAA TTA AAC ACG TAC AGA GTG GAA 5328
Ala Asn Arg Ser Glu Trp Thr Asp Glu Leu Asn Thr Tyr Arg Val Glu
1765 1770 1775
GCA GCT TGG AAA TTG TCA CAG TGG GAT TTG GTG GAA AAC TAT TTG GCA 5376
Ala Ala Trp Lys Leu Ser Gin Trp Asp Leu Val Glu Asn Tyr Leu Ala
1780 1785 1790
GCA GAT GGA AAA TCT ACA ACA TGG AGT GTC AGA CTG GGA CAG CTA TTA 5424
Ala Asp Gly Lys Ser Thr Thr Trp Ser Val Arg Leu Gly Gin Leu Leu
1795 1800 1805
TTA TCA GCC AAA AAA AGA GAT ATC ACA GCT TTT TAT GAC TCA CTG AAA 5472
Leu Ser Ala Lys Lys Arg Asp Ile Thr Ala Phe Tyr Asp Ser Leu Lys
1810 1815 1820
CTA GTG AGA GCA GAA CAA ATT GTA CCT CTT TCA GCT GCA AGC TTT GAA 5520
Leu Val Arg Ala Glu Gin Ile Val Pro Leu Ser Ala Ala Ser Phe Glu
1825 1830 1835 1840
AGA GGC TCC TAC CAA CGA GGA TAT GAA TAT ATT GTG AGA TTG CAC ATG 5568
Arg Gly Ser Tyr Gin Arg Gly Tyr Glu Tyr Ile Val Arg Leu His Met
1845 1850 1855
TTA TGT GAG TTG GAG CAT AGC ATC AAA CCA CTT TTC CAG CAT TCT CCA 5616
Leu Cys Glu Leu Glu His Ser Ile Lys Pro Leu Phe Gin His Ser Pro
1860 1865 1870
GGT GAC AGT TCT CAA GAA GAT TCT CTA AAC TGG GTA GCT CGA CTA GAA 5664
Gly Asp Ser Ser Gin Glu Asp Ser Leu Asn Trp Val Ala Arg Leu Glu
1875 1880 1885
ATG ACC CAG AAT TCC TAC AGA GCC AAG GAG CCT ATC CTG GCT CTC CGG 5712
Met Thr Gin Asn Ser Tyr Arg Ala Lys Glu Pro Ile Leu Ala Leu Arg
1890 1895 1900
AGG GCT TTA CTA AGC CTC AAC AAA AGA CCA GAT TAC AAT GAA ATG GTT 5760
Arg Ala Leu Leu Ser Leu Asn Lys Arg Pro Asp Tyr Asn Glu Met Val
1905 1910 1915 1920
GGA GAA TGC TGG CTG CAG AGT GCC AGG GTA GCT AGA AAG GCT GGT CAC 5808
Gly Glu Cys Trp Leu Gin Ser Ala Arg Val Ala Arg Lys Ala Gly His
1925 1930 1935
• *
- 155 -
CAC His CAG Gin ACA Thr GCC TAC Ala Tyr 1940 AAT Asn GCT Ala CTC Leu CTT AAT Leu Asn 1945 GCA Ala GGG Gly GAA Glu TCA CGA Ser Arg 1950 CTC Leu 5856
GCT GAA CTG TAC GTG GAA AGG GCA AAG TGG CTC TGG TCC AAG GGT GAT 5904
Ala Glu Leu Tyr Val Glu Arg Ala Lys Trp Leu Trp Ser Lys Gly Asp
1955 1960 1965
GTT CAC CAG GCA CTA ATT GTT CTT CAA AAA GGT GTT GAA TTA TGT TTT 5952
Val Hi s Gin Ala Leu Ile Val Leu Gin Lys Gly Val Glu Leu Cys Phe
1970 1975 1980
CCT GAA AAT GAA ACC CCA CCT GAG GGT AAG AAC ATG TTA ATC CAT GGT 6000
Pro Glu Asn Glu Thr Pro Pro Glu Gly Lys Asn Met Leu Ile His Gly
1985 1990 1995 2000
CGA GCT ATG CTA CTA GTG GGC CGA TTT ATG GAA GAA ACA GCT AAC TTT 6048
Arg Ala Met Leu Leu Val Gly Arg Phe Met Glu Glu Thr Ala Asn Phe
2005 2010 2015
GAA AGC AAT GCA ATT ATG AAA AAA TAT AAG GAT GTG ACC GCG TGC CTG 6096
Glu Ser Asn Ala Ile Met Lys Lys Tyr Lys Asp Val Thr Ala Cys Leu
2020 2025 2030
CCA GAA TGG GAG GAT GGG CAT TTT TAC CTT GCC AAG TAC TAT GAC AAA 6144
Pro Glu Trp Glu Asp Gly His Phe Tyr Leu Ala Lys Tyr Tyr Asp Lys
2035 2040 2045
TTG ATG CCC ATG GTC ACA GAC AAC AAA ATG GAA AAG CAA GGT GAT CTC 6192
Leu Met Pro Met Val Thr Asp Asn Lys Met Glu Lys Gin Gly Asp Leu
2050 2055 2060
ATC CGG TAT ATA GTT CTT CAT TTT GGC AGA TCT CTA CAA TAT GGA AAT 6240
Ile Arg Tyr Ile Val Leu His Phe Gly Arg Ser Leu Gin Tyr Gly Asn
2065 2070 2075 2080
CAG TTC ATA TAT CAG TCA ATG CCA CGA ATG TTA ACT CTA TGG CTT GAT 6288
Gin Phe Ile Tyr Gin Ser Met Pro Arg Met Leu Thr Leu Trp Leu Asp
2085 2090 2095
TAT GGT ACA AAG GCA TAT GAA TGG GAA AAA GCT GGC CGC TCC GAT CGT 6336
Tyr Gly Thr Lys Ala Tyr Glu Trp Glu Lys Ala Gly Arg Ser Asp Arg
2100 2105 2110
GTA CAA ATG AGG AAT GAT TTG GGT AAA ATA AAC AAG GTT ATC ACA GAG 6384
Val Gin Met Arg Asn Asp Leu Gly Lys Ile Asn Lys Val Ile Thr Glu
2115 2120 2125
CAT ACA AAC TAT TTA GCT CCA TAT CAA TTT TTG ACT GCT TTT TCA CAA 6432
His Thr Asn Tyr Leu Ala Pro Tyr Gin Phe Leu Thr Ala Phe Ser Gin
2130 2135 2140
TTG ATC TCT CGA ATT TGT CAT TCT CAC GAT GAA GTT TTT GTT GTC TTG 6480
Leu Ile Ser Arg Ile Cys His Ser His Asp Glu Val Phe Val Val Leu
2145 2150 2155 2160
ATG GAA ATA ATA GCC AAA GTA TTT CTA GCC TAT CCT CAA CAA GCA ATG 6528
Met Glu Ile Ile Ala Lys Val Phe Leu Ala Tyr Pro Gin Gin Ala Met
2165 2170 2175
TGG ATG ATG ACA GCT GTG TCA AAG TCA TCT TAT CCC ATG CGT GTG AAC 6576
Trp Met Met Thr Ala Val Ser Lys Ser Ser Tyr Pro Met Arg Val Asn
2180 2185 2190 ·
AGA TGC AAG GAA ATC CTC AAT AAA GCT ATT CAT ATG AAA AAA TCC TTA 6624
Arg Cys Lys Glu Ile Leu Asn Lys Ala Ile His Met Lys Lys Ser Leu
2200
2205
2195 » · · · · ·
156
GAG Glu AAG TTT Lys Phe 2210 GTT Val GGA Gly GAT Asp GCA ACT Ala Thr 2215 CGC Arg CTA Leu ACA Thr GAT AAG Asp Lys 2220 CTT Leu CTA Leu GAA Glu 6672
TTG TGC AAT AAA CCG GTT GAT GGA AGT AGT TCC ACA TTA AGC ATG AGC 6720
Leu Cys Asn Lys Pro Val Asp Gly Ser Ser Ser Thr Leu Ser Met Ser
2 22 5 2230 2235 2240
ACT CAT TTT AAA ATG CTT AAA AAG CTG GTA GAA GAA GCA ACA TTT AGT 6768
Thr His Phe Lys Met Leu Lys Lys Leu Val Glu Glu Ala Thr Phe Ser
2245 2250 2255
GAA ATC CTC ATT CCT CTA CAA TCA GTC ATG ATA CCT ACA CTT CCA TCA 6816
Glu Ile Leu Ile Pro Leu Gin Ser Val Met Ile Pro Thr Leu Pro Ser
2260 2265 2270
ATT CTG GGT ACC CAT GCT AAC CAT GCT AGC CAT GAA CCA TTT CCT GGA 6864
Ile Leu Gly Thr His Ala Asn His Ala Ser His Glu Pro Phe Pro Gly
2275 2280 2285
CAT TGG GCC TAT ATT GCA GGG TTT GAT GAT ATG GTG GAA ATT CTT GCT 6912
His Trp Ala Tyr Ile Ala Gly Phe Asp Asp Met Val Glu Ile Leu Ala
2290 2295 2300
TCT CTT CAG AAA CCA AAG AAG ATT TCT TTA AAA GGC TCA GAT GGA AAG 6960
Ser Leu Gin Lys Pro Lys Lys Ile Ser Leu Lys Gly Ser Asp Gly Lys
2305 2310 2315 2320
TTC TAC ATC ATG ATG TGT AAG CCA AAA GAT GAC CTG AGA AAG GAT TGT 7008
Phe Tyr Ile Met Met cys Lys Pro Lys Asp Asp Leu Arg Lys Asp Cys
2325 2330 2335
AGA CTA ATG GAA TTC AAT TCC TTG ATT AAT AAG TGC TTA AGA AAA GAT 7056
Arg Leu Met Glu Phe Asn Ser Leu Ile Asn Lys Cys Leu Arg Lys Asp
2340 2345 2350
GCA GAG TCT CGT AGA AGA GAA CTT CAT ATT CGA ACA TAT GCA GTT ATT 7104
Ala Glu Ser Arg Arg Arg Glu Leu His Ile Arg Thr Tyr Ala Val Ile
2355 2360 2365
CCA CTA AAT GAT GAA TGT GGG ATT ATT GAA TGG GTG AAC AAC ACT GCT 7152
Pro Leu Asn Asp Glu Cys Gly Ile Ile Glu Trp Val Asn Asn Thr Ala
2370 2375 2380
GGT TTG AGA CCT ATT CTG ACC AAA CTA TAT AAA GAA AAG GGA GTG TAT 7200
Gly Leu Arg Pro Ile Leu Thr Lys Leu Tyr Lys Glu Lys Gly Val Tyr
2385 2390 2395 2400
ATG ACA GGA AAA GAA CTT CGC CAG TGT ATG CTA CCA AAG TCA GCA GCT 7248
Met Thr Gly Lys Glu Leu Arg Gin Cys Met Leu Pro Lys Ser Ala Ala
2405 2410 2415
TTA TCT GAA AAA CTC AAA GTA TTC CGA GAA TTT CTC CTG CCC AGG CAT 7296
Leu Ser Glu Lys Leu Lys Val Phe Arg Glu Phe Leu Leu Pro Arg His
2420 2425 2430
CCT CCT ATT TTT CAT GAG TGG TTT CTG AGA ACA TTC CCT GAT CCT ACA 7344
Pro Pro Ile Phe His Glu Trp Phe Leu Arg Thr Phe Pro Asp Pro Thr
2435 2440 2445
TCA TGG TAC AGT AGT AGA TCA GCT TAC TGC CGT TCC ACT GCA GTA ATG 7392
Ser Trp Tyr Ser Ser Arg Ser Ala Tyr Cys Arg Ser Thr Ala Val Met
2450 2455 2460
TCA ATG GTT GGT TAT ATT CTG GGG CTT GGA GAC CGT CAT GGT GAA AAT 7440
Ser Met Val Gly Tyr Ile Leu Gly Leu Gly Asp Arg His Gly Glu Asn 2465 2470 2475 2480 • · ·
- 157 • · · · ·
ATT Ile CTC Leu TTT Phe GAT Asp TCT TTG Ser Leu 2485 ACT Thr GGT Gly GAA Glu TGC GTA Cys Val 2490 CAT His GTA Val GAT Asp TTC AAT Phe Asn 2495 7488
TGT CTT TTC AAT AAG GGA GAA ACC TTT GAA GTT CCA GAA ATT GTG CCA 7536
Cys Leu Phe Asn Lys Gly Glu Thr Phe Glu Val Pro Glu Ile Val Pro
2500 2505 2510
TTT CGC CTG ACT CAT AAT ATG GTT AAT GGA ATG GGT CCT ATG GGA ACA 7584
Phe Arg Leu Thr His Asn Met Val Asn Gly Met Gly Pro Met Gly Thr
2515 2520 2525
GAG GGT CTT TTT CGA AGA GCA TGT GAA GTT ACA ATG AGG CTG ATG CGT 7632
Glu Gly Leu Phe Arg Arg Ala Cys Glu Val Thr Met Arg Leu Met Arg
2530 2535 2540
GAT CAG CGA GAG CCT TTA ATG AGT GTC TTA AAG ACT TTT CTA CAT GAT 7680
Asp Gin Arg Glu Pro Leu Met Ser Val Leu Lys Thr Phe Leu His Asp
2545 2550 2555 2560
CCT CTT GTG GAA TGG AGT AAA CCA GTG AAA GGG CAT TCC AAA GCG CCA 7728
Pro Leu Val Glu Trp Ser Lys Pro Val Lys Gly His Ser Lys Ala Pro
2565 2570 2575
CTG AAT GAA ACT GGA GAA GTT GTC AAT GAA AAG GCC AAG ACC CAT GTT 7776
Leu Asn Glu Thr Gly Glu Val Val Asn Glu Lys Ala Lys Thr His Val
2580 2585 2590
CTT GAC ATT GAG CAG CGA CTA CAA GGT GTA ATC AAG ACT CGA AAT AGA 7824
Leu Asp Ile Glu Gin Arg Leu Gin Gly Val Ile Lys Thr Arg Asn Arg
2595 2600 2605
GTG ACA GGA CTG CCG TTA TCT ATT GAA GGA CAT GTG CAT TAC CTT ATA 7872
Val Thr Gly Leu Pro Leu Ser Ile Glu Gly His Val His Tyr Leu Ile
2610 2615 2620
CAA GAA GCT ACT GAT GAA AAC TTA CTA TGC CAG ATG TAT CTT GGT TGG 7920
Gin Glu Ala Thr Asp Glu Asn Leu Leu Cys Gin Met Tyr Leu Gly Trp
2625 2630 2635 2640
ACT CCA TAT ATG TGA 7935
Thr Pro Tyr Met
(2) INFORMACE O SEQ ID NO:29:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 2644 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 29:
Met 1 Gly Glu His Gly 5 Leu Glu Leu Ala Ser 10 Met Ile Pro Ala Leu 15 Arg
Glu Leu Gly Ser 20 Ala Thr Pro Glu Glu 25 Tyr Asn Thr Val Val 30 Gin Lys
Pro Arg Gin 35 Ile Leu Cys Gin Phe 40 Ile Asp Arg Ile Leu 45 Thr Asp Val
• · · ·
Lys Met Glu Ser Met 405 Glu Ile Ile Glu Glu 410 Ile Gin Cys Gin Thr 415 Gin
Gin Glu Asn Leu 420 Ser Ser Asn Ser Asp 425 Gly Ile Ser Pro Lys 430 Arg Arg
Arg Leu Ser 435 Ser Ser Leu Asn Pro 440 Ser Lys Arg Ala Pro 445 Lys Gin Thr
Glu Glu 450 Ile Lys His Val Asp 455 Met Asn Gin Lys Ser 460 Ile Leu Trp Ser
Ala 465 Leu Lys Gin Lys Ala 470 Glu Ser Leu Gin Ile 475 Ser Leu Glu Tyr Ser 480
Gly Leu Lys Asn Pro 485 Val Ile Glu Met Leu 490 Glu Gly Ile Ala Val 495 Val
Leu Gin Leu Thr 500 Ala Leu Cys Thr Val 505 His Cys Ser His Gin 510 Asn Met
Asn Cys Arg 515 Thr Phe Lys Asp Cys 520 Gin His Lys Ser Lys 525 Lys Lys Pro
Ser Val 530 Val Ile Thr Trp Met 535 Ser Leu Asp Phe Tyr 540 Thr Lys Val Leu
Lys 545 Ser Cys Arg Ser Leu 550 Leu Glu Ser Val Gin 555 Lys Leu Asp Leu Glu 560
Ala Thr Ile Asp Lys 565 Val Val Lys Ile Tyr 570 Asp Ala Leu Ile Tyr 575 Met
Gin Val Asn Ser 580 Ser Phe Glu Asp His 585 Ile Leu Glu Asp Leu 590 Cys Gly
Met Leu Ser 595 Leu Pro Trp Ile Tyr 600 Ser His Ser Asp Asp 605 Gly Cye Leu
Lys Leu 610 Thr Thr Phe Ala Ala 615 Asn Leu Leu Thr Leu 620 Ser Cys Arg Ile
Ser 625 Asp Ser Tyr Ser Pro 630 Gin Ala Gin Ser Arg 635 Cys Val Phe Leu Leu 640
Thr Leu Phe Pro Arg 645 Arg Ile Phe Leu Glu 650 Trp Arg Thr Ala Val 655 Tyr
Asn Trp Ala Leu 660 Gin Ser Ser His Glu 665 Val Ile Arg Ala Ser 670 Cys Val
Ser Gly Phe 675 Phe Ile Leu Leu Gin 680 Gin Gin Asn Ser Cys 685 Asn Arg Val
Pro Lys 690 Ile Leu Ile Asp Lys 695 Val Lys Asp Asp Ser 700 Asp Ile Val Lys
Lys 705 Glu Phe Ala Ser Ile 710 Leu Gly Gin Leu Val 715 Cys Thr Leu His Gly 720
Met Phe Tyr Leu Thr Ser Ser Leu Thr Glu Pro Phe Ser Glu His Gly
725 730 735
His Val Asp Leu Phe Cys Arg Asn Leu Lys Ala Thr Ser Gin His Glu 740 745 750 • ·
- 160 - • · · • ·
Cys Ser Sex 755 Sex’ Gin Leu Lys Ala Ser Val Cys Lys Pro Phe 760 765 Leu Phe
Leu Leu Lys 770 Lys Lys Ile Pro Ser Pro Val Lys Leu Ala Phe 775 780 Ile Asp
Asn Leu His 765 His Leu Cys Lys His Leu Asp Phe Arg Glu Asp 790 795 Glu Thr 800
Asp Val Lys Ala Val Leu Gly Thr Leu Leu Asn Leu Met Glu 805 810 Asp 815 Pro
Asp Lys Asp Val Arg Val Ala Phe Ser Gly Asn Ile Lys His 620 625 Θ30 Ile Leu
Glu Ser Leu 635 Asp Ser Glu Asp Gly Phe Ile Lys Glu Leu Phe 840 845 Val Leu
Arg Met Lys 650 Glu Ala Tyr Thr His Ala Gin Ile Ser Arg Asn 855 860 Asn Glu
Leu Lys Asp 865 Thr Leu Ile Leu Thr Thr Gly Asp Ile Gly Arg 870 875 Ala Ala 880
Lys Gly Asp Leu Val Pro Phe Ala Leu Leu His Leu Leu His 885 890 Cys 895 Leu
Leu Ser Lys Ser Ala Ser Val Ser Gly Ala Ala Tyr Thr Glu 900 905 910 Ile Arg
Ala Leu Val 915 Ala Ala Lys Ser Val Lys Leu Gin Ser Phe Phe 920 925 Ser Gin
Tyr Lys Lys 930 Pro Ile Cys Gin Phe Leu Val Glu Ser Leu His 935 940 Ser Ser
Gin Met Thr 945 Ala Leu Pro Asn Thr Pro Cvs Gin Asn Ala Asp 950 ' 955 Val Arg 960
Lys Gin Asp Val Ala His Gin Arg Glu Met Ala Leu Asn Thr 965 970 Leu 975 Ser
Glu Ile Ala Asn Val Phe Asp Phe Pro Asp Leu Asn Arg Phe 980 985 990 Leu Thr
Arg Thr Leu 995 Gin Val Leu Leu Pro Asp Leu Ala Ala Lys Ala 1000 1005 Ser Pro
Ala Ala Ser 1010 Ala Leu Ile Arg Thr Leu Gly Lys Gin Leu Asn 1015 1020 Val Asn
Arg Arg Glu 1025 Ile Leu Ile Asn Asn Phe Lys Tyr Ile Phe Ser 1030 1035 His Leu 1040
Val Cys Ser Cys Ser Lys Asp Glu Leu Glu Arg Ala Leu His 1045 1050 Tyr Leu 1055
Lys Asn Glu Thr Glu Ile Glu Leu Gly Ser Leu Leu Arg Gin Asp 1060 1065 1070 Phe
Gin Gly Leu His Asn Glu Leu Leu Leu Arg Ile Gly Glu His 1075 1080 1085 Tyr Gin
Gin Val Phe Asn Gly Leu Ser Xle Leu Ala Ser Phe Ala Ser Ser Asp 1090 1095 1100
161 -
Asp Pro Tyr Gin Gly Pro Arg Asp Ile Ile Ser Pro Glu Leu Met Ala
1105 1110 1115 1120
Asp Tyr Leu Gin Pro Lys Leu Leu Gly Ile Leu Ala Phe Phe Asn Met
1125 1130 H35
Gin Leu Leu Ser Ser Ser Val Gly Ile Glu Asp Lys Lys Met Ala Leu
1140 1145 1150
Asn Ser Leu Met Ser Leu Met Lys Leu Met Gly Pro Lys His Val Ser
1155 1160 1165
Ser Val Arg Val Lys Met Met Thr Thr Leu Arg Thr Gly Leu Arq Phe
1170 1175 1180
Lys Asp Asp Phe Pro Glu Leu Cys Cys Arg Ala Trp Asp Cys Phe Val
1185 1190 1195 1200
Arg Cys Leu Asp His Ala Cys Leu Gly Ser Leu Leu Ser His Val Ile
1205 1210 1215
Val Ala Leu Leu Pro Leu Ile His Ile Gin Pro Lys Glu Thr Ala Ala
1220 1225 1230
Ile Phe His Tyr Leu Ile Ile Glu Asn Arg Asp Ala Val Gin Asp Phe
1235 1240 1245
Leu His Glu Ile Tyi- Phe Leu Pro Asp His Pro Glu Leu Lys Lys Ile
1250 1255 1260
Lys Ala Val Leu Gin Glu Tyr Arg Lys Glu Thr Ser Glu Ser Thr Asp
1265 1270 1275 1280
Leu Gin Thr Thr Leu Gin Leu Ser Met Lys Ala Ile Gin His Glu Asn
1285 1290 1295
Val Asp Val Arg Ile His Ala Leu Thr Ser Leu Lys Glu Thr Leu Tyr
1300 1305 1310
Lys Asn Gin Glu Lys Leu Ile Lys Tyr Ala Thr Asp Ser Glu Thr Val
1315 1320 1325
Glu Pro Ile Ile Ser Gin Leu Val Thr Val Leu Leu Lys Gly Cys Gin
1330 1335 1340
Asp Ala Asn Ser Gin Ala Arg Leu Leu Cys Gly Glu Cys Leu Gly Glu
1345 1350 1355 1360
Leu Gly Ala Ile Asp Pro Gly Arg Leu Asp Phe Ser Thr Thr Glu Thr
1365 1370 1375
Gin Gly Lys Asp Phe Thr Phe Val Thr Gly Val Glu Asp Ser Ser Phe
1380 1385 1390
Ala Tyr Gly Leu Leu Met Glu Leu Thr Arg Ala Tyr Leu Ala Tyr Ala
1395 1400 1405
Asp Asn Ser Arg Ala Gin Asp Ser Ala Ala Tyr Ala Ile Gin Glu Leu
1410 1415 1420
Leu Ser Ile Tyr Asp Cys Arg Glu Met Glu Thr Asn Gly Pro Gly His
1425 1430 1435 1440
Gin Leu Trp Arg Arg Phe Pro Glu His Val Arg Glu Ile Leu Glu Pro 1445 1450 1455 • ·
162
His Leu Asn Thr Arg 1460 Tyr Lys Ser Ser Gin 1465 Lys Ser Thr Asp Trp Ser 1470
Gly Val Lys Lys Pro Ile Tyr Leu Ser Lys Leu Gly Ser Asn Phe Ala
1475 1480 1485
Glu Trp Ser Ala Ser Trp Ala Gly Tyr Leu Ile Thr Lys Val Arg His
1490 1495 1500
Asp Leu Ala Ser Lys Ile Phe Thr Cys Cys Ser Ile Met Met Lys His
1505 1510 1515 1520
Asp Phe Lys Val Thr Ile Tyr Leu Leu Pro His Ile Leu Val Tyr Val
1525 1530 1535
Leu Leu Gly Cys Asn Gin Glu Asp Gin Gin Glu Val Tyr Ala Glu Ile
1540 1545 1550
Met Al a Val Leu Lys His Asp Asp Gin His Thr Ile Asn Thr Gin Asp
1555 1560 1565
Ile Ala Ser Asp Leu Cys Gin Leu Ser Thr Gin Thr Val Phe Ser Met
1570 1575 1580
Leu Asp His Leu Thr Gin Trp Ala Arg His Lys Phe Gin Ala Leu Lys
1585 1590 1595 , 1600
Ala Glu Lys Cys Pro His Ser Lys Ser Asn Arg Asn Lys Val Asp Ser
1605 1610 1615
Met Val Ser Thr Val Asp Tyr Glu Asp Tyr Gin Ser Val Thr Arg Phe
1620 1625 1630
Leu Asp Leu Ile Pro Gin Asp Thr Leu Ala Val Ala Ser Phe Arg Ser
1635 1640 1645
Lys Ala Tyr Thr Arg Ala Val Met His Phe Glu Ser Phe Ile Thr Glu
1650 1655 1660
Lys Lys Gin Asn Ile Gin Glu His Leu Gly Phe Leu Gin Lys Leu Tyr
1665 1670 1675 ' 1680
Ala Ala Met His Glu Pro Asp Gly Val Ala Gly Val Ser Ala Ile Arg
1685 1690 1695
Lys Ala Glu Pro Ser Leu Lys Glu Gin Ile Leu Glu His Glu Ser Leu
1700 1705 1710
Gly Leu Leu Arg Asp Ala Thr Ala Cys Tyr Asp Arg Ala Ile Gin Leu
1715 1720 1725
Glu Pro Asp Gin Ile Ile His Tyr His Gly Val Val Lys Ser Met Leu
1730 1735 1740
Gly Leu Gly Gin Leu Ser Thr Val Ile Thr Gin Val Asn Gly Val His
1745 1750 1755 i 1760
Ala Asn Arg Ser Glu Trp Thr Asp Glu Leu Asn Thr Tyr Arg Val Glu
1765 1770 1775
Ala Ala Trp Lys Leu Ser Gin Trp Asp Leu Val Glu Asn Tyr Leu Ala
1780 1785 1790
Ala Asp Gly Lys Ser Thr Thr Trp Ser Val Arg Leu Gly Gin Leu Leu
1795 1800 1805
• · · · · ι
- 163 -
Leu Ser Ala 1810 Lys Lys Arg Asp Ile 1815 Thr Ala Phe Tyr Asp 1820 Ser Leu Lys
Leu Val Arg Ala Glu Gin Ile Val Pro Leu Ser Ala Ala Ser Phe Glu
1825 1830 1835 1840
Arg Gly Ser Tyr Gin Arg Gly Tyr Glu Tyr Ile Val Arg Leu His Met
1845 1850 1855
Leu Cys Glu Leu Glu His Ser Ile Lys Pro Leu Phe Gin His Ser Pro
1860 1865 1870
Gly Asp Ser Ser Gin Glu Asp Ser Leu Asn Trp Val Ala Arg Leu Glu
1875 1880 1885
Met Thr Gin Asn Ser Tyr Arg Ala Lys Glu Pro Ile Leu Ala Leu Arg
1890 1895 1900
Arg Ala Leu Leu Ser Leu Asn Lys Arg Pro Asp Tyr Asn Glu Met Val
1905 1910 1915 1920
Gly Glu Cys Trp Leu Gin Ser Ala Arg Val Ala Arg Lys Ala Gly His
1925 1930 1935
His Gin Thr Ala Tyr Asn Ala Leu Leu Asn Ala Gly Glu Ser Arg Leu
1940 1945 1950
Ala Glu Leu Tyr Val Glu Arg Ala Lys Trp Leu Trp Ser Lys Gly Asp
1955 1960 1965
Val His Gin Ala Leu Ile Val Leu Gin Lys Gly Val Glu Leu Cys Phe
1970 1975 1980
Pro Glu Asn Glu Thr Pro Pro Glu Gly Lys Asn Met Leu Ile His Gly
1985 1990 1995 2000
Arg Ala Met Leu Leu Val Gly Arg Phe Met Glu Glu Thr Ala Asn Phe
2005 2010 2015
Glu Ser Asn Ala Ile Met Lys Lys Tyr Lys Asp Val Thr Ala Cys Leu
2020 2025 2030
Pro Glu Trp Glu Asp Gly His Phe Tyr Leu Ala Lys Tyr Tyr Asp Lys
2035 2040 2045
Leu Met Pro Met Val Thr Asp Asn Lys Met Glu Lys Gin Gly Asp Leu
2050 2055 2060
Ile Arg Tyr Ile Val Leu His Phe Gly Arg Ser Leu Gin Tyr Gly Asn
2065 2070 2075 2080
Gin Phe Ile Tyr Gin Ser Met Pro Arg Met Leu Thr Leu Trp Leu Asp
2085 2090 2095
Tyr Gly Thr Lys Ala Tyr Glu Trp Glu Lys Ala Gly Arg Ser Asp Arg
2100 2105 2110
Val Gin Met Arg Asn Asp Leu Gly Lys He Asn Lys Val Ile Thr Glu
2115 2120 2125
His Thr Asn Tyr Leu Ala Pro Tyr Gin Phe Leu Thr Ala Phe Ser Gin
2130 2135 2140
Leu Ile Ser Arg Ile Cys His Ser His Asp Glu Val Phe Val Val Leu
2145 2150 2155 2160
164 • · · ··
Met Glu Ile Ile Ala Lys 2165 Val Phe Leu Ala Tyr Pro Gin Gin Ala Met
2170 2175
Trp Met Met Thr Ala Val Ser Lys Ser Ser Tyr Pro Met Arg Val Asn
2180 2185 2190
Arg Cys Lys Glu Ile Leu Asn Lys Ala Ile His Met Lys Lys Ser Leu
2195 2200 2205
Glu Lys Phe Val Gly Asp Ala Thr Arg Leu Thr Asp Lys Leu Leu Glu
2210 2215 2220
Leu Cys Asn Lys Pro Val Asp Gly Ser Ser Ser Thr Leu Ser Met Ser
2225 2230 2235 2240
Thr His Phe Lys Met Leu Lys Lys Leu Val Glu Glu Ala Thr Phe Ser
2245 2250 2255
Glu Ile Leu Ile Pro Leu Gin Ser Val Met Ile Pro Thr Leu Pro Ser
2260 2265 2270
Ile Leu Gly Thr His Ala Asn His Ala Ser His Glu Pro Phe Pro Gly
2275 2280 2285
His Trp Ala Tyr Ile Ala Gly Phe Asp Asp Met Val Glu Ile Leu Ala
2290 2295 2300
Ser Leu Gin Lys Pro Lys Lys Ile Ser Leu Lys Gly Ser Asp Gly Lys
2305 2310 2315 2320
Phe Tyr Ile Met Met Cys Lys Pro Lys Asp Asp Leu Arg Lys Asp Cys
2325 2330 2335
Arg Leu Met Glu Phe Asn Ser Leu Ile Asn Lys Cys Leu Arg Lys Asp
2340 2345 2350
Ala Glu Ser Arg Arg Arg Glu Leu His Ile Arg Thr Tyr Ala Val Ile
2355 2360 2365
Pro Leu Asn Asp Glu Cys Gly Ile Ile Glu Trp Val Asn Asn Thr Ala
2370 2375 2380
Gly Leu Arg Pro Ile Leu Thr Lys Leu Tyr Lys Glu Lys Gly Val Tyr
2385 2390 2395 2400
Met Thr Gly Lys Glu Leu Arg Gin Cys Met Leu Pro Lys Ser Ala Ala
2405 2410 2415
Leu Ser Glu Lys Leu Lys Val Phe Arg Glu Phe Leu Leu Pro Arg His
2420 2425 2430
Pro Pro Ile Phe His Glu Trp Phe Leu Arg Thr Phe Pro Asp Pro Thr
2435 2440 2445
Ser Trp Tyr Ser Ser Arg Ser Ala Tyr Cys Arg Ser Thr Ala Val Met
2450 2455 2460
Ser Met Val Gly Tyr Ile Leu Gly Leu Gly Asp Arg His Gly Glu Asn
2465 2470 2475 2480
Ile Leu Phe Asp Ser Leu Thr Gly Glu Cys Val His Val Asp Phe Asn
2485 2490 2495
Cys Leu Phe Asn Lys Gly Glu Thr Phe Glu Val Pro Glu Ile Val Pro 2500 2505 2510
165
Phe Arg Leu Thr His Asn Met Val Asn Gly Met Gly Pro Met 2525 Gly Thr
2515 2520
Glu Gly Leu Phe Arg Arg Ala Cys Glu Val Thr Met Arg Leu Met Arg
2530 2535 2540
Asp Gin Arg Glu Pro Leu Met Ser Val Leu Lys Thr Phe Leu His Asp
2545 2550 2555 2560
Pro Leu Val Glu Trp Ser Lys Pro Val Lys Gly His Ser Lys Ala Pro
2565 2570 2575
Leu Asn Glu Thr Gly Glu Val Val Asn Glu Lys Ala Lys Thr His Val
2580 2585 2590
Leu Asp Ile Glu Gin Arg Leu Gin Gly Val Ile Lys Thr Arg Asn Arg
2595 2600 2605
Val Thr Gly Leu Pro Leu Ser Ile Glu Gly His Val His Tyr Leu Ile
2610 2615 2620
Gin Glu Ala Thr Asp Glu Asn Leu Leu Cys Gin Met Tyr Leu Gly Trp
2625 2630 2635 2640
Thr Pro Tyr Met (2) INFORMACE O SEQ ID NO:30:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 7624 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 333..7562 (xi) POPIS SEKVENCE: SEQ ID NO: 30:
(xi) SEQUENCE DESCRIPTION: SEQ ID NO.-30:
CTTGTGAAGA GAATGTTTTA CACTCTTGTT AGTGAAGTTT ATTCTTTAAA AGTCAATCGT 60
CAAGGATTTA GCAAATGAAT TAGCACTTCG GATATACTTG ΤΤΤΑΤΊΤΑΑΤ ATCTTTTTTG 120
TTTATTTCAA AGAATTCAGT AATTGGATCA TAACGAGACT TCTGCGGATT GCAGCAACTC 180
CCTCCTGTCA TTTGTTACAC AAGAAAATCT GTGAAGTCAT CTGTTCATTA TTATTTCTTT 24 0
TTAAAAGCAA GAGTCCTGCT ATTTTTGGGG TACTCACAAA AGAATTATTA CAACTTTTTG 300
AAGACTTGGT TTACCTCCAT AGAAGAAATG TG ATG GGT CAT GCT GTG GAA TGG 353
Met Gly His Ala Val Glu Trp
5
CCA GTG GTC ATG AGC CGA TTT TTA AGT CAA TTA GAT GAA CAC ATG GGA 401
Pro Val Val Met Ser Arg Phe Leu Ser Gin Leu Asp Glu His Met Gly
15 20
TAT TTA CAA TCA GCT CCT TTG CAG TTG ATG AGT ATG CAA AAT TTA GAA 449
Tyr Leu Gin Ser Ala Pro Leu Gin Leu Met Ser Met Gin Asn Leu Glu
30 35
166
TTT ATT GAA GTC Val ACT TTA TTA ATG GTT CTT Leu ACT CGT ATT ATT GCA ATT 497
Phe 40 Ile Glu Thr Leu 45 Leu Met Val Thr 50 Arg Ile Ile Ala Ile 55
GTG TTT TTT AGA AGG CAA GAA CTC TTA CTT TGG CAG ATA GGT TGT GTT 545
Val Phe Phe Arg Arg 60 Gin Glu Leu Leu Leu 65 Trp Gin Ile Gly Cys 70 Val
CTG CTA GAG TAT GGT AGT CCA AAA ATT AAA TCC CTA GCA ATT AGC TTT 593
Leu Leu Glu Tyr 75 Gly Ser Pro Lys Ile 80 Lys Ser Leu Ala Ile 85 Ser Phe
TTA ACA GAA CTT TTT CAG CTT GGA GGA CTA CCA GCA CAA CCA GCT AGC 641
Leu Thr Glu 90 Leu Phe Gin Leu Gly 95 Gly Leu Pro Ala Gin 100 Pro Ala Ser
ACT TTT TTC AGC TCA TTT TTG GAA TTA TTA AAA CAC CTT GTA GAA ATG 689
Thr Phe 105 Phe Ser Ser Phe Leu 110 Glu Leu Leu Lys His 115 Leu Val Glu Met
GAT ACT GAC CAA TTG AAA CTC TAT GAA GAG CCA TTA TCA AAG CTG ATA 737
Asp 120 Thr Asp Gin Leu Lys 125 Leu Ty i- Glu Glu Pro 130 Leu Ser Lys Leu Ile 135
ZvAG ACA CTA TTT CCC TTT GAA GCA GAA GCT TAT AGA AAT ATT GAA CCT 785
Lys Thr Leu Phe Pro 140 Phe Glu Ala Glu Ala 145 Tyr Arg Asn Ile Glu 150 Pro
GTC TAT TTA AAT ATG CTG CTG GAA AAA CTC TGT GTC ATG TTT GAA GAC 833
Val Tyr Leu Asn 155 Met Leu Leu Glu Lys 160 Leu Cys Val Met Phe 165 Glu Asp
GGT GTG CTC ATG CGG CTT AAG TCT GAT TTG CTA AAA GCA GCT TTG TGC 881
Gly Val Leu 170 Met Arg Leu Lys Ser 175 Asp Leu Leu Lys Ala 180 Ala Leu Cys
CAT TTA CTG CAG TAT TTC CTT AAA TTT GTG CCA GCT GGG TAT GAA TCT 929
His Leu 185 Leu Gin Tyr Phe Leu 190 Lys Phe Val Pro Ala 195 Gly Tyr Glu Ser
GCT TTA CAA GTC AGG AAG GTC TAT GTG AGA AAT ATT TGT AAA GCT CTT 977
Ala 200 Leu Gin Val Arg Lys 205 Val Tyr Val Arg Asn 210 Ile Cys Lys Ala Leu 215
TTG GAT GTG CTT GGA ATT GAG GTA GAT GCA GAG TAC TTG TTG GGC CCA 1025
Leu Asp Val Leu Gly 220 Ile Glu Val Asp Ala 225 Glu Tyr Leu Leu Gly 230 Pro
CTT TAT GCA GCT TTG AAA ATG GAA AGT ATG GAA ATC ATT GAG GAG ATT 1073
Leu Tyr Ala Ala 235 Leu Lys Met Glu Ser 240 Met Glu Ile Ile Glu 245 Glu Ile
CAA TGC CAA ACT CAA CAG GAA AAC CTC AGC AGT AAT AGT GAT GGA ATA 1121
Gin Cys Gin 250 Thr Gin Gin Glu Asn 255 Leu Ser Ser Asn Ser 260 Asp Gly Ile
TCA CCC AAA AGG CGT CGT CTC AGC TCG TCT CTA AAC CCT TCT AAA AGA 1169
Ser Pro 265 Lys Arg Arg Arg Leu 270 Ser Ser Ser Leu Asn 275 Pro Ser Lys Arg
GCA CCA AAA CAG ACT GAG GAA ATT AAA CAT GTG GAC ATG AAC CAA AAG 1217
Ala 280 Pro Lys Gin Thr Glu 285 Glu Ile Lys His Val 290 Asp Met Asn Gin Lys 295
AGC ATA TTA TGG AGT GCA CTG AAA CAG AAA GCT GAA TCC CTT CAG ATT 1265
Ser Ile Leu Trp Ser Ala Leu Lys Gin Lys Ala Glu Ser Leu Gin Ile
300 305 310 » · · I
- 167 -
TCC CTT GAA TAC AGT GGC CTA AAG AAT CCT GTT ATT GAG ATG TTA GAA 1313
Ser Leu Glu Tyr Ser Gly Leu Lys Asn Pro Val Ile Glu Met Leu Glu
315 320 325
GGA ATT GCT GTT GTC TTA CAA CTG ACT GCT CTG TGT ACT GTT CAT TGT 1361
Gly Ile Ala Val Val Leu Gin Leu Thr Ala Leu Cys Thr Val His Cys
330 335 340
TCT CAT CAA AAC ATG AAC TGC CGT ACT TTC AAG GAC TGT CAA CAT AAA 1409
Ser His Gin Asn Met Asn Cys Arg Thr Phe Lys Asp Cys Gin His Lys
345 350 355
TCC AAG AAG AAA CCT TCT GTA GTG ATA ACT TGG ATG TCA TTG GAT TTT 1457
Ser Lys Lys Lys Pro Ser Val Val Ile Thr Trp Met Ser Leu Asp Phe
360 365 370 375
TAC ACA AAA GTG CTT AAG AGC TGT AGA AGT TTG TTA GAA TCT GTT CAG 1505
Tyr Thr Lys Val Leu Lys Ser Cys Arg Ser Leu Leu Glu Ser Val Gin
380 385 390
AAA CTG GAC CTG GAG GCA ACC ATT GAT AAG GTG GTG AAA ATT TAT GAT 1553
Lys Leu Asp Leu Glu Ala Thr Ile Asp Lys Val Val Lys Ile Tyr Asp
395 400 405
GCT TTG ATT TAT ATG CAA GTA AAC AGT TCA TTT GAA GAT CAT ATC CTG 1601
Ala Leu Ile Tyr Met Gin Val Asn Ser Ser Phe Glu Asp His Ile Leu
410 415 420
GAA GAT TTA TGT GGA ATG CTC TCA CTT CCA TGG ATT TAT TCC CAT TCT 1649
Glu Asp Leu Cys Gly Met Leu Ser Leu Pro Trp Ile Tyr Ser His Ser
425 430 435
GAT GAT GGC TGT TTA AAG TTG ACC ACA TTT GCC GCT AAT CTT CTA ACA 1697
Asp Asp Gly Cys Leu Lys Leu Thr Thr Phe Ala Ala Asn Leu Leu Thr
440 445 450 455
TTA AGC TGT AGG ATT TCA GAT AGC TAT TCA CCA CAG GCA CAA TCA CGA 1745
Leu Ser Cys Arg Ile Ser Asp Ser Tyr Ser Pro Gin Ala Gin Ser Arg
460 465 470
TGT GTG TTT CTT CTG ACT CTG TTT CCA AGA AGA ATA TTC CTT GAG TGG 1793
Cys Val Phe Leu Leu Thr Leu Phe Pro Arg Arg Ile Phe Leu Glu Trp
475 480 485
AGA ACA GCA GTT TAC AAC TGG GCC CTG CAG AGC TCC CAT GAA GTA ATC 1841
Arg Thr Ala Val Tyr Asn Trp Ala Leu Gin Ser Ser His Glu Val Ile
490 495 500
CGG GCT AGT TGT GTT AGT GGA TTT TTT ATC TTA TTG CAG CAG CAG AAT 1889
Arg Ala Ser Cys Val Ser Gly Phe Phe Ile Leu Leu Gin Gin Gin Asn
505 510 515
TCT TGT AAC AGA GTT CCC AAG ATT CTT ATA GAT AAA GTC AAA GAT GAT 1937
Ser Cys Asn Arg Val Pro Lys Ile Leu Ile Asp Lys Val Lys Asp Asp
520 525 530 535
TCT GAC ATT GTC AAG AAA GAA TTT GCT TCT ATA CTT GGT CAA CTT GTC 1985
Ser Asp Ile Val Lys Lys Glu Phe Ala Ser Ile Leu Gly Gin Leu Val
540 545 550
TGT ACT CTT CAC GGC ATG TTT TAT CTG ACA AGT TCT TTA ACA GAA CCT 2033
Cys Thr Leu His Gly Met Phe Tyr Leu Thr Ser Ser Leu Thr Glu Pro
555 560 565
TTC TCT GAA CAC GGA CAT GTG GAC CTC TTC TGT AGG AAC TTG AAA GCC 2081
Phe Ser Glu His Gly His Val Asp Leu Phe Cys Arg Asn Leu Ly6 Ala
570 575 560
168 »· · · · ·
ACT TCT CAA CAT GAA TGT TCA TCT TCT CAA CTA AAA GCT TCT GTC TGC 2129
Thr Ser Gin His Glu Cys Ser Ser Ser Gin Leu Lys Ala Ser Val Cys
585 590 595
AAG CCA TTC CTT TTC CTA CTG AAA AAA AAA ATA CCT AGT CCA GTA AAA 2177
Lys Pro Phe Leu Phe Leu Leu Lys Lys Lys Ile Pro Ser Pro Val Lys
600 605 610 615
CTT GCT TTC ATA GAT AAT CTA CAT CAT CTT TGT AAG CAT CTT GAT TTT 2225
Leu Ala Phe Ile Asp Asn Leu His His Leu Cys Lys His Leu Asp Phe
620 625 630
AGA GAA GAT GAA ACA GAT GTA AAA GCA GTT CTT GGA ACT TTA TTA AAT 2273
Arg Glu Asp Glu Thr Asp Val Lys Ala Val Leu Gly Thr Leu Leu Asn
635 640 645
TTA ATG GAA GAT CCA GAC AAA GAT GTT AGA GTG GCT TTT AGT GGA AAT 2321
Leu Met Glu Asp Pro Asp Lys Asp Val Arg Val Ala Phe Ser Gly Asn
650 655 660
ATC AAG CAC ATA TTG GAA TCC TTG GAC TCT GAA GAT GGA TTT ATA AAG 2369
Ile Lvs His Ile Leu Glu Ser Leu Asp Ser Glu Asp Gly Phe Ile Lys
665 670 675
GAG CTT TTT GTC TTA AGA ATG AAG GAA GCA TAT ACA CAT GCC CAA ATA 2417
Glu Leu Phe Val Leu Arg Met Lys Glu Ala Tyr Thr His Ala Gin Ile
680 685 690 695
TCA AGA AAT AAT GAG CTG AAG GAT ACC TTG ATT CTT ACA ACA GGG GAT 2465
Ser Arg Asn Asn Glu Leu Lys Asp Thr Leu Ile Leu Thr Thr Gly Asp
700 705 710
ATT GGA AGG GCC GCA AAA GGA GAT TTG GTA CCA TTT GCA CTC TTA CAC 2513
Ile Gly Arg Ala Ala Lys Gly Asp Leu Val Pro Phe Ala Leu Leu His
715 720 725
TTA TTG CAT TGT TTG TTA TCC AAG TCA GCA TCT GTC TCT GGA GCA GCA 2561
Leu Leu His Cys Leu Leu Ser Lys Ser Ala Sex' Val Ser Gly Ala Ala
730 735 740
TAC ACA GAA ATT AGA GCT CTG GTT GCA GCT AAA AGT GTT AAA CTG CAA 2609
Tyr Thr Glu Ile Arg Ala Leu Val Ala Ala Lys Ser Val Lys Leu Gin
745 750 755
AGT TTT TTC AGC CAG TAT AAG AAA CCC ATC TGT CAG TTT TTG GTA GAA 2657
Ser Phe Phe Ser Gin Tyr Lys Lys Pro Ile Cys Gin Phe Leu Val Glu
760 765 770 775
TCC CTT CAC TCT AGT CAG ATG ACA GCA CTT CCG AAT ACT CCA TGC CAG 2705
Ser Leu His Ser Ser Gin Met Thr Ala Leu Pro Asn Thr Pro Cys Gin
780 785 790
AAT GCT GAC GTG CGA AAA CAA GAT GTG GCT CAC CAG AGA GAA ATG GCT 2753
Asn Ala Asp Val Arg Lys Gin Asp Val Ala His Gin Arg Glu Met Ala
795 800 805
TTA AAT ACG TTG TCT GAA ATT GCC AAC GTT TTC GAC TTT CCT GAT CTT 2801
Leu Asn Thr Leu Ser Glu Ile Ala Asn Val Phe Asp Phe Pro Asp Leu
810 815 820
AAT CGT TTT CTT ACT AGG ACA TTA CAA GTT CTA CTA CCT GAT CTT GCT 2849
Asn Arg Phe Leu Thr Arg Thr Leu Gin Val Leu Leu Pro Asp LeU Ala
825 830 835
GCC AAA GCA AGC CCT GCA GCT TCT GCT CTC ATT CGA ACT TTA GGA AAA 2897
Ala Lys Ala Ser Pro Ala Ala Ser Ala Leu Ile Arg Thr Leu Gly Lys
840 845 850 855
• · 9···
CAA TTA AAT GTC Val AAT Asn 860 CGT Arg AGA GAG ATT TTA Leu 865 ATA AAC AAC TTC AAA Lys 870 TAT Tyr 2945
Gin Leu Asn Arg Glu Ile Ile Asn Asn Phe
ATT TTT TCT CAT TTG GTC TGT TCT TGT TCC AAA GAT GAA TTA GAA CGT 2993
Ile Phe Ser His Leu Val Cys Ser Cys Ser Lys Asp Glu Leu Glu Arg
875 880 885
GCC CTT CAT TAT CTG AAG AAT GAA ACA GAA ATT GAA CTG GGG AGC CTG 3041
Ala Leu His Tyr Leu Lys Asn Glu Thr Glu Ile Glu Leu Gly Ser Leu
890 895 900
TTG AGA CAA GAT TTC CAA GGA TTG CAT AAT GAA TTA TTG CTG CGT ATT 3089
Leu Arg Gin Asp Phe Gin Gly Leu His Asn Glu Leu Leu Leu Arg Ile
905 910 915
GGA GAA CAC TAT CAA CAG GTT TTT AAT GGT TTG TCA ATA CTT GCC TCA 3137
Gly Glu His Tyr Gin Gin Val Phe Asn Gly Leu Ser Ile Leu Ala Ser
920 925 930 935
TTT GCA TCC AGT GAT GAT CCA TAT CAG GGC CCG AGA GAT ATC ATA TCA 3185
Phe Ala Ser Ser Asp Asp Pro Tyr Gin Gly Pro Arg Asp Ile Ile Ser
940 945 950
CCT GAA CTG ATG GCT GAT TAT TTA CAA CCC AAA TTG TTG GGC ATT TTG 3233
Pro Glu Leu Met Ala Asp Tyr Leu Gin Pro Lys Leu Leu Gly Ile Leu
955 960 965
GCT TTT TTT AAC ATG CAG TTA CTG AGC TCT AGT GTT GGC ATT GAA GAT 3281
Ala Phe Phe Asn Met Gin Leu Leu Ser Ser Ser Val Gly Ile Glu Asp
970 975 980
AAG AAA ATG GCC TTG AAC AGT TTG ATG TCT TTG ATG AAG TTA ATG GGA 3329
Lys Lys Met Ala Leu Asn Ser Leu Met Ser Leu Met Lys Leu Met Gly
985 990 995
CCC AAA CAT GTC AGT TCT GTG AGG GTG AAG ATG ATG ACC ACA CTG AGA 3377
Pro Lys His Val Ser Ser Val Arg Val Lys Met Met Thr Thr Leu Arg
1000 1005 1010 1015
ACT GGC CTT CGA TTC AAG GAT GAT TTT CCT GAA TTG TGT TGC AGA GCT 3425
Thr Gly Leu Arg Phe Lys Asp Asp Phe Pro Glu Leu Cys Cys Arg Ala
1020 102! 1030
TGG GAC TGC TTT GTT CGC TGC CTG GAT CAT GCT TGT CTG GGC TCC CTT 3473
Trp Asp Cys Phe Val Arg Cys Leu Asp His Ala Cys Leu Gly Ser Leu
1035 1040 1045
CTC AGT CAT GTA ATA GTA GCT TTG TTA CCT CTT ATA CAC ATC CAG CCT 3521
Leu Ser His Val Ile Val Ala Leu Leu Pro Leu Ile His Ile Gin Pro
1050 1055 1060
AAA GAA ACT GCA GCT ATC TTC CAC TAC CTC ATA ATT GAA AAC AGG GAT 3569
Lys Glu Thr Ala Ala Ile Phe His Tyr Leu ile Ile Glu Asn Arg Asp
106! 1070 1075
GCT GTG CAA GAT TTT CTT CAT GAA ATA TAT TTT TTA CCT GAT CAT CCA 3617
Ala Val Gin Asp Phe Leu His Glu Ile Tyr Phe Leu Pro Asp His Pro
1080 1085 1090 1095
GAA TTA AAA AAG ATA AAA GCC GTT CTC CAG GAA TAC AGA AAG GAG ACC 3665
Glu Leu Lys Lys Ile Lys Ala Val Leu Gin Glu Tyr Arg Lys Glu Thr
1100 1105 1Ϊ10
TCT GAG AGC ACT GAT CTT CAG ACA ACT CTT CAG CTC TCT ATG AAG GCC 3713
Ser Glu Ser Thr Asp Leu Gin Thr Thr Leu Gin Leu Ser Met Lys Ala
1115 1120 1125
·· ··»· • ·· ·· » · • · · • · · · • · · ··· ··
- 170
ATT Ile CAA Gin CAT His 113C GAA Glu ) AAT Asn GTC Val GAT Asp GTT CGT Val Arg 1135 ATT Ile CAT His GCT Ala CTT ACA Leu Thr 1140 AGC Ser TTG Leu 3761
AAG GAA ACC TTG TAT AAA AAT CAG GAA AAA CTG ATA AAG TAT GCA ACA 3809
Lys Glu 1145 Thr Leu Tyr Lys Asn Gin Glu 1150 Lys Leu Ile Lys Tyr 1155 Ala Thr
GAC AGT GAA ACA GTA GAA CCT ATT ATC TCA CAG TTG GTG ACA GTG CTT 3857
Asp Ser 1160 Glu Thr Val Glu Pro 1165 Ile Ile Ser Gin Leu 1170 Val Thr Val Leu 1175
TTG AAA GGT TGC CAA GAT GCA AAC TCT CAA GCT CGG TTG CTC TGT GGG 3905
Leu Lys Gly Cys Gin Asp 11B0 Ala Asn Ser Gin Ala 1185 Arg Leu Leu Cys Gly 1190
GAA TGT TTA GGG GAA TTG GGG GCG ATA GAT CCA GGT CGA TTA GAT TTC 3953
Glu Cys Leu Gly Glu 1195 Leu Gly Ala Ile Asp 1200 Pro Gly Arg Leu Asp 1205 Phe
TCA ACA ACT GAA ACT CAA GGA AAA GAT TTT ACA TTT GTG ACT GGA GTA 4001
Ser Thr Thr Glu 1210 Thr Gin Gly Lvs Asp 1215 Phe Thr Phe Val Thr 1220 Gly Val
GAA GAT TCA AGC TTT GCC TAT GGA TTA TTG ATG GAG CTA ACA AGA GCT 4049
Glu Asp 1225 Ser Ser Phe Ala Tyr Gly Leu 1230 Leu Met Glu Leu Thr 1235 Arg Ala
TAC CTT GCG TAT GCT GAT AAT AGC CGA GCT CAA GAT TCA GCT GCC TAT 4097
Tyr Leu 1240 Ala Tyr Ala Asp Asn 1245 Ser Arg Ala Gin Asp 1250 Ser Ala Ala Tyr 1255
GCC ATT CAG GAG TTG CTT TCT ATT TAT GAC TGT AGA GAG ATG GAG ACC 4145
Ala Ile Gin Glu Leu Leu 1260 Ser Ile Tyr Asp Cys 1265 Arg Glu Met Glu Thr 1270
AAC GGC CCA GGT CAC CAA TTG TGG AGG AGA TTT CCT GAG CAT GTT CGG 4193
Asn Gly Pro Gly His 1275 Gin Leu Trp Arg Arg 1280 Phe Pro Glu His Val 1285 Arg
GAA ATA CTA GAA CCT CAT CTA AAT ACC AGA TAC AAG AGT TCT CAG AAG 4241
Glu Ile Leu Glu 1290 Pro His Leu Asn Thr 1295 Arg Tyr Lys Ser Ser 1300 Gin Lys
TCA ACC GAT TGG TCT GGA GTA AAG AAG CCA ATT TAC TTA AGT AAA TTG 4289
Ser Thr Asp 1305 Trp Ser Gly Val Lys Lys 1310 Pro Ile Tyr Leu Ser 1315 Lys Leu
GGT AGT AAC TTT GCA GAA TGG TCA GCA TCT TGG GCA GGT TAT CTT ATT 4337
Gly Ser 1320 Asn Phe Ala Glu Trp 1325 Ser Ala Ser Trp Ala 1330 Gly Tyr Leu Ile 1335
ACA AAG GTT CGA CAT GAT CTT GCC AGT AAA ATT TTC ACC TGC TGT AGC 4385
Thr Lys Val Arg His Asp 1340 Leu Ala Ser Lys Ile 1345 Phe Thr Cys Cys Ser 1350
ATT ATG ATG AAG CAT GAT TTC AAA GTG ACC ATC TAT CTT CTT CCA CAT 4433
Ile Met Met Lys His 1355 Asp Phe Lys Val Thr 1360 Ile Tyr Leu Leu Pro 1365 His
ATT CTG GTG TAT GTC TTA CTG GGT TGT AAT CAA GAA GAT CAG CAG GAG 4481
Ile Leu Val Tyr 1370 Val Leu Leu Gly Cys 1375 Asn Gin Glu Asp Gin 1380 Gin Glu
GTT TAT GCA GAA ATT ATG GCA GTT CTA AAG CAT GAC GAT CAG CAT ACC 4529
Val Tyr Ala Glu Ile Met Ala Val Leu Lys His Asp Asp Gin His Thr
1385 1390 1395
171
ATA AAT Ile Asn 1400 ACC Thr CAA Gin GAC Asp ATT GCA Ile Ala 1405 TCT Ser GAT Asp CTG Leu TGT CAA Cys Gin 1410 CTC Leu AGT Ser ACA Thr CAG Gin 1415 4577
ACT GTG TTC TCC ATG CTT GAC CAT CTC ACA CAG TGG GCA AGG CAC AAA 4625
Thr Val Phe Ser Met 142C Leu Asp 1 His Leu Thr 1425 Gin Trp Ala Arg His Lys 1430
TTT CAG GCA CTG AAA GCT GAG AAA TGT CCA CAC AGC AAA TCA AAC AGA 4673
Phe Gin Ala Leu Lys 1435 Ala Glu Lys Cys 144C Pro 1 His Ser Lys Ser Asn 1445 Arg
AAT AAG GTA GAC TCA ATG GTA TCT ACT GTG GAT TAT GAA GAC TAT CAG 4721
Asn Lys Val Asp 1450 Ser Met Val Ser Thr 1455 Val Asp Tyr Glu Asp 1460 Tyr Gin
AGT GTA ACC CGT TTT CTA GAC CTC ATA CCC CAG GAT ACT CTG GCA GTA 4769
Ser Val Thr 1465 Arg Phe Leu Asp Leu 1470 Ile Pro Gin Asp Thr 1475 Leu Ala Val
GCT TCC TTT CGC TCC AAA GCA TAC ACA CGA GCT GTA ATG CAC TTT GAA 4817
Ala Ser 1480 Phe Arg Ser Lys Ala 1485 Tyr Thr Ala Val 1490 Met His Phe Glu 1495
TCA TTT ATT ACA GAA AAG AAG CAA AAT ATT CAG GAA CAT CTT GGA TTT 4865
Ser Phe Ile Thr Glu Lys Lys 1500 Gin Asn Ile Gin Glu 1505 His Leu Gly Phe 1510
TTA CAG AAA TTG TAT GCT GCT ATG CAT GAA CCT GAT GGA GTG GCC GGA 4913
Leu Gin Lys Leu Tyr 1515 Ala Ala Met His Glu 1520 Pro Asp Gly Val Ala 1525 Gly
GTC AGT GCA ATT AGA AAG GCA GAA CCA TCT CTA AAA GAA CAG ATC CTT 4961
Val Ser Ala Ile 1530 Arg Lys Ala Glu Pro 1535 Ser Leu Lys Glu Gin 1540 Ile Leu
GAA CAT GAA AGC CTT GGC TTG CTG AGG GAT GCC ACT GCT TGT TAT GAC 5009
Glu His Glu 1545 Ser Leu Gly Leu Leu 1550 Arg Asp Ala Thr Ala 1555 Cys Tyr Asp
AC-G GCT ATT CAG CTA GAA CCA GAC CAG ATC ATT CAT TAC CAT GGT GTA 5057
Arg Ala 1560 Ile Gin Leu Glu Pro 1565 Asp Gin Ile Ile His 1570 Tyr His Gly Val 1575
GTA AAG TCC ATG TTA GGT CTT GGT CAG CTG TCT ACT GTT ATC ACT CAG 5105
Val Lys Ser Met Leu Gly Leu 1580 Gly Gin Leu Ser Thr 1585 Val Ile Thr Gin 1590
GTG AAT GGA GTG CAT GCT AAC AGG TCC GAG TGG ACA GAT GAA TTA AAC 5153
Val Asn Gly Val His 1595 Ala Asn Arg Ser Glu 1600 Trp Thr Asp Glu Leu 1605 Asn
ACG TAC AGA GTG GAA GCA GCT TGG AAA TTG TCA CAG TGG GAT TTG GTG 5201
Thr Tyr Arg Val 1610 Glu Ala Ala Trp Lys 1615 Leu Ser Gin Trp Asp 1620 Leu Val
GAA AAC TAT TTG GCA GCA GAT GGA AAA TCT ACA ACA TGG AGT GTC AGA 5249
Glu Asn Tyr 1625 Leu Ala Ala Asp Gly 1630 Lys Ser Thr Thr Trp 1635 Ser Val Arg .
CTG GGA CAG CTA TTA TTA TCA GCC AAA AAA AGA GAT ATC ACA GCT TTT 5297
Leu Gly 1640 Gin Leu Leu Leu Ser 1645 Ala Lys Lys Arg Asp 1650 Ile Thr Ala Phe 1655
TAT GAC TCA CTG AAA CTA GTG AGA GCA GAA CAA ATT GTA CCT CTT TCA 5345
Tyr Asp Ser Leu Lys Leu Val Arg Ala Glu Gin Ile Val Pro Leu Ser
1660 1665 1670 • · · ·
GCT Ala GCA AGC TTT GAA AGA GGC TCC TAC CAA CGA GGA TAT GAA TAT Phe Glu Arg Gly Ser Tyr Gin Arg Gly Tyr Glu Tyr ATT Ile 5393
Ala Ser
1675 1680 1685
GTG AGA TTG CAC ATG TTA TGT GAG TTG GAG CAT AGC ATC AAA CCA CTT 5441
Val Arg Leu His Met Leu Cys 1690 Glu Leu Glu His Ser 1695 Ile Lys Pro 1700 Leu
TTC CAG CAT TCT CCA GGT GAC AGT TCT CAA GAA GAT TCT CTA AAC TGG 5489
Phe Gin 1709 His Ser Pro Gly Asp Ser Ser Gin Glu Asp Ser Leu Asn 1710 1715 Trp
GTA GCT CGA CTA GAA ATG ACC CAG AAT TCC TAC AGA GCC AAG GAG CCT 5537
Val Ala 1720 Arg Leu Glu Met Thr 1725 Gin Asn Ser Tyr Arg 1730 Ala Lys Glu Pro 1735
ATC CTG GCT CTC CGG AGG GCT TTA CTA AGC CTC AAC AAA AGA CCA GAT 5585
Ile Leu Ala Leu Arg Arg Ala 1740 Leu Leu Ser Leu Asn 1745 Lys Arg Pro Asp 1750
TAC AAT GAA ATG GTT GGA GAA TGC TGG CTG CAG AGT GCC AGG GTA GCT 5633
Tyr Asn Glu Met Val Gly Glu 1755 Cys Trp Leu Gin Ser 1760 Ala Arg Val 1765 Ala
AGA AAG GCT GGT CAC CAC CAG ACA GCC TAC AAT GCT CTC CTT AAT GCA 5681
Arg Lys Ala Gly His His Gin 1770 Thr Ala Tyr Asn Ala 1775 Leu Leu Asn 1780 Ala
GGG GAA TCA CGA CTC GCT GAA CTG TAC GTG GAA AGG GCA AAG TGG CTC 5729
Gly Glu Ser 1785 Arg Leu Ala Glu Leu Tyr Val Glu Arg Ala Lys Trp 1790 1795 Leu
TGG TCC AAG GGT GAT GTT CAC CAG GCA CTA ATT GTT CTT CAA AAA GGT 57-77
Trp Ser 1800 Lys Gly Asp Val His 1805 Gin Ala Leu Ile Val 1810 Leu Gin Lys Gly 1815
GTT GAA TTA TGT TTT CCT GAA AAT GAA ACC CCA CCT GAG GGT AAG AAC 5825
Val Glu Leu Cys Phe Pro Glu 1820 Asn Glu Thr Pro Pro 1825 Glu Gly Lys Asn 1830
ATG TTA ATC CAT GGT CGA GCT ATG CTA CTA GTG GGC CGA TTT ATG GAA 5873
Met Leu Ile His Gly Arg Ala 1835 Met Leu Leu Val Gly 1840 Arg Phe Met 1845 Glu
GAA ACA GCT AAC TTT GAA AGC AAT GCA. ATT ATG AAA AAA TAT AAG GAT 5921
Glu Thr Ala Asn Phe Glu Ser 1850 Asn Ala Ile Met Lys 1855 Lys Tyr Lys 1860 Asp
GTG ACC GCG TGC CTG CCA GAA TGG GAG GAT GGG CAT TTT TAC CTT GCC 5969
Val Thr Ala 1865 Cys Leu Pro Glu Trp Glu Asp Gly His Phe Tyr Leu 1870 1875 Ala
AAG TAC TAT GAC AAA TTG ATG CCC ATG GTC ACA GAC AAC AAA ATG GAA 6017
Lys Tyr 1880 Tyr Asp Lys Leu Met 1885 Pro Met Val Thr Asp 1890 Asn Lys Met Glu 1895
AAG CAA GGT GAT CTC ATC CGG TAT ATA GTT CTT CAT TTT GGC AGA TCT 6065
Lys Gin Gly Asp Leu Ile Arg 1900 Tyr Ile Val Leu His 1905 Phe Gly Arg Ser 1910
CTA CAA TAT GGA AAT CAG TTC ATA TAT CAG TCA ATG CCA CGA ATG TTA 6113
Leu Gin Tyr Gly Asn Gin Phe 1915 Ile Tyr Gin Ser Met 1920 Pro Arg Mat 1925 Leu
ACT CTA TGG CTT GAT TAT GGT ACA AAG GCA TAT GAA TGG GAA AAA GCT 6161
Thr Leu Trp Leu Asp Tyr Gly Thr Lys Ala Tyr Glu Trp Glu Lys Ala
1930 1935 1940 «· ·
173
GGC Gly CGC TCC GAT CGT GTA CAA ATG AGG AAT GAT TTG GGT AAA Lys ATA Ile AAC Asn
Arg 1945 Ser Asp Arg Val Gin Met 1950 Arg Asn Asp Leu Gly 1955
AAG GTT ATC ACA GAG CAT ACA AAC TAT TTA GCT CCA TAT CAA TTT TTG
Lys 196C Val 1 Ile Thr Glu His Thr Asn 1965 Tyr Leu Ala Pro Tyr 1970 Gin Phe Leu 1975
ACT GCT TTT TCA CAA TTG ATC TCT CGA ATT TGT CAT TCT CAC GAT GAA
Thr Ala Phe Ser Gin Leu 1980 Ile Ser Arg Ile Cys 1985 His Ser His Asp Glu 1990
GTT TTT GTT GTC TTG ATG GAA ATA ATA GCC AAA GTA TTT CTA GCC TAT
Val Phe Val Val Leu 1995 Met Glu Ile Ile Ala Lys 2000 Val Phe Leu Ala 2005 Tyr
CCT CAA CAA GCA ATG TGG ATG ATG ACA GCT GTG TCA AAG TCA TCT TAT
Pro Gin Gin Ala Met 2010 Trp Met Met Thr 2015 Ala Val Ser Lys Ser 2020 Ser Tyr
CCC ATG CGT GTG AAC AGA TGC AAG GAA ATC CTC AAT AAA GCT ATT CAT
Pro Met 2025 Arg Val Asn Arg Cys Lys 2030 Glu Ile Leu Asn Lys 2035 Ala Ile His
ATG AAA AAA TCC TTA GAG AAG TTT GTT GGA GAT GCA ACT CGC CTA ACA
Met Lys 2040 Lys Ser Leu Glu 2045 Lys Phe Val Gly Asp Ala Thr 2050 Arg Leu Thr 2055
GAT AAG CTT CTA GAA TTG TGC AAT AAA CCG GTG GAA ATT CTT GCT TCT
Asp Lys Leu Leu Glu Leu 2060 Cys Asn Lys Pro Val 2065 Glu Ile Leu Ala Ser 2070
CTT CAG AAA CCA AAG AAG ATT TCT TTA AAA GGC TCA GAT GGA AAG TTC
Leu Gin Lys Pro Lys 2075 Lys Ile Ser Leu Lys Gly 2080 Ser Asp Gly Lys 2085 Phe
TAC ATC ATG ATG TGT AAG CCA AAA GAT GAC CTG AGA AAG GAT TGT AGA
Tyr Ile Met Met Cys 2090 Lys Pro Lys Asp 2095 Asp Leu Arg Lys Asp 2100 Cys Arg
CTA ATG GAA TTC AAT TCC TTG ATT AAT AAG TGC TTA AGA AAA GAT GCA
Leu Met Glu Phe Asn 2105 Ser Leu Ile 2110 Asn Lys Cys Leu Arg 2115 Lys Asp Ala
GAG TCT CGT AGA AGA GAA CTT CAT ATT CGA ACA TAT GCA GTT ATT CCA
Glu Ser 2120 Arg Arg Arg Glu Leu His 2125 Ile Arg Thr Tyr Ala 2130 Val Ile Pro 2135
CTA AAT GAT GAA TGT GGG ATT ATT GAA TGG GTG AAC AAC ACT GCT GGT
Leu Asn Asp Glu Cys Gly 2140 Ile Ile Glu Trp Val 2145 Asn Asn Thr Ala Gly 2150
TTG AGA CCT ATT CTG ACC AAA CTA TAT AAA GAA AAG GGA GTG TAT ATG
Leu Arg Pro Ile Leu 2155 Thr Lys Leu Tyr Lys Glu 2160 Lys Gly Val Tyr 2165 Met
ACA GGA AAA GAA CTT CGC CAG TGT ATG CTA CCA AAG TCA GCA GCT TTA
Thr Gly Lys Glu Leu 2170 Arg Gin Cys Met 2175 Leu Pro Lys Ser Ala 2180 Ala Leu
TCT GAA AAA CTC AAA GTA TTC CGA GAA TTT CTC CTG CCC AGG CAT CCT
Ser Glu Lys Leu Lys 2185 Val Phe Arg 2190 Glu Phe Leu Leu Pro 2195 Arg His. Pro
CCT ATT TTT CAT GAG TGG TTT CTG AGA ACA TTC CCT GAT CCT ACA TCA
Pro Ile 2200 Phe His Glu Trp Phe Leu 2205 Arg Thr Phe Pro Asp 2210 Pro Thr Ser 2215
< · · ····· »* ·
6209
6257
6305
6353
6401
6449
6497
6545
6593
6641
6689
6737
6785
6833
6881
6929
6977
TGG Trp TAC Tyr AGT Ser AGT Ser AGA TCA Arg Ser 2220 GCT Ala TAC Tyr TGC Cys CGT TCC Arg Ser 2225 ACT Thr GCA Ala GTA Val ATG TCA Met Ser 2230 7025
ATG GTT GGT TAT ATT CTG GGG CTT GGA GAC CGT CAT GGT GAA AAT ATT 7073
Met Val Gly Tyr Ile Leu 2235 Gly Leu Gly Asp Arg 2240 His Gly Glu Asn Ile 2245
CTC TTT GAT TCT TTG ACT GGT GAA TGC GTA CAT GTA GAT TTC AAT TGT 7121
Leu Phe Asp Ser 2250 Leu Thr Gly Glu 225S Cys Val His Val Asp Phe 2260 Asn Cys
CTT TTC AAT AAG GGA GAA ACC TTT GAA GTT CCA GAA ATT GTG CCA TTT 7169
Leu Phe Asn 2265 Lys Gly Glu Thr Phe 2270 Glu Val Pro Glu Ile 2275 Val Pro Phe
CGC CTG ACT CAT AAT ATG GTT AAT GGA ATG GGT CCT ATG GGA ACA GAG 7217
Arg Leu 2280 Thr His Asn Met Val 2285 Asn Gly Met Gly Pro 2290 Met Gly Thr Glu 2295
GGT CTT TTT CGA AGA GCA TGT GAA GTT ACA ATG AGG CTG ATG CGT GAT 7265
Gly Leu Phe Arg Arg Ala 2300 Cys Glu Val Thr Met 2305 Arg Leu Met Arg Asp 2310
CAG CGA GAG CCT TTA ATG AGT GTC TTA AAG ACT TTT CTA CAT GAT CCT 7313
Gin Arg Glu Pro Leu Met 2315 Ser Val Leu Lys Thr 2320 Phe Leu His Asp Pro 2325
CTT GTG GAA TGG AGT AAA CCA GTG AAA GGG CAT TCC AAA GCG CCA CTG 7361
Leu Val Glu Trp 2330 Ser Lys Pro Val Lys 2335 Gly His Ser Lys Ala 2340 Pro Leu
AAT GAA ACT GGA GAA GTT GTC AAT GAA AAG GCC AAG ACC CAT GTT CTT 7409
Asn Glu Thr 2345 Gly Glu Val Val Asn 2350 Glu Lys Ala Lys Thr 2355 His Val Leu
GAC ATT GAG CAG CGA CTA CAA GGT GTA ATC AAG ACT CGA AAT AGA GTG 7457
Asp Ile 2360 Glu Gin Arg Leu Gin 2365 Gly Val Ile Lys Thr 2370 Arg Asn Arg Val 2375
ACA GGA CTG CCG TTA TCT ATT GAA GGA CAT GTG CAT TAC CTT ATA CAA 7505
Tnr Gly Leu Pro Leu Ser 2380 Ile Glu Gly His Val 2385 His Tyr Leu Ile Gin 2390
GAA GCT ACT GAT GAA AAC TTA CTA TGC CAG ATG TAT CTT GGT TGG ACT 7553
Glu CCA Pro Ala TAT Tyr Thr Asp Glu Asn Leu Leu Cys Gin Met Tyr Leu Gly Trp Thr 2395 2400 2405 ATG TGAAATGAAA TTATGTAAAA GAATATGTTA ATAATCTAAA Met 2410 7602
AGTAAAAAAA AAAAAAAAAA AA 7 624 (2) INFORMACE O SEQ ID NO:31:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 2410 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 31:
• · · · · • · · · « · · · · · • · · ····· ·· ·
175
Met Gly His Ala Val Glu Trp Pro Val Val Met Ser Arg Phe Leu Ser
1 5 10 15
Gin Leu Asp Glu His Met Gly Tyr Leu Gin Ser Ala Pro Leu Gin Leu
20 25 30
Met Ser Met Gin Asn Leu Glu Phe Ile Glu Val Thr Leu Leu Met Val
35 40 45
Leu Thr Arg Ile Ile Ala Ile Val Phe Phe Arg Arg Gin Glu Leu Leu
50 55 60
Leu Trp Gin Ile Gly Cys Val Leu Leu Glu Tyr Gly Ser Pro Lys Ile
65 70 75 80
Lys Ser Leu Ala Ile Ser Phe Leu Thr Glu Leu Phe Gin Leu Gly Gly
85 90 95
Leu Pro Ala Gin Pro Ala Ser Thr Phe Phe Ser Ser Phe Leu Glu Leu
100 105 110
Leu Lys His Leu Val Glu Met Asp Thr Asp Gin Leu Lys Leu Tyr Glu
115 120 125
Glu Pro Leu Ser Lys Leu Ile Lys Thr Leu Phe Pro Phe Glu Ala Glu
130 135 140
Ala Tyr Arg Asn Ile Glu Pro Val Tyr Leu Asn Met Leu Leu Glu Lys
145 150 155 160
Leu cys Val Met Phe Glu Asp Gly Val Leu Met Arg Leu Lys Ser Asp
165 170 175
Leu Leu Lys Ala Ala Leu Cys His Leu Leu Gin Tyr Phe Leu Lys Phe
180 185 190
Val Pro Ala Gly Tyr Glu Ser Ala Leu Gin Val Arg Lys Val Tyr Val
195 200 205
Arg Asn Ile Cys Lys Ala Leu Leu Asp Val Leu Gly Ile Glu Val Asp
210 215 220
Ala Glu Tyr Leu Leu Gly Pro Leu Tyr Ala Ala Leu Lys Met Glu Ser
225 230 235 240
Met Glu Ile Ile Glu Glu Ile Gin Cys Gin Thr Gin Gin Glu Asn Leu
245 250 255
Ser Ser Asn Ser Asp Gly Ile Ser Pro Lys Arg Arg Arg Leu Ser Ser
260 265 270
Ser Leu Asn Pro Ser Lys Arg Ala Pro Lys Gin Thr Glu Glu Ile Lys
275 280 285
His Val Asp Met Asn Gin Lys Ser Ile Leu Trp Ser Ala Leu Lys Gin
290 295 300
Lys Ala Glu Ser Leu Gin Ile Ser Leu Glu Tyr Ser Gly Leu Lys Asn
305 310 315 320
Pro Val Ile Glu Met Leu Glu Gly Ile Ala Val Val Leu Gin Leu Thr
325 330 335'
Ala Leu Cys Thr Val His Cys Ser His Gin Asn Met Asn Cys Arg Thr
340 345 350
« ·
- 176 • · · · · · ·
Phe Lys Asp 355 Cys Gin His Lys Ser 360 Lys Lys Lys Pro Ser 365 Val Val Ile
Thr Trp 370 Met Ser Leu Asp Phe 375 Tyr Thr Lys Val Leu 380 Lys Ser Cys Arg
Ser 385 Leu Leu Glu Ser Val 390 Gin Lys Leu Asp Leu 395 Glu Ala Thr Ile Asp 400
Lys Val Val Lys Ile 405 Tyr Asp Ala Leu Ile 410 Tyr Met Gin Val Asn 415 Ser
Ser Phe Glu Asp 420 His Ile Leu Glu Asp 425 Leu Cys Gly Met Leu 430 Ser Leu
Pro Trp Ile 435 Tyr Ser His Ser Asp 440 Asp Gly Cys Leu Lys 445 Leu Thr Thr
Phe Ala 450 Ala Asn Leu Leu Thr 455 Leu Ser Cys Arg Ile 460 Ser Asp Ser Tyr
Ser 465 Pro Gin Ala Gin Ser 470 Arg Cys Val Phe Leu 475 Leu Thr Leu Phe Pro 480
Arg Arg Ile Phe Leu 485 Glu Trp Arg Thr Ala 490 Val Tyr Asn Trp Ala 495 Leu
Gin Ser Ser His 500 Glu Val Ile Arg Ala 505 Ser Cys Val Ser Gly 510 Phe Phe
Ile Leu Leu 515 Gin Gin Gin Asn Ser 520 Cys Asn Arg Val Pro 525 Lys Ile Leu
Ile Asp 530 Lys Val Lys Asp Asp 535 Ser Asp Ile Val Lys 540 Lys Glu Phe Ala
Ser 545 Ile Leu Gly Gin Leu 550 Val Cys Thr Leu His 555 Gly Met Phe Tyr Leu 560
Thr Ser Ser Leu Thr 565 Glu Pro Phe Ser Glu 570 His Gly His Val Asp 575 Leu
Phe Cys Arg Asn 580 Leu Lys Ala Thr Ser 585 Gin His Glu Cys Ser 590 Ser Ser
Gin Leu Lys 595 Ala Ser Val Cys Lys 600 Pro Phe Leu Phe Leu 605 Leu Lys Lys
Lys Ile 610 Pro Ser Pro Val Lys 615 Leu Ala Phe Ile Asp 620 Asn Leu His His
Leu 625 Cys Lys His Leu Asp 630 Phe Arg Glu Asp Glu 635 Thr Asp Val Lys Ala 640
Val Leu Gly Thr Leu 645 Leu Asn Leu Met Glu 650 Asp Pro Asp Lys Asp 655 Val
Arg Val Ala Phe 660 Ser Gly Asn Ile Lys 665 His Ile Leu Glu Ser 670 Leu Asp
Ser Glu Asp 675 Gly Phe Ile Lys Glu 680 Leu Phe Val Leu Arg 685 Met Lys Glu
Ala Tyr 690 Thr His Ala Gin Ile 695 Ser Arg Asn Asn Glu 700 Leu Lys Asp Thr
• · · ·
- 177 -
Leu 705 Ile Leu Thr Thr Gly Asp 710 Ile Gly Arg Ala Ala 715 Lys Gly Asp Leu 720
Val Pro Phe Ala Leu Leu His 725 Leu Leu His Cys Leu 730 Leu Ser Lys 735 Ser
Ala Ser Val Ser Gly Ala Ala 740 Tyr Thr 745 Glu Ile Arg Ala Leu 750 Val Ala
Ala Lys Ser 755 Val Lys Leu Gin Ser 760 Phe Phe Ser Gin Tyr 765 Lys Lys Pro
Ile Cys 770 Gin Phe Leu Val Glu 775 Ser Leu His Ser Ser 780 Gin Met Thr Ala
Leu 785 Pro Asn Thr Pro Cys Gin 790 Asn Ala Asp Val Arg 795 Lys Gin Asp Val 800
Al a His Gin Arg Glu Met Ala 805 Leu Asn Thr Leu Ser 810 Glu Ile Ala 815 Asn
Val Phe Asp Phe Pro Asp Leu 820 Asn Arg 825 Phe Leu Thr Arg Thr 830 Leu Gin
Val Leu Leu 835 Pro Asp Leu Ala Ala 840 Lys Ala Ser Pro Ala 845 Ala Ser Ala
Leu Ile 850 Arg Thr Leu Gly Lys 855 Gin Leu Asn Val Asn 860 Arg Arg Glu Ile
Leu 865 Ile Asn Asn Phe Lys Tyr 870 Ile Phe Ser His Leu 875 Val Cys Ser Cys 880
Ser Lys Asp Glu Leu Glu Arg 885 Ala Leu His Tyr Leu 890 Lys Asn Glu 895 Thr
Glu Ile Glu Leu Gly Ser Leu 900 Leu Arg 905 Gin Asp Phe Gin Gly 910 Leu His
Asn Glu Leu 915 Leu Leu Arg Ile Gly 920 Glu His Tyr Gin Gin 925 Val Phe Asn
Gly Leu 930 Ser Ile Leu Ala Ser 935 Phe Ala Ser Ser Asp 940 Asp Pro Tyr Gin
Gly 945 Pro Arg Asp Ile Ile Ser 950 Pro Glu Leu Met Ala 955 Asp Tyr Leu Gin 960
Pro Lys Leu Leu Gly Ile Leu 965 Ala Phe Phe Asn Met 970 Gin Leu Leu 975 Ser
Ser Ser Val Gly Ile Glu Asp 980 Lys Lys 985 Met Ala Leu Asn Ser 990 Leu Met
Ser Leu Met 995 Lys Leu Met Gly Pro Lys 1000 His Val Ser Ser Val 1005 Arg Val
Lys Met Met 1010 Thr Thr Leu Arg Thr 1015 Gly Leu Arg Phe Lys 1020 Asp Asp Phe
Pro 1025 Glu Leu Cys Cys Arg Ala 1030 Trp Asp Cys Phe Val 1035 Arg Cys Léu Asp 1040
His Ala Cys Leu Gly Ser Leu 1045 Leu Ser His Val Ile 1050 Val Ala Leu Leu 1055
• · · ·
- 178 -
Ρΐ'ο Leu Ile His Ile 1060 Gin Pro Lys Glu Thr Ala Ala 1065 Ile Phe His 1070 Tyr
Leu Ile Ile Glu Asn Arg Asp Ala Val Gin Asp Phe Leu His Glu Ile
1075 1080 1085
Tyr Phe Leu Pro Asp His Pro Glu Leu Lys Lys Ile Lys Ala Val Leu
1090 1095 1100
Gin Glu Tyr Arg Lys Glu Thr Ser Glu Ser Thr Asp Leu Gin Thr Thr
1105 1110 1115 1120
Leu Gin Leu Ser Met Lys Ala Ile Gin His Glu Asn Val Asp Val Arg
1125 1130 1135
Ile His Ala Leu Thr Ser Leu Lys Glu Thr Leu Tyr Lys Asn Gin Glu
1140 1145 1150
Lys Leu Ile Lys Tyr Ala Thr Asp Ser Glu Thr Val Glu Pro Ile Ile
1155 1160 1165
Ser Gin Leu Val Thr Val Leu Leu Lys Gly Cys Gin Asp Ala Asn Ser
1170 1175 1180
Gin Ala Arg Leu Leu Cys Gly Glu Cys Leu Gly Glu Leu Gly Ala Ile
1185 1190 1195 1200
Asp Pro Gly Arg Leu Asp Phe Ser Thr Thr Glu Thr Gin Gly Lys Asp
120 = > 1210 1215
Phe Thr Phe Val Thr Gly Val Glu Asp Ser Ser Phe Ala Tyr Gly Leu
1220 1225 1230
Leu Met Glu Leu Thr Arg Ala Tyr Leu Ala Tyr Ala Asp Asn Ser Arg
1235 1240 1245
Ala Gin Asp Ser Ala Ala Tyr Ala Ile Gin Glu Leu Leu Ser Ile Tyr
1250 1255 1260
Asp Cys Arg Glu Met Glu Thr Asn Gly Pro Gly His Gin Leu Trp Arg
1265 1270 1275 1280
Arg Phe Pro Glu His Val Arg Glu Ile Leu Glu Pro His Leu Asn Thr
1285 1290 1295
Arg Tyr Lys Ser Ser Gin Lys Ser Thr Asp Trp Ser Gly Val Lys Lys
1300 1305 1310
Pro Ile Tyr Leu Ser Lys Leu Gly Ser Asn Phe Ala Glu Trp Ser Ala
1315 1320 1325
Ser Trp Ala Gly Tyr Leu Ile Thr Lys Val Arg His Asp Leu Ala Ser
1330 1335 1340
Lys Ile Phe Thr Cys Cys Ser Ile Met Met Lys His Asp Phe Lys Val
1345 1350 1355 13G0
Thr Ile Tyr Leu Leu Pro His Ile Leu Val Tyr Val Leu Leu Gly Cys
1365 1370 1375
Asn Gin Glu Asp Gin Gin Glu Val Tyr Ala Glu Ile Met Ala Val Leu
1380 1385 1390
Lys His Asp Asp Gin His Thr Ile Asn Thr Gin Asp Ile Ala Ser Asp
1395 1400 1405
179 • · · · ·
Lreu Cys Gin 1410 Leu Ser Thr Gin Thr Val 1415 Phe Ser Met Leu 1420 Asp His Leu
Thr Gin Trp Ala Arg His Lys Phe Gin Ala Leu Lys Ala Glu Lys Cys
1425 1430 1435 1440
Pro His Ser Lys Ser Asn Arg Asn Lys Val Asp Ser Met Val Ser Thr
1445 1450 1455
Val Asp Tyr Glu Asp Tyr Gin Ser Val Thr Arg Phe Leu Asp Leu Ile
1460 1465 1470
Pro Gin Asp Thr Leu Ala Val Ala Ser Phe Arg Ser Lys Ala Tyr Thr
1475 1480 1485
Arg Ala Val Met His Phe Glu Ser Phe Ile Thr Glu Lys Lys Gin Asn
1490 1495 1500
Ile Gin Glu His Leu Gly Phe Leu Gin Lys Leu Tyr Ala Ala Met His
1505 1510 1515 1520
C-lu Pro Asp Gly Val Ala Gly Val Ser Ala Ile Arg Lys Ala Glu Pro
1525 1530 1535
Ser Leu Lys Glu Gin Ile Leu Glu His Glu Ser Leu Gly Leu Leu Arg
1540 1545 1550
Asp Ala Thr Ala Cys Tyr Asp Arg Ala Ile Gin Leu Glu Pro Asp Gin
1555 1560 1565
Ile Ile His Tyr His Gly Val Val Lys Ser Met Leu Gly Leu Gly Gin
1570 1575 1580
Leu Ser Thr Val Ile Thr Gin Val Asn Gly Val His Ala Asn Arg Ser
1585 1590 1595 1600
Glu Trp Thr Asp Glu Leu Asn Thr Tyr Arg Val Glu Ala Ala Trp Lys
1605 1610 1615
Leu Ser Gin Trp Asp Leu Val Glu Asn Tyr Leu Ala Ala Asp Gly Lys
162C ) 1625 1630
Ser Thr Thr Trp Ser Val Arg Leu Gly Gin Leu Leu Leu Ser Ala Lys
1635 1640 1645
Lys Arg Asp Ile Thr Ala Phe Tyr Asp Ser Leu Lys Leu Val Arg Ala
1650 1655 1660
Glu Gin Ile Val Pro Leu Ser Ala Ala Ser Phe Glu Arg Gly Ser Tyr
1665 1670 1675 1680
Gin Arg Gly Tyr Glu Tyr Ile Val Arg Leu His Met Leu Cys Glu Leu
1685 1690 1695
Glu His Ser Ile Lys Pro Leu Phe Gin His Ser Pro Gly Asp Ser Ser
1700 1705 1710
Gin Glu Asp Ser Leu Asn Trp Val Ala Arg Leu Glu Met Thr Gin Asn
1715 1720 1725
Ser Tyr Arg Ala Lys Glu Pro Ile Leu Ala Leu Arg Arg Ala L.eu Leu
1730 1735 1740
Ser Leu Asn Lys Arg Pro Asp Tyr Asn Glu Met Val Gly Glu Cys Trp
1745 1750 1755 1760
180 • · · • · · · ·
Leu Gin Ser Ala Arg Val Ala Arg Lys Ala Gly His His Gin Thr Ala
1765 i 177C ) 1775
Tyr Asn Ala Leu Leu 1780 Asn Ala Gly Glu Ser 1785 Arg Leu Ala Glu Leu 1790 Tyr
Val Glu Arg Ala Lys 1795 Trp Leu Trp Ser Lys 1800 Gly Asp Val His Gin 1805 Ala
Leu Ile Val Leu Gin 1810 Lys Gly Val Glu Leu 1815 Cys Phe Pro Glu Asn 1820 Glu
Thr Pro Pro Glu Gly Lys Asn Met Leu Ile His Gly Arg Ala Met Leu
1825 1830 1835 1840
Leu Val Gly Arg Phe Met Glu Glu Thr Ala Asn Phe Glu Ser Asn Ala
1845 , 185C 1 1855
Ile Met Lys Lys Tyr 1860 Lys Asp Val Thr Ala 1865 Cys Leu Pro Glu Trp 1870 Glu
Asp Gly His Phe Tyr 1875 Leu Ala Lys Tyr Tyr 1880 Asp Lys Leu Met Pro 1885 Met
Val Thr Asp Asn Lys 1890 Met Glu Lys Gin Gly 1895 Asp Leu Ile Arg Tyr 1900 Ile
Val Leu His Phe Gly Arg Ser Leu Gin Tyr Gly Asn Gin Phe Ile Tyr
1905 1910 1915 1920
Gin Ser Met Pro Arg Met Leu Thr Leu Trp Leu Asp Tyr Gly Thr Lys
1925 193C ' 1935
Ala Tyr Glu Trp Glu 1940 Lys Ala Gly Arg Ser 1945 Asp Arg Val Gin Met 1950 Arg
Asn Asp Leu Gly Lys 1955 Ile Asn Lys Val Ile 1960 Thr Glu His Thr Asn 1965 Tyr
Leu Ala Pro Tyr Gin 1970 Phe Leu Thr Ala Phe 1975 Ser Gin Leu Ile Ser 1980 Arg
Ile Cys His Ser His Asp Glu Val Phe Val Val Leu Met Glu Ile Ile
1985 1990 1995 2000
Ala Lys Val Phe Leu Ala Tyr Pro Gin Gin Ala Met Trp Met Met Thr
2005 201C i 2015
Ala Val Ser Lys Ser 2020 Ser Tyr Pro Met Arg 2025 Val Asn Arg Cys Lys 2030 Glu
Ile Leu Asn Lys Ala 2035 Ile His Met Lys Lys 2040 Ser Leu Glu Lys Phe 2045 Val
Gly Asp Ala Thr Arg 2050 Leu Thr Asp Lys Leu 2055 Leu Glu Leu Cys Asn 2060 Lys
Pro Val Glu Ile Leu Ala Ser Leu Gin Lys Pro Lys Lys Ile Ser Leu
2065 2070 2075 2080
Lys Gly Ser Asp Gly Lys Phe Tyr Ile Met Met Cys Lys Pro Lys Asp
2085 209C ' 2095
Asp Leu Arg Lys Asp Cys Arg Leu Met Glu Phe Asn Ser Leu Ile Asn 2100 2105 2110
181 * · · • · · · ·
Lys Cys Leu Arg Lys Asp Ala Glu Ser Arg Arg Arg Glu Leu His Ile
2115 2120 2125
Arg Thr Tyr Ala Val Ile Pro Leu Asn Asp Glu Cys Gly Ile Ile Glu
213C I 2135 2140
Trp Val Asn Asn Thr Ala Gly Leu Arg Pro Ile Leu Thr Lys Leu Tyr
2145 2150 2155 2160
Lys Glu Lys Gly Val Tyr Met Thr Gly Lys Glu Leu Arg Gin Cys Met
2165 2170 2175
Leu Pro Lys Ser Ala Ala Leu Ser Glu Lys Leu Lys Val Phe Arg Glu
2180 2185 2190
Phe Leu Leu Pro Arg His Pro Pro Ile Phe His Glu Trp Phe Leu Arg
2195 2200 2205
Thr Phe Pro Asp Pro Thr Ser Trp Tyr Ser Ser Arg Ser Ala Tyr Cys
221C » 2215 i 2220
Arg Ser Thr Ala Val Met Ser Met Val Gly Tyr Ile Leu Gly Leu Gly
2225 2230 2235 2240
Asp Arg His Gly Glu Asn Ile Leu Phe Asp Ser Leu Thr Gly Glu Cys
2245 2250 2255
Val His Val Asp Phe Asn Cys Leu Phe Asn Lys Gly Glu Thr Phe Glu
2260 2265 2270
Val Pro Glu Ile Val Pro Phe Arg Leu Thr His Asn Met Val Asn Gly
2275 2280 2285
Met Gly Pro Met Gly Thr Glu Gly Leu Phe Arg Arg Ala Cys Glu Val
229C i 2295 , 2300
Thr Met Arg Leu Met Arg Asp Gin Arg Glu Pro Leu Met Ser Val Leu
2305 2310 2315 2320
Lys Thr Phe Leu His Asp Pro Leu Val Glu Trp Ser Lys Pro Val Lys
2325 2330 2335
Gly His Ser Lys Ala Pro Leu Asn Glu Thr Gly Glu Val Val Asn Glu
2340 2345 2350
Lys Ala Lys Thr His Val Leu Asp Ile Glu Gin Arg Leu Gin Gly Val
2355 2360 2365
Ile Lys Thr Arg Asn Arg Val Thr Gly Leu Pro Leu Ser Ile Glu Gly
237C i 2375 2380
His Val His Tyr Leu Ile Gin Glu Ala Thr Asp Glu Asn Leu Leu Cys
23Θ5 2390 2395 2400
Gin Met Tyr Leu Gly Trp Thr Pro Tyr Met
2405 2410
(2) INFORMACE O SEQ ID NO:32:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 7502 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární • 9
9
9 9 9
- 182 (ii) TYP MOLEKULY: CDNA (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 1..7440 (xi) POPIS SEKVENCE: SEQ ID NO: 32:
ATG GGT CAT GCT GTG GAA Glu TGG Trp CCA GTG GTC ATG AGC CGA TTT TTA AGT 48
Met 1 Gly His Ala Val 5 Pro Val Val 10 Met Ser Arg Phe Leu 15 Ser
CAA TTA GAT GAA CAC ATG GGA TAT TTA CAA TCA GCT CCT TTG GAG TTG 96
Gin Leu Asp Glu His Met Gly Tyr Leu Gin Ser Ala Pro Leu Gin Leu
20 25 30
ATG AGT ATG CAA AAT TTA GAA TTT ATT GAA GTC ACT TTA TTA ATG GTT 144
Met Ser Met Gin Asn Leu Glu Phe Ile Glu Val Thr Leu Leu Met Val
35 40 45
CTT ACT CGT ATT ATT GCA ATT GTG TTT TTT AGA AGG CAA GAA CTC TTA 192
Leu Thr Arg Ile Ile Ala Ile Val Phe Phe Arg Arg Gin Glu Leu Leu
50 55 60
CTT TGG CAG ATA GGT TGT GTT CTG CTA GAG TAT GGT AGT CCA AAA ATT 240
Leu Trp Gin Ile Gly Cys Val Leu Leu Glu Tyr Gly Ser Pro Lys Ile
65 70 75 80
AAA TCC CTA GCÁ ATT AGC TTT TTA ACA GAA CTT TTT CAG CTT GGA GGA 288
Lys Ser Leu Ala Ile Ser Phe Leu Thr Glu Leu Phe Gin Leu Gly Gly
85 90 95
CTA CCA GCA CAA CCA GCT AGC ACT TTT TTC AGC TCA TTT TTG GAA TTA 336
Leu Pro Ala Gin Pro Ala Ser Thr Phe Phe Ser Ser Phe Leu Glu Leu
. · 100 105 110 *—- ·
----- -
TTA AAA CAC CTT GTA GAA ATG GAT ACT GAC CAA TTG AAA CTC TAT GAA 384
Leu Lys His Leu Val Glu Met Asp Thr Asp Gin Leu Lys Leu Tyr Glu
115 120 125
GAG CCA TTA TCA AAG CTG ATA AAG ACA. CTA TTT CCC TTT GAA GCA GAA 432
Glu Pro Leu Ser Lys Leu Ile Lys Thr Leu Phe ťro Phe Glu Ala Glu
130 135 140
GCT TAT AGA AAT ATT GAA CCT GTC TAT TTA AAT ATG CTG CTG GAA AAA 480
Ala Tyr Arg Asn Ile Glu Pro Val Tyr Leu Asn Met Leu Leu Glu Lys
145 150 155 160
CTC TGT GTC ATG TTT GAA GAC GGT GTG CTC ATG CGG CTT AAG TCT GAT 528
Leu Cys Val Met Phe Glu Asp Gly Val Leu Met Arg Leu Lys Ser Asp
165 170 175
TTG CTA AAA GCA GCT TTG TGC CAT TTA CTG CAG TAT TTC CTT AAA TTT 576
Leu Leu Lys Ala Ala Leu Cys His Leu Leu Gin Tyr Phe Leu Lys Phe
180 185 190
·- -. -
GTG CCA GCT GGG TAT GAA TCT GCT TTA CAA GTC AGG AAG GTC ŤÁT GTG 624
Val Pro Al 3 Gly Tyr Glu Ser Ala Leu Gin Val Arg Lys Val Tyr Val
195 200 205
AGA AAT ATT TGT AAA GCT CTT TTG GAT GTG CTT GGA ATT GAG GTA GAT 672
Arg Asn Ile Cys Lys Ala Leu Leu Asp Val Leu Gly Ile Glu Val Asp
210 215 220
• · · ·
183
GCA GAG TAC Tyr TTG TTG GGC CCA CTT TAT GCA GCT TTG AAA Lys ATG Met GAA Glu AGT Ser 240 720
Ala 225 Glu Leu Leu Gly 230 Pro Leu Tyr Ala Ala 235 Leu
ATG GAA ATC ATT GAG GAG ATT CAA TGC CAA ACT CAA CAG GAA AAC CTC 768
Met Glu Ile Ile Glu Glu Ile Gin Cys Gin Thr Gin Gin Glu Asn Leu
245 250 255
AGC AGT AAT AGT GAT GGA ATA TCA CCC AAA AGG CGT CGT CTC AGC TCG 816
Ser Ser Asn Ser Asp Gly Ile Ser Pro Lys Arg Arg Arg Leu Ser Ser
260 265 270
TCT CTA AAC CCT TCT AAA AGA GCA CCA AAA CAG ACT GAG GAA ATT AAA 864
Ser Leu Asn Pro Ser Lys Arg Ala Pro Lys Gin Thr Glu Glu Ile Lys
275 280 285
CAT GTG GAC ATG AAC CAA AAG AGC ATA TTA TGG AGT GCA CTG AAA CAG 912
His Val Asp Met Asn Gin Lys Ser Ile Leu Trp Ser Ala Leu Lys Gin
290 295 300
AAA GCT GAA TCC CTT CAG ATT TCC CTT GAA TAC AGT GGC CTA AAG AAT 960
Lvs Ala Glu Ser Leu Gin Ile Ser Leu Glu Tyr Ser Gly Leu Lys Asn
3 05 310 315 320
CCT GTT ATT GAG ATG TTA GAA GGA ATT GCT GTT GTC TTA CAA CTG ACT 1008
Pro Val Ile Glu Met Leu Glu Gly Ile Ala Val Val Leu Gin Leu Thr
325 330 335
GCT CTG TGT ACT GTT CAT TGT TCT CAT CAA AAC ATG AAC TGC CGT ACT 1056
Ala Leu Cys Thr Val His Cys Ser His Gin Asn Met Asn Cys Arg Thr
340 345 350
TTC AAG GAC TGT CAA CAT AAA TCC AAG AAG AAA CCT TCT GTA GTG ATA 1104
Phe Lys Asp Cys Gin His Lys Ser Lys Lys Lys Pro Ser Val Val Ile
355 360 365
ACT TGG ATG TCA TTG GAT TTT TAC ACA AAA GTG CTT AAG AGC TGT AGA 1152
Thr Trp Met Ser Leu Asp Phe Tyr Thr Lys Val Leu Lys Ser Cys Arg
370 375 380
AGT TTG TTA GAA TCT GTT CAG AAA CTG GAC CTG GAG GCA ACC ATT GAT 1200
Ser Leu Leu Glu Ser Val Gin Lys Leu Asp Leu Glu Ala Thr Ile Asp
385 390 395 400
AAG GTG GTG AAA ATT TAT GAT GCT TTG ATT TAT ATG CAA GTA AAC AGT 1248
Lys Val Val Lys Ile Tyr Asp Ala Leu Ile Tyr Met Gin Val Asn Ser
405 410 415
TCA TTT GAA GAT CAT ATC CTG GAA GAT TTA TGT GGA ATG CTC TCA CTT 1296
Ser Phe Glu Asp His Ile Leu Glu Asp Leu Cys Gly Met Leu Ser Leu
420 425 430
CCA TGG ATT TAT TCC CAT TCT GAT GAT GGC TGT TTA AAG TTG ACC ACA 1344
Pro Trp Ile Tyr Ser His Ser As o Asp Gly Cys Leu Lys Leu Thr Thr
435 440 445
TTT GCC GCT AAT CTT CTA ACA TTA AGC TGT AGG ATT TCA GAT AGC TAT 1392
Phe Ala Ala Asn Leu Leu Thr Leu Ser Cys Arg Ile Ser Asp Ser Tyr
450 455 460
TCA CCA CAG GCA CAA TCA CGA TGT GTG TTT CTT CTG ACT CTG TTT CCA 1440
Ser Pro Gin Ala Gin Ser Arg Cys Val Phe Leu Leu Thr Leu Phe Pro
465 470 475 480
AGA AGA ATA TTC CTT GAG TGG AGA ACA GCA GTT TAC AAC TGG GCC CTG 1488
Arg Arg Ile Phe Leu Glu Trp Arg Thr Ala Val Tyr Asn Trp Ala Leu
485 490 495
184 • · · ·
CAG Gin AGC TCC CAT GAA GTA ATC CGG GCT AGT TGT GTT AGT GGA TTT TTT Phe 1536
Ser Ser His 500 Glu Val Ile Arg Ala 505 Ser Cys Val Ser Gly 510 Phe
ATC TTA TTG CAG CAG CAG AAT TCT TGT AAC AGA GTT CCC AAG ATT CTT 1584
Ile Leu Leu Gin Gin Gin Asn Ser Cys Asn Arg Val Pro Lys Ile Leu
515 520 525
ATA GAT AAA GTC AAA GAT GAT TCT GAC ATT GTC AAG AAA GAA TTT GCT 1632
Ile Asp Lys Val Lys Asp Asp Ser Asp Ile Val Lys Lys Glu Phe Ala
530 535 540
TCT ATA CTT GGT CAA CTT GTC TGT ACT CTT CAC GGC ATG TTT TAT CTG 1680
Ser Ile Leu Gly Gin Leu Val Cys Thr Leu His Gly Met Phe Tyr Leu
545 550 555 560
ACA AGT TCT TTA ACA GAA CCT TTC TCT GAA CAC GGA CAT GTG GAC CTC 1728
Thr Ser Ser Leu Thr Glu Pro Phe Ser Glu His Gly His Val Asp Leu
565 570 575
TTC TGT AGG AAC TTG AAA GCC ACT TCT CAA CAT GAA TGT TCA TCT TCT 1776
Phe Cys Arg Asn Leu Lys Ala Thr Ser Gin His Glu Cys Ser Ser Ser
580 585 590
CAA CTA AAA GCT TCT GTC TGC AAG CCA TTC CTT TTC CTA CTG AAA AAA 1824
Gin Leu Lys Ala Ser Val cys Lys Pro Phe Leu Phe Leu Leu Lys Lys
595 600 605
AAA ATA CCT AGT CCA GTA AAA CTT GCT TTC ATA GAT AAT CTA CAT CAT 1872
Lys Ile Pro Ser Pro Val Lys Leu Ala Phe Ile Asp Asn Leu His His
610 615 620
CTT TGT AAG CAT CTT GAT TTT AGA GAA GAT GAA ACA GAT GTA AAA GCA 1920
Leu Cys Lys His Leu Asp Phe Arg Glu Asp Glu Thr Asp Val Lys Ala
G25 630 635 640
GTT CTT GGA ACT TTA TTA AAT TTA ATG GAA GAT CCA GAC AAA GAT GTT 1968
Val Leu Gly Thr Leu Leu Asn Leu Met Glu Asp Pro Asp Lys Asp Val
645 650 655
AGA GTG GCT TTT AGT GGA AAT ATC AAG CAC ATA TTG GAA TCC TTG GAC 2016
Arg Val Ala Phe Ser Gly Asn Ile Lys His Ile Leu Glu Ser Leu Asp
660 665 670
TCT GAA GAT GGA TTT ATA AAG GAG CTT TTT GTC TTA AGA ATG AAG GAA 2064
Ser Glu Asp Gly Phe Ile Lys Glu Leu Phe Val Leu Arg Met Lys Glu
675 680 665
GCA TAT ACA CAT GCC CAA ATA TCA AGA AAT AAT GAG CTG AAG GAT ACC 2112
Ala Tyr Thr His Ala Gin Ile Ser Arg Asn Asn Glu Leu Lys Asp Thr
690 695 700
TTG ATT CTT ACA ACA GGG GAT ATT GGA AGG GCC GCA AAA GGA GAT TTG 2160
Leu Ile Leu Thr Thr Gly Asp Ile Gly Arg Ala Ala Lys Gly Asp Leu
705 710 715 720
GTA CCA TTT GCA CTC TTA CAC TTA TTG CAT TGT TTG TTA TCC AAG TCA 2208
Val Pro Phe Ala Leu Leu His Leu Leu His Cys Leu Leu Ser Lys Ser
725 730 735
GCA TCT GTC TCT GGA GCA GCA TAC ACA GAA ATT AGA GCT CTG GTT GCA 2256
Ala Ser Val Ser Gly Ala Ala Tyr Thr Glu He Arg Ala Leu Val Ala
740 745 750
GCT AAA AGT GTT AAA CTG CAA AGT TTT TTC AGC CAG TAT AAG AAA CCC 2304
Ala Lys Ser Val Lys Leu Gin Ser Phe Phe Ser Gin Tyr Lys Lys Pro
755 760 765
• ·
- 185 - ·'· · ·· • · · · · · ·
ATC TGT CAG TTT TTG GTA GAA TCC CTT CAC TCT AGT CAG ATG ACA GCA 2352
Ile Cys Gin 770 Phe Leu Val Glu Ser Leu His Ser Ser Gin Met 775 780 Thr Ala
CTT CCG AAT ACT CCA TGC CAG AAT GCT GAC GTG CGA AAA CAA GAT GTG 2400
Leu Pro Asn 7Θ5 Thr Pro Cys Gin Asn Ala Asp Val Arg Lys Gin 790 795 Asp Val 800
GCT CAC CAG AGA GAA ATG GCT TTA AAT ACG TTG TCT GAA ATT GCC AAC 2448
Ala His Gin Arg Glu Met Ala Leu Asn Thr Leu Ser Glu Ile 805 810 Ala 815 Asn
GTT TTC GAC TTT CCT GAT CTT AAT CGT TTT CTT ACT AGG ACA TTA CAA 2496
Val Phe Asp Phe Pro Asp Leu Asn Arg Phe Leu Thr Arg Thr 820 825 830 Leu Gin
GTT CTA CTA CCT GAT CTT GCT GCC AAA GCA AGC CCT GCA GCT TCT GCT 2544
Val Leu Leu 835 Pro Asp Leu Ala Ala Lys Ala Ser Pro Ala Ala 840 845 Ser Ala
CTC ATT CGA ACT TTA GGA AAA CAA TTA AAT GTC AAT CGT AGA GAG ATT 2592
Leu Ile Arg 650 Thr Leu Gly Lys Gin Leu Asn Val Asn Arg Arg 855 860 Glu Ile
TTA ATA AAC AAC TTC AAA TAT ATT TTT TCT CAT TTG GTC TGT TCT TGT 2640
Leu Ile Asn 865 Asn Phe Lys Tyr Ile Phe Ser His Leu Val Cys 870 875 Ser Cys 880
TCC AAA GAT GAA TTA GAA CGT GCC CTT CAT TAT CTG AAG AAT GAA ACA 2688
Ser Lys Asp Glu Leu Glu Arg Ala Leu His Tyr Leu Lys Asn 885 890 Glu 895 Thr
GAA ATT GAA CTG GGG AGC CTG TTG AGA CAA GAT TTC CAA GGA TTG CAT 2736
Glu Ile Glu Leu Gly Ser Leu Leu Arg Gin Asp Phe Gin Gly 900 905 910 Leu His
AAT GAA TTA TTG CTG CGT ATT GGA GAA CAC TAT CAA CAG GTT TTT AAT 2784
Asn Glu Leu 915 Leu Leu Arg Xle Gly Glu His Tyr Gin Gin Val 920 925 Phe Asn
GGT TTG TCA ATA CTT GCC TCA TTT GCA TCC AGT GAT GAT CCA TAT CAG 2832
Gly Leu Ser 930 Ile Leu Ala Ser Phe Ala Ser Ser Asp Asp Pro 935 940 Tyr Gin
GGC CCG AGA GAT ATC ATA TCA CCT GAA CTG ATG GCT GAT TAT TTA CAA 2880
Gly Pro Arg 945 Asp Ile Ile Ser Pro Glu Leu Met Ala Asp Tyr 950 955 Leu Gin 960
CCC AAA TTG TTG GGC ATT TTG GCT TTT TTT AAC ATG CAG TTA CTG AGC 2928
Pro Lys Leu Leu Gly Ile Leu Ala Phe Phe Asn Met Gin Leu 965 970 Leu 975 Ser
TCT AGT GTT GGC ATT GAA GAT AAG AAA ATG GCC TTG AAC AGT TTG ATG 2976
Ser Ser Val Gly Ile Glu Asp Lys Lys Met Ala Leu Asn Ser 980 985 990 Leu Met
TCT TTG ATG AAG TTA ATG GGA CCC AAA CAT GTC AGT TCT GTG AGG GTG 3024
Ser Leu Met 995 Lys Leu Met Gly Pro Lys His Val Ser Ser Val 1000 1005 Arg Val
AAG ATG ATG ACC ACA CTG AGA ACT GGC CTT CGA TTC AAG GAT GAT TTT 3072
Lys Met Met 1010 Thr Thr Leu Arg Thr Gly Leu Arg Phe Lys Asp 1015 1020 ASp Phe
CCT GAA TTG TGT TGC AGA GCT TGG GAC TGC TTT GTT CGC TGC CTG GAT 3120
Pro Glu Leu 1025 Cys Cys Arg Ala Trp Asp Cys Phe Val Arg Cys 1030 1035 Leu Asp 1040
- 186 - • ·· · • · • « • « • · « ·· • • • · • • · • · · • · · · « · • · · • · • · · · · · ·
CAT GCT TGT CTG GGC TCC CTT CTC AGT CAT GTA ATA GTA GCT TTG TTA 3168
His Ala Cys Leu Gly Ser Leu Leu Ser His Val Ile Val 1045 1050 Ala Leu Leu 1055
CCT CTT ATA CAC ATC CAG CCT AAA GAA ACT GCA GCT ATC TTC CAC TAC 3216
Pro Leu Ile His Ile Gin Pro Lys Glu Thr Ala Ala Ile 1060 1065 Phe His 1070 Tyr
CTC ATA ATT GAA AAC AGG GAT GCT GTG CAA GAT TTT CTT CAT GAA ATA 3264
Leu Ile Ile Glu 1075 Asn Arg Asp Ala Val Gin Asp Phe Leu His Glu 1080 1085 Ile
TAT TTT TTA CCT GAT CAT CCA GAA TTA AAA AAG ATA AAA GCC GTT CTC 3312
Tyr Phe Leu Pro 1090 Asp His Pro Glu Leu Lys Lys Ile Lys 1095 1100 Ala Val Leu
CAG GAA TAC AGA AAG GAG ACC TCT GAG AGC ACT GAT CTT CAG ACA ACT 3360
Gin Glu Tyr Arg 1105 Lys Glu Thr Ser Glu Ser Thr Asp Leu 1110 1115 Gin Thr Thr 1120
CTT CAG CTC TCT ATG AAG GCC ATT CAA CAT GAA AAT GTC GAT GTT CGT 3408
Leu Gin Leu Ser Met Lys Ala Ile Gin His Glu Asn Val 1125 1130 Asp Val 1135 Arg
ATT CAT GCT CTT ACA AGC TTG AAG GAA ACC TTG TAT AAA AAT CAG GAA 3456
Ile His Ala Leu Thr Ser Leu Lys Glu Thr Leu Tyr Lys 1140 1145 Asn Gin 1150 Glu
AAA CTG ATA AAG TAT GCA ACA GAC AGT GAA ACA GTA GAA CCT ATT ATC 3504
Lys Leu Ile Lys 1155 Tyr Ala Thr Asp Ser Glu Thr Val Glu Pro Ile 1160 1165 Ile
TCA CAG TTG GTG ACA GTG CTT TTG AAA GGT TGC CAA GAT GCA AAC TCT 3552
Ser Gin Leu Val 1170 Thr Val Leu Leu Lys Gly Cys Gin Asp 1175 1180 Ala Asn Ser
CAA GCT CGG TTG CTC TGT GGG GAA TGT TTA GGG GAA TTG GGG GCG ATA 3600
Gin Ala Arg Leu 1185 Leu Cys Gly Glu Cys Leu Gly Glu Leu 1190 1195 Gly Ala Ile 1200
GAT CCA GGT CGA TTA GAT TTC TCA ACA ACT GAA ACT CAA GGA AAA GAT 3648
Asp Pro Gly Arg Leu Asp Phe Ser Thr Thr Glu Thr Gin 1205 1210 Gly Lys Asp 1215
TTT ACA TTT GTG ACT GGA GTA GAA GAT TCA AGC TTT GCC TAT GGA TTA 3696
Phe Thr Phe Val Thr Gly Val Glu Asp Ser Ser Phe Ala 1220 1225 Tyr Gly 1230 Leu
TTG ATG GAG CTA ACA AGA GCT TAC CTT GCG TAT GCT GAT AAT AGC CGA 3744
Leu Met Glu Leu 1235 Thr Arg Ala Tyr Leu Ala Tyr Ala Asp Asn Ser 1240 1245 Arg
GCT 'CAA GAT TCA GCT GCC TAT GCC ATT CAG GAG TTG CTT TCT ATT TAT 3792
Ala Gin Asp Ser 1250 Ala Ala Tyr Ala Ile Gin Glu Leu Leu 1255 1260 Ser Ile Tyr
GAC TGT AGA GAG ATG GAG ACC AAC GGC CCA GGT CAC CAA TTG TGG AGG 3840
Asp Cys Arg Glu 1265 Met Glu Thr Asn Gly Pro Gly His Gin 1270 1275 Leu Trp Arg 1280
AGA TTT CCT GAG CAT GTT CGG GAA ATA CTA GAA CCT CAT CTA AAT ACC 3888
Arg Phe Pro Glu His Val Arg Glu Ile Leu Glu Pro His 1285 1290 Leu Asn Thr 1295
AGA TAC AAG AGT TCT CAG AAG TCA ACC GAT TGG TCT GGA GTA AAG AAG 3936
Arg Tyr Lys Ser Ser Gin Lys Ser Thr Asp Trp Ser Gly 1300 1305 Val Lys 1310 Lys
··
• ·
- 187 • · · • · • · • · «·· *·
CCA ATT TAC TTA AGT AAA Lys TTG Leu GGT AGT AAC Gly Ser Asn 1320 TTT GCA GAA TGG TCA GCA 3984
Pro Ile Tyr Leu 1315 Ser Phe Ala Glu Trp 1325 Ser Ala
TCT TGG GCA GGT TAT CTT ATT ACA AAG GTT CGA CAT GAT CTT GCC AGT 4032
Ser Trp Ala Gly 1330 Tyr Leu Ile Thr Lys Val 1335 Arg His Asp Leu 1340 Ala Ser
AAA ATT TTC ACC TGC TGT AGC ATT ATG ATG AAG CAT GAT TTC AAA GTG 4080
Lys Ile 1345 Phe Thr Cys Cys Ser 1350 Ile Met Met Lys His 1355 Asp Phe Lys Val 1360
ACC ATC TAT CTT CTT CCA CAT ATT CTG GTG TAT GTC TTA CTG GGT TGT 4128
Thr Ile Tyr Leu Leu Pro 1365 His Ile Leu Val Tyr 1370 Val Leu Leu Gly Cys 1375
AAT CAA GAA GAT CAG CAG GAG GTT TAT GCA GAA ATT ATG GCA GTT CTA 4176
Asn Gin Glu Asp Gin 1380 Gin Glu Val Tyr Ala 1385 Glu Ile Met Ala Val 1390 Leu
AAG CAT GAC GAT CAG CAT ACC ATA AAT ACC CAA GAC ATT GCA TCT GAT 4224
Lys His Asp Asp 1395 Gin His Thr Ile Asn Thr 1400 Gin Asp Ile Ala 1405 Ser Asp
CTG TGT CAA CTC AGT ACA CAG ACT GTG TTC TCC ATG CTT GAC CAT CTC 4272
Leu Cys Gin Leu 1410 Ser Thr Gin Thr Val Phe 1415 Ser Met Leu Asp 1420 His Leu
ACA CAG TGG GCA AGG CAC AAA TTT CAG GCA CTG AAA GCT GAG AAA TGT 4320
Thr Gin 1425 Trp Ala Arg His Lys 1430 Phe Gin Ala Leu Lys 1435 Ala Glu Lys Cys 1440
CCA CAC AGC AAA TCA AAC AGA AAT AAG GTA GAC TCA ATG GTA TCT ACT 4368
Pro His Ser Lys Ser Asn 1445 Arg Asn Lys Val Asp 1450 Ser Met Val Ser Thr 1455
GTG GAT TAT GAA GAC TAT CAG AGT GTA ACC CGT TTT CTA GAC CTC ATA 4416
Val Asp Tyr Glu Asp 1460 Tyr Gin Ser Val Thr 1465 Arg Phe Leu Asp Leu 1470 Ile
CCC CAG GAT ACT CTG GCA GTA GCT TCC TTT CGC TCC AAA GCA TAC ACA 4464
Pro Gin Asp Thr 1475 Leu Ala Val Ala Ser Phe 1400 Arg Ser Lys Ala 1485 Tyr Thr
CGA GCT GTA ATG CAC TTT GAA TCA TTT ATT ACA GAA AAG AAG CAA AAT 4512
Arg Ala Val Met 1490 His Phe Glu Ser Phe Ile 1495 Thr Glu Lys Lys 1500 Gin Asn
ATT CAG GAA CAT CTT GGA TTT TTA CAG AAA TTG TAT GCT GCT ATG CAT 4560
Ile Gin 1505 Glu His Leu Gly Phe 1510 Leu Gin Lys Leu Tyr 1515 Ala Ala Met His 1520
GAA CCT GAT GGA GTG GCC GGA GTC AGT GCA ATT AGA AAG GCA GAA CCA 4608
Glu Pro Asp Gly Val Ala 1525 Gly Val Ser Ala Ile 1530 Arg Lys Ala Glu Pro 1535
TCT CTA AAA GAA CAG ATC CTT GAA CAT GAA AGC CTT GGC TTG CTG AGG 4656
Ser Leu Lys Glu Gin 1540 Ile Leu Glu His Glu 1545 Ser Leu Gly Leu Leu 1550 Arg
GAT GCC ACT GCT TGT TAT GAC AGG GCT ATT CAG CTA GAA CCA GAC CAG 4704
Asp Ala Thr Ala 1555 Cys Tyr Asp Arg Ala Ile 1560 Gin Leu Glu Pro 1565 Asp Gin
ATC ATT CAT TAC CAT GGT GTA GTA AAG TCC ATG TTA GGT CTT GGT CAG 4752
Ile Ile 157C His Tyr 1 His Gly Val 1575 Val Lys Ser Met Leu Gly Leu 1580 Gly Gin
·· ···· • ·· ·· · · · • · · • · · * • · · ··· ♦ · ·
- 188 • « • · · · · 11·· ι lil · • · · ··»· ·· ·
CTG TCT ACT GTT ATC ACT CAG GTG AAT GGA GTG CAT GCT AAC AGG TCC 4 800
Leu Ser Thr Val Ile Thr Gin Val Asn Gly Val His Ala Asn Arg Ser
1585 1590 1595 1600
GAG TGG ACA GAT GAA TTA AAC ACG TAC AGA GTG GAA GCA GCT TGG AAA 4 84 8
Glu Trp Thr Asp Glu Leu Asn Thr Tyr Arg Val Glu Ala Ala Trp Lys
1605 1610 1615
TTG TCA CAG TGG GAT TTG GTG GAA AAC TAT TTG GCA GCA GAT GGA AAA 4 89 6
Leu Ser Gin Trp Asp Leu Val Glu Asn Tyr Leu Ala Ala Asp Gly Lys
1620 1625 1630
TCT ACA ACA TGG AGT GTC AGA CTG GGA CAG CTA TTA TTA TCA GCC AAA 4944
Ser Thr Thr Trp Ser Val Arg Leu Gly Gin Leu Leu Leu Ser Ala Lys
1635 1640 1645
AAA AGA GAT ATC ACA GCT TTT TAT GAC TCA CTG AAA CTA GTG AGA GCA 4992
Lys Arg Asp Ile Thr Ala Phe Tyr Asp Ser Leu Lys Leu Val Arq Ala
1650 1655 1660
GAA CAA ATT GTA CCT CTT TCA GCT GCA AGC TTT GAA AGA GGC TCC TAC 504 0
Glu Gin Ile Val Pro Leu Ser Ala Ala Ser Phe Glu Arg Gly Ser Tyr
1665 1670 1675 1680
CAA CGA GGA TAT GAA TAT ATT GTG AGA TTG CAC ATG TTA TGT GAG TTG 5088
Gin Arg Gly Tyr Glu Tyr Ile Val Arg Leu His Met Leu Cys Glu Leu
1685 1690 1695
GAG CAT AGC ATC AAA CCA CTT TTC CAG CAT TCT CCA GGT GAC AGT TCT 5136
Glu His Ser Ile Lys Pro Leu Phe Gin His Ser Pro Gly Asp Ser Ser
1700 1705 1710
CAA Gin GAA GAT TCT Glu Asp Ser 1715 CTA Leu AAC Asn TGG Trp GTA GCT Val Ala 1720
TCC TAC AGA GCC AAG GAG CCT ATC CTG
Ser Tyr Arg Ala 1730 Lys Glu Pro Ile Leu 1735
AGC CTC AAC AAA AGA CCA GAT TAC AAT
Ser 1745 Leu Asn Lys Arg Pro Asp 1750 Tyr Asn
CTG CAG AGT GCC AGG GTA GCT AGA AAG
Leu Gin Ser Ala Arg Val Ala Arg Lys
1765
TAC AAT GCT CTC CTT AAT GCA Ala GGG Gly GAA Glu 178!
Tyr Asn Ala Leu Leu 1780 Asn
GTG GAA AGG GCA AAG TGG CTC TGG TCC
Val Glu Arg Ala Lys Trp Leu Trp Ser
1795 1800
CTA ATT GTT CTT CAA AAA GGT GTT GAA
Leu Ile Val Leu Gin Lys Gly Val Glu
1810 1815
ACC CCA CCT GAG GGT AAG AAC ATG TTA
Thr Pro Pro Glu Gly Lys Asn Met Leu
1825 1830
CTA GTG GGC CGA TTT ATG GAA GAA ACA
Leu Val Gly Arg Phe Met Glu Glu Thr
1845
CGA Arg CTA Leu GAA Glu ATG ACC CAG AAT Met Thr Gin Asn 1725 5184
GCT CTC CGG AGG GCT TTA CTA 5232
Ala Leu Arg Arg Ala Leu Leu 1740
GAA ATG GTT GGA GAA TGC TGG 5280
Glu Met Val 1755 Gly Glu Cys Trp 1760
GCT GGT CAC CAC CAG ACA GCC 5328
Ala Gly 1770 His His Gin Thr Ala 1775
TCA CGA CTC GCT GAA CTG TAC 5376
Ser Arg Leu Ala Glu Leu Tyr
1790
AAG GGT GAT GTT CAC CAG GCA 5424
Lys Gly Asp Val His Gin Ala
1805
TTA TGT TTT CCT GAA AAT GAA 5472
Leu Cys Phe Pro Glu 1820 Asn Glu
ATC CAT GGT CGA GCT ATG CTA 5520
Ile His Gly Arg Ala 1835 Met Leu 1840
GCT AAC TTT GAA AGC AAT GCA 5568
Ala Asn 1850 Phe Glu Ser Asn Ala 1855
189
ATT Ile ATG AAA AAA TAT AAG GAT GTG ACC GCG TGC CTG CCA GAA TGG GAG Glu Trp Glu 1870 5616
Met Lys Lys Tyr Lys 1860 Asp Val Thr Ala 1865 Cys Leu Pro
GAT GGG CAT TTT TAC CTT GCC AAG TAC TAT GAC AAA TTG ATG CCC ATG 5664
Asp Gly His Phe Tyr Leu 1875 Ala Lys Tyr Tyr 1880 Asp Lys Leu Met Pro Met 1885
GTC ACA GAC AAC AAA ATG GAA AAG CAA GGT GAT CTC ATC CGG TAT ATA 5712
Val Thr Asp 1890 Asn Lys Met Glu Lys 1895 Gin Gly Asp Leu Ile 1900 Arg Tyr Ile
GTT CTT CAT TTT GGC AGA TCT CTA CAA TAT GGA AAT CAG TTC ATA TAT 5760
Val Leu 1905 His Phe Gly Arg Ser 1910 Leu Gin Tyr Gly Asn 1915 Gin Phe Ile Tyr 1920
CAG TCA ATG CCA CGA ATG TTA ACT CTA TGG CTT GAT TAT GGT ACA AAG 5808
Gin Ser Met Pro Arg Mec 1925 Leu Thr Leu Trp Leu 1930 Asp Tyr Gly Thr Lys 1935
GCA TAT GAA TGG GAA AAA GCT GGC CGC TCC GAT CGT GTA CAA ATG AGG 5856
Ala Tyr Glu Trp Glu Lys 1940 Ala Gly Arg Ser 1945 Asp Arg Val Gin Met Arg 1950
AAT GAT TTG GGT AAA ATA AAC AAG GTT ATC ACA GAG CAT ACA AAC TAT 5904
Asn Asp Leu Gly Lys Ile 1955 Asn Lys Val Ile 1960 Thr Glu His Thr Asn Tyr 1965
TTA GCT CCA TAT CAA TTT TTG ACT GCT TTT TCA CAA TTG ATC TCT CGA 5952
Leu Ala Pro 1970 Tyr Gin Phe Leu Thr 1975 Ala Phe Ser Gin Leu 1980 Ile Ser Arg
ATT TGT CAT TCT CAC GAT GAA GTT TTT GTT GTC TTG ATG GAA ATA ATA 6000
Ile Cys 1985 His Ser His Asp Glu 1990 Val Phe Val Val Leu 1995 Met Glu Ile Ile 2000
GCC AAA GTA TTT CTA GCC TAT CCT CAA CAA GCA ATG TGG ATG ATG ACA 6048
Ala Lys Val Phe Leu Ala 2005 Tyr Pro Gin Gin Ala 2010 Met Trp Met Met Thr 2015
GCT GTG TCA AAG TCA TCT TAT CCC ATG CGT GTG AAC AGA TGC AAG GAA 6096
Ala Val Ser Lys Ser Ser 2020 Tyr Pro Met Arg 2025 Val Asn Arg Cys Lys Glu 2030
ATC CTC AAT AAA GCT ATT CAT ATG AAA AAA TCC TTA GAG AAG TTT GTT 6144
Ile Leu Asn 2035 Lys Ala Ile His Met Lys Lys 2040 Ser Leu Glu Lys Phe Val 2045
GGA GAT GCA ACT CGC CTA ACA GAT AAG CTT CTA GAA TTG TGC AAT AAA 6192
Gly Asp Ala 2050 Thr Arg Leu Thr Asp 2055 Lys Leu Leu Glu Leu 2060 Cys Asn Lys
CCG GTT GAT GGA AGT AGT TCC ACA TTA AGC ATG AGC ACT CAT TTT AAA 6240
Pro Val 2065 Asp Gly Ser Ser Ser 2070 Thr Leu Ser Met Ser 2075 Thr His Phe Lys 2080
ATG CTT AAA AAG CTG GTA GAA GAA GCA ACA TTT AGT GAA ATC CTC ATT 6288
Met Leu Lys Lys Leu Val 2085 Glu Glu Ala Thr Phe 2090 Ser Glu Ile Leu Ile 2095
CCT CTA CAA TCA GTC ATG ATA CCT ACA CTT CCA TCA ATT CTG GGT ACC 6336
Pro Leu Gin Ser Val Met 2100 Ile Pro Thr Leu 2105 Pro Ser Ile Leu Gly Thr 2110 '
CAT GCT AAC CAT GCT AGC CAT GAA CCA TTT CCT GGA CAT TGG GCC TAT 6384
His Ala Asn 2115 His Ala Ser Hie Glu Pro Phe 2120 Pro Gly His Trp Ala Tyr 2125
·· ····
- 190
ATT GCA GGG Ile Ala Gly TTT GAT GAT ATG GTG GAA ATT CTT GCT TCT CTT CAG AAA 6432
Phe Asp Asp Met Val 2135 Glu Ile Leu Ala Ser 2140 Leu Gin Lys
2130
CCA AAG AAG ATT TCT TTA AAA GGC TCA GAT GGA AAG TTC TAC ATC ATG 6480
Pro Lys Lys 2145 Ile Ser Leu Lys Gly 2150 Ser Asp Gly Lys Phe 2155 Tyr Ile Met 2160
ATG TGT AAG CCA AAA GAT GAC CTG AGA AAG GAT TGT AGA CTA ATG GAA 6528
Met Cys Lys Pro Lys Asp Asp Leu 2165 Arg Lys Asp 2170 Cys Arg Leu Met Glu 2175
TTC AAT TCC TTG ATT AAT AAG TGC TTA AGA AAA GAT GCA GAG TCT CGT 6576
Phe Asn Ser Leu Ile 2180 Asn Lys Cys Leu Arg 2185 Lys Asp Ala Glu Ser 2190 Arg
AGA AGA GAA CTT CAT ATT CGA ACA TAT GCA GTT ATT CCA CTA AAT GAT 6624
Arg Arg Glu 2195 Leu His Ile Arg Thr Tyr 2200 Ala Val Ile Pro 2205 Leu Asn Asp
GAA TGT GGG ATT ATT GAA TGG GTG AAC AAC ACT GCT GGT TTG AGA CCT 6672
Glu Cys Gly 2210 Ile Ile Glu Trp Val 2215 Αεη Asn Thr Ala Gly 2220 Leu Arg Pro
ATT CTG ACC AAA CTA TAT AAA GAA AAG GGA GTG TAT ATG ACA GGA AAA 6720
Ile Leu Thr 2225 Lys Leu Tyr Lys Glu 2230 Lys Gly Val Tyr Met 2235 Thr Gly Lys 2240
GAA CTT CGC CAG TGT ATG CTA CCA AAG TCA GCA GCT TTA TCT GAA AAA 6768
Glu Leu Arg Gin Cys Met Leu Pro 2245 Lys Ser Ala 2250 Ala Leu Ser Glu Lys 2255
CTC AAA GTA TTC CGA GAA TTT CTC CTG CCC AGG CAT CCT CCT ATT TTT 6816
Leu Lys Val Phe Arg 2260 Glu Phe Leu Leu Pro 2265 Arg His Pro Pro Ile 2270 Phe
CAT GAG TGG TTT CTG AGA ACA TTC CCT GAT CCT ACA TCA TGG TAC AGT 6864
His Glu Trp Phe Leu 2275 Arg Thr Phe Pro 2260 Asp Pro Thr Ser Trp 2285 Tyr Ser
AGT AGA TCA GCT TAC TGC CGT TCC ACT GCA GTA ATG TCA ATG GTT GGT 6912
Ser Arg Ser 2290 Ala Tyr Cys Ara Ser 2295 Thr Ala Val Met Ser 2300 Met Val Gly
TAT ATT CTG GGG CTT GGA GAC CGT CAT GGT GAA AAT ATT CTC TTT GAT 6960
Tyr Ile Leu 2305 Gly Leu Gly Asp Arg 2310 His Gly Glu Asn Ile 2315 Leu Phe Asp 2320
TCT TTG ACT GGT GAA TGC GTA CAT GTA GAT TTC AAT TGT CTT TTC AAT 7008
Ser Leu Thr Gly Glu Cys Val His 2325 Val Asp Phe 2330 Asn Cys Leu Phe Asn 2335
AAG GGA GAA ACC TTT GAA GTT CCA GAA ATT GTG CCA TTT CGC CTG ACT 7056
Lys Gly Glu Thr Phe 2340 Glu Val Pro Glu Ile 2345 Val Pro Phe Arg Leu 2350 Thr
CAT AAT ATG GTT AAT GGA ATG GGT CCT ATG GGA ACA GAG GGT CTT TTT 7104
His Asn Met 2355 Val Asn Gly Met Gly Pro 2360 Met Gly Thr Glu Gly 2365 Leu Phe
CGA AGA GCA TGT GAA GTT ACA ATG AGG CTG ATG CGT GAT CAG CGA GAG 7152
Arg Arg Ala 2370 Cys Glu Val Thr Met 2375 Arg Leu Met Arg Asp 2380 Gin Arg Glu
CCT TTA ATG AGT GTC TTA AAG ACT TTT CTA CAT GAT CCT CTT GTG GAA 7200
Pro 2385 Leu Met Ser Val Leu Lys Thr 2390 Phe Leu His Asp Pro 2395 Leu Val Glu 2400
191
TGG Trp AGT Ser AAA CCA GTG AAA GGG CAT His TCC AAA GCG Ser Lys Ala 2410 CCA CTG AAT GAA ACT 7248
Lye Pro Val Lye 2405 Gly Pro Leu Asn Glu Thr 2415
GGA GAA GTT GTC AAT GAA AAG GCC AAG ACC CAT GTT CTT GAC ATT GAG 7296
Gly Glu Val Val Asn Glu 2420 Lys Ala Lys Thr His 2425 Val Leu Asp Ile Glu 2430
CAG CGA CTA CAA GGT GTA ATC AAG ACT CGA AAT AGA GTG ACA GGA CTG 7344
Gin Arg Leu Gin Gly Val 2435 Ile Lys Thr Arg Asn 2440 Arg Val Thr 2445 Gly Leu
CCG TTA TCT ATT GAA GGA CAT GTG CAT TAC CTT ATA CAA GAA GCT ACT 7392
Pro Leu Ser 2450 Ile Glu Gly His Val 2455 His Tyr Leu Ile Gin 2460 Glu Ala Thr
GAT GAA AAC TTA CTA TGC CAG ATG TAT CTT GGT TGG ACT CCA TAT ATG 7440
Asp Glu Asn Leu Leu Cys Gin Met Tyr Leu Gly Trp Thr Pro Tyr Met
2465 2470 2475 24B0
TGAAATGAAA TTATGTAAAA GAATATGTTA ATAATCTAAA AGTAAAAAAA AAAAAAAAAA 7500
AA 7502 (2) INFORMACE O SEQ ID NO:33:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 2480 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 33:
Met 1 Gly His Ala Val 5 Glu Trp Pro Val Val 10 Met Ser Arg Phe Leu 15 Ser
Gin Leu Asp Glu 20 His Met Gly Tyr Leu 25 Gin Ser Ala Pro Leu 30 Gin Leu
Met Ser Met 35 Gin Asn Leu Glu Phe 40 Ile Glu Val Thr Leu 45 Leu Met Val
Leu Thr 50 Arg Ile Ile Ala Ile 55 Val Phe Phe Arg Arg 60 Gin Glu Leu Leu
Leu 65 Trp Gin Ile Gly Cys 70 Val Leu Leu Glu Tyr 75 Gly Ser Pro Lys Ile 80
Lys Ser Leu Ala Ile 85 Ser Phe Leu Thr Glu 90 Leu Phe Gin Leu Gly 95 Gly
Leu Pro Ala Gin 100 Pro Ala Ser Thr Phe 105 Phe Ser Ser Phe Leu 110 Glu Leu
Leu Lys His 115 Leu Val Glu Met Asp 120 Thr Asp Gin Leu Lys 125 Leu Tyr Glu
Glu Pro 130 Leu Ser Lys Leu Ile 135 Lys Thr Leu Phe Pro 140 Phe Glu Ala Glu
Al a 145 Tyr Arg Asn Ile Glu 150 Pro Val Tyr Leu Asn 155 Met Leu Leu Glu Lys 160
• · • ·· ·
- 192 -
Leu Cys Val Met Phe 165 Glu Asp Gly Val Leu 170 Met Arg Leu Lys Ser 175 Asp
Leu Leu Lys Ala 180 Ala Leu Cys His Leu 185 Leu Gin Tyr Phe Leu 190 Lys Phe
Val Pro Ala 195 Gly Tyr Glu Ser Ala 200 Leu Gin Val Arg Lys 205 Val Tyr Val
Arg Asn 210 Ile Cys Lys Ala Leu 215 Leu Asp Val Leu Gly 220 Ile Glu Val Asp
Ala 225 Glu Tyr Leu Leu Gly 230 Pro Leu Tyr Ala Ala 235 Leu Lys Met Glu Ser 240
Met Glu Ile Ile Glu 245 Glu Ile Gin Cys Gin 250 Thr Gin Gin Glu Asn 255 Leu
Ser Ser Asn Ser 260 Asp Gly Ile Ser Pro 265 Lys Arg Arg Arg Leu 270 Ser Ser
Ser Leu Asn 275 Pro Ser Lys Arg Ala 280 Pro Lys Gin Thr Glu 285 Glu Ile Lys
His Val 290 Asp Met Asn Gin Lys 295 Ser Ile Leu Trp Ser 300 Ala Leu Lys Gin
Lys 305 Ala Glu Ser Leu Gin 310 Ile Ser Leu Glu Tyr 315 Ser Gly Leu Lys Asn 320
Pro Val Ile Glu Met 325 Leu Glu Gly Ile Ala 330 Val Val Leu Gin Leu 335 Thr
Ala Leu Cys Thr 340 Val Hi s Cys Ser His 345 Gin Asn Met Asn Cys 350 Arg Thr
Phe Lys Asp 355 Cys Gin His Lys Ser 360 Lys Lys Lys Pro Ser 365 Val Val Ile
Thr Trp 370 Met Ser Leu Asp Phe 375 Tyr Thr Lys Val Leu 380 Lys Ser Cys Arg
Ser 365 Leu Leu Glu Ser Val 390 Gin Lys Leu Asp Leu 395 Glu Ala Thr Ile Asp 400
Lys Val Val Lys Ile 405 Tyr Asp Ala Leu Ile 410 Tyr Met Gin Val Asn 415 Ser
Ser Phe Glu Asp 420 His Ile Leu Glu Asp 425 Leu Cys Gly Met Leu 430 Ser Leu
Pro Trp Ile 435 Tyr Ser His Ser Asp 440 Asp Gly Cys Leu Lys 445 Leu Thr Thr
Phe Ala 450 Ala Asn Leu Leu Thr 455 Leu Ser Cys Arg Ile 460 Ser Asp Ser Tyr
Ser 465 Pro Gin Ala Gin Ser 470 Arg Cys Val Phe Leu 475 Leu Thr Leu Phe Pro 480
Arg Arg Ile Phe Leu 485 Glu Trp Arg Thr Ala 490 Val Tyr Asn Trp Ala 495 Leu
Gin Ser Ser His 500 Glu Val Ile Arg Ala 505 Ser Cys Val Ser Gly 510 Phe Phe
• ·
- 193 -
Ile Leu Leu 515 Gin Gin Gin Asn Ser 520 Cys Asn Arg Val Pro 525 Lys Ile Leu
Ile Asp 530 Lys Val Lys Asp Asp 535 Ser Asp Ile Val Lys 540 Lys Glu Phe Ala
Ser 545 Ile Leu Gly Gin Leu 550 Val Cys Thr Leu His 555 Gly Met Phe Tyr Leu 560
Thr Ser Ser Leu Thr 565 Glu Pro Phe Ser Glu 570 His Gly His Val Asp 575 Leu
Phe Cys Arg Asn 580 Leu Lys Ala Thr Ser 585 Gin His Glu Cys Ser 590 Ser Ser
Gin Leu Lys 555 Ala Ser Val Cys Lys 600 Pro Phe Leu Phe Leu 605 Leu Lys Lys
Lys Ile 610 Pro Ser Pro Val Lys 615 Leu Ala Phe Ile Asp 620 Asn Leu His His
Leu 625 Cys Lys His Leu Asp 630 Phe Arg Glu Asp Glu 635 Thr Asp Val Lys Ala 640
Val Leu Gly Thr Leu 645 Leu Asn Leu Met Glu 650 Asp Pro Asp Lys Asp 655 Val
Arg Val Ala Phe 660 Ser Gly Asn Ile Lys 665 His Ile Leu Glu Ser 670 Leu Asp
Ser Glu Asp 675 Gly Phe Ile Lys Glu 680 Leu Phe Val Leu Arg 685 Met Ly6 Glu
Ala Tyr 690 Thr His Ala Gin Ile 695 Ser Arg Asn Asn Glu 700 Leu Lys Asp Thr
Leu 705 Ile Leu Thr Thr Gly 710 Asp Ile Gly Arg Ala 715 Ala Lys Gly Asp Leu 720
Val Pro Phe Ala Leu 725 Leu His Leu Leu His 730 Cys Leu Leu Ser Lys 735 Ser
Ala Ser Val Ser 740 Gly Ala Ala Tyr Thr 745 Glu Ile Arg Ala Leu 750 Val Ala
Ala Lys Ser 755 Val Lys Leu Gin Ser 760 Phe Phe Ser Gin Tyr 765 Lys Lys Pro
Ile Cys 770 Gin Phe Leu Val Glu 775 Ser Leu His Ser Ser 780 Gin Met Thr Ala
Leu 785 Pro Asn Thr Pro Cys 790 Gin Asn Ala Asp Val 795 Arg Lys Gin Asp Val 800
Ala His Gin Arg Glu 805 Met Ala Leu Asn Thr 810 Leu Ser Glu Ile Ala 815 Asn
Val Phe Asp Phe 820 Pro Asp Leu Asn Arg 825 Phe Leu Thr Arg Thr 830 Leu Gin
Val Leu Leu 835 Pro Asp Leu Ala Ala 640 Lys Ala Ser Pro Ala 845 Ala Ser Ala
Leu Ile 850 Arg Thr Leu Gly Lys 855 Gin Leu Asn Val Asn 860 Arg Arg Glu Ile
• · · ·
- 194 - • · • · · « « · '
Leu Ile Asn Asn Phe Lys Tyr Ile Phe Ser His Leu Val Cys Ser Cys
665 870 875 880
Ser Lys Asp Glu Leu Glu Arg Ala Leu His Tyr Leu Lys Asn Glu Thr
885 890 895
Glu Ile Glu Leu Gly Ser Leu Leu Arg Gin Asp Phe Gin Gly Leu His
900 905 910
Asn Glu Leu Leu Leu Arg Ile Gly Glu His Tyr Gin Gin Val Phe Asn
915 920 925
Gly Leu Ser Ile Leu Ala Ser Phe Ala Ser Ser Asp Asp Pro Tyr Gin
930 935 940
Gly Pro Arg Asp Ile Ile Ser Pro Glu Leu Met Ala Asp Tyr Leu Gin
945 950 955 960
Pro Lys Leu Leu Gly Ile Leu Ala Phe Phe Asn Met Gin Leu Leu Ser
965 970 975
Ser Ser Val Gly Ile Glu Asp Lys Lys Met Ala Leu Asn Ser Leu Met
980 985 990
Ser Leu Met Lys Leu Met Gly Pro Lys His Val Ser Ser Val Arg Val
995 1000 1005
Lys Met Met Thr Thr Leu Arg Thr Gly Leu Arg Phe Lys Asp Asp Phe
1010 1015 1020
Pro Glu Leu Cys Cys Arg Ala Trp Asp Cys Phe Val Arg Cys Leu Asp
1025 1030 1035 1040
His Ala Cys Leu Gly Ser Leu Leu Ser His Val Ile Val Ala Leu Leu
1045 1050 1055
Pro Leu Ile His Ile Gin Pro Lys Glu Thr Ala Ala Ile Phe His Tyr
1060 1065 1070
Leu Ile Ile Glu Asn Arg Asp Ala Val Gin Asp Phe Leu His Glu Ile
1075 1080 1085
Tyr Phe Leu Pro Asp His Pro Glu Leu Lys Lys Ile Lys Ala Val Leu
1090 1095 1100
Gin Glu Tyr Arg Lys Glu Thr Ser Glu Ser Thr Asp Leu Gin Thr Thr
1105 HIC 1115 1120
Leu Gin Leu Ser Met Lys Ala Ile Gin His Glu Asn Val Asp Val Arg
1125 1130 1135
Ile His Ala Leu Thr Ser Leu Lys Glu Thr Leu Tyr Lys Asn Gin Glu
1140 1145 1150
Lys Leu Ile Lys Tyr Ala Thr Asp Ser Glu Thr Val Glu Pro Ile Ile
1155 1160 1165
Ser Gin Leu Val Thr Val Leu Leu Lys Gly Cys Gin Asp Ala Asn Ser
1170 1175 1180
Gin Ala Arg Leu Leu Cys Gly Glu Cys Leu Gly Glu Leu Gly Ala Ile
1185 1190 1195 1200
Asp Pro Gly Arg Leu Asp Phe Ser Thr Thr Glu Thr Gin Gly Lys Asp
1205 1210 1215
• · · ·
Phe Thr Phe Val Thr Gly 1220 Val Glu Asp Ser Ser Phe Ala Tyr Gly Leu
1225 1230
Leu Met Glu Leu Thr Arg Ala Tyr Leu Ala Tyr Ala Asp Asn Ser Arg
1235 1240 1245
Ala Gin Asp Ser Ala Ala Tyr Ala Ile Gin Glu Leu Leu Ser Ile Tyr
1250 1255 1260
Asp Cys Arg Glu Met Glu Thr Asn Gly Pro Gly His Gin Leu Trp Arg
1265 1270 1275 1280
Arg Phe Pro Glu His Val Arg Glu Ile Leu Glu Pro His Leu Asn Thr
1285 1290 1295
Arg Tyr Lys Ser Ser Gin Lys Ser Thr Asp Trp Ser Gly Val Lys Lys
1300 1305 1310
Pro Ile Tyr Leu Ser Lys Leu Gly Ser Asn Phe Ala Glu Trp Ser Ala
1315 1320 1325
Ser Trp Ala Gly Tyr Leu Ile Thi Lys Val Arg His Asp Leu Ala Ser
1330 1335 i 1340
Lys Ile Phe Thr Cys Cys Ser Ile Met Met Lys His Asp Phe Lys Val
1345 1350 1355 1360
Thr Ile Tyr Leu Leu Pro His Ile Leu Val Tyr Val Leu Leu Gly Cys
1365 1370 1375
Asn Gin Glu Asp Gin Gin Glu Val Tyr Ala Glu Ile Met Ala Val Leu
1380 1385 1390
Lys His Asp Asp Gin His Thr Ile Asn Thr Gin Asp Ile Ala Ser Asp
1395 1400 1405
Leu Cys Gin Leu Ser Thr Gin Thr Val Phe Ser Met Leu Asp His Leu
1410 1415 i 1420
Thr Gin Trp Ala Arg His Lys Phe Gin Ala Leu Lys Ala Glu Lys Cys
1425 1430 1435 1440
Pro His Ser Lys Ser Asn Arg Asn Ly6 Val Asp Ser Met Val Ser Thr
1445 1450 1455
Val Asp Tyr Glu Asp Tyr Gin Ser Val Thr Arg Phe Leu Asp Leu Ile
1460 1465 1470
Pro Gin Asp Thr Leu Ala Val Ala Ser Phe Arg Ser Lys Ala Tyr Thr
1475 1480 1485
Arg Ala Val Met His Phe Glu Ser Phe Ile Thr Glu Lys Lys Gin Asn
1490 1495 i 1500
Ile Gin Glu His Leu Gly Phe Leu Gin Lys Leu Tyr Ala Ala Met His
1505 1510 1515 1520
Glu Pro Asp. Gly Val Ala Gly Val Ser Ala Ile Arg Lys Ala Glu Pro
1525 1530 1535
Ser Leu Lys Glu Gin Ile Leu Glu His Glu Ser Leu Gly Leu Leu Arg
1540 1545 1550 .
Asp Ala Thr Ala Cys Tyr Asp Arg Ala Ile Gin Leu Glu Pro Asp Gin
1555 1560 1565
• · ♦ · • · · • · · • · ·
- 196 - .....
Ile Ile His 1570 Tyr His Gly Val Val 1575 Lys Ser Met Leu Gly Leu Gly 1580 Gin
Leu Ser Thr Val Ile Thr Gin Val Asn Gly Val His Ala Asn Arg Ser
1565 1590 1595 1600
Glu Trp Thr Asp Glu Leu Asn Thr Tyr Arg Val Glu Ala Ala Trp Lys
1605 1610 1615
Leu Ser Gin Trp Asp Leu Val Glu Asn Tyr Leu Ala Ala Asp Gly Lys
1620 1625 1630
Ser Thr Thr Trp Ser Val Arg Leu Gly Gin Leu Leu Leu Ser Ala Lys
1635 1640 1645
Lys Arg Asp Ile Thr Ala Phe Tyr Asp Ser Leu Lys Leu Val Arg Ala
1650 1655 1660
Glu Gin Ile Val Pro Leu Ser Ala Ala Ser Phe Glu Arg Gly Ser Tyr
1665 1670 1675 1680
Gin Arg Gly Tyr Glu Tyr Ile Val Arg Leu His Met Leu Cys Glu Leu
1685 1690 1695
Glu His Ser Ile Lys Pro Leu Phe Gin His Ser Pro Gly Asp Ser Ser
1700 1705 i 1710
Gin Glu Asp Ser Leu Asn Trp Val Ala Arg Leu Glu Met Thr Gin Asn
1715 1720 1725
Ser Tyr Arg Ala Lys Glu Pro Ile Leu Ala Leu Arg Arg Ala Leu Leu
1730 1735 1740
Ser Leu Asn Lys Arg Pro Asp Tyr Asn Glu Met Val Gly Glu Cys Trp
1745 1750 1755 1760
Leu Gin Ser Ala Arg Val Ala Arg Lys Ala Gly His His Gin Thr Ala
1765 1770 177S
Tyr Asn Ala Leu Leu Asn Ala Gly Glu Ser Arg Leu Ala Glu Leu Tyr
1780 1785 i 1790
Val Glu Arg Ala Lys Trp Leu Trp Ser Lys Gly Asp Val His Gin Ala
1795 1800 1805
Leu Ile Val Leu Gin Lys Gly Val Glu Leu Cys Phe Pro Glu Asn Glu
1810 1815 1820
Thr Pro Pro Glu Gly Lys Asn Met Leu Ile His Gly Arg Ala Met Leu
1825 1830 1835 1840
Leu Val Gly Arg Phe Met Glu Glu Thr Ala Asn Phe Glu Ser Asn Ala
1845 1850 1855
Ile Met Lys Lys Tyr Lys Asp Val Thr Ala Cys Leu Pro Glu Trp Glu
1860 1865 ί 1870
Asp Gly His Phe Tyr Leu Ala Lys Tyr Tyr Asp Lys Leu Met Pro Met
1875 1880 1885
Val Thr Asp Asn Lys Met Glu Lys Gin Gly Asp Leu Ile Arg Tyr Ile
1890 1895 1900
Val Leu His Phe Gly Arg Ser Leu Gin Tyr Gly Asn Gin Phe Ile Tyr 1905 1910 1915 1920 • ·
Gin Ser Met Pro Arg Met 1925 Leu Thr Leu Trp Leu Asp Tyr Gly Thr Lys
1930 1935
Ala Tyr Glu Trp Glu Lys Ala Gly Arg Ser Asp Arg Val Gin Met Arg
1940 1945 1950
Asn Asp Leu Gly Lys Ile Asn Lys Val Ile Thr Glu His Thr Asn Tyr
1955 1960 1965
Leu Ala Pro Tyr Gin Phe Leu Thr Ala Phe Ser Gin Leu Ile Ser Arg
1970 1975 1980
Ile Cys His Ser His Asp Glu Val Phe Val Val Leu Met Glu Ile Ile
1985 1990 1995 2000
Ala Lys Val Phe Leu Ala Tyr Pro Gin Gin Ala Met Trp Met Met Thr
2005 2010 2015
Ala Val Ser Lys Ser Ser Tyr Pro Met Arg Val Asn Arg Cys Lys Glu
2020 2025 2030
Ile Leu Asn Lys Ala Ile His Met Lys Lys Ser Leu Glu Lys Phe Val
2035 2040 2045
Gly Asp Ala Thr Arg Leu Thr Asp Lys Leu Leu Glu Leu Cys Asn Lys
2050 2055 2060
Pro Val Asp Gly Ser Ser Ser Thr Leu Ser Met Ser Thr His Phe Lys
2065 2070 2075 2080
Met Leu Lys Lys Leu Val Glu Glu Ala Thr Phe Ser Glu Ile Leu Ile
2085 2090 2095
Pro Leu Gin Ser Val Met Ile Pro Thr Leu Pro Ser Ile Leu Gly Thr
2100 2105 2110
His Ala Asn His Ala Ser His Glu Pro Phe Pro Gly His Trp Ala Tyr
2115 2120 2125
Ile Ala Gly Phe Asp Asp Met Val Glu Ile Leu Ala Ser Leu Gin Lys
2130 2135 2140
Pro Lys Lys Ile Ser Leu Lys Gly Ser Asp Gly Lys Phe Tyr Ile Met
2145 2150 2155 2160
Met Cys Lys Pro Lys Asp Asp Leu Arg Lys Asp Cys Arg Leu Met Glu
2165 2170 2175
Phe Asn Ser Leu Ile Asn Lys Cys Leu Arg Lys Asp Ala Glu Ser Arg
2180 2185 2190
Arg Arg Glu Leu His Ile Arg Thr Tyr Ala Val Ile Pro Leu Asn Asp
2195 1 2200 2205
Glu Cys Gly Ile Ile Glu Trp Val Asn Asn Thr Ala Gly Leu Arg Pro
221C ) 2215 2220
Ile Leu Thr Lys Leu Tyr Lys Glu Lys Gly Val Tyr Met Thr Gly Lys
2225 2230 2235 2240
Glu Leu Arg Gin Cys Met Leu Pro Lys Ser Ala Ala Leu Ser Glu Lys
2245 2250 2255
Leu Lys Val Phe Arg Glu Phe Leu Leu Pro Arg His Pro Pro Ile Phe
2260 2265 2270
198
His Glu Trp Phe 2275 Leu Arg Thr Phe Pro Asp 2280 Pro Thr Ser Trp Tyr 2285 Ser
Ser Arg Ser Ala Tyr Cys Arg Ser Thr Ala Val Met Ser Met Val Gly
2290 2295 2300
Tyr Ile Leu Gly Leu Gly Asp Arg His Gly Glu Asn Ile Leu Phe Asp
2305 2310 2315 2320
Ser Leu Thr Gly Glu Cys Val His Val Asp Phe Asn Cys Leu Phe Asn
2325 2330 2335
Lys Gly Glu Thr Phe Glu Val Pro Glu Ile Val Pro Phe Arg Leu Thr
2340 2345 2350
His Asn Met Val Asn Gly Met Gly Pro Met Gly Thr Glu Gly Leu Phe
2355 2360 2365
Arg Arg Ala Cys Glu Val Thr Met Arg Leu Met Arg Asp Gin Arg Glu
2370 2375 2380
Pro Leu Met Ser Val Leu Lys Thr Phe Leu His Asp Pro Leu Val Glu
2385 2390 2395 2400
Trp Ser Lys Pro Val Lys Gly His Ser Lys Ala Pro Leu Asn Glu Thr
2405 i 2410 2415
Gly Glu Val Val Asn Glu Lys Ala Lys Thr His Val Leu Asp Ile Glu
2420 2425 2430
Gin Arg Leu Gin Gly Val Ile Lys Thr Arg Asn Arg Val Thr Gly Leu
2435 2440 2445
Pro Leu Ser Ile Glu Gly His Val His Tyr Leu Ile Gin Glu Ala Thr
2450 2455 2460
Asp Glu Asn Leu Leu Cys Gin Met Tyr Leu Gly Trp Thr Pro Tyr Met
2465 2470 2475 2480
(2) INFORMACE O SEQ ID NO:34:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 9385 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (v) TYP FRAGMENTU: lineární (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 190..9357 (xi) POPIS SEKVENCE: SEQ ID NO: 34:
GCGAGAGGAG TCGGGATCTG CGCTGCAGCC ACCGCCGCGG TTGATACTAC TTTGACCTTC 60
CGAGTGCAGT GAGGCATACA TCACAATTrG GAATTATGCA TTGGTTTATC AATTTACTTG 120
TTTATTGTCA CCCTGCTGCC CAGATATGAC TTCATGAGGA CAGTGATGTG TGTTCTGAAA 180
• · · • ·
- 199
TTGTGAACC ATG AGT CTA GTA CTT AAT GAT CTG CTT ATC TGC TGC CGT 22 8
Met Ser Leu Val Leu Asn Asp Leu Leu Ile Cys Cys Arg
10
-JOZ-
CAA Gin CTA Leu 15 GAA Glu CAT GAT AGA GCT ACA GAA CGA AAG AAA GAA GTT GAG AAA 276
His Asp Arg Ala 20 Thr Glu Arg Lys Lys 25 Glu Val Glu Lys
TTT AAG CGC CTG ATT CGA GAT CCT GAA ACA ATT AAA CAT CTA GAT CGG 324
Phe Lys Arg Leu Ile Arg Asp Pro Glu Thr Ile Lys His Leu Asp Arg
30 35 40 45
CAT TCA GAT TCC AAA CAA GGA AAA TAT TTG AAT TGG GAT GCT GTT TTT 372
His Ser Asp Ser Lys Gin Gly Lys Tyr Leu Asn Trp Asp Ala Val Phe
50 55 60
AGA TTT TTA CAG AAA TAT ATT CAG AAA GAA ACA GAA TGT CTG AGA ATA 420
Arg Phe Leu Gin Lys Tyr Ile Gin Lys Glu Thr Glu Cys Leu Arg Ile
65 70 75
GCA AAA CCA AAT GTA TCA GCC TCA ACA CAA GCC TCC AGG CAG AAA AAG 468
Ala Lys Pro Asn Val Ser Ala Ser Thr Gin Ala Ser Arg Gin Lys Lys
80 85 90
ATG CAG GAA ATC AGT AGT TTG GTC AAA TAC TTC ATC AAA TGT GCA AAC 516
Met Gin Glu Ile Ser Ser Leu Val Lys Tyr Phe Ile Lys Cys Ala Asn
95 100 105
AGA AGA GCA CCT AGG CTA AAA TGT CAA GAA CTC TTA AAT TAT ATC ATG 564
Arg Arg Ala Pro Arg Leu Lys Cys Gin Glu Leu Leu Asn Tyr Ile Met
110 115 120 125
GAT ACA GTG AAA GAT TCA TCT AAT GGT GCT ATT TAC GGA GCT GAT TGT 612
Asp Thr Val Lys Asp Ser Ser Asn Gly Ala Ile Tyr Gly Ala Asp Cys
130 135 140
AGC AAC ATA CTA CTC AAA GAC ATT CTT TCT GTG AGA AAA TAC TGG TGT 660
Ser Asn Ile Leu Leu Lys Asp Ile Leu Ser Val Arg Lys Tyr Trp Cys
145 150 155
GAA ATA TCT CAG CAA CAG TGG TTA GAA TTG TTC TCT GTG TAC TTC AGG 708
Glu Ile Ser Gin Gin Gin Trp Leu Glu Leu Phe Ser Val Tyr Phe Arg
160 165 170
CTC TAT CTG AAA CCT TCA CAA GAT GTT CAT AGA GTT TTA GTG GCT AGA 756
Leu Tyr Leu Lys Pro Ser Gin Asp Val His Arg Val Leu Val Ala Arg
175 180 185
ATA ATT CAT GCT GTT ACC AAA GGA TGC TGT TCT CAG ACT GAC GGA TTA 804
Ile Ile His Ala Val Thr Lys Gly Cys Cys Ser Gin Thr Asp Gly Leu
190 195 200 205
AAT TCC AAA TTT TTG GAC TTT TTT TCC AAG GCT ATT CAG TGT GCG AGA 852
Asn Ser Lys Phe Leu Asp Phe Phe Ser Lys Ala Ile Gin Cys Ala Arg
210 215 220
CAA GAA AAG AGC TCT TCA GGT CTA AAT CAT ATC TTA GCA GCT CTT ACT 900
Gin Glu Lys Ser Ser Ser Gly Leu Asn His Ile Leu Ala Ala Leu Thr
225 230 235
ATC TTC CTC AAG ACT TTG GCT GTC AAC TTT CGA ATT CGA GTG TGT GAA 940
Ile Phe Leu Lys Thr Leu Ala Val Asn Phe Arg Ile Arg Val Cys Glu
240 245 2S0
TTA GGA GAT GAA ATT CTT CCC ACT TTG CTT TAT ATT TGG ACT CAA CAT 996
Leu Gly Asp Glu Ile Leu Pro Thr Leu Leu Tyr Ile Trp Thr Gin His
255 260 265
• · · · · ·
200 • • · · • · • · • · ··· ····
AGG CTT AAT GAT TCT TTA AAA GAA GTC ATT ATT GAA TTA TTT CAA CTG 1044
Arg 270 Leu Asn Asp Ser Leu 275 Lys Glu Val Ile Ile 280 Glu Leu Phe Gin Leu 285
CAA ATT TAT ATC CAT CAT CCG AAA GGA GCC AAA ACC CAA GAA AAA GGT 1092
Gin Ile Tyr Ile His 290 His Pro Lys Gly Ala 295 Lys Thr Gin Glu Lys 300 Gly
GCT TAT GAA TCA ACA AAA TGG AGA AGT ATT TTA TAC AAC TTA TAT GAT 1140
Ala Tyr Glu Ser 305 Thr Lys Trp Arg Ser 310 Ile Leu Tyr Asn Leu 315 Tyr Asp
CTG CTA GTG AAT GAG ATA AGT CAT ATA GGA AGT AGA GGA AAG TAT TCT 1188
Leu Leu Val 320 Asn Glu Ile Ser His 325 Ile Gly Ser Arg Gly 330 Lys Tyr Ser
TCA GGA TTT CGT AAT ATT GCC GTC AAA GAA. AAT TTG ATT GAA TTG ATG 1236
Ser Gly 33S Phe Arg Asn Ile Ala 340 Val Lys Glu Asn Leu 345 Ile Glu Leu Met
GCA GAT ATC TGT CAC CAG GTT TTT AAT GAA GAT ACC AGA TCC TTG GAG 1284
Ala 350 Asp Ile Cys His Gin 355 Val Phe Asn Glu Asp 360 Thr Arg Ser Leu Glu 365
ATT TCT CAA TCT TAC ACT ACT ACA CAA AGA GAA TCT AGT GAT TAC AGT 1332
Ile Ser Gin Ser Tyr 370 Thr Thr Thr Gin Arg 375 Glu Ser Ser Asp Tyr 380 Ser
GTC CCT TGC AAA AGG AAG AAA ATA GAA CTA GGC TGG GAA GTA ATA AAA 1380
Val Pro Cys Lys 385 Arg Lys Lys Ile Glu 390 Leu Gly Trp Glu Val 395 Ile Lys
GAT CAC CTT CAG AAG TCA CAG AAT GAT TTT GAT CTT GTG CCT TGG CTA 1428
Αερ His Leu 400 Gin Lys Ser Gin Asn 405 Asp Phe Asp Leu Val 410 Pro Trp Leu
CAG ATT GCA ACC CAA TTA ATA TCA AAG TAT CCT GCA AGT TTA CCT AAC 1476
Gin Ile 415 Ala Thr Gin Leu Ile 420 Ser Lys Tyr Pro Ala 425 Ser Leu Pro Asn
TGT GAG CTG TCT CCA TTA CTG ATG ATA CTA TCT CAG CTT CTA CCC CAA 1524
Cys 430 Glu Leu Ser Pro Leu 435 Leu Met Ile Leu Ser 440 Gin Leu Leu Pro Gin 445
CAG CGA CAT GGG GAA CGT ACA CCA TAT GTG TTA CGA TGC CTT ACG GAA 1572
Gin Arg His Gly Glu 450 Arg Thr Pro Tyr Val 455 Leu Arg Cys Leu Thr 460 Glu
GTT GCA TTG TGT CAA GAC AAG AGG TCA AAC CTA GAA AGC TCA CAA AAG 1620
Val Ala Leu Cys 465 Gin Asp Lys Arg Ser 470 Asn Leu Glu Ser Ser 475 Gin Lys
TCA GAT TTA TTA AAA CTC TGG AAT AAA ATT TGG TGT ATT ACC TTT CGT 1668
Ser Asp Leu 4Θ0 Leu Lys Leu Trp Asn 485 Lys Ile Trp Cys Ile 490 Thr Phe Arg
GGT ATA AGT TCT GAG CAA ATA CAA GCT GAA AAC TTT GGC TTA CTT GGA 1716
Gly Ile 495 Ser Ser Glu Gin Ile 500 Gin Ala Glu Asn Phe 505 Gly Leu Leu Gly
GCC ATA ATT CAG GGT AGT TTA GTT GAG GTT GAC AGA GAA TTC TGG AAG 1764
Ala 510 Ile Ile Gin Gly Ser 515 Leu Val Glu Val Asp 520 Arg Glu Phe Trp Lys 525
TTA TTT ACT GGG TCA GCC TGC AGA CCT TCA TGT CCT GCA GTA TGC TGT 1812
Leu Phe Thr Gly Ser 530 Ala Cys Arg Pro Ser 535 Cys Pro Ala Val Cys 540 Cys
201 • · · · ·
TTG Leu ACT Thr TTG GCA CTG ACC ACC AGT ATA GTT CCA GGA GCG GTA AAA ATG Met 1860
Leu Ala 545 Leu Thr Thr Ser Ile 550 Val Pro Gly Ala Val 555 Lys
GGA ATA GAG CAA AAT ATG TGT GAA GTA AAT AGA AGC TTT TCT TTA AAG 1908
Gly Ile Glu Gin Asn Met Cys Glu Val Asn Arg Ser Phe Ser Leu Lys
560 565 570
GAA TCA ATA ATG AAA TGG CTC TTA TTC TAT CAG TTA GAG GGT GAC TTA 1956
Glu Ser Ile Met Lys Trp Leu Leu Phe Tyr Gin Leu Glu Gly Asp Leu
575 560 585
GAA AAT AGC ACA GAA GTG CCT CCA ATT CTT CAC AGT AAT TTT CCT CAT 2004
Glu Asn Ser Thr Glu Val Pro Pro Ile Leu His Ser Asn Phe Pro His
590 595 600 605
CTT GTA CTG GAG AAA ATT CTT GTG AGT CTC ACT ATG AAA AAC TGT AAA 2052
Leu Val Leu Glu Lys Ile Leu Val Ser Leu Thr Met Lys Asn Cys Lys
610 615 620
GCT GCA ATG AAT TTT TTC CAA AGC GTG CCA GAA TGT GAA CAC CAC CAA 2100
Ala Ala Met Asn Phe Phe Gin Ser Val Pro Glu Cys Glu His His Gin
625 630 635
AAA GAT AAA GAA GAA CTT TCA TTC TCA GAA GTA GAA GAA CTA TTT CTT 2148
Lys Asp Lys Glu Glu Leu Ser Phe Ser Glu Val Glu Glu Leu Phe Leu
640 645 650
CAG ACA ACT TTT GAC AAG ATG GAC TTT TTA ACC ATT GTG AGA GAA TGT 2196
Gin Thr Thr Phe Asp Lys Met Asp Phe Leu Thr Ile Val Arg Glu Cys
655 660 665
GGT ATA GAA AAG CAC CAG TCC AGT ATT GGC TTC TCT GTC CAC CAG AAT 2244
Gly Ile Glu Lys His Gin Ser Ser Ile Gly Phe Ser Val His Gin Asn
670 675 680 685
CTC AAG GAA TCA CTG GAT CGC TGT CTT CTG GGA TTA TCA GAA CAG CTT 2292
Leu Lys Glu Ser Leu Asp Arg Cys Leu Leu Gly Leu Ser Glu Gin Leu
690 695 700
CTG AAT AAT TAC TCA TCT GAG ATT ACA AAT TCA GAA ACT CTT GTC CGG 2340
Leu Asn Asn Tyr Ser Ser Glu Ile Thr Asn Ser Glu Thr Leu Val Arg
705 710 715
TGT TCA CGT CTT TTG GTG GGT GTC CTT GGC TGC TAC TGT TAC ATG GGT 2388
Cys Ser Arg Leu Leu Val Gly Val Leu Gly Cy6 Tyr Cys Tyr Met Gly
720 725 730
GTA ATA GCT GAA GAG GAA GCA TAT AAG TCA GAA TTA TTC CAG AAA GCC 2436
Val Ile Ala Glu Glu Glu Ala Tyr Lys Ser Glu Leu Phe Gin Lys Ala
735 740 745
AAC TCT CTA ATG CAA TGT GCA GGA GAA AGT ATC ACT CTG TTT AAA AAT 2484
Asn Ser Leu Met Gin Cys Ala Gly Glu Ser Ile Thr Leu Phe Lys Asn
750 755 760 765
AAG ACA AAT GAG GAA TTC AGA ATT GGT TCC TTG AGA AAT ATG ATG CAG 2532
Lys Thr Asn Glu Glu Phe Arg Ile Gly Ser Leu Arg Asn Met Met Gin
770 775 780
CTA TGT ACA CGT TGC TTG AGC AAC TGT ACC AAG AAG AGT CCA AAT AAG 2580
Leu Cys Thr Arg Cys Leu Ser Asn Cys Thr Lys Lys Ser Pro Asn Lys
765 790 795
ATT GCA TCT GGC TTT TTC CTG CGA TTG TTA ACA TCA AAG CTA ATG AAT 2628
Ile Ala Ser Gly Phe Phe Leu Arg Leu Leu Thr Ser Lys Leu Met Asn
800 805 810 • · · · · ·
- 202 -
GAC ATT GCA Ala GAT ATT TGT AAA AGT Ser TTA GCA TCC TTC ATC AAA Lys AAG Lys CCA Pro 2676
Asp Ile 815 Asp Ile Cys Lys 820 Leu Ala Ser Phe 825 ile
TTT GAC CGT GGA GAA GTA GAA TCA ATG GAA GAT GAT ACT AAT GGA AAT 2724
Phe 830 Asp Arg Gly Glu Val 835 Glu Ser Met Glu Asp 840 Asp Thr Asn Gly Asn 845
CTA ATG GAG GTG GAG GAT CAG TCA TCC ATG AAT CTA TTT AAC GAT TAC 2772
Leu Met Glu Val Glu 850 Asp Gin Ser Ser Met 855 Asn Leu Phe Asn Asp 860 Tyr
CCT GAT AGT AGT GTT AGT GAT GCA AAC GAA CCT GGA GAG AGC CAA AGT 2820
Pro Asp Ser Sex- 865 Val Ser Asp Ala Asn 870 Glu Pro Gly Glu Ser 875 Gin Ser
ACC ATA GGT GCC ATT AAT CCT TTA GCT GAA GAA TAT CTG TCA AAG CAA 2868
Thr Ile Gly 880 Ala Ile Asn Pro Leu 885 Ala Glu Glu Tyr Leu 890 Ser Lys Gin
GAT CTA CTT TTC TTA GAC ATG CTC AAG TTC TTG TGT TTG TGT GTA ACT 2916
Asp Leu 895 Leu Phe Leu Asp Met 900 Leu Lys Phe Leu Cys 905 Leu Cys Val Thr
ACT GCT CAG ACC AAT ACT GTG TCC TTT AGG GCA GCT GAT ATT CGG AGG 2964
Thr 910 Ala Gin Thr Asn Thr 915 Val Ser Phe Arg Ala 920 Ala Asp Ile Arg Arg 925
AAA TTG TTA ATG TTA ATT GAT TCT AGC ACG CTA GAA CCT ACC AAA TCC 3012
Lys Leu Leu Met Leu 930 Ile Asp Ser Ser Thr 935 Leu Glu Pro Thr Lys 940 Ser
CTC CAC CTG CAT ATG TAT CTA ATG CTT TTA AAG GAG CTT CCT GGA GAA 3060
Leu His Leu His 945 Met Tyr Leu Met Leu 950 Leu Lys Glu Leu Pro 955 Gly Glu
GAG TAC CCC TTG CCA ATG GAA GAT GTT CTT GAA CTT CTG AAA CCA CTA 3108
Glu Tyr Pro 960 Leu Pro Met Glu Asp 965 Val Leu Glu Leu Leu 970 Lys Pro Leu
TCC AAT GTG TGT TCT TTG TAT CGT CGT GAC CAA GAT GTT TGT AAA ACT 3156
Ser Asn 975 Val Cys Ser Leu Tyr 980 Arg Arg Asp Gin Asp 985 Val Cys Lys Thr
ATT TTA AAC CAT GTC CTT CAT GTA GTG AAA AAC CTA GGT CAA AGC AAT 3204
Ile 990 Leu Asn His Val Leu 995 His Val Val Lys Asn Leu 1000 Gly Gin Ser Asn 1005
ATG GAC TCT GAG AAC ACA AGG GAT GCT CAA GGA CAG TTT CTT ACA GTA 3252
Met Asp Ser Glu Asn Thr 1010 Arg Asp Ala Gin Gly 1015 Gin Phe Leu Thr Val 1020
ATT GGA GCA TTT TGG CAT CTA ACA AAG GAG AGG AAA TAT ATA TTC TCT 3300
Ile Gly Ala Phe Trp 1025 His Leu Thr Lys Glu 1030 Arg Lys Tyr Ile Phe 1035 Ser
GTA AGA ATG GCC CTA GTA AAT TGC CTT AAA ACT TTG CTT GAG GCT GAT 3348
Val Arg Met Ala 1040 Leu Val Asn Cys Leu 1045 Lys Thr Leu Leu Glu 1050 Ala Asp
CCT TAT TCA AAA TGG GCC ATT CTT AAT GTA ATG GGA AAA GAC TTT CCT 3396
Pro Tyr Ser 1055 Lys Trp Ala Ile Leu 1050 Asn Val Met Gly Lys 1065 Asp Phe Pro
GTA AAT GAA GTA TTT ACA CAA TTT CTT GCT GAC AAT CAT CAC CAA GTT 3444
Val Asn 1070 Glu Val Phe Thr Gin 1075 Phe Leu Ala Asp Asn 1080 His His Gin val 1085
- 203 -
CGC Arg ATG Met TTG Leu GCT Ala GCA GAG Ala Glu 1090 TCA Ser ATC Ile AAT Asn AGA TTG Arg Leu 1095 TTC Phe CAG Gin GAC Asp ACG AAG Thr Lys 1100 3492
GGA GAT TCT TCC AGG TTA CTG AAA GCA CTT CCT TTG AAG CTT CAG CAA 3540
Gly Asp Ser Ser Arg Leu Leu Lys Ala Leu Pro Leu Lys Leu Gin Gin
1105 1110 1115
ACA GCT TTT GAA AAT GCA TAC TTG AAA GCT CAG GAA GGA ATG AGA GAA 3588
Thr Ala Phe Glu Asn Ala Tyr Leu Lys Ala Gin Glu Gly Met Arg Glu
1120 1125 1130
ATG TCC CAT AGT GCT GAG AAC CCT GAA ACT TTG GAT GAA ATT TAT AAT 3636
Met Ser His Ser Ala Glu Asn Pro Glu Thr Leu Asp Glu Ile Tyr Asn
1135 1140 1145
AGA AAA TCT GTT TTA CTG ACG TTG ATA GCT GTG GTT TTA TCC TGT AGC 3684
Arg Lys Ser Val Leu Leu Thr Leu Ile Ala Val Val Leu Ser Cys Ser
115C 1155 1160 1165
CCT ATC TGC GAA AAA CAG GCT TTG TTT GCC CTG TGT AAA TCT GTG AAA 3732
Pro Ile Cys Glu Lys Gin Ala Leu Phe Ala Leu Cys Lys Ser Val Lys
1170 1175 1180
GAG AAT GGA TTA GAA CCT CAC CTT GTG AAA AAG GTT TTA GAG AAA GTT 3780
Glu Asn Gly Leu Glu Pro His Leu Val Lys Lys Val Leu Glu Lys Val
1185 1190 1195
TCT GAA ACT TTT GGA TAT AGA CGT TTA GAA GAC TTT ATG GCA TCT CAT 3828
Ser Glu Thr Phe Gly Tyr Arg Arg Leu Glu Asp Phe Met Ala Ser His
1200 1205 1210
TTA GAT TAT CTG GTT TTG GAA TGG CTA AAT CTT CAA GAT ACT GAA TAC 3876
Leu Asp Tyr Leu Val Leu Glu Trp Leu Asn Leu Gin Asp Thr Glu Tyr
1215 1220 1225
AAC TTA TCT TCT TTT CCT TTT ATT TTA TTA AAC TAC ACA AAT ATT GAG 3924
Asn Leu Ser Ser Phe Pro Phe Ile Leu Leu Asn Tyr Thr Asn Ile Glu
1230 1235 1240 1245
GAT TTC TAT AGA TCT TGT TAT AAG GTT TTG ATT CCA CAT CTG GTG ATT 3972
Asp Phe Tyr Arg Ser Cys Tyr Lys Val Leu Ile Pro His Leu Val Ile
1250 1255 1260
AGA AGT CAT TTT GAT GAG GTG AAG TCC ATT GCT AAT CAG ATT CAA GAG 4020
Arg Ser His Phe Asp Glu Val Lys Ser Ile Ala Asn Gin Ile Gin Glu
1265 1270 1275
GAC TGG AAA AGT CTT CTA ACA GAC TGC TTT CCA AAG ATT CTT GTA AAT 4068
Αερ Trp Lys Ser Leu Leu Thr Asp Cys Phe Pro Lys Ile Leu Val Asn
1280 1285 1290
ATT CTT CCT TAT TTT GCC TAT GAG GGT ACC AGA GAC AGT GGG ATG GCA 4116
Ile Leu Pro Tyr Phe Ala Tyr Glu Gly Thr Arg Asp Ser Gly Met Ala
1295 1300 1305
CAG CAA AGA GAG ACT GCT ACC AAG GTC TAT GAT ATG CTT AAA AGT GAA 4164
Gin Gin Arg Glu Thr Ala Thr Lys Val Tyr Asp Met Leu Lys Ser Glu
1310 1315 1320 1325
AAC TTA TTG GGA AAA CAG ATT GAT CAC TTA TTC ATT AGT AAT TTA CCA 4212
Asn Leu Leu Gly Lys Gin Ile Asp His Leu Phe Ile Ser Asn Leu Pro
1330 1335 1340
GAG ATT GTG GTG GAG TTA TTG ATG ACG TTA CAT GAG CCA GCA AAT TCT 4260
Glu Ile Val Val Glu Leu Leu Met Thr Leu His Glu Pro Ala Asn Ser
1345 1350 1355
• · · · · · • · · · · • · · • · · ·
- 204 -1 υ /
AGT Ser GCC Ala AGT CAG Ser Gin 1360 AGC ACT GAC Ser Thr Asp CTC TGT GAC TTT TCA GGG GAT TTG Leu GAT Asp 4308
Leu Cys 1365 Asp Phe Ser Gly Asp 1370
CCT GCT CCT AAT CCA CCT CAT TTT CCA TCG CAT GTG ATT AAA GCA ACA 4356
Pro Ala Pro Asn 1375 Pro Pro His Phe Pro 1380 Ser His Val Ile Lys 1385 Ala Thr
TTT GCC TAT ATC AGC AAT TGT CAT AAA ACC AAG TTA AAA AGC ATT TTA 4404
Phe Ala 1390 Tyr Ile Ser Asn Cys 1395 His Lys Thr Lys Leu Lys Ser 1400 Ile Leu 1405
GAA ATT CTT TCC AAA AGC CCT GAT TCC TAT CAG AAA ATT CTT CTT GCC 4452
Glu Ile Leu Ser Lys Ser Pro 1410 Asp Ser Tyr Gin 1415 Lys Ile Leu Leu Ala 1420
ATA TGT GAG CAA GCA GCT GAA ACA AAT AAT GTT TAT AAG AAG CAC AGA 4500
Ile Cys Glu Gin Ala Ala Glu 1425 Thr Asn Asn 1430 Val Tyr Lys Lys His 1435 Arg
ATT CTT AAA ATA TAT CAC CTG TTT GTT AGT TTA TTA CTG AAA GAT ATA 4548
Ile Leu Lys Ile 1440 Tyr His Leu Phe Val 1445 Ser Leu Leu Leu Lys 1450 Asp Ile
AAA AGT GGC TTA GGA GGA GCT TGG GCC TTT GTT CTT CGA GAC GTT ATT 4596
Lys Ser Gly Leu 1455 Gly Gly Ala Trp Ala 1460 Phe Val Leu Arg Asp 1465 Val Ile
TAT ACT TTG ATT CAC TAT ATC AAC CAA AGG CCT TCT TGT ATC ATG GAT 4644
Tyr Thr 1470 Leu Ile His Tyr Ile 1475 Asn Gin Arg Pro Ser Cys Ile 1480 Met Asp 1485
GTG TCA TTA CGT AGC TTC TCC CTT TGT TGT GAC TTA TTA AGT CAG GTT 4692
Val Ser Leu Arg Ser Phe Ser 1490 Leu Cys Cys Asp 1495 Leu Leu Ser Gin Val 1500
TGC CAG ACA GCC GTG ACT TAC TGT AAG GAT GCT CTA GAA AAC CAT CTT 4740
Cys Gin Thr Ala Val Thr Tyr 1505 Cys Lys Asp 1510 Ala Leu Glu Asn His 1515 Leu
CAT GTT ATT GTT GGT ACA CTT ATA CCC CTT GTG TAT GAG CAG GTG GAG 4788
His Val Ile Val 1520 Gly Thr Leu Ile Pro 1525 Leu Val Tyr Glu Gin 1530 Val Glu
GTT CAG AAA CAG GTA TTG GAC TTG TTG AAA TAC TTA GTG ATA GAT AAC 4836
Val Gin Lys Gin 1535 Val Leu Asp Leu Leu 1540 Lys Tyr Leu Val Ile 1545 Asp Asn
AAG GAT AAT GAA AAC CTC TAT ATC ACG ATT AAG CTT TTA GAT CCT TTT 4884
Lys Asp 1550 Asn Glu Asn Leu Tyr 1555 Ile Thr Ile Lys Leu Leu Asp 1560 Pro Phe 1565
CCT GAC CAT GTT GTT TTT AAG GAT TTG CGT ATT ACT CAG CAA AAA ATC 4932
Pro Asp His Val Val Phe Lys 1570 Asp Leu Arg Ile 1575 Thr Gin Gin Lys Ile 1580
AAA TAC AGT AGA GGA CCC TTT TCA CTC TTG GAG GAA ATT AAC CAT TTT 4980
Lys Tyr Ser Arg Gly Pro Phe 1585 Ser Leu Leu 1590 Glu Glu Ile Asn His 1595 Phe
CTC TCA GTA AGT GTT TAT GAT GCA CTT CCA TTG ACA AGA CTT GAA GGA 5028
Leu Ser Val Ser 1600 Val Tyr Asp Ala Leu 1605 Pro Leu Thr Arg Leu 1610 Glu Gly
CTA AAG GAT CTT CGA AGA CAA CTG GAA CTA CAT AAA GAT CAG ATG GTG 5076
Leu Lys Asp Leu Arg Arg Gin Leu Glu Leu His Lys Asp Gin Met Val
1615 1620 1625 • · · ·
- 205 -
GAC ATT ATG AGA GCT TCT CAG GAT AAT CCG Pro CAA GAT GGG ATT ATG GTG 5124
Asp Ile 1630 Met Arg Ala Ser Gin 1635 Asp Asn Gin Asp 1640 Gly Ile Met Val 1645
AAA CTA GTT GTC AAT TTG TTG CAG TTA TCC AAG ATG GCA ATA AAC CAC 5172
Lys Leu Val Val Asn Leu Leu 1650 Gin Leu Ser Lys Met 1655 Ala Ile Asn His 1660
ACT GGT GAA AAA GAA GTT CTA GAG GCT GTT GGA AGC TGC TTG GGA GAA 5220
Thr Gly Glu Lys Glu 1665 Val Leu Glu Ala Val 1670 Gly Ser Cys Leu Gly 1675 Glu
GTG GGT CCT ATA GAT TTC TCT ACC ATA GCT ATA CAA CAT AGT AAA GAT 5268
Val Gly Pro Ile 1680 Asp Phe Ser Thr Ile 1685 Ala Ile Gin His Ser 1690 Lys Asp
GCA TCT TAT ACC AAG GCC CTT AAG TTA TTT GAA GAT AAA GAA CTT CAG 5316
Ala Ser Tyr 1695 Thr Lys Ala Leu Lys 1700 Leu Phe Glu Asp Lys 1705 Glu Leu Gin
TGG ACC TTC ATA ATG CTG ACC TAC CTG AAT AAC ACA CTG GTA GAA GAT 5364
Trp Thr 1710 Phe Ile Met Leu Thr 1715 Tyr Leu Asn Asn Thr 1720 Leu Val Glu Asp 1725
TGT GTC AAA GTT CGA TCA GCA GCT GTT ACC TGT TTG AAA AAC ATT TTA 5412
Cys Val Lys Val Arg Ser Ala 1730 Ala Val Thr Cys Leu 1735 Lys Asn Ile Leu 1740
GCC ACA AAG ACT GGA CAT AGT TTC TGG GAG ATT TAT AAG ATG ACA ACA 5460
Ala Thr Lys Thr Gly 1745 His Ser Phe Trp Glu 1750 Ile Tyr Lys Met Thr 1755 Thr
GAT CCA ATG CTG GCC TAT CTA CAG CCT TTT AGA ACA TCA AGA AAA AAG 5508
Asp Pro Met Leu 1760 Ala Tyr Leu Gin Pro 1765 Phe Arg Thr Ser Arg 1770 Lys Lys
TTT TTA GAA GTA CCC AGA TTT GAC AAA GAA AAC CCT TTT GAA GGC CTG 5556
Phe Leu Glu 1775 Val Pro Arg Phe Asp 1780 Lys Glu Asn Pro Phe 1785 Glu Gly Leu
GAT GAT ATA AAT CTG TGG ATT CCT CTA AGT GAA AAT CAT GAC ATT TGG 5604
Asp Asp 1790 Ile Asn Leu Trp Ile 1795 Pro Leu Ser Glu Asn 1800 His Asp Ile Trp 1805
ATA AAG ACA CTG ACT TGT GCT TTT TTG GAC AGT GGA GGC ACA AAA TGT 5652
Ile Lys Thr Leu Thr Cys Ala 1810 Phe Leu Asp Ser Gly 1815 Gly Thr Lys Cys 1820
GAA ATT CTT CAA TTA TTA AAG CCA ATG TGT GAA GTG AAA ACT GAC TTT 5700
Glu Ile Leu Gin Leu 1825 Leu Lys Pro Met Cys 1830 Glu Val Lys Thr Asp 1835 Phe
TGT CAG ACT GTA CTT CCA TAC TTG ATT CAT GAT ATT TTA CTC CAA GAT 5748
Cys Gin Thr Val 1840 Leu Pro Tyr Leu Ile 1845 His Asp Ile Leu Leu 1850 Gin Asp
ACA AAT GAA TCA TGG AGA AAT CTG CTT TCT ACA CAT GTT CAG GGA TTT 5796
Thr Asn Glu 1Θ55 Ser Trp Arg Asn Leu 1860 Leu Ser Thr His Val 1865 Gin Gly Phe
TTC ACC AGC TGT CTT CGA CAC TTC TCG CAA ACG AGC CGA TCC ACA ACC 5844
Phe Thr 1870 Ser Cys Leu Arg His 1875 Phe Ser Gin Thr Ser 1880 Arg Ser Thr Thr 1885
CCT GCA AAC TTG GAT TCA GAG TCA GAG CAC TTT TTC CGA TGC TGT TTG 5892
Pro Ala Asn Leu Asp 1890 Ser Glu 1 Ser Glu His Phe Phe 1895 Arg Cys Cys Leu 1900
·· ···« ·· • · • · · • · · · • · · ··· ··
- 206 • ·· ·· · · • · • · • · t ·· » ·· «4 · ···· '107'
GAT Asp AAA AAA TCA CAA AGA ACA Thr ATG Met CTT GCT GTT GTG GAC TAC ATG AGA Val Asp Tyr Met Arg 1915 5940
Lys Lys Ser Gin Arg 1905 Leu Ala 1910 Val
AGA CAA AAG AGA CCT TCT TCA GGA ACA ATT TTT AAT GAT GCT TTC TGG 5988
Arg Gin Lys Arg Pro Ser 1920 Ser Gly Thr Ile 1925 Phe Asn Asp Ala Phe Trp 1930
CTG GAT TTA AAT TAT CTA GAA GTT GCC AAG GTA GCT CAG TCT TGT GCT 6036
Leu Asp Leu 1935 Asn Tyr Leu Glu 1941 Val 3 Ala Lys Val Ala Gin Ser Cys Ala 1945
GCT CAC TTT ACA GCT TTA CTC TAT GCA GAA ATC TAT GCA GAT AAG AAA 6084
Ala His 1950 Phe Thr Ala Leu Leu 1955 Tyr Ala Glu Ile Tyr Ala Asp Lys Lys 1960 1965
AGT ATG GAT GAT CAA GAG AAA AGA AGT CTT GCA TTT GAA GAA GGA AGC 6132
Ser Met Asp Aso Gin Glu 1970 Lys Arg Ser Leu Ala 1975 Phe Glu Glu Gly Ser 1980
CAG AGT ACA ACT ATT TCT AGC TTG AGT GAA AAA AGT AAA GAA GAA ACT 6180
Gin Ser Thr Thr Ile Ser 1985 Ser Leu Ser Glu 1990 Lys Ser Lys Glu Glu Thr 1995
GGA ATA AGT TTA CAG GAT CTT CTC TTA GAA ATC TAC AGA AGT ATA GGG 6228
Gly Ile Ser Leu Gin Asp 2000 Leu Leu Leu Glu 2005 Ile Tyr Arg Ser Ile Gly 2010
GAG CCA GAT AGT TTG TAT GGC TGT GGT GGA GGG AAG ATG TTA CAA CCC 6276
Glu Pro Asp 2015 Ser Leu Tyr Gly Cys 2020 Gly Gly Gly Lys Met Leu Gin Pro 2025
ATT ACT AGA CTA CGA ACA TAT GAA CAC GAA GCA ATG TGG GGC AAA GCC 6324
Ile Thr 2030 Arg Leu Arg Thr Tyr 2035 Glu His Glu Ala Met Trp Gly Lys Ala 2040 2045
CTA GTA ACA TAT GAC CTC GAA ACA GCA ATC CCC TCA TCA ACA CGC CAG 6372
Leu Val Thr Tyr Asp Leu 2050 Glu Thr Ala Ile Pro 2055 Ser Ser Thr Arg Gin 2060
GCA GGA ATC ATT CAG GCC TTG CAG AAT TTG GGA CTC TGC CAT ATT CTT 6420
Ala Gly Ile Ile Gin Ala 2065 Leu Gin Asn Leu 2070 Gly Leu Cys His Ile Leu 2075
TCC GTC TAT TTA AAA GGA TTG GAT TAT GAA AAT AAA GAC TGG TGT CCT 6468
Ser val Tyr Leu Lys Gly 2080 Leu Asp Tyr Glu 2085 Asn Lys Asp Trp Cys Pro 2090
GAA CTA GAA GAA CTT CAT TAC CAA GCA GCA TGG AGG AAT ATG CAG TGG 6516
Glu Leu Glu 2095 Glu Leu His Tyr Gin 2100 Ala Ala Trp Arg Asn Met Gin Trp 2105
GAC CAT TGC ACT TCC GTC AGC AAA GAA GTA GAA GGA ACC AGT TAC CAT 6564
Asp His 2110 Cys Thr Ser Val Ser 2115 Lys Glu Val Glu Gly Thr Ser Tyr His 2120 2125
GAA TCA TTG TAC AAT GCT CTA CAA TCT CTA AGA GAC AGA GAA TTC TCT 6612
Glu Ser Leu Tyr Asn Ala 2130 Leu Gin Ser Leu Arg 2135 Asp Arg Glu Phe Ser 2140
ACA TTT TAT GAA AGT CTC AAA TAT GCC AGA GTA AAA GAA GTG GAA GAG 6660
Thr Phe Tyr Glu Ser Leu 2145 Lys Tyr Ala Arg 2150 Val Lys Glu Vál Glu Glu 2155
ATG· TGT AAG CGC AGC CTT GAG TCT GTG TAT TCG CTC TAT CCC ACA CTT 6708
Met Cys Lys Arg Ser Leu Glu Ser Val Tyr Ser Leu Tyr Pro Thr Leu
2160 2165 2170
207
AGC Ser AGG TTG Arg Leu 2175 CAG Gin GCC Ala ATT Ile GGA GAG Gly Glu 2180 CTG Leu GAA Glu AGC Ser ATT GGG Ile Gly 2185 GAG Glu CTT Leu TTC Phe 6756
TCA AGA TCA GTC ACA CAT AGA CAA CTC TCT GAA GTA TAT ATT AAG TGG 6804
Ser Arg Ser Val Thr His Arg Gin Leu Ser Glu Val Tyr Ile Lys Trp
2190 2195 2200 2205
CAG AAA CAC TCC CAG CTT CTC AAG GAC AGT GAT TTT AGT TTT CAG GAG 6852
Gin Lys His Ser Gin Leu Leu Lys Asp Ser Asp Phe Ser Phe Gin Glu
2210 2215 2220
CCT ATC ATG GCT CTA CGC ACA GTC ATT TTG GAG ATC CTG ATG GAA AAG 6900
Pro Ile Met Ala Leu Arg Thr Val Ile Leu Glu Ile Leu Met Glu Lys
2225 2230 2235
GAA ATG GAC AAC TCA CAA AGA GAA TGT ATT AAG GAC ATT CTC ACC AAA 6948
Glu Met Asp Asn Ser Gin Arg Glu Cys Ile Lys Asp Ile Leu Thr Lys
2240 2245 2250
CAC CTT GTA GAA CTC TCT ATA CTG GCC AGA ACT TTC AAG AAC ACT CAG 6996
His Leu Val Glu Leu Ser Ile Leu Ala Arg Thr Phe Lys Asn Thr Gin
2255 2260 2265
CTC CCT GAA AGG GCA ATA TTT CAA ATT AAA CAG TAC AAT TCA GTT AGC 7044
Leu Pro Glu Arg Ala Ile Phe Gin Ile Lys Gin Tyr Asn Ser Val Ser
2270 2275 2280 2285
TGT GGA GTC TCT GAG TGG CAG CTG GAA GAA GCA CAA GTA TTC TGG GCA 7092
Cys Gly Val Ser Glu Trp Gin Leu Glu Glu Ala Gin Val Phe Trp Ala
2290 2295 2300
AAA AAG GAG CAG AGT CTT GCC CTG AGT ATT CTC AAG CAA ATG ATC AAG 7140
Lys Lys Glu Gin Ser Leu Ala Leu Ser Ile Leu Lys Gin Met Ile Lys
2305 2310 2315
AAG TTG GAT GCC AGC TGT GCA GCG AAC AAT CCC AGC CTA AAA CTT ACA 7188
Lys Leu Asp Ala Ser Cys Ala Ala Asn Asn Pro Ser Leu Lys Leu Thr
2320 2325 2330
TAC ACA GAA TGT CTG AGG GTT TGT GGC AAC TGG TTA GCA GAA ACG TGC 7236
Tyr Thr Glu Cys Leu Arg Val Cys Gly Asn Trp Leu Ala Glu Thr Cys
2335 2340 2345
TTA GAA AAT CCT GCG GTC ATC ATG CAG ACC TAT CTA GAA AAG GCA GTA 7284
Leu Glu Asn Pro Ala Val Ile Met Gin Thr Tyr Leu Glu Lys Ala Val
2350 2355 2360 2365
GAA GTT GCT GGA AAT TAT GAT GGA GAA AGT AGT GAT GAG CTA AGA AAT 7332
Glu Val Ala Gly Asn Tyr Asp Gly Glu Ser Ser Asp Glu Leu Arg Asn
2370 2375 2380
GGA AAA ATG AAG GCA TTT CTC TCA TTA GCC CGG TTT TCA GAT ACT CAA 7380
Gly Lys Met Lys Ala Phe Leu Ser Leu Ala Arg Phe Ser Asp Thr Gin
2385 2390 2395
TAC CAA AGA ATT GAA AAC TAC ATG AAA TCA TCG GAA TTT GAA AAC AAG 7428
Tyr Gin Arg Ile Glu Asn Tyr Met Lys Ser Ser Glu Phe Glu Asn Lys
2400 2405 2410
CAA GCT CTC CTG AAA AGA GCC AAA GAG GAA GTA GGT CTC CTT AGG GAA 7476
Gin Ala Leu Leu Lys Arg Ala Lys Glu Glu Val Gly Leu Leu Arg Glu
2415 2420 2425
CAT AAA ATT CAG ACA AAC AGA TAC ACA GTA AAG GTT CAG CGA GAG CTG 7524
His Lys Xle Gin Thr Asn Arg Tyr Thr Val Lys Val Gin Arg Glu Leu
2430 2435 2440 2445
• · β · • · · ·
GAG Glu TTG Leu GAT Asp GAA Glu TTA GCC Leu Ala 2450 CTG Leu CGT Arg GCA Ala CTG AAA Leu Lys 2455 GAG Glu GAT Asp CGT Arg AAA CGC Lys Arg 2460 7572
TTC TTA TGT AAA GCA GTT GAA AAT TAT ATC AAC TGC TTA TTA AGT GGA 7620
Phe Leu Cys Lys Ala Val 2465 Glu Asn Tyr Ile Asn 2470 Cys Leu Leu Ser Gly 2475
GAA GAA CAT GAT ATG TGG GTA TTC CGG CTT TGT TCC CTC TGG CTT GAA 7668
Glu Glu Hie Asp 2480 Met Trp Val Phe Arg 2485 Leu Cys Ser Leu Trp 2490 Leu Glu
AAT TCT GGA GTT TCT GAA GTC AAT GGC ATG ATG AAG AGA GAC GGA ATG 7716
Asn Ser Gly 2495 Val Ser Glu Val Asn 2500 Gly Met Met Lys Arg 2505 Asp Gly Met
AAG ATT CCA ACA TAT AAA TTT TTG CCT CTT ATG TAC CAA TTG GCT GCT 7764
Lys Ile 2510 Pro Thr Tyr Lys Phe 2515 Leu Pro Leu Met Tyr 2520 Gin Leu Ala Ala 2525
AGA ATG GGG ACC AAG ATG ATG GGA GGC CTA GGA TTT CAT GAA GTC CTC 7812
Arg Met Gly Thr Lys Met 2530 Met Gly Gly Leu Gly 2535 Phe His Glu Val Leu 2540
AAT AAT CTA ATC TCT AGA ATT TCA ATG GAT CAC CCC CAT CAC ACT TTG 7860
Asn Asn Leu Ile Ser Arg 2545 Ile Ser Met Asp His 2550 Pro His His Thr Leu 2555
TTT ATT ATA CTG GCC TTA GCA AAT GCA AAC AGA GAT GAA TTT CTG ACT 7908
Phe Ile Ile Leu 2560 Ala Leu Ala Asn Ala 2565 Asn Arg Asp Glu Phe 2570 Leu Thr
AAA CCA GAG GTA GCC AGA AGA AGC AGA ATA ACT AAA AAT GTG CCT AAA 7956
Lys Pro Glu 2575 Val Ala Arg Arg Ser 2580 Arg Ile Thr Lys Asn 2585 Val Pro Lys
CAA AGC TCT CAG CTT GAT GAG GAT CGA ACA GAG GCT GCA AAT AGA ATA 8004
Gin Ser 2590 Ser Gin Leu Asp Glu 2595 Asp Arg Thr Glu Ala 2600 Ala Asn Arg Ile 2605
ATA TGT ACT ATC AGA AGT AGG AGA CCT CAG ATG GTC AGA AGT GTT GAG 8052
Ile Cys Thr Ile Arg Ser 2610 Arg Arg Pro Gin Met 2615 Val Arg Ser Val Glu 2620
GCA CTT TGT GAT GCT TAT ATT ATA TTA GCA AAC TTA GAT GCC ACT CAG 8100
Ala Leu Cys Asp Ala Tyr 2625 Ile Ile Leu Ala Asn 2630 Leu Asp Ala Thr Gin 2635
TGG AAG ACT CAG AGA AAA GGC ATA AAT ATT CCA GCA GAC CAG CCA ATT 8148
Trp Lys Thr Gin 2640 Arg Lys Gly Ile Asn 2645 Ile Pro Ala Asp Gin 2650 Pro Ile
ACT AAA CTT AAG AAT TTA GAA GAT GTT GTT GTC CCT ACT ATG GAA ATT 8196
Thr Lys Leu 2655 Lys Asn Leu Glu Asp 2660 Val Val Val Pro Thr 2665 Met Glu Ile
AAG GTG . GAC CAC ACA GGA GAA TAT GGA AAT CTG GTG ACT ATA CAG TCA 8244
Lys Val 2670 Asp His Thr Gly Glu 2675 Tyr Gly Asn Leu Val 2680 Thr Ile Gin Ser 2685
TTT AAA GCA GAA TTT CGC TTA GCA GGA GGT GTA AAT TTA CCA AAA ATA 8292
Phe Lys Ala Glu Phe Arg 2690 Leu Ala Gly Gly Val 2695 Asn Leu Pro Lys Ile 2700
ATA GAT TGT GTA GGT TCC GAT GGC AAG GAG AGG AGA CAG CTT GTT AAG 8340
Ile Asp Cys Val 2705 Gly Ser Asp Gly Lys Glu Arg 2710 Arg Gin Leu Val Lys 2715
• · · ·
- 209 -
GGC Gly CGT Arg GAT GAC CTG Asp Asp Leu 2720 AGA CAA GAT GCT GTC ATG CAA Gin CAG GTC Gin Val 2730 TTC Phe CAG Gin 8388
Arg Gin Asp Ala Val 2725 Met
ATG TGT AAT ACA TTA CTG CAG AGA AAC ACG GAA ACT AGG AAG AGG AAA 8436
Met Cys Asn Thr Leu 2735 Leu Gin Arg Asn Thr 2740 Glu Thr Arg Lys 2745 Arg Lys
TTA ACT ATC TGT ACT TAT AAG GTG GTT CCC CTC TCT CAG CGA AGT GGT 8484
Leu Thr 2750 Ile Cys Thr Tyr Lys Val Val Pro 2755 Leu Ser 2760 Gin Arg Ser Gly 2765
GTT CTT GAA TGG TGC ACA GGA ACT GTC CCC ATT GGT GAA TTT CTT GTT 8532
Val Leu Glu Trp Cys Thr 2770 Gly Thr Val Pro Ile 2775 Gly Glu Phe Leu Val 2780
AAC AAT GAA GAT GGT GCT CAT AAA AGA TAC AGG CCA AAT GAT TTC AGT 8580
Asn Asn Glu Asp Gly 2785 Ala His Lys Arg Tyr 2790 Arg Pro Asn Asp Phe 2795 Ser
GCC TTT CAG TGC CAA AAG AAA ATG ATG GAG GTG CAA AAA AAG TCT TTT 8628
Ala Phe Gin Cys Gin 2800 Lys Lys Met Mec Glu 2805 Val Gin Lys Lys 2810 Ser Phe
GAA GAG AAA TAT GAA GTC TTC ATG GAT GTT TGC CAA AAT TTT CAA CCA 8676
Glu Glu Lys Tyr Glu 2815 Val Phe Met Asp Val 2820 Cys Gin Asn Phe 2825 Gin Pro
GTT TTC CGT TAC TTC TGC ATG GAA AAA TTC TTG GAT CCA GCT ATT TGG 8724
Val Phe 2830 Arg Tyr Phe Cys Met Glu Lys Phe 2835 Leu Asp 2B40 Pro Ala Ile Trp 2845
TTT GAG AAG CGA TTG GCT TAT ACG CGC AGT GTA GCT ACT TCT TCT ATT 8772
Phe Glu Lys Arg Leu Ala 2850 Tyr Thr Arg Ser Val 2855 Ala Thr Ser Ser Ile 2860
GTT GGT TAC ATA CTT GGA CTT GGT GAT AGA CAT GTA CAG AAT ATC TTG - 8820
Val Gly Tyr Ile Leu 2865 Gly Leu Gly Asp Arg 2870 His Val Gin Asn Ile 2875 Leu
ATA AAT GAG CAG TCA GCA GAA CTT GTA CAT ATA GAT CTA GGT GTT GCT 8868
Ile Asn Glu Gin Ser 2880 Ala Glu Leu Val His 2885 Ile Asp Leu Gly 2890 Val Ala
TTT GAA CAG GGC AAA ATC CTT CCT ACT CCT GAG ACA GTT CCT TTT AGA 8916
Phe Glu Gin Gly Lys 2895 Ile Leu Pro Thr Pro 2900 Glu Thr Val Pro 2905 Phe Arg
CTC ACC AGA GAT ATT GTG GAT GGC ATG GGC ATT ACG GGT GTT GAA GGT 8964
Leu Thr 2910 Arg Asp Ile Val Asp Gly Met Gly 2915 Ile Thr 2920 Gly Val Glu Gly 2925
GTC TTC AGA AGA TGC TGT GAG AAA ACC ATG GAA GTG ATG AGA AAC TCT 9012
Val Phe Arg Arg Cys Cys 2930 Glu Lys Thr Met Glu 2935 Val Met Arg Asn Ser 2940
CAG GAA ACT CTG TTA ACC ATT GTA GAG GTC CTT CTA TAT GAT CCA CTC 9060
Gin Glu Thr Leu Leu 2945 Thr Ile Val Glu Val 2950 Leu Leu Tyr Asp Pro 2955 Leu
TTT GAC TGG ACC ATG AAT CCT TTG AAA GCT TTG TAT TTA CAG CAG AGG 9108
Phe Asp Trp Thr Met 2960 Asn Pro Leu Lys Ala 2965 Leu Tyr Leu Gin 2970 Gin Arg 4
CCG GAA GAT GAA ACT GAG CTT CAC CCT ACT CTG AAT GCA GAT GAC CAA 9156
Pro Glu Asp Glu Thr Glu Leu His Pro Thr Leu Asn Ala Asp Asp Gin
2975 2980 2985
- 210
- i
GAA TGC Glu Cys 2990 AAA Lys CGA Arg AAT Asn CTC AGT Leu Ser 2995 GAT Asp ATT Ile GAC Asp CAG AGT Gin Ser 3000 TTC Phe GAC Asp AAA Lys GTA Val 3005 9204
GCT GAA CGT GTC TTA ATG AGA CTA CAA GAG AAA CTG AAA GGA GTG GAA 9252
Ala Glu Arg Val Leu Met Arg 3010 Leu Gin Glu Lys Leu 3015 Lys Gly Val Glu 3020
GAA GGC ACT GTG CTC AGT GTT GGT GGA CAG GTG AAT TTG CTC ATA CAG 9300
Glu Gly Thr Val 3025 Leu Ser Val Gly Gly Gin 3030 Val Asn Leu Leu Ile 3035 Gin
CAG GCC ATA GAC CCC AAA AAT CTC AGC CGA CTT TTC CCA GGA TGG AAA 9348
Gin Ala Ile Asp 3040 Pro Lys Asn Leu 3045 Ser 1 Arg Leu Phe Pro 3050 Gly 1 Trp Lys
GCT TGG GTG TGATCTTCAG TATATGAATT ACCCTTTC 93 85
Ala Trp Val
3055 (2) INFORMACE O SEQ ID NO:35:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 3056 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein
( xi) POPIS SEKVENCE: SEQ ID NO: 35:
Met 1 Ser Leu Val Leu 5 Asn Asp Leu Leu Ile 10 Cys Cys Arg Gin Leu Glu 15
His Asp Arg Ala Thr 20 Glu Arg Lys Lys 25 Glu Val Glu Lys Phe Lys Arg 30
Leu Ile Arg 35 Asp Pro Glu Thr Ile 40 Lys His Leu Asp Arg His Ser Asp 45
Ser Lys 50 Gin Gly Lys Tyr Leu Asn 55 Trp Asp Ala Val Phe Arg Phe Leu 60
Gin 65 Lys Tyr Ile Gin Lys Glu Thr 70 Glu Cys Leu 75 Arg Ile Ala Lys Pro 80
Asn Val Ser Ala Ser 85 Thr Gin Ala Ser Arg 90 Gin Lys Lys Met Gin Glu 95
Ile Ser Ser Leu Val 100 Lys Tyr Phe Ile 105 Lys Cys Ala Asn Arg Arg Ala 110
Pro Arg Leu 115 Lys Cys Gin Glu Leu 120 Leu Asn Tyr Ile Met Asp Thr Val 125
Lys Asp 13*0 Ser Ser Asn Gly Ala Ile 135 Tyr Gly Ala Asp Cys Ser Asn Ile 140
Leu 145 Leu Lys Asp Ile Leu Ser Val 150 Arg Lys Tyr 155 Trp Cys Glu Ile Ser 160
Gin Gin Gin Trp Leu 165 Glu Leu Phe Ser Val 170 Tyr Phe Arg Leu Tyr Leu 175
Lys Pro Ser Gin Asp 180 Val His Arg Val 185 Leu Val Ala Arg Ile Ile His 190
• · · ·
- 2 11 9 · • · · • 9 9 • 9 9 9
Ala Val Thr Lys Gly Cys Cys Ser Gin Thr Asp Gly Leu Asn Ser Lys
195 200 205
Phe Leu Asp Phe Phe Ser Lys Ala Ile Gin Cys Ala Arg Gin Glu Lys
210 215 220
Ser Ser Ser Gly Leu Asn His Ile Leu Ala Ala Leu Thr Ile Phe Leu
2 2 5 230 235 240
Lys Thr Leu Ala Val Asn Phe Arg Ile Arg Val Cys Glu Leu Gly Asp
245 250 255
Glu Ile Leu Pro Thr Leu Leu Tyr Ile Trp Thr Gin His Arg Leu Asn
260 265 270
Asp Ser Leu Lys Glu Val Ile Ile Glu Leu Phe Gin Leu Gin Ile Tyr
275 280 285
Ile His His Pro Lys Gly Ala Lys Thr Gin Glu Lys Gly Ala Tyr Glu
290 295 300
Ser Thr Lys Trp Arg Ser Ile Leu Tyr Asn Leu Tyr Asp Leu Leu Val
305 310 315 320
Asn Glu Ile Ser His Ile Gly Ser Arg Gly Lys Tyr Ser Ser Gly Phe
325 330 335
Arg Asn Ile Ala Val Lys Glu Asn Leu Ile Glu Leu Met Ala Asp Ile
340 345 350
Cys His Gin Val Phe Asn Glu Asp Thr Arg Ser Leu Glu Ile Ser Gin
355 360 365
Ser Tyr Thr Thr Thr Gin Arg Glu Ser Ser Asp Tyr Ser Val Pro Cys
370 375 300
Lys Arg Lys Lys Ile Glu Leu Gly Trp Glu Val Ile Lys Asp His Leu
385 390 395 400
Gin Lys Ser Gin Asn Asp Phe Asp Leu Val Pro Trp Leu Gin Ile Ala
405 410 415
Thr Gin Leu Ile Ser Lys Tyr Pro Ala Ser Leu Pro Asn Cys Glu Leu
420 425 430
Ser Pro Leu Leu Met Ile Leu Ser Gin Leu Leu Pro Gin Gin Arg His
435 440 445
Gly Glu Arg Thr Pro Tyr Val Leu Arg Cys Leu Thr Glu Val Ala Leu
450 455 460
Cys Gin Asp Lys Arg Ser Asn Leu Glu Ser Ser Gin Lys Ser Asp Leu
465 470 475 480
Leu Lys Leu Trp Asn Lys Ile Trp Cys Ile Thr Phe Arg Gly Ile Ser
485 490 495
Ser Glu Gin Ile Gin Ala Glu Asn Phe Gly Leu Leu Gly Ala Ile Ile
500 505 510
Gin Gly Ser Leu Val Glu Val Asp Arg Glu Phe Trp Lys Leu Phe Thr
515 520 525
Gly Ser Ala Cys Arg Pro Ser Cys Pro Ala Val Cys Cys Leu Thr Leu
530 535 540
• · • · · ·
- 212 -
Ala Leu Thr Thr Ser Ile Val Pro Gly Ala Val Lys Met Gly Ile Glu
545 550 555 560
Gin Asn Met Cys Glu Val Asn Arg Ser Phe Ser Leu Lys Glu Ser Ile
565 570 575
Met Lys Trp Leu Leu Phe Tyr Gin Leu Glu Gly Asp Leu Glu Asn Ser
580 585 590
Thr Glu Val Pro Pro Ile Leu His Ser Asn Phe Pro His Leu Val Leu
595 600 605
Glu Lys Ile Leu Val Ser Leu Thr Met Lys Asn Cys Lys Ala Ala Met
610 615 620
Asn Phe Phe Gin Ser Val Pro Glu Cys Glu His His Gin Lys Asp Lys
625 630 635 640
Glu Glu Leu Ser Phe Ser Glu Val Glu Glu Leu Phe Leu Gin Thr Thr
645 650 655
Phe Asp Lys Met Asp Phe Leu Thr Ile Val Arg Glu Cys Gly Ile Glu
660 665 670
Lys His Gin Ser Ser Ile Gly Phe Ser Val His Gin Asn Leu Lys Glu
675 680 685
Ser Leu Asp Arg Cys Leu Leu Gly Leu Ser Glu Gin Leu Leu Asn Asn
690 695 700
Tyr Ser Ser Glu Ile Thr Asn Ser Glu Thr Leu Val Arg Cys Ser Arg
705 710 715 720
Leu Leu Val Gly Val Leu Gly Cys Tyr Cys Tyr Met Gly Val Ile Ala
725 730 735
Glu Glu Glu Ala Tyr Lys Ser Glu Leu Phe Gin Lys Ala Asn Ser Leu
740 745 750
Met Gin Cys Ala Gly Glu Ser Ile Thr Leu Phe Lys Asn Lys Thr Asn
755 760 765
Glu Glu Phe Arg Ile Gly Ser Leu Arg Asn Met Met Gin Leu Cys Thr
770 775 780
Arg Cys Leu Ser Asn Cys Thr Lys Lys Ser Pro Asn Lys Ile Ala Ser
785 790 795 800
Gly Phe Phe Leu Arg Leu Leu Thr Ser Lys Leu Met Asn Asp Ile Ala
805 810 815
Asp Ile Cys Lys Ser Leu Ala Ser Phe Ile Lys Lys Pro Phe Asp Arg
820 825 830
Gly Glu Val Glu Ser Met Glu Asp Asp Thr Asn Gly Asn Leu Met Glu
835 840 845
Val Glu Asp Gin Ser Ser Met Asn Leu Phe Asn Asp Tyr Pro Asp Ser
850 855 860
Ser Val Ser Asp Ala Asn Glu Pro Gly Glu Ser Gin Ser Thr Ile Gly
865 870 875 880
Ala Ile Asn Pro Leu Ala Glu Glu Tyr Leu Ser Lys Gin Asp Leu Leu 885 890 895 • · • · · · • ·
- 213 - • · • · · « • • • · · ·
Phe Leu Asp Met Leu Lys Phe Leu 900 Cys Leu Cys Val 905 Thr Thr 910 Ala Gin
Thr Asn Thr Val Ser Phe Arg Ala 915 920 Ala Asp Ile Arg Arg Lys 925 Leu Leu
Met Leu Ile Asp Ser Ser Thr Leu 930 935 Glu Pro Thr Lys 940 Ser Leu His Leu
His Met Tyr Leu Met Leu Leu Lys 945 950 Glu Leu Pro Gly 955 Glu Glu Tyr Pro 960
Leu Pro Met Glu Asp Val Leu Glu 965 Leu Leu Lys Pro 970 Leu Ser Asn 975 Val
Cys Ser Leu Tyr Arg Arg Asp Gin 980 Asp Val Cys Lys 985 Thr Ile 990 Leu Asn
His Val Leu His Val Val Lys Asn Leu Gly Gin Ser 995 1000 Asn Met 1005 Asp Ser
Glu Asn Thr Arg Asp Ala Gin Gly 1010 1015 Gin Phe Leu Thr Val Ile 1020 Gly Ala
Phe Trp His Leu Thr Lys Glu Arg 1025 1030 Lys Tyr Ile Phe 1035 Ser Val Arg Met 1040
Ala Leu Val Asn Cys Leu Lys Thr 1045 Leu Leu Glu Ala 1050 Asp Pro Tyr Ser 1055
Lys Trp Ala Ile Leu Asn Val Met 1060 Gly Lys Asp Phe 1065 Pro Val Asn 1070 Glu
Val Phe Thr Gin Phe Leu Ala Asp Asn His His Gin 1075 1080 Val Arg 1085 Met Leu
Ala Ala Glu Ser Ile Asn Arg Leu 1090 1095 Phe Gin Asp Thr Lys Gly 1100 Asp Ser
Ser Arg Leu Leu Lys Ala Leu Pro 1105 1110 Leu Lys Leu Gin 1115 Gin Thr Ala Phe 1120
Glu Asn Ala Tyr Leu Lys Ala Gin 1125 Glu Gly Met Arg 1130 Glu Met Ser His 1135
Ser Ala Glu Asn Pro Glu Thr Leu 1140 Asp Glu Ile Tyr 1145 Asn Arg Lys 1150 Ser
Val Leu Leu Thr Leu Ile Ala Val Val Leu Ser Cys 1155 1160 Ser Pro 1165 Ile Cys
Glu Lys Gin Ala Leu Phe Ala Leu 1170 1175 Cys Lys Ser Val Lys Glu 1180 Asn Gly
Leu Glu Pro His Leu Val Lys Lys 1185 1190 Val Leu Glu Lys 1195 Val Ser Glu Thr 1200
Phe Gly Tyr Arg Arg Leu Glu Asp 1205 Phe Met Ala Ser 1210 His Leu Asp 1215 Tyr
Leu Val Leu Glu Trp Leu Asn Leu 1220 Gin Asp Thr Glu 122 5 Tyr Asn 123C Leu Ser
Ser Phe Pro Phe Ile Leu Leu Asn 1235 1240 Tyr Thr Asn Ile Glu Asp 1245 Phe Tyr
• ·
- 214 -
Arg Ser Cys Tyr Lys Val Leu Ile Pro His Leu Val Ile Arg Ser His
12 51 3 125 5 1260
Phe Asp Glu Val Lys Ser Ile Ala Asn Gin Ile Gin Glu Asp Trp Lye
1265 1270 1275 1280
Ser Leu Leu Thr Asp Cys Phe 1285 Pro Lys Ile Leu Val Asn Ile Leu Pro 1290 1295
Tyr Phe Ala Tyr Glu Gly Thr 1300 Arg Asp Ser Gly Met Ala Gin Gin Arg 1305 1310
Glu Thr Ala Thr Lys Val Tyr 1315 Asp Met Leu Lys Ser Glu Asn Leu Leu 1320 1325
Gly Lys Gin Ile Asp His Leu Phe Ile Ser Asn Leu Pro Glu Ile Val
1330 1335 1340
Val Glu Leu Leu Met Thr Leu His Glu Pro Ala Asn Ser Ser Ala Ser
1345 1350 1355 1360
Gin Ser Thr Asp Leu Cys Asp 1365 Phe Ser Gly Asp Leu Asp Pro Ala Pro 1370 1375
Asn Pro Pro His Phe Pro Ser 1380 His Val Ile Lys Ala Thr Phe Ala Tyr 1385 1390
Ile Ser Asn Cys His Lys Thr 1395 Lys Leu Lys Ser Ile Leu Glu Ile Leu 1400 1405
Ser Lys Ser Pro Asp Ser Tyr Gin Lys Ile Leu Leu Ala Ile Cys Glu
1410 1415 1420
Gin Ala Ala Glu Thr Asn Asn Val Tyr Lys Lys His Arg Ile Leu Lys
1425 1430 1435 1440
Ile Tyr His Leu Phe Val Ser 1445 Leu Leu Leu Lys Asp Ile Lys Ser Gly 1450 1455
Leu Gly Gly Ala Trp Ala Phe 1460 Val Leu Arg Asp Val Ile Tyr Thr Leu 1465 1470
Ile His Tyr Ile Asn Gin Arg 1475 Pro Ser Cys Ile Met Asp Val Ser Leu 1480 1485
Arg Ser Phe Ser Leu Cys Cys Asp Leu Leu Ser Gin Val Cys Gin Thr
149C l 149Ξ i 1500
Ala Val Thr Tyr Cys Lys Asp Ala Leu Glu Asn His Leu His Val Ile
1505 1510 1515 1520
Val Gly Thr Leu Ile Pro Leu 1525 Val Tyr Glu Gin Val Glu Val Gin Lys 1530 1535
Gin Val Leu Asp Leu Leu Lys 1540 Tyr Leu Val Ile Asp Asn Lys Asp Asn 1545 1550
Glu Asn Leu Tyr Ile Thr Ile 1555 Lys Leu Leu Asp Pro Phe Pro Asp His 1560 1565
Val Val Phe Lys Asp Leu Arg Ile Thr Gin Gin Lys Ile Lys Tyr Ser
1570 1575 1580
Arg Gly Pro Phe Ser Leu Leu Glu Glu Ile Asn His Phe Leu Ser Val
1585 1590 1595 1600
Ser Val Tyr Asp Ala Leu 1605 Pro Leu Thr Arg Leu Glu Gly Leu Lys Asp
1610 1615
Leu Arg Arg Gin Leu Glu Leu His Lys Asp Gin Met Val Asp Ile Met
1620 1625 1630
Arg Ala Ser Gin Asp Asn Pro Gin Asp Gly Ile Met Val Lys Leu Val
1635 1640 1645
Val Asn Leu Leu Gin Leu Ser Lys Met Ala Ile Asn His Thr Gly Glu
1650 1655 1660
Lys Glu Val Leu Glu Ala Val Gly Ser Cys Leu Gly Glu Val Gly Pro
1665 1670 1675 1680
Ile Asp Phe Sei' Thr Ile Ala Ile Gin His Ser Lys Asp Ala Ser Tyr
1685 1690 1695
Thr Lys Ala Leu Lys Leu Phe Glu Asp Lys Glu Leu Gin Trp Thr Phe
1700 1705 1710
Ile Met Leu Thr Tyr Leu Asn Asn Thr Leu Val Glu Asp Cys Val Lys
1715 1720 1725
Val Arg Ser Ala Ala Val Thr Cys Leu Lys Asn Ile Leu Ala Thr Lys
1730 1735 1740
Thr Gly His Ser Phe Trp Glu Ile Tyr Lys Met Thr Thr Asp Pro Met
1745 1750 1755 1760
Leu Ala Tyr Leu Gin Pro Phe Arg Thr Ser Arg Lys Lys Phe Leu Glu
1765 1770 1775
Val Pro Arg Phe Asp Lys Glu Asn Pro Phe Glu Gly Leu Asp Asp Ile
1780 1785 1790
Asn Leu Trp Ile Pro Leu Ser Glu Asn His Asp Ile Trp Ile Lys Thr
1795 1800 1805
Leu Thr Cys Ala Phe Leu Asp Ser Gly Gly Thr Lys Cys Glu Ile Leu
1810 1815 1820
Gin Leu Leu Lys Pro Met Cys Glu Val Lys Thr Asp Phe Cys Gin Thr
1Θ25 1830 1835 1840
Val Leu Pro Tyr Leu Ile His Asp Ile Leu Leu Gin Asp Thr Asn Glu
1845 1850 1855
Ser Trp Arg Asn Leu Leu Ser Thr His Val Gin Gly Phe Phe Thr Ser
1860 1865 1870
Cys Leu Arg His Phe Ser Gin Thr Ser Arg Ser Thr Thr Pro Ala Asn
1875 1880 1885
Leu Asp Ser Glu Ser Glu His Phe Phe Arg Cys Cys Leu Asp Lys Lys
1890 1895 1900
Ser Gin Arg Thr Met Leu Ala Val Val Asp Tyr Met Arg Arg Gin Lys
1905 1910 1915 1920
Arg Pro Ser Ser Gly Thr Ile Phe Asn Asp Ala Phe Trp Leu Asp Leu
1925 1930 1935
Asn Tyr Leu Glu Val Ala Lys Val Ala Gin Ser Cys Ala Ala His Phe
1940 1945 1950
• ·
- 216 - • • • · · • « • » « · • · • • · ·
-- -
Thr Ala Leu Leu Tyr Ala Glu Ile Tyr Ala Asp Lys Lys Ser Met Asp
1955 1960 1965
Asp Gin Glu Lys Arg Ser Leu Ala Phe Glu Glu Gly Ser Gin Ser Thr
1970 1975 1980
Thr Ile Ser Ser Leu Ser Glu Lys Ser Lys Glu Glu Thr Gly Ile Ser
19Θ5 1990 1995 2000
Leu Gin Asp Leu Leu Leu Glu Ile Tyr Arg Ser Ile Gly Glu Pro Asp
2005 2010 2015
Ser Leu Tyr Gly Cys Gly Gly Gly Lys Met Leu Gin Pro Ile Thr Arg
2020 2025 2030
Leu Arg Thr Tyr Glu His Glu Ala Met Trp Gly Lys Ala Leu Val Thr
2035 2040 2045
Tyr Asp Leu Glu Thr Ala Ile Pro Ser Ser Thr Arg Gin Ala Gly Ile
2050 2055 2060
Ile Gin Ala Leu Gin Asn Leu Gly Leu Cys His Ile Leu Ser Val Tyr
2065 2070 2075 2080
Leu Lys Gly Leu Asp Tyr Glu Asn Lys Aso Trp Cys Pro Glu Leu Glu
2085 2090 2095
Glu Leu His Tyr Gin Ala Ala Trp Arg Asn Met Gin Trp Asp His Cys
2100 2105 2110
Thr Ser Val Ser Lys Glu Val Glu Gly Thr Ser Tyr His Glu Ser Leu
2115 2120 2125
Tyr Asn Ala Leu Gin Ser Leu Arg Asp Arg Glu Phe Ser Thr Phe Tyr
2130 2135 2140
Glu Ser Leu Lys Tyr Ala Arg Val Lys Glu Val Glu Glu Met Cys Lys
2145 2150 2155 2160
Arg Ser Leu Glu Ser Val Tyr Ser Leu Tyr Pro Thr Leu Ser Arg Leu
2165 2170 2175
Gin Ala Ile Gly Glu Leu Glu Ser Ile Gly Glu Leu Phe Ser Arg Ser
2180 2185 2190
Val Thr His Arg Gin Leu Ser Glu Val Tyr Ile Lys Trp Gin Lys His
2195 2200 2205
Ser Gin Leu Leu Lys Asp Ser Asp Phe Ser Phe Gin Glu Pro Ile Met
2210 2215 2220
Ala Leu Arg Thr Val Ile Leu Glu Ile Leu Met Glu Lys Glu Met Asp
2225 2230 2235 2240
Asn Ser Gin Arg Glu Cys Ile Lys Asp Ile Leu Thr Lys His Leu Val
2245 2250 2255
Glu Leu Ser Ile Leu Ala Arg Thr Phe Lys Asn Thr Gin Leu Pro Glu
2260 2265 2270
Arg Ala Ile Phe Gin Ile Lys Gin Tyr Asn Ser Val Ser Cys Gly Val
2275 2280 2285
Ser Glu Trp Gin Leu Glu Glu Ala Gin Val Phe Trp Ala Lys LyB Glu
2290 2295 2300
• · · · · ·
- 217 -
Gin Ser Leu Ala Leu 2305 Ser Ue Leu Lys Gin Met Ile Lys Lys Leu Asp 2320
2310 2315
Ala Ser Cys Ala Ala Asn Asn Pro Ser Leu Lys Leu Thr Tyr Thr Glu
2325 2330 2335
Cys Leu Arg Val Cys Gly Asn Trp Leu Ala Glu Thr Cys Leu Glu Asn
2340 2345 2350
Pro Ala Val Ile Met Gin Thr Tyr Leu Glu Lys Ala Val Glu Val Ala
2355 2360 2365
Gly Asn Tyr Asp Gly Glu Ser Ser Asp Glu Leu Arg Asn Gly Lys Met
2370 2375 2380
Lys Ala Phe Leu Ser Leu Ala Arg Phe Ser Asp Thr Gin Tyr Gin Arg
2385 2390 2395 2400
Ile Glu Asn Tyr Met Lys Ser Ser Glu Phe Glu Asn Lys Gin Ala Leu
2405 2410 2415
Leu Lys Arg Ala Lys Glu Glu Val Gly Leu Leu Arg Glu His Lys Ile
2420 2425 2430
Gin Thr Asn Arg Tyr Thr Val Lys Val Gin Arg Glu Leu Glu Leu Asp
2435 2440 2445
Glu Leu Ala Leu Arg Ala Leu Lys Glu Asp Arg Lys Arg Phe Leu Cys
2450 2455 2460
Lys Ala Val Glu Asn Tyr Ile Asn Cys Leu Leu Ser Gly Glu Glu His
2465 2470 2475 2480
Asp Met Trp Val Phe Arg Leu Cys Ser Leu Trp Leu Glu Asn Ser Gly
2485 2490 2495
Val Ser Glu Val Asn Gly Met Met Lys Arg Asp Gly Met Lys Ile Pro
2500 2505 2510
Thr Tyr Lys Phe Leu Pro Leu Met Tyr Gin Leu Ala Ala Arg Met Gly
2515 2520 2525
Thr Lys Met Met Gly Gly Leu Gly Phe His Glu Val Leu Asn Asn Leu
2530 2535 2540
Ile Ser Arg Ile Ser Met Asp His Pro His His Thr Leu Phe Ue Ile
2545 2550 2555 2560
Leu Ala Leu Ala Asn Ala Asn Arg Asp Glu Phe Leu Thr Lys Pro Glu
2565 2570 2575
Val Ala Arg Arg Ser Arg Ue Thr Lys Asn Val Pro Lys Gin Ser Ser
2580 2585 2590
Gin Leu Asp Glu Asp Arg Thr Glu Ala Ala Asn Arg Ile Ue Cys Thr
2595 2600 2605
Ile Arg Ser Arg Arg Pro Gin Met Val Arg Ser Val Glu Ala Leu Cys
2610 2615 2620
Asp Ala Tyr Ue Ue Leu Ala Asn Leu Asp Ala Thr Gin Trp Lys Thr
2625 2630 2635 2640
Gin Arg Lys Gly Ile Asn Ile Pro Ala Asp Gin Pro Ile Thr Lys Leu 2645 2650 2655
218 • · · · ·
Lys Asn Leu Glu Asp Val Val Val Pro Thr 2665 Met Glu Ile Lys Val Asp 2670
2660
His Thr Gly Glu Tyr Gly Asn Leu Val Thr Ile Gin Ser Phe Lys Ala
2675 2680 2685
Glu Phe Arg Leu Ala Gly Gly Val Asn Leu Pro Lys Ile Ile Asp Cys
2690 2695 2700
Val Gly Ser Asp Gly Lys Glu Arg Arg Gin Leu Val Lys Gly Arg Asp
2705 2710 2715 2720
Asp Leu Arg Gin Asp Ala Val Met Gin Gin Val Phe Gin Met Cys Asn
2725 2730 2735
Thr Leu Leu Gin Arg Asn Thr Glu Thr Arg Lys Arg Lys Leu Thr Ile
2740 2745 2750
Cys Thr Tyr Lys Val Val Pro Leu Ser Gin Arg Ser Gly Val Leu Glu
2755 2760 2765
Trp Cys Thr Gly Thr Val Pro Ile Gly Glu Phe Leu Val Asn Asn Glu
2770 2775 2780
Asp Gly Ala His Lys Arg Tyr Arg Pro Asn Asp Phe Ser Ala Phe Gin
2785 2790 2795 2800
Cys Gin Lys Lys Met Mec Glu Val Gin Lys Lys Ser Phe Glu Glu Lys
2805 2810 2815
Tyr Glu Val Phe Met Asp Val Cys Gin Asn Phe Gin Pro Val Phe Arg
2820 2825 2830
Tyr Phe Cys Met Glu Lys Phe Leu Asp Pro Ala Ile Trp Phe Glu Lys
2835 2840 2845
Arg Leu Ala Tyr Thr Arg Ser Val Ala Thr Ser Ser Ile Val Gly Tyr
2850 2855 2860
Ile Leu Gly Leu Gly Asp Arg His Val Gin Asn Ile Leu Ile Asn Glu
2865 2870 2875 2880
Gin Ser Ala Glu Leu Val His Ile Asp Leu Gly Val Ala Phe Glu Gin
2885 2890 2895
Gly Lys Ile Leu Pro Thr Pro Glu Thr Val Pro Phe Arg Leu Thr Arg
2900 2905 2910
Asp Ile Val Asp Gly Met Gly Ile Thr Gly Val Glu Gly Val Phe Arg
2915 2920 2925
Arg Cys Cys Glu Lys Thr Met Glu Val Met Arg Asn Ser Gin Glu Thr
2930 2935 2940
Leu Leu Thr Ile Val Glu Val Leu Leu Tyr Asp Pro Leu Phe Asp Trp
2945 i 2950 2955 2960
Thr Met Asn Pro Leu Lys Ala Leu Tyr Leu Gin Gin Arg Pro Glu Asp
2965 2970 2975
Glu Thr Glu Leu His Pro Thr Leu Asn Ala Asp Asp Gin Glu Cys Lys
2980 2985 2990
Arg Asn Leu Ser Asp Ile Asp Gin Ser Phe Asp Lys Val Ala Glu Arg
2995 3000 3005
219 • · · « · ······ • · · · · · · • · · · · ······· ·· ·
Val Leu Met Arg Leu Gin Glu Lys Leu Lys Gly Val Glu Glu Gly Thr
3010 3015 3020
Val Leu Ser Val Gly Gly Gin Val Asn Leu Leu Xle Gin Gin Ala Xle
3025 3030 3035 3040
Asp Pro Lys Asn Leu Ser Arg Leu Phe Pro Gly Trp Lys Ala Trp Val
3045 3050 3055
(2) INFORMACE O SEQ ID NO:36:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 19 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: peptid (xi) POPIS SEKVENCE: SEQ ID NO: 36:
Met Ser Gly Gly Ser Ser Cys Gin Thr Pro Ser Arg Ala Ile Pro 15 10 15
Ala Thr Arg Arg (2) INFORMACE O SEQ ID NO:37:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 21 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: peptid (xi) POPIS SEKVENCE: SEQ ID NO: 37:
Gly Asp Tyr Ser Thr Thr Pro Gly Gly Thr Leu Phe Ser Thr Thr 15 10 15
Pro Gly Gly Thr Arg Arg (2) INFORMACE O SEQ ID NO:38:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 12 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: peptid (xi) POPIS SEKVENCE: SEQ ID NO: 38:
Glu Cys Arg Asn Ser Pro Val Thr Lys Thr Arg Arg
10 (2) INFORMACE O SEQ ID NO:39:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 12 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární
220 (ii) TYP MOLEKULY: peptid (xi) POPIS SEKVENCE: SEQ ID NO: 39:
Gly Val Thr Ser Pro Ser Ser Asp Glu Pro Arg Arg 15 10 (2) INFORMACE O SEQ ID NO:40:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 10 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: peptid (xi) POPIS SEKVENCE: SEQ ID NO: 40:
Met Glu Ala Ser Gin Ser His Leu Arg Arg
10 (2) INFORMACE O SEQ ID NO:41:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 12 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: peptid (xi) POPIS SEKVENCE: SEQ ID NO: 41:
Arg Arg Asn Ser Pro Glu Asp Lys Arg Ala Gly Gly 15 10 (2) INFORMACE O SEQ ID NO:42:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 12 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: peptid (xi) POPIS SEKVENCE: SEQ ID NO: 42:
Gly Glu Glu Ser Gin Phe Glu Met Asp Ile Arg Arg 15 10
- 221 INDICATIONS RELAT1NG TO A DEPOSITED MICROORGANISM (PCT Rule 13b,j)
A. The indications made below rclale lo lhe micTOOrgamsm referred lo in lhe description on page θ .lineš 2— 6
B. IDENTIFICATION OF DEPOSIT Further deposiu are identified on an additional sbeet [ [
Name of depositary instiruiion
American Type Culture Collection
Address of depositary ins ti lu l ion (ineluding poital codc and country) 12301 Parklawn Drive Rockville, MD 20852 US
Dále of deposit
November 1996
Acccssion Number s
HB 12233 and HB 12234
C. ADDITIONAL INDICATIONS (Icave blani if not applicable)
This information is conlinued on an additionaI sbeet
In respect of those designations in vhich a European patent is sought, a sarople of the deposited nícroorganism vili be made available until the publication of the mention of the grant of the European patent or until the dáte on vhich the application has been refused or vithdravn or ís deemed to be vithdravn, only by the issue of such a sample to an expert norainated by the person requesting the sample (Rule 28(4) EPC).
D. DESIGNATED STATES FOR WHICFI INDICATIONS ARE MADE (if the indicotionj are not for all dcjigtialcd States)
EP
E. SEPARATE FURNISHING OF INDICATIONS (Icave blani if no< applicable)
Tbe indications listed below will be submitled to lhe Intcmaiional Bureau later (specifythcgenerálnaiureofihcindicattonse.g. 'Acccssion Humbcr of Deposit)
For receiving Office use only | Cj^Tbis sbeet was received witb tbe interna tional application ^3^7'For International Bureau use only | This sheet was received by lhe International Bureau on:
Authorized officer

Claims (26)

  1. PATENTOVÉ NÁROKY
    1. Purifikovaný a izolovaný polynukleotid zahrnující polynukleotid kódující aminokyselinovou sekvenci kinasy příbuzné PIK MCCSla uvedenou v SEQ ID NO: 31.
  2. 2. Purifikovaný a izolovaný polynukleotid zahrnující polynukleotid kódující aminokyselinovou sekvenci kinasy příbuzné PIK MCCSip uvedenou v SEQ ID NO: 33.
  3. 3. Polynukleotid podle nároku 1 nebo 2, kterým je
    DNA.
  4. 4. DNA podle nároku 3, kterou je cDNA.
  5. 5. cDNA MCCSla skládající se ze sekvence DNA uvedené V SEQ ID NO: 30.
  6. 6. DNA MCCSip skládající se ze sekvence DNA uvedené v SEQ ID NO: 32.
  7. 7. DNA podle nároku 3, kterou je genomová DNA.
  8. 8. RNA transkript DNA podle nároku 3.
  9. 9. DNA podle nároku 3, kterou je zcela nebo zčásti chemicky syntetizovaná DNA.
  10. 10. DNA zahrnující DNA kódující úplnou délku savčí kinasy MCCS1 zvolená ze souboru zahrnujícího
    a) DNA, která za stringentních podmínek hybridizuje k nekódujícímu řetězci DNA o sekvenci uvedené v SEQ ID NO: 30;
    9 99 9
    b) DNA, která za stringentních podmínek hybridizuje k nekódujícímu řetězci DNA o sekvenci uvedené v SEQ ID NO: 3 a
    c) DNA, která za stringentních podmínek hybridizuje k nekódujícímu řetězci DNA o sekvenci uvedené v SEQ ID NO: 32.
  11. 11. Vektor zahrnující DNA podle nároku 3 nebo 10.
  12. 12. Vektor podle nároku 11, v němž je DNA operativně připojena k sekvenci DNA řídící expresi.
  13. 13. Hostitelská buňka stabilně transformovaná nebo transfekovaná DNA podle nároku 3 nebo 10 způsobem umožňujícím expresi kinasy MCCS1 v této hostitelské buňce.
  14. 14. Způsob produkce kinasy příbuzné PIK MCCS1, vyznačující se tím, že se hostitelská buňka podle nároku 11 pěstuje ve vhodném živném médiu a z buněk nebo růstového média se izoluje kinasa MCCS1.
  15. 15. Purifikovaný a izolovaný polypeptid zahrnující aminokyselinovou sekvenci kinasy příbuzné PIK MCCSla, která je uvedena v SEQ ID NO: 31.
  16. 16. Purifikovaný a izolovaný polypeptid zahrnující aminokyselinovou sekvenci kinasy příbuzné PIK MCCSlp, která je uvedena v SEQ ID NO: 33.
  17. 17. Polypeptid nebo peptid, který je schopen specificky vázat kinasu příbuznou PIK MCCS1.
  18. 18. Protilátkový produkt podle nároku 17.
  19. 19. Monoklonální protilátka podle nároku 18.
    - 224 ·· · • · • · ····
  20. 20. Hybridomální buněčná linie produkující monoklonální protilátku podle nároku 19.
  21. 21. Způsob identifikace modulátorů aktivity kinasy MCCSl, vyznačující se tím, že se
    a) přípravek obsahující kinasu MCCSl v kinasovém pufru inkubuje s gamma-32P-ATP a exogenním substrátem pro kinasu za přítomnosti a za nepřítomnosti zkoušené sloučeniny a
    b) měří se počet molů fosfátu přeneseného na substrát; přičemž zvýšení počtu molů 32P-fosfátu přeneseného na substrát za přítomnosti zkoušené sloučeniny ve srovnání s počtem molů 32P-fosfátu přeneseného na substrát za nepřítomnosti zkoušené sloučeniny ukazuje, že zkoušená sloučenina je aktivátorem této kinasy MCCSl a snížení počtu molů 32P-fosfátu přeneseného na substrát za přítomnosti zkoušené sloučeniny ve srovnání s počtem molů 32P-fosfátu přeneseného na substrát za nepřítomnosti zkoušené sloučeniny ukazuje, že zkoušená sloučenina je inhibitorem této kinasy MCCSl.
  22. 22. Hybridomální buněčná linie 224C.
  23. 23. Hybridomální buněčná linie 224F.
  24. 24. Způsob identifikace sloučeniny inhibující MCCSl, vyznačující se tím, že se (a) exprimuje MCCSl v geneticky pozměněné buňce, čímž se sníží citlivost této buňky vůči poškození DNA, kterážto citlivost je spojena s genetickým pozměněním;
    - 225 (b) geneticky pozměněná buňka ze stupně (a) se exponuje škodlivému působení za přítomnosti a nepřítomnosti zkoušené modulační sloučeniny;
    • · ·· · · · · ♦ · · · · · · • ·· · · · · · · · • · · · · · • ·· ···»·· ·· · (c) měří se citlivost buňky vůči poškození DNA; a (d) jako inhibitor aktivity MCCS1 se identifikuje zkoušená sloučenina, která buňce navrací citlivost vůči poškození DNA.
  25. 25. Způsob identifikace sloučeniny inhibující ATM, vyznačující se tím, že se (a) exprimuje ATM v geneticky pozměněné buňce, čímž se sníží citlivost této buňky vůči poškození DNA, kterážto citlivost je spojena s genetickým pozměněním;
    (b) geneticky pozměněná buňka ze stupně (a) se exponuje škodlivému působení za přítomnosti a nepřítomnosti zkoušené modulační sloučeniny;
    (c) měří se citlivost buňky vůči poškození DNA; a (d) jako inhibitor aktivity ATM se identifikuje zkoušená sloučenina, která buňce navrací citlivost vůči poškození DNA.
  26. 26. Způsob identifikace modulátorů aktivity kinasy ATM, vyznačující se tím, že se
    a) přípravek obsahující kinasu ATM v kinasovém pufru inkubuje s gamma-32P-ATP a exogenním substrátem pro kinasu za přítomnosti a za nepřítomnosti zkoušené sloučeniny a ····
    - 226
    b) měří se počet molů fosfátu přeneseného na substrát; přičemž zvýšení počtu molů 32P-fosfátu přeneseného na substrát za přítomnosti zkoušené sloučeniny ve srovnání s počtem molů 32P-fosfátu přeneseného na substrát za nepřítomnosti zkoušené sloučeniny ukazuje, že zkoušená sloučenina je aktivátorem této kinasy ATM a snížení počtu molů 32P-fosfátu přeneseného na substrát za přítomnosti zkoušené sloučeniny ve srovnání s počtem molů 32P-fosfátu přeneseného na substrát za nepřítomnosti zkoušené sloučeniny ukazuje, že zkoušená sloučenina je inhibitorem této kinasy ATM.
    01-1656-97-Če
CZ972547A 1995-11-16 1996-11-18 Kinasa příbuzná PIK kontrolního prvku buněčného cyklu, látky a způsoby CZ254797A3 (cs)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US55866695A 1995-11-16 1995-11-16
US60731296A 1996-02-27 1996-02-27
US72530496A 1996-10-21 1996-10-21

Publications (1)

Publication Number Publication Date
CZ254797A3 true CZ254797A3 (cs) 1998-03-18

Family

ID=27415778

Family Applications (1)

Application Number Title Priority Date Filing Date
CZ972547A CZ254797A3 (cs) 1995-11-16 1996-11-18 Kinasa příbuzná PIK kontrolního prvku buněčného cyklu, látky a způsoby

Country Status (2)

Country Link
CA (1) CA2210650A1 (cs)
CZ (1) CZ254797A3 (cs)

Also Published As

Publication number Publication date
CA2210650A1 (en) 1997-05-22

Similar Documents

Publication Publication Date Title
CA2111205C (en) Polypeptides having kinase activity, their preparation and use
US5686412A (en) Protein kinases
AU1461197A (en) Cell cycle checkpoint pik-related kinase materials and methods
US5846824A (en) Polypeptides having kinase activity, their preparation and use
US6218136B1 (en) Methods of the identification of pharmaceutically active compounds
US6030788A (en) Cyclin-dependent protein kinase
US6297356B1 (en) Telomere repeat binding factors and diagnostic and therapeutic use thereof
US5830699A (en) SOK-1 and methods of use
WO1997010252A1 (en) Dna encoding an sh2-inositol phosphatase, an shc-binding protein
EP1263939B1 (en) 18477, a human protein kinase and uses therefor
AU9223198A (en) Mammalian chk1 effector cell-cycle checkpoint protein kinase materials and methods
JP2001510684A (ja) アッセイ、治療法及び治療手段
US6406875B1 (en) Mammalian putative phosphatidylinositol-4-phosphate-5-kinase
US20070172493A1 (en) 12832, a novel human kinase-like molecule and uses thereof
US20020142428A1 (en) Novel kinases and uses thereof
CA2318519A1 (en) Genes and polypeptides associated with ultraviolet radiation-mediated skin damage and uses thereof
JP2004503211A (ja) ヒトnim1キナーゼ
CZ254797A3 (cs) Kinasa příbuzná PIK kontrolního prvku buněčného cyklu, látky a způsoby
SK111597A3 (en) Cell-cycle checkpoint phosphatidylinositol- (pik-) related kinases, genes coding therefor and methods for assaying and modulating enzymatic activity
US5840536A (en) Growth factor receptor-binding insulin receptor
EP0807169A2 (en) Cell cycle checkpoint pik-related kinase materials and methods
WO1997020573A1 (en) Growth factor receptor-binding protein 2 homolog