[go: up one dir, main page]

CN1684974A - 可获自类芽孢杆菌种的杀虫活性蛋白质及多核苷酸 - Google Patents

可获自类芽孢杆菌种的杀虫活性蛋白质及多核苷酸 Download PDF

Info

Publication number
CN1684974A
CN1684974A CNA038153378A CN03815337A CN1684974A CN 1684974 A CN1684974 A CN 1684974A CN A038153378 A CNA038153378 A CN A038153378A CN 03815337 A CN03815337 A CN 03815337A CN 1684974 A CN1684974 A CN 1684974A
Authority
CN
China
Prior art keywords
protein
paenibacillus
toxin
gene
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA038153378A
Other languages
English (en)
Inventor
S·B·宾特里姆
S·A·贝文
朱宝龙
D·J·默洛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Corteva Agriscience LLC
Original Assignee
Dow AgroSciences LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dow AgroSciences LLC filed Critical Dow AgroSciences LLC
Publication of CN1684974A publication Critical patent/CN1684974A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/142Toxicological screening, e.g. expression profiles which identify toxicity

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本主题发明提供了用于害虫控制的独特生物学备选物。更具体地,本发明涉及新杀虫蛋白质、杀虫蛋白质的新来源、编码此类毒素的多核苷酸及涉及用这些毒素控制昆虫及其它植物害虫的方法。本主题发明涉及类芽孢杆菌种及来自它的蛋白质对鳞翅目有毒性的令人惊讶的发现。类芽孢杆菌种、菌株或蛋白质对鳞翅目有毒性还未见已知报导。这也是第一个已知的对鳞翅目有毒性的类芽孢杆菌Cry蛋白质的实例。此外,这是类芽孢杆菌具有毒性复合体(TC)样蛋白质的首次已知报导。此处公开的DAS1529分离株也是产生Cry毒素及TC蛋白质这两者的天然细菌的首个已知实例。本发明也涉及新类型的具有杀虫活性的Cry及TC蛋白质。

Description

可获自类芽孢杆菌种的杀虫活性蛋白质及多核苷酸
相关申请的交互参照
本申请要求2002年6月28日申请的临时申请序列号60/392,633及2003年1月21日申请的临时申请序列号60/441,647的优先权。
发明背景
昆虫和其它害虫在农作物损失及在控制这些害虫的花费上使农民每年损失数十亿美圆。虫害在农业生产环境中引起的损失包括农作物产量下降、农作物质量降低及收获成本升高。虫害也是菜农和果农的负担,也是观赏花的生产者及家庭园丁及家庭物主的负担。
耕作方法,如轮作法及应用高水平氮肥,部分解决了农业害虫引起的问题。然而,应用农田的经济需求限制了轮作法的应用。此外,一些昆虫的越冬特性破坏了在一些地区运用轮作法。
因此,最大程度依赖合成化学杀虫剂以达到足够水平的控制。然而,应用合成化学杀虫剂有几个缺点。例如,应用这些化学剂中的一些可对许多有益昆虫造成有害影响。靶昆虫对一些化学杀虫剂也发展了抗性。这已通过多种抵抗管理策略得到部分减轻,但对备选害虫控制剂有增加的需求。而且,非常多的幼虫、大雨及杀虫应用设备的标度不适当可导致控制失败。不适当应用杀虫剂引起环境忧虑如污染土壤及地表和地下供水系统。残留物也存在于经处理的水果、蔬菜及其它经处理植物上。操作一些杀虫剂也可对应用杀虫剂的人造成危害。因此,合成化学杀虫剂由于它们的潜在毒性环境后果受到越来越多的仔细审查。应用杀虫剂的严格新限制及从市场上去除一些有效杀虫剂对控制损害及费用大的害虫可对经济的和有效的选择产生限制。
由于与应用合成化学杀虫剂相关的问题,明确需要限制这些试剂的应用及需要确定备选控制剂。替代合成化学杀虫剂或将这些试剂与生物学杀虫剂组合可降低环境中毒性化学剂的水平。
现在正在应用的,已取得一些成功的一些生物学杀虫剂来源自土壤微生物苏云金芽孢杆菌(Bacillus thuringiensis)(B.t.)。土壤微生物苏云金芽孢杆菌(B.t.)为革兰氏阳性的产孢子细菌。B.t.的大多数菌株不表现杀虫活性。一些B.t.菌株产生并以形成伴胞晶体蛋白质包含体为特征。这些包含体在显微镜下常常呈现为特定形状的晶体。一些B.t.蛋白质对害虫如昆虫有高度毒性,并且它们的毒性活性是特异的。某些杀虫B.t.蛋白质与包含体相关。这些  “δ-内毒素”与有非特异宿主范围的外毒素不同。其它种的芽孢杆菌也产生杀虫蛋白质。
已对某些芽孢杆菌毒素基因进行了分离并测序,并产生了基于重组DNA的产物,且已批准应用。此外,随着基因工程技术的应用,多种向农业环境中递送这些毒素的方法正在完善。这些包括将针对昆虫抗性的毒素基因进行基因改造的植物及应用经稳定的完整微生物细胞作为毒素递送载体。因此,经分离的芽孢杆菌毒素基因正成为商业上有价值的物质。
B.t.杀虫剂的商业用途最初局限于靶向鳞翅目(毛虫)害虫的狭窄范围。苏云金芽孢杆菌库尔斯塔克(Kurstaki)亚种的芽孢和晶体制剂作为对鳞翅目害虫的商品化杀虫剂已应用多年。例如苏云金芽孢杆菌库尔斯塔克HD-1变种产生对许多鳞翅目昆虫有毒性的晶体δ-内毒素。
最近,已鉴定了B.t.的新亚种,并已分离了负责活性δ-内毒素蛋白质的基因。H_fte和Whiteley将B.t.晶体蛋白质基因分为四个主要类型(H_fte,H.,H.R.Whiteley[1989] Microbiological Reviews 52(2):242-255)。所述类型为CryI(鳞翅目特异),CryII(鳞翅目及双翅目特异),CryIII(鞘翅目特异)及CryIV(双翅目特异)。已报导发现对其它害虫有特异毒性的种。例如,提议将CryV和CryVI作为线虫特异的毒素基因类型。
鳞翅目特异CryI晶体蛋白质,在它们的天然状态下,为大约130-至140-kDa的蛋白质,此蛋白质是在苏云金芽孢杆菌芽孢形成期间在双锥体晶体包含体中积累。这些蛋白质为在昆虫中肠的碱性环境中稳定的原毒素(protoxin),通过晶体相关或幼虫中肠蛋白酶的蛋白水解转换成60至70kDa的毒性核心片段。该活化也可在体外用多种蛋白酶实现。毒性结构域位于原毒素的N-末端部分。这是对CryIA(b)及CryIC蛋白质通过对经胰蛋白酶活化毒素的N-末端氨基酸序列进行测定证实的。Hofte等人,1989。切割发生在称为“第5区块(Block 5)”保守区的C-末端,因此形成核心毒素的C-末端。短的N-末端原毒素节段也可进行加工去除。N-末端切割位点对CryIA及CryID蛋白质也高度保守,表明对于这些蛋白质,毒素片段的N末端位于同一位置。然而,在这个区域,CryIB与其它CryI蛋白质不同。该蛋白质是否也在N末端进行加工是未知的。H_fte等人1989。
几种cryI基因的缺失分析进一步证实原毒素的3’部分对毒素活性是不需要的。报导的最短毒性片段之一位于CryIAb的密码子29和607之间。进一步从3’末端去除四个密码子或从5’末端去除八个密码子使基因产物的毒素活性完全丧失。对cryIA(a)及cryIA(c)基因观察到同样现象。H_fte等人,1989。
cryII基因编码几株亚种菌株中形成立方型包含体的65-kDa蛋白质。以前将这些晶体蛋白质命名为“P2”蛋白质,以与存在于同一菌株中的130-kDa Pl晶体蛋白质进行区分。H_fte等人1989。
cryIIA基因克隆自苏云金芽孢杆菌库尔斯塔克HD-263亚种并在巨大芽孢杆菌(Bacillus megaterium)中进行表达。产生CryIIA蛋白质的细胞对鳞翅目中的烟芽夜蛾(Heliothis virescens)和舞毒蛾(Lymantriadispar),并且对双翅目埃及伊蚊(Aedes aegypti)的幼虫有毒性。Widner和Whitely (1989,J.Bacteriol.171:965-974)从苏云金芽孢杆菌库尔斯塔克HD-1亚种克隆了两个相关基因(cryIIA及cryIIB)。两个基因均编码预计分子量为71kDa的633个氨基酸(比苏云金芽孢杆菌产生的P2蛋白质确定的表观分子量稍大)。虽然CryIIA和CryIIB蛋白质有高度同源性(约87%氨基酸同一性),它们在杀虫谱上不同。CryIIA对鳞翅目(烟草天蛾(Manduca Sexta))和双翅目(埃及伊蚊)物种均有活性,而cryIIB只对鳞翅目昆虫有毒性。H_fte等人,1989。将CryII毒素作为一组,在序列水平上比其它组相对更保守(>80%同一性)。相反,有很多例如,包括一些低于60%同一性的CryI毒素。
H_fte和Whiteley 1989年对晶体蛋白质的命名与分类方案均是建立在毒素的推导氨基酸序列和宿主范围的基础上。该系统编辑为涵盖分为五个主要类的14个不同型的毒素基因。由于发现越来越多的编码有多种杀虫活性谱的蛋白质基因,1989年的命名方案变的不再适用。因此,采用了只建立在氨基酸同一性基础上的经修订命名方案(Crickmore等人,1998,Microbiology and Molecular Biology Reviews 62:807-813)。除了仍为单独类型的cytA及cytB外,对于所有毒素基因保留了有助于记忆的“cry”。第一位的罗马数字换成阿拉伯数字,将第三位的括号去除。虽然对许多进行了重新分类,但除了所指出的例外外,仍保留了许多最初的名称。现在至少有37个最初类别的Cry蛋白质及两个最初类别的cyt毒素。从苏云金芽孢杆菌中也发现了其它型的毒素,如WO98/18932及WO97/40162中所述的毒素。
将芽孢杆菌(和其它生物学)杀虫蛋白质成功用于农业有一些障碍。某些昆虫对芽孢杆菌毒素的作用有抗性。昆虫如棉子象鼻虫(boll weevils)、黑切根虫(black cutworm)及谷实夜蛾(Helicoverpa zea)以及大多数物种的成虫,迄今已证实对许多B.t.-δ内毒素没有明显敏感性。
另一个潜在障碍是昆虫对B.t.毒素的抗性发展。B.t.蛋白质毒素最初作为可喷洒的昆虫控制剂进行配制。更最近B.t.技术的应用是分离编码这些毒素的基因并转化植物。随后转基因植物产生毒素,因此提供昆虫控制。参见Mycogen公司的美国专利号5,380,831;5,567,600及5,567,862。转基因B.t.植物是非常有效的并且预计在一些农作物及一些地区应用率很高。这引起一些忧虑即抗性控制问题比传统可喷雾应用增加的更快。虽然已将许多昆虫对B.t.毒素的抗性在实验室中进行了筛选,只有菱形斑纹蛾(Plutella xylostella)在田间证实有抗性(Ferre,J.和Van Rie,J.,Annu.Rev.Etitoinol.47:501-533,2002)。
转基因植物技术中的抗性控制策略极令人感兴趣(例如,如在天然细菌中,多种不同毒素可暴露在同一植物上,因此大大降低了对一种毒素有抗性的昆虫存活而散布抗性的机会)。已提议了几种用于保留有效应用苏云金芽孢杆菌毒素能力的策略。这些策略包括使用高剂量的权宜之计,以及备选或共应用不同毒素(McGaughey等人,(1998),“B.t.抗性控制”,Nature Biotechnol 16:144-146)。
因此,非常需要研发在植物中表达的其它基因以有效控制多种昆虫。除继续尝试发现新B.t.毒素外,非常希望发现能产生在用于转基因植物策略中应用的毒素或能与B.t.组合产生昆虫控制的转基因植物的其它细菌源(不同于B.t.)。
从细菌光杆状菌属/致病杆菌属(Photorhabdus/Xenorhabdus)中克隆杀虫毒素基因的最近努力提出了来自苏云金芽孢杆菌毒素的潜在备选物。细菌致病杆菌种与斯氏线虫(Steinernema)共生相关是本领域已知的。不幸地是,如在许多文章中报导的,细菌只在注射到昆虫幼虫时有杀虫活性,而经口递送时不表现生物学活性。
有效的开发线虫或其细菌共生生物的杀虫特性是困难的。因此,非常需要从有口腔活性的致病杆菌细菌中发现蛋白质因子以使产生自所述细菌的产物可作为可喷雾杀虫剂进行制备,或可将编码所述蛋白质因子的细菌基因进行分离并在产生转基因植物中应用。WO95/00647涉及用致病杆菌蛋白毒素控制昆虫,但它不为经口活性毒素。WO98/08388涉及来自致病杆菌的经口施用杀虫剂。美国专利号6,048,838涉及获得自致病杆菌种及菌株的有口腔活性的蛋白质毒素/毒素复合体。
光杆状菌及致病杆菌种是与土壤线虫在昆虫病原学上相关并为共生相关的革兰氏阴性细菌。这些细菌在侵袭并杀死昆虫的昆虫病原性线虫的肠中发现。当线虫侵袭昆虫宿主时,将细菌释放到昆虫血腔(开放循环系统)中,细菌和线虫均进行多轮复制;昆虫宿主一般死亡。这些细菌可在它们的线虫宿主外进行培养。对这些细菌的更详细的讨论,参见Forst和Nealson,60 Microbiol.Rev.1(1996),第21-43页。
将致病杆菌属分类定义为肠杆菌科成员,但它有不属于这个科的某些特性。例如,该属的菌株一般为硝酸盐还原阴性及过氧化氢酶阴性。只是最近将致病杆菌进行再分类以产生第二个属,即光杆状菌属,其中包含一种发光光杆状菌(Photorhabdus luminescens)(以前称为发光致病杆菌(Xenorhabdus luminescens))(Boemare等人,1993 Int.J.Syst.Bacteriol.43,249-255)。此差异是建立在熟练技术人员易于鉴定的几个有区别特征的基础上的。所述差异包括下列差异:DNA-DNA特征研究;过氧化氢活性的表型存在(光杆状菌)或缺失(致病杆菌);生物发光存在(光杆状菌)或缺失(致病杆菌);线虫宿主家族的不同,因为在斯氏线虫(Steinernematidae)中发现致病杆菌, 而在异小杆线虫(Heterorhabditidae)中发现光杆状菌);以及比较性进行的细胞脂肪酸分析(Janse等人,1990,Lett.Appl.Microbiol.10,131-135;Suzuki等人,1990,J.Gen.Appl.Microbiol.,36,393-401)。此外,最近集中于16S rRNA基因的序列(Rainey等人,1995,Int.J.Syst.Bacteriol.,45,379-381)及限制性分析(Brunel等人,1997,App.Environ.Micro.,63,574-580)的分子研究也支持这两个属的分开。
致病杆菌的预期性状如下:为革兰氏染色阴性的杆菌,白色至黄色/棕色菌落着色,存在包含体,不存在过氧化氢酶,不能还原硝酸盐,不存在生物发光,能从培养基中摄取染料,明胶水解阳性,在肠杆菌科选择培养基上生长,生长温度低于37℃,在厌氧条件下存活及有运动性。
现在,细菌致病杆菌属由四个公认种组成,嗜线虫致病杆菌(Xenorhabdus nematophilus),波氏致病杆菌(Xenorhabdus poinarii),博氏致病杆菌(Xenorhabdus bovienii)以及贝氏致病杆菌(Xenorhabdusbeddingii)(Brunel等人,1997,App.Environ.Micro.,63,574-580)。在文献中对多个相关菌株进行了描述(例如,Akhurst和Boemare 1988 J.Gen.Microbiol.,134,1835-1845;Boemare等人,1993 Int.J.Syst.Bacteriol.43,第249-255页;Putz等人,1990,Appl.Environ.Microbiol.,56,181-186,Brunel等人,1997,App.Environ.Micro.,63,574-580,Rainey等人,1995,Int.J.Syst.Bacteriol.,45,379-381)。
致病杆菌及光杆状菌细菌向培养基中分泌多种物质;这些分泌物包括脂酶、蛋白酶、抗生素及脂多糖。对不同蛋白酶级分的纯化清楚证实了它们与发光光杆状菌培养基(随后确定该培养基只存在Tc蛋白质)的经口毒性活性无关。这些物质中的几种以前就与昆虫毒性有关但直到最近还没有对杀虫基因进行克隆。然而,蛋白酶的纯化及分离也有助于检查它们在例如,抑制抗细菌蛋白质如杀菌肽中的推定作用。R.H.ffrench-Constant和Bowen,Current Opinions in Micriobiology,1999,12:284-288。参见R.H.ffrench-Constant等,66 AEM No.8,第3310-3329页(2000年8月),与光杆状菌昆虫毒力有关的多种因素的综述。
对编码来自发光光杆状菌及嗜线虫致病杆菌这两者的杀虫毒素基因进行克隆已取得很大进展。来自发光光杆状菌的毒素复合体编码基因最先得以检验。参见,例如WO98/08932。“平行”基因是最近从嗜线虫致病杆菌克隆的。Morgan等人,Applied and Environmental Microbiology 2001,67:2062-69。
在光杆状菌种中已鉴定四个不同的毒素复合体(TC)-Tca,Tcb,Tcc及Tcd。这些毒素复合体中每种在天然琼脂糖凝胶上可作为单体或二聚体,但在变性凝胶上的分辨率显示每种复合物由25-280kDa范围的分子组成。来自光杆状菌的编码TC的ORF以及蛋白酶切割位点(垂直箭头)在图1中显示。也参见R.H.ffrench-Constant和Bowen,57 Cell.Mol.Life Sci.828-833(2000)。
将发光光杆状菌的基因文库用DNA探针及用针对毒素的单克隆和/或多克隆抗体进行了筛选。对四个tc基因座tca,tcb,tcc及tcd进行了克隆。Tca基因座为从同一DNA链转录的三个可读框(ORF)tcaA、tcaB和tcaC,以及一个从相反方向转录的小末端ORF(tcaZ)的推定操纵子。tcc基因座也由推定从同一方向(tccA,tccB及tccC)转录的三个ORF组成。tcb基因座为一个大ORF(tcbA),且tcd基因座由两个ORF(tcdA及tcdB)组成,tcbA及tcdA,每个大约7.5kb,编码大昆虫毒素。TcdB与TcaC有一些同源性。经确定这些基因的许多产物是由蛋白酶进行切割的。例如,TcbA及TcdA均被切割成三个称为i、ii、iii(例如,TcbAi,TcbAii及TcbAiii)片段。也将tca及tcc ORF的产物进行切割。参见图1。也参见R.H.ffrench-Constant和D.J.Bowen,Current Opinions in Microbiology,1999,12:284-288。
Tca毒素复合体的生物测试显示经口服用时,它们对第一龄期烟草天蛾(tobacco hornworm)有高度毒性(LD50为每平方厘米人工饮食875ng)。R.H.ffrench-Constant和Bowen 1999。Tca剂量低至40ng/cm2停止摄食。鉴于Tca的在摩尔基础上的高预计分子量,发光光杆状菌毒素为高活性并且显示需要相对少量分子发挥毒性作用。R.H.ffrench-Constant和Bowen,Current Opinions in Micriobiology,1999,12:284-288。
显示这四个基因座无一与基因库中已知功能的任何序列具有总体上的相似性。序列相似性区域暗示这些蛋白质(TcaC及TccA)可通过攻击昆虫血细胞克服昆虫免疫力。R.H.ffrench-Constant和Bowen,CurrentOpinions in Microbiology,1999,12:284-288。
将TcaB,TcbA及TcdA进行相互比较,在它们预测的蛋白酶切割位点附近,均显示氨基酸保守性(~50%同一性)。三个不同TC蛋白质间的此保守性表明它们都可通过相同或相似的蛋白酶进行加工。TcbA和TcdA总体也有~50%的同一性,并且在羧基及氨基末端的切割中有相似的预定模式。可以推定这些蛋白质为相互的同系物。此外,TcbA及TcdA相似的大小,以及这两种毒素均显示作用于昆虫肠的事实,可表明相似的作用方式。R.H.ffrench-Constant和Bowen,Current Opinions in Microbiology,1999,12:284-288。
缺失/敲除研究表明tca及tcd基因座的产物引起了对鳞翅目的大多数口服毒性。缺失tca或tcd基因大大降低了对烟草天蛾的口服毒性。即tca及tcd基因座产物自身为口服鳞翅目毒素;它们组合作用对大部分分泌的口服活性有贡献。R.H.ffrench-Constant和D.J.Bowen,57 Cell.Mol.Life.Sci.831(2000)。令人感兴趣的是,单独缺失tcb或tcc基因座也降低死亡率,表明不同基因产物有复合相互作用。因此,tca基因座的产物可增强tcd产物的毒性。备选地,tcd产物可调节tca产物及可能其它复合物的毒性。注意以上涉及针对单一昆虫物种的口服毒性,tcb或tcc基因座可产生对其它组昆虫活性更强的毒素(或通过直接注射到昆虫血腔有活性—这是通过细菌体内分泌时递送的正常途径)。R.H.ffrench-Constant和Bowen,Current Opinions in Microbiology,1999,12:284-288。
WO01/11029公开了编码TcdA及TcbA的核苷酸序列,并且其具有对天然基因已进行改变的碱基组成以使它们与植物基因更相似。也公开了表达毒素A及毒素B的转基因植物。
在分离自发光光杆状菌(W-14)的分离毒素中,对命名为毒素A及毒素B的毒素集中研究了它们对靶目的昆虫物种(例如,玉米根虫)的活性。毒素A包含两个不同亚单位。天然基因tcdA编码原毒素TcdA。如通过质谱测定法确定的,TcdA通过一种或多种蛋白酶进行加工以提供毒素A。更具体地,TcdA为大约282.9kDa蛋白质(2516个氨基酸),所述282.9kDa蛋白质进行加工以提供TcdAi(最初的88个氨基酸),TcdAii(接下来的1849个氨基酸;由tcdA核苷酸265-5811编码的大约208.2kDa蛋白质)及大约63.5kDa(579个氨基酸)蛋白质(由tcdA核苷酸5812-7551编码)的TcdAiii。显示TcdAii及TcdAiii装配成二聚体(可能通过TcdAi的帮助),并且二聚体装配成四个二聚体的四聚体。毒素B同样来自TcbA。
由于现在对TC蛋白质相互的确切分子相互作用及它们的作用机制还不了解,例如,已知光杆状菌的Tca毒素复合体对烟草天蛾有毒性。此外,一些TC蛋白质已知有“独特”杀虫活性,其它TC蛋白质已知加强或增强独特毒素的活性。已知TcdA蛋白质单独对烟草天蛾有活性,但TcdB和TccC一起,可用于增强TcdA的活性。Waterfield,N.等人,Appl.Environ.Microbiol.2001,67:5017-5024。TcbA(只有一个Tcb蛋白质)是来自光杆状菌的另一个独特毒素。该毒素(TcbA)的活性也可通过TcdB与TccC-样蛋白质进行增强。
美国专利申请20020078478提供了来自发光光杆状菌W-14基因组区的两个增效基因tcdB2及tccC2的核苷酸序列。其中显示tcdB及tccC1与tcdA的共表达与tcdA单独表达相比,前者导致获得的口服昆虫毒性水平增强。tcdB及tccC1与tcdA或tcbA共表达提供增强的口服昆虫毒性。
如下表中显示的,TccA与TcdA的N末端有一些水平的同源性,并且TccB与TcdA的C末端有一些水平的同源性。TccA及TccB对某些受试昆虫的活性远比TcdA低。来自发光光杆状菌W-14菌株的TccA及TccB称为“毒素D”。在下面对“毒素A”(TcdA),“毒素B”(TcbA)及“毒素C”(TcaA及TcaB)也进行了显示。此外,TcaA与TccA有一些水平的同源性并同样与TcdA的N末端有一些水平的同源性。又进一步,TcaB与TccB有一些水平的同源性及同样与TcdA的N末端有一些水平的同源性。TccA及TcaA大小相似,TccB及TcaB也大小相似。TcdB与Tcac有显著水平的相似性(序列及大小均相似)。
  光杆状菌 光杆状茵W14菌株命名   一些同源性
    TcaA     毒素C   TccA
    TcaB   TccB
    TcaC                                                                            TcdB
    TcbA                         毒素B
    TccA     毒素D   TcdA N末端
    TccB   TcdA C末端
    TccC
    TcdA     毒素A   TccA+TccB
    TcdB                                                                               TcaC
昆虫中肠上皮均包含柱状(结构)及杯形(分泌)细胞。烟草天蛾摄取tca产物导致柱状细胞的细胞质囊泡顶端肿胀并起泡,导致最终囊泡内的细胞核排入肠腔。杯形细胞也明显地以同样方式受到影响。tca产物在经口递送或注射后作用于昆虫中肠。R.H.french-Constant和D.J.Bowen,Current Opinions in Microbiology,1999,12:284-288。经纯化的tca产物对烟草天蛾显示有口服毒性(LD50为875ng/cm2)。R.H.french-Constant和D.J.Bowen,57 Cell.Mol.Life Sci.828-833(2000)。
WO99/42589及美国专利号6,281,413公开了来自发光光杆状菌的TC样ORF。WO00/30453及WO00/42855公开了来自致病杆菌的TC样蛋白质。WO99/03328及WO99/54472(及美国专利号6,174,860及6,277,823)涉及来自致病杆菌和光杆状菌的其它毒素。
嗜线虫致病杆菌的近期克隆结果也显示:经确定的新杀虫毒素基因与发光光杆状菌的tc基因座有同源性。参见,例如WO98/08388及Morgan等人,Applied and Environmental Microbiology 2001,67:2062-69。R.H.ffrench-Constant和D.J.Bowen,Current Opinions in Microbiology,1999,12:284-288。粘粒克隆对另一鳞翅目菜粉蝶(Pieris brassicae)的口服毒性直接进行筛选。将口服毒性粘粒克隆进行测序。对所述粘粒的序列分析表明五个不同的ORF与光杆状菌tc基因有相似性;orf2及orf5均与tcbA及tcdA有一些水平的序列相关性,而orf1与tccB相似,orf3与tccC相似及orf4与tcaC相似。重要的是,许多这些预计的ORF也有发光光杆状菌中记录的推定切割位点,表明活性毒素也是受蛋白水解加工的。
有五个典型的致病杆菌TC蛋白质:XptA1,XptA2,XptB1,XptC1及XptD1。XptA1是“独特”毒素。XptA2是来自致病杆菌有独特毒素活性的另一TC蛋白质。对来自嗜线虫致病杆菌的序列参见GENBANK登录号AJ308438。XptB1及XptC1为可增强一种(或两种)XptA毒素活性的致病杆菌增效物。XptD1与TccB有一些水平的同源性。XptC1与TcaC有一些水平的相似性。致病杆菌的XptA2蛋白质与TcdA蛋白质有一些程度的相似性。XptB1与TccC有一些水平的相似性。
在这两种不同细菌中发现多少有些相似的毒素编码基因座,这一点对在这些毒力基因的可能来源方面是令人感兴趣的。嗜线虫致病杆菌粘粒也显示包含转座酶样序列,该序列的存在可表明这些基因座可在不同细菌菌株或种间转移。许多这样的转移事件也可解释两种不同细菌中tc操纵子的明显不同的基因组构成。此外,只有嗜线虫致病杆菌及发光光杆状菌菌株亚群显示对烟草天蛾有毒性,这表明或是不同菌株缺乏tc基因或是它们携带不同的tc基因。对这些细菌种内或种间进行菌株及毒素种系发生的详细分析有助于阐明毒素基因的可能来源及它们在不同菌群中是如何维持的。R.H.ffrench-Constant和Bowen,Current Opinions in Microbiology,1999,12:284-288。
最近对来自其它的昆虫相关细菌如昆虫病原菌嗜虫沙雷氏菌(Serratiaentomophila)的TC蛋白质及基因进行了描述。Waterfield等人,TRENDSin Microbiology,第9卷,第4期,2001年4月。
总而言之,来自发光光杆状菌及嗜线虫致病杆菌的毒素复合体蛋白质显示与以前鉴定的细菌毒素同源性较低,并对来自苏云金芽孢杆菌的毒素提供了有用的备选物。虽然它们与其他口服活性毒素对昆虫中肠有相似的毒性作用,它们确切作用方式还是模糊的。进一步的工作可阐明它们的作用机制。
虽然发现一些致病杆菌TC蛋白质与一些光杆状菌TC蛋白质“对应”(有相似功能及一些水平的序列同源性),特定的光杆状菌蛋白质与“相关”的致病杆菌蛋白质只有约40%序列同一性。这在以下四个“独特”毒素中进行了示例:
  与P.I.W-14 TcbA的同一性   与P.I.W-14 TcdA的同一性
Xwi XptA1         44%         46%
Xwi XptA2         41%         41%
(对于更完整的综述,参见,例如Morgan等人“来自嗜线虫致病杆菌PMFI296的杀虫基因的序列分析,”第67卷,Applied and EnvironmentalMicrobiology,2001年5月,第2062-2069页)。
类芽孢杆菌属(paenibacillus)细菌与其它细菌在rRNA及表型特征方面是有区别的(C.Ash等人(1993),“用PCR探针检验分子鉴定rRNA第3组芽孢杆菌(Ash,Farrow,Wallbanks和Collins):产生新类芽孢杆菌属的建议,”Antonie Van Leeuwenhoek 64:253-260)。比较16S rRNA序列分析证实芽孢杆菌属由至少五个种系组成。核糖体RNA第3组芽孢杆菌(Ash,Farrow,Wallbanks和Collins(1991),包含多粘芽孢杆菌(Bacillus polymyxa)及其相关细菌),为系统发生的,因此从枯草芽孢杆菌(Bacillus subtilis)(本属的模式种及其它需氧芽孢形成杆菌)中去除,将它们进行重新分类作为新属,即类芽孢杆菌属。
该属的一些种已知对蜜蜂(幼虫类芽孢杆菌(Paenibacillus Larvae))及金龟子甲虫蛴螬(日本甲虫类芽孢杆菌(P.popilliae)及缓病类芽孢杆菌(P.lentinnorbus))有病原性是已知的。已发现蜜蜂相关的一些其它类芽孢杆菌种,但它们是不致病的。在该属中已知至少18个其它种,包括解硫胺素类芽孢杆菌(P.thianninolyticus);它们没有已知的昆虫相关性(Shida等人,1997;Pettersson等人,1999)。金龟子(鞘翅目)是全北美的草皮、苗圃及农作物的严重害虫,并有检疫价值。参见美国农业部,农业研究机构网。
认为幼虫类芽孢杆菌(P.larvae),日本甲虫类芽孢杆菌(P.popilliae)及缓病类芽孢杆菌(P.lentimiorbus)是与金龟子甲虫的乳白病相关的专性昆虫病原(在A.Balows等人编辑的The Procaryotes,第2版,第2卷,Springer-Verlag,纽约,NY一书中,D.P.Stahly等人(1992),“芽孢杆菌属:昆虫病原,”第1697-1745页)。这三个类芽孢杆菌种特征是生长缓慢,为通过侵袭过程引起疾病的难养生物,所述侵袭过程为细菌通过中肠并在血淋巴及其它组织中增殖到高数量。对于所有三个种,已提出了在昆虫致病性中一些常见蛋白相关的指征。然而,对特定蛋白质没有证实有特定作用。Stahly等人对幼虫类芽孢杆菌作出结论即毒素相关的问题是开放的,并且(甲虫)乳白病的确切原因还是未知的。
在日本甲虫类芽孢杆菌及缓病类芽孢杆菌中鉴定了甲虫(鞘翅目)毒素Cry18。Cry18与Cry2蛋白质有约40%同一性(Zhang等人,1997;Harrison等人,2000)。而Zhang等人(1997)推测Cry18攻击中肠以利于营养细胞进入血腔,Harrison等人认为对这个作用没有直接证据并进一步声明“乳白病中多分孢子蛋白质的作用,如果有,是未知的。”J.Zhang等人(1997),“来自日本甲虫芽孢杆菌的第一个cry基因的克隆及分析”,J.Bacteriol.179:4336-4341;H.Harrison等人(2000),“中美及南美金龟子中的类芽孢杆菌相关的乳白病,”J.Invertebr.Pathol.76(3):169-175。
Stahly等人,Zhang等人及Harrison等人均指出:与苏云金芽孢杆菌晶体蛋白质对昆虫毒性作用(昆虫症状的高频率可通过特定晶体蛋白质的性质进行解释)相比较,类芽孢杆菌及乳白病(特定毒素的作用没有此类联系)的情况呈现相反的证据。
因此,虽然已知一些类芽孢杆菌种对某些鞘翅目及一些与蜜蜂相关的昆虫有致病性,迄今为止已知还未知对鳞翅目有毒性的类芽孢杆菌菌株。同样,在类芽孢杆菌中还没有报导TC蛋白质及鳞翅目毒性Cry蛋白质。
发明简述
这是首次公开对鳞翅目害虫有活性的类芽孢杆菌蛋白质毒素。一些类芽孢杆菌种已知是有杀虫性的,但它们对蛴螬/甲虫/鞘翅目有活性。没有已知对鳞翅目有毒性的类芽孢杆菌种或菌株的报导。因此,本发明总体上涉及对鳞翅目有活性的类芽孢杆菌种,并涉及从类芽孢杆菌种筛选类芽孢杆菌亚种、其对鳞翅目有活性的蛋白质及克隆文库。
更具体地,本发明最初来源于对文中称为DAS1529的新类芽孢杆菌菌株的发现。这在多种原因上是一个令人惊讶的发现。该菌株产生独特的鳞翅目毒性Cry蛋白质。该菌株以及DB482,产生独特的毒性复合物(TC)样蛋白质(与致病杆菌/光杆状菌TC有一些相似性)。高度优选类芽孢杆菌DB482分离株及获自该菌株的毒素,并且均在本发明的范围内。
这是首次报导具有TC样蛋白质的类芽孢杆菌。因此,本发明涉及对类芽孢杆菌种筛选TC样基因及蛋白质的方法。文中显示本发明的类芽孢杆菌TC蛋白质用于例如增强或加强“独特”致病杆菌毒素蛋白质的活性。迄今为止,本文鉴定的TC样基因在类芽孢杆菌属中至今为止是未知的。本发明扩宽了发现TC样基因的生物体(细菌属)的范围。因此,本发明总体上涉及获自类芽孢杆菌种的TC样蛋白质,并涉及对类芽孢杆菌种筛选这些蛋白质的方法等。一个实例为发现了产生TC样蛋白质的蜂类芽孢杆菌(Paenibacillus apiarius)。
虽然目标TC样蛋白质与致病杆菌及光杆状菌TC蛋白质有一些序列相关性及共同特征,目标TC样蛋白质的序列与以前已知的TC蛋白质有很大差异。因此,本申请提供了新类型的获自类芽孢杆菌属、光杆状菌属、致病杆菌属等细菌的TC样蛋白质及编码这些蛋白质的基因。
DAS1529菌株的另一令人惊讶的特征为它产生对鳞翅目有毒性的独特B.t.样Cry蛋白质。将目标Cry毒素进行压缩/缩短并显示缺乏它野生型形态的典型原毒素部分。因此,本发明总体上涉及筛选具有鳞翅目毒性Cry蛋白质的类芽孢杆菌分离株。本发明也涉及对类芽孢杆菌亚种及苏云金芽孢杆菌种筛选例如具有该新类型Cry基因及蛋白质的方法。
DAS1529菌株是第一个已知均产生Cry样毒素及TC样蛋白质的天然细菌的实例。又令人惊讶的是这是第一个已知与TC蛋白质基因密切相关(基因近似)的cry毒素基因实例。这些前驱的观察现象有广泛含义并因此使本领域技术人员能对合适细菌种筛选这些类型的独特操纵子及这些类型的已知操纵子的其它组分。这些技术在本发明的范围内。
本发明的又一方面来源于DAS1529菌株也产生与硫胺素酶非常相似的可溶昆虫毒素这一令人惊讶的发现。令人惊讶的是发现类芽孢杆菌硫胺素酶蛋白有杀虫活性。虽然此类蛋白是已知的,但本领域不能预计该酶显示对昆虫/昆虫样害虫的毒素样活性。因此,本发明也涉及对类芽孢杆菌筛选具有杀虫硫胺素酶基因及蛋白质等的方法,并涉及这些基因及蛋白质对控制昆虫及相似害虫的用途。
本发明的其它目的、优点及特征对受益于本公开的本领域技术人员是明显的。
附图简述
图1显示了来自光杆状菌的TC操纵子。
图2显示了插入到“SBI2”克隆中的来自DAS1529的显示有杀虫活性的DNA,其中可读框用框状及线状箭头标出。
图3显示了SEQ ID NO:17与来自解硫胺素芽孢杆菌(Campobasso等人,1998)或AAC44156的硫胺素酶I的部分序列对比。
图4显示了来自DAS1529的经纯化硫胺素酶对CEW的测试结果。
图5显示了pEt101D中的ORF3-ORF6。
图6显示了针对烟芽夜蛾(TBW)的Cry1529(ORF7)活性。
图7显示了SEQ ID NO:9与SEQ ID NO:5(tcaB2与tcaB1)的比较/对比;括号显示了ORF2连接处。
图8显示了DAS1529 ORF7(Cry1529)与其它Cry蛋白质比较的系统发生树。
图9和10显示了野生型及经修饰Cry1529蛋白质的胰蛋白酶消化结果。
图11A和11B显示了用于tcaA引物设计的序列对比。
图12A-D显示了用于tcaB引物设计的序列对比。
图13A和13B显示了用于tcaC引物设计的序列对比。
图14A和14B显示了用于tccC引物设计的序列对比。
序列简述
SEQ ID NO:1为SB12整个插入片段的核苷酸序列。
SEQ ID NO:2为编码tcaA样蛋白质(基因tcaA1,来源生物为:类芽孢杆菌IDAS1529菌株,基因命名为tcaA1-1529)的ORF1核苷酸序列。
SEQ ID NO:3为ORF1编码的氨基酸序列。
SEQ ID NO:4为ORF2去除IS元件的核苷酸序列,其编码tcaB样蛋白质(基因tcaB1,来源生物为:类芽孢杆菌IDAS1529菌株,基因命名为tcaB1-1529)。
SEQ ID NO:5为ORF2编码的氨基酸序列。
SEQ ID NO:6为编码tcaA样蛋白质的ORF3的核苷酸序列(基因tcaA2,来源生物为:类芽孢杆菌IDAS1529菌株,基因命名为tcaA2-1529)。
SEQ ID NO:7为ORF3编码的氨基酸序列。
SEQ ID NO:8为编码tcaB样蛋白质的ORF4的核苷酸序列(基因tcaB2,来源生物为:类芽孢杆菌IDAS1529菌株,基因命名为tcaB2-1529)。
SEQ ID NO:9为ORF4编码的氨基酸序列。
SEQ ID NO:10为编码tcaC样蛋白质的ORF5的核苷酸序列(基因tcaC,来源生物为:类芽孢杆菌IDAS1529菌株,基因命名为tcaC-1529)。
SEQ ID NO:11为ORF5编码的氨基酸序列。
SEQ ID NO:12为编码tccC样蛋白质的ORF6的核苷酸序列。
SEQ ID NO:13为ORF6编码的氨基酸序列。
SEQ ID NO:14为编码Cry样蛋白质的ORF7的核苷酸序列。
SEQ ID NO:15为ORF7编码的氨基酸序列。
SEQ ID NO:16为用于分类的DAS1529 16S rDNA的部分核苷酸序列。
SEQ ID NO:17为来自DAS1529培养液级分中经纯化毒素的N末端氨基酸序列。
SEQ ID NO:18来自解硫胺素芽孢杆菌的硫胺素酶I的氨基酸序列(Campobasso等人,J.Biochem.37(45):15981-15989(1998))。
SEQ ID NO:19为ORF6蛋白质的ORF6核苷酸序列(基因tccC,来源生物:类芽孢杆菌IDAS1529菌株,基因命名为tccC-1529)编码的备选氨基酸序列。
SEQ ID NO:20为基因xptC1,来源生物:致病杆菌Xwi菌株,基因命名为xptC1-Xwi。
SEQ ID NO:21为基因xptB1,类源生物:致病杆菌Xwi菌株,基因命名为xptB1-Xwi。
SEQ ID NO:22为引物SB101。
SEQ ID NO:23为引物SB102。
SEQ ID NO:24为引物SB103。
SEQ ID NO:25为引物SB104。
SEQ ID NO:26为引物SB105。
SEQ ID NO:27为引物SB106。
SEQ ID NO:28为引物SB212。
SEQ ID NO:29为引物SB213。
SEQ ID NO:30为引物SB215。
SEQ ID NO:31为引物SB217。
SEQ ID NO:32为来自蜂类芽孢杆菌DB482菌株的tcaA样基因的核苷酸序列。
SEQ ID NO:33为来自蜂类芽孢杆菌DB482菌株的TcaA样蛋白质的氨基酸序列。
SEQ ID NO:34为来自蜂类芽孢杆菌DB482菌株的tcaB样基因的核苷酸序列。
SEQ ID NO:35为来自蜂类芽孢杆菌DB482菌株的tcaB样基因的核苷酸序列。
SEQ ID NO:36为来自蜂类芽孢杆菌DB482菌株的TcaB样蛋白质的氨基酸序列。
SEQ ID NO:37为来自蜂类芽孢杆菌DB482菌株的TcaB样蛋白质的氨基酸序列。
SEQ ID NO:38为来自蜂类芽孢杆菌DB482菌株的tcaC样基因的核苷酸序列。
SEQ ID NO:39为来自蜂类芽孢杆菌DB482菌株的TcaC样蛋白质的氨基酸序列。
SEQ ID NO:40来自蜂类芽孢杆菌DB482菌株的tccC样基因的核苷酸序列。
SEQ ID NO:41为来自蜂类芽孢杆菌DB482菌株的TccC样蛋白质的氨基酸序列。
SEQ ID NO:42为基因tcdB1,来源生物:光杆状菌W14菌株,基因命名为tcdB1-W14。
SEQ ID NO:43为基因tcdB2,来源生物为:光杆状菌W14菌株,基因命名为tcdB2-W14。
SEQ ID NO:44为基因tccC1,来源生物:光杆状菌W14菌株,基因命名为tccC1-W14。
SEQ ID NO:45为基因tccC2,来源生物:光杆状菌W14菌株,基因命名为tccC2-W14。
SEQ ID NO:46为基因tccC3,来源生物:光杆状菌W14菌株,基因命名为tccC3-W14。
SEQ ID NO:47为基因tccC4,来源生物:光杆状菌W14菌株,基因命名为tccC4-W14。
SEQ ID NO:48为基因tccC5,来源生物:光杆状菌W14菌株,基因命名为tccC5-W14。
SEQ ID NO:49为来自嗜线虫致病杆菌Xwi的XptA2 TC蛋白质的氨基酸序列。
发明详述
本发明提供了用于害虫控制的独特生物学备选物。更具体地,本发明提供了对昆虫,优选对鳞翅目及其它类似害虫有毒素活性蛋白质的新来源。本发明也涉及可用于编码此类毒素的新多核苷酸的新来源,并涉及毒素制备方法及用毒素及对应的核酸序列控制昆虫和其它类似植物害虫的方法。本发明提出需要新的昆虫控制剂。本发明涉及获自类芽孢杆菌及其它细菌的新杀虫蛋白质。
本发明最初源自新的类芽孢杆菌菌株的发现。该菌株在文中是指DAS1529。为证实本发明的广泛含义,也对另一类芽孢杆菌菌株的发现进行示例。这些菌株保藏在位于美国,1815 North University Street Peoria,Ill.61604的农业研究机构专利培养物保藏中心(NRRL)。保藏菌株及对应的保藏日期及保藏编号如下:
保藏菌株           保藏日期           保藏编号
DAS1529             2002年6月19日       NRRL B-30599
DB482               2003年6月17日       NRRL B-30670
这些培养物是为了本专利申请进行保藏并在保证这个专利申请未决期间专利和商标委员会确定的人可获得培养物的条件下保藏,所赋予的号为37 CFR 1.14及35 U.S.C.122。对本申请的副本或其随后的申请文本进行申请时,当其所在国家的外国专利法要求这些保藏物时,这些保藏物也是可获得的。然而,应当理解保藏物的可用性并不允许在损害政府授予的专利权下实施本发明。
此外,目标培养保藏物根据用于保藏微生物的布达佩斯公约的条款进行制备,即它们必需全力在最近用于提供保藏样本的需求后至少五年时期,并且在任何情况下,保藏日期后的至少三十(30)年时期或可发布公开培养物可实施期限内,使它们保持活力并不受污染下进行保存。如果由于保藏条件,在需要时对保藏物不能提供样本,保藏者有责任替代保藏物。一旦授予专利公开它们时,公众对目标培养保藏物可获得性的所有限制最终废止。
目标DAS1529菌株的发现有多种原因是令人惊讶的。该菌株产生独特的鳞翅目毒性Cry蛋白质。该菌株以及DB482,也产生独特的毒素复合体(TC)样蛋白质(与致病杆菌/光杆状菌TC)有相似性)。类芽孢杆菌DB482分离株及由其获得的毒素是高度优选的,并均在本发明的范围内。
这是第一个已知公开的有针对鳞翅目活性的类芽孢杆菌蛋白质毒素。发现DAS1529菌株对鳞翅目害虫有毒素活性。这是令人惊讶的发现。已知一些种的类芽孢杆菌对蛴螬/甲虫/鞘翅目有杀虫活性。还没有类芽孢杆菌种或菌株对鳞翅目有毒性的报导。因此,本发明总体上涉及对鳞翅目有活性的类芽孢杆菌种,并涉及针对鳞翅目具有活性的和/或编码“鳞翅目毒素”的基因,且更具体地,涉及用于鳞翅目毒性Cry蛋白质的类芽孢杆菌培养物、其蛋白质及其克隆文库的筛选。
这也是具有TC样蛋白质的类芽孢杆菌的第一次已知报导。因此,本发明涉及对类芽孢杆菌种筛选TC样基因及蛋白质的方法。非常令人惊讶的是发现DAS1529及DB482菌株有TC样操纵子并产生TC蛋白质(与致病杆菌及光杆状菌的TC蛋白质有一些水平的相似性)。迄今为止,在类芽孢杆菌属中还不知道存在文中鉴定的TC蛋白质及基因。此发现扩宽了发现TC蛋白质的生物体(细菌属)的范围。因此本发明总体上涉及获自类芽孢杆菌种的TC蛋白质,涉及对类芽孢杆菌种筛选此类蛋白质等的方法。用本发明的方法发现类芽孢杆菌种的实例为蜂类芽孢杆菌(Paenibacillus apairus)DB482菌株。此蜂类芽孢杆菌菌株也产生独特TC样蛋白质。
虽然目标TC蛋白质与致病杆菌及光杆状菌的TC蛋白质有一些共同特征,目标TC蛋白质是独特的并与以前已知的TC蛋白质不同。因此,本申请提供了获自类芽孢杆菌属,光杆状菌属,致病杆菌属,沙雷氏菌属等细菌的新类型TC样蛋白质及编码这些蛋白质的基因。
本发明也涉及获自类芽孢杆菌种的鳞翅目毒性Cry蛋白质。因此,本发明涉及对类芽孢杆菌种筛选针对鳞翅目害虫有毒素活性的cry基因及Cry蛋白质的方法。
DAS1529 Cry毒素为非常独特的B.t.样Cry蛋白质毒素。另一对蛴螬有活性的类芽孢杆菌菌株已知产生鞘翅目毒性Cry蛋白质。其为与Cry2蛋白质最相关的(但只有大约40%同一性)的Cry18蛋白质。文中示例的Cry蛋白质显示与以前已知的Cry蛋白质只有低水平的序列同一性及相似性。如果那样,在所有已知的B.t.Cry蛋白质中,目标Cry蛋白质与Cry1蛋白质有最大的相似性。目标Cry蛋白质的一个令人惊讶的方面是它非常小,即甚至比Cry1 Fa核心毒素小。目标Cry蛋白质在它的C末端或接近C末端有一个可鉴定的第5区块(Block 5)。此毒素的野生型状态没有原毒素部分,其中所述原毒素部分一般在Cry1毒素中发现。目标Cry毒素令人惊讶地进行了压缩。因此,本发明总体上涉及新类型的Cry蛋白质。此公开对从苏云金芽孢杆菌(B.t.)中寻找额外cry基因也是重要的。对从本公开获益的本领域技术人员清楚的是,可对其它细菌如B.t.及其它芽孢杆菌亚种(包括球形芽孢杆菌(B.sphaericus))筛选类似毒素及毒素基因。这些筛选方法在本发明的范围内。
DAS1529菌株是第一个已知可产生Cry样毒素及TC样蛋白质这两者的天然细菌的实例。又令人惊讶的是这是第一个已知与TC蛋白质基因密切相关(基因近似)的cry毒素基因的实例。这些先驱的观察现象使本领域技术人员能对适当细菌种筛选这些型的独特操纵子及这些型的已知操纵子的其他组分。这些技术在本发明的范围内。DAS1529菌株是具有同一类型的多个TC蛋白质基因(即在这种情况下,两个tca样及两个tcaB样基因)的TC样操纵子的野生型菌株的令人感兴趣的实例。这对进一步的基因发现有意义。
本发明的又一方面起源于类芽孢杆菌硫胺素酶蛋白质有杀虫活性的令人惊讶的发现。虽然此蛋白质是已知的,本领域决不会预计此酶显示对昆虫/昆虫样害虫的毒素样活性。
类芽孢杆菌TC蛋白质
关于示例TC蛋白质的更具体的说明,以下对来自DAS1529菌株的TC蛋白质文中进行了充分描述:两个TcaA样蛋白质(TcaA1及TcaA2),两个TcaB样蛋白质(TcaB1及TcaB2),一个TcaC蛋白质及一个TccC样蛋白质。TcaA1及TcaA2蛋白质相互在序列水平上有高度相似性,并且tcaB1及tcaB2蛋白质相互在序列水平上有高度相似性。获自蜂类芽孢杆菌的TC样蛋白质也本文也进行了示例,并在本发明的范围内。
本发明的TC蛋白质可与其它蛋白质一样进行应用。这对于在根据本领域已知的进行观察时具有本公开益处的本领域技术人员是很显然的。参见,例如R.H.ffrench-Constant和Bowen(2000))及美国专利号6,048,838讨论的以上背景部分。例如,光杆状菌的Tca毒素复合体对烟草天蛾有高度毒性是已知的。
虽然现在不了解TC蛋白质相互的确切分子相互作用及它们的作用机制,已知一些TC蛋白质有“独特”杀虫活性,并且已知其它TC蛋白质增强同一给定生物产生独特毒素的活性。例如已知TcdA蛋白质对烟草天蛾有活性。TcaC及TccC一起可用于增强TcdA的活性。TcdB(替代TcaC)与TccC可用作增强剂。TcbA是另一个有独特毒素活性的光杆状菌TC蛋白质。TcaC(或TcdB)与TccC一起可用于增强/加强TcbA的毒素活性。
以下对光杆状菌TC蛋白质及来自类芽孢杆菌“对应的”TC蛋白质/基因进行概述:
  光杆状菌 光杆状菌W14菌株命名 光杆状菌自身同源性 类芽孢杆菌1529
    TcaA 毒素C    TccA   ORF3(&1)
    TcaB    TccB   ORF4(&2)
    TcaC    TcdB   ORF5
    TcbA     毒素B
    TccA 毒素D    TcdA N末端
    TccB    TcdA C末端
    TccC   ORF6
    TcdA     毒素A    TccA+TccB
    TcdB    TcaC
如以上指出的,TccA与TcdA的N末端有一些水平的同源性,及TccB与TcdA的C末端有一些水平的同源性。此外,TcdA大约280kDa,及如果组合,TccA与TccB一起与TcdA大约同样大小。此外,TcaA与TccA有一些水平的同源性并且同样与TcdA的N末端有一些水平的同源性。又此外,TcaB与TccB有一些水平的同源性及同样与TcdA的N末端有一些水平的同源性。TccA及TcaA,TccB及TcaB有同样大小。
虽然发现一些致病杆菌TC蛋白质“对应”于一些光杆状菌TC蛋白质,“对应”蛋白质相互只有约40%(近似)序列同一性。来自类芽孢杆菌的目标蛋白质与以前TC蛋白质有大约同样程度的序列相关性(~40%同一性)。
如以下更详细的描述,本发明的一种或多种毒素能互相组合和/或与其它毒素组合应用(即光杆状菌Tca复合物已知对烟草天蛾有活性;光杆状菌TC蛋白质的多种“组合”例如可一起应用以增强其它独特光杆状菌毒素的活性;例如,建议应用光杆状菌毒素“与”B.t.毒素用于抗性控制)。此外,本发明的类芽孢杆菌TC蛋白质文中显示用于增强或加强“独特”致病杆菌毒素蛋白质的活性。例如,临时申请号60/441,723(Timothy D.Hey等人),标题为“用于害虫控制的混合及匹配TC蛋白质”涉及TC蛋白质来源于一个属如光杆状菌属生物的TC蛋白质与来源于另一属生物对应的TC蛋白质互换应用的令人惊讶的发现。接着这些在以下列出的其它令人惊讶的数据进一步表明了本发明类芽孢杆菌TC蛋白质的实用性。这些结果的一个原因为令人惊讶的是在“对应”致病杆菌、光杆状菌及目标类芽孢杆菌TC蛋白质之间只有~40%序列同一性。
蛋白质及毒素  本发明提供了易于施用的功能性蛋白质。本发明也提供了用于递送对许多种昆虫,优选对鳞翅目昆虫具有功能活性并为有效杀虫毒素的方法。“功能活性”(或“针对活性”)文中表示蛋白质毒素作为口服活性昆虫控制剂(单独或与其它蛋白质组合)发挥功能,蛋白质有毒性作用(单独或与其它蛋白质组合)或能破坏或阻止昆虫生长和/或摄食,其中所述摄食引起或不可引起昆虫死亡。当昆虫与通过转基因植物表达,被制成蛋白质组合物,可喷雾蛋白质组合物,诱饵基质或其它递送系统递送的有效量的本发明“毒素”接触时,结果一般是昆虫死亡,抑制昆虫的生长和/或增殖,和/或预防昆虫摄食昆虫可获得毒素的来源(优选转基因植物)。本发明的功能性蛋白质也可增强或改进其它毒素蛋白质的活性。因此,文中应用的术语“毒性”“毒力”“毒素活性”及“杀虫活性”如文中定义表示目标“毒素”有“功能活性”。
优选对摄食昆虫有完全致死性,但不需要达到功能活性。如果昆虫避开毒素或停止摄食,在一些应用中此避开是有用的,即使作用是亚致死的或致死性被延迟或非直接的。例如,如果目的是获得抗昆虫的转基因植物,昆虫不愿摄食植物与对昆虫有致死毒性同样是有用的,因为最终目的是避免昆虫引起植物损害。
有其它将毒素混合到昆虫食物的方法。例如,如文中公开的,通过向食物喷洒蛋白质溶液将毒性蛋白质掺入到幼虫食物源是可能的。备选地,可将经纯化蛋白质基因改造入另外的无害细菌中,然后此细菌可在培养物中生长,并且将所述细菌或用于食物源或使其在需要根除昆虫的土壤中定居。并且,可将蛋白质直接基因改造入昆虫食物源中。例如,对许多昆虫幼虫的主要食物源是植物。因此可将编码毒素的基因转移到植物中以使所述植物表达目的毒素。
将功能活性转移到植物或细菌系统中一般需要将编码毒素氨基酸序列的核酸序列整合到适于载体定居的宿主的蛋白质表达载体中。获得编码有功能活性蛋白质的核酸序列的一个途径是如文中公开的,用来自毒素氨基酸序列推导的信息,从产生毒素的细菌种中分离天然遗传物质。可将天然序列进行优化用于在植物中表达,例如,以下进行更详细的讨论。优化的多核苷酸也可在蛋白质序列的基础上进行设计。
本发明提供了具有有益杀虫活性的新类型毒素。对这些类型的毒素及编码它们的多核苷酸进行定性的一个途径是在一系列特定条件下,与示例的核苷酸序列(其互补体和/或探针或来自任意链的探针)杂交能力和/或通过它们用来自示例序列的引物通过PCR进行扩增的能力定义多核苷酸。
有许多获得本发明杀虫毒素的方法。例如,文中公开及权利要求的杀虫毒素的抗体可用于从蛋白质混合物中鉴定并分离其它毒素。特别地,可制备针对更稳定并与其它毒素区别最大的毒素部分的抗体。然后这些抗体可用于特别通过免疫沉淀、酶联免疫吸附测定(ELISA)或Western印迹鉴定有特征活性的相同毒素。文中公开的毒素抗体或相同毒素抗体或这些毒素片段的抗体,用标准方法易于制备。单克隆、多克隆、特异和/或交叉反应抗体可根据本发明进行制备及应用。在检测试剂盒中可包括此类抗体用于检测本发明蛋白质(及其抗原性片段)的存在。
本领域技术人员易于认识到本发明的毒素(及基因)可从多种来源获得。“来自”或“获自”目标DAS1529分离株和/或蜂类芽孢杆菌分离株的毒素表示此毒素(或相似毒素)可获自该分离株或一些其它来源,如另一细菌菌株或转基因植物。例如,本领域技术人员易于认识到,如果公开细菌基因及毒素,可将植物进行工程化以产生毒素。抗体制剂、核酸探针(DNA及RNA)等等可用文中公开的多核苷酸和/或氨基酸序列进行制备并用于从其它(天然)来源筛选及发现其它毒素基因。本发明的毒素可获自多种来源/源微生物。
多核苷酸及探针  本发明进一步提供了编码本发明毒素的核苷酸序列。本发明又提供了鉴定及定性编码杀虫毒素基因的方法。在一个实施方案中,本发明提供了用于作为杂交探针和/或用于PCR技术引物的独特核苷酸序列。产生特征性基因片段的引物可用于鉴定、定性和/或分离特异毒素基因。本发明的核苷酸序列编码与以前描述毒素不同的毒素。
本发明的多核苷酸可用于形成完整“基因”以在目的宿主细胞中编码蛋白质或肽。例如,如本领域技术人员易于识别的,如本领域显然已知的,目标多核苷酸可适当地处于目的宿主中的启动子控制下。
如本领域技术人员已知的,DNA一般以双链形式存在。在此排列中,一条链与另一条链互补,反过来也是如此。由于DNA在植物中复制,产生额外的DNA互补链。本领域中常用的“编码链”是指与反义链结合的链。mRNA从DNA的“反义”链进行转录。“正义”或“编码”链有一系列可作为可读框(ORF)进行阅读以形成目的蛋白质或肽的密码子(密码子为可作为三个残基单位进行阅读以代表一个特定氨基酸的三个核苷酸)。为了在体内表达蛋白质,DNA链一般转录成可用作用于蛋白质模板的mRNA的互补链。因此,本发明包括后附序列表和/或包括互补链的等同物显示的示例多核苷酸的用途。与示例DNA功能性相同的RNA及PNA(肽核酸)包括在本发明中。
在本发明的一个实施方案中,细菌分离株可在致使该微生物高度增殖的条件下进行培养。在处理微生物以提供单链基因组核酸后,DNA可与本发明的引物接触并进行PCR扩增。毒素编码基因的特征性片段可通过程序进行扩增,因此确定毒素编码基因的存在。
本发明的又一方面包括用文中公开的方法及核苷酸序列鉴定的基因及分离株。这样鉴定的基因编码对害虫有活性的毒素。
本发明的毒素及基因可例如通过用寡核苷酸探针进行鉴定并获得。这些探针为可依靠适当标记可检测的或如国际申请号WO93/16094描述的可制成固有荧光的可检测核苷酸序列。探针(及本发明的多核苷酸)可为DNA、RNA或PNA。除腺嘌呤(A),胞嘧啶(C),鸟嘌呤(G),胸腺嘧啶(T)及尿嘧啶(U,用于RNA分子)外,本发明的合成探针(及多核苷酸)也可有次黄嘌呤(能与所有四个碱基配对的中性碱基;在合成探针中,有时用于替代所有四种碱基的混合物)。因此,当文中谈及合成的简并寡核苷酸时,一般应用“n”,“n”可为G,A,T,C或次黄嘌呤。根据标准IUPAC命名委员会,本申请的文中应用含糊密码子(例如,R表示A或G,Y表示C或T等)。
如本领域公知的,如果探针分子与核酸样本杂交,可合理地推定探针与样本大体上有同源性/相似性/同一性。优选地,通过本领域公知的技术,例如,如在Keller,G.H.,M.M.Manak(1987)DNA Probes,Stockton出版社,纽约,NY,第169-170页一书中所述,首先进行多核苷酸的杂交,接着在低、中等或高严格条件下洗涤。例如,如文中阐述的,低严格条件可通过第一次用2×SSC(标准柠檬酸盐)/0.1%SDS(十二烷基硫酸钠)于室温洗涤15分钟实施。一般进行两次洗涤。然后高严格条件可通过降低盐浓度和/或通过升高温度而达到。例如,以上描述的洗涤可接着每次用0.1×SSC/0.1%SDS于室温洗涤15分钟,进行两次,接着继续用0.1×SSC/0.1%SDS于55℃每次洗涤30分钟。这些温度可与其它文中提出的杂交及洗涤方法应用,并是本领域技术人员已知的(例如,SSPE可代替SSC用作盐)。2×SSC/0.1%SDS可通过向445ml水中加入50ml的20×SSC及5ml的10%SDS进行制备。20×SSC可通过组合NaCl(175.3g/0.150M)、柠檬酸钠(88.2g/0.015M)及加水至1升,接着用10NNaOH调整pH至7.0进行制备。10%SDS可通过在50ml经高压水中溶解10g的SDS,稀释至100ml并分装进行制备。
探针的检测提供了以已知的方式用于确定是否杂交在维持着的方法。此种探针分析提供了用于快速鉴定本发明毒素编码基因的方法。根据本发明用作探针的核苷酸节段可用DNA合成仪及标准方法进行合成。这些核苷酸序列可用作PCR引物以扩增本发明的基因。
根据本发明用于应用的探针可来源自多种来源,如文中提及或建议的任何基因。例如,根据本发明可应用以下任何类型的基因(编码和/或非编码或其互补链)的全部或部分:tcaA,tcaB,tcaC,tcbA,tccA,tccB,tccC,tcdA,tcdB,xptA1,xptD1,xptB1,xptC1,xptA2,sepA,sepB及sepC。除了另外特别指出外,例如,提到“tccC”基因包括这个型基因所有特异等位基因(如tccC1及tccC2)。所有其它基因也是同样的(例如,tcdB2,tccC3及表17中提及的等位基因)。
分子的杂交特征可用于定义本发明的多核苷酸。因此本发明包括与文中示例或建议的多核苷酸(或寡核苷酸或引物)杂交的多核苷酸(和/或它们的互补体,优选它们全长互补体)。
如文中应用的杂交的“严格”条件是指可达到通过当前申请人利用的条件同样或大约同样程度的杂交特异性的条件。具体地,通过标准方法(参见,例如,Maniatis,T.,E.F.Fritsch,J.Sambrook [1982] MolecularCloning:A Laboratory Manual,Cold Spring Harbor Laboratory,ColdSpring Harbor,NY)在Southern印迹上固定的DNA用32P-标记的基因特异探针进行杂交。一般而言,杂交及后来的洗涤可在可允许检测靶序列的条件下进行。对于双链DNA基因探针,杂交在低于DNA杂交体解链温度(Tm)20-25℃时在6×SSPE,5×Denhardt′s溶液,0.1%SDS,0.1mg/ml经变性DNA中过夜进行。解链温度通过以下公式进行描述(Beltz,G.A.,K.A.Jacobs,T.H.Eickbush,P.T.Cherbas和F.C.Kafatos[1983]Mcthods of Enzymology,Wu,L.Grossman和K.Moldave编辑,Academic出版社,纽约100:266-285):
Tm=81.5℃+16.6Log[Na+]+0.41(%G+C)-0.61(%甲酰胺)-600/碱基对中双链体长度。
洗涤一般按以下进行:
(1)在1×SSPE,0.1%SDS中于室温洗涤15分钟进行两次(低严格洗涤)。
(2)在0.2×SSPE,0.1%SDS中于室温20℃洗涤15分钟,进行一次(中等严格洗涤)。
对于寡核苷酸探针,杂交于低于杂交体解链温度10-20℃时在6×SSPE,5×Denhardt′s溶液,0.1%SDS,0.1mg/ml经变性DNA中过夜进行。用于寡核苷酸探针的Tm通过以下公式进行确定:
Tm(℃)=2(T/A碱基对数目)+4(G/C碱基对数目)(Suggs,S.V.,T.Miyake,E.H.Kawashime,M.J.Johnson,K.Itakura和R.B.Wallace[1981]ICN-UCLA Symp.Dev.Biol.Using Purified Genes,D.D.Brown编辑,Academic出版社,纽约,23:683-693)
一般按以下进行洗涤:
(1)在1×SSPE,0.1%SDS中于室温洗涤15分钟,进行两次(低严格洗涤)。
(2)在1×SSPE,0.1%SDS中于杂交温度洗涤15分钟,进行一次(中等严格洗涤)。
一般,盐和/或温度可进行改变以改变严格度。用经标记的长度>70个碱基左右的DNA片段,可应用以下条件:
低:1或2×SSPE,室温
低:1或2×SSPE,42℃
中等:0.2×或1×SSPE,65℃
高:0.1×SSPE,65℃
双链体形成及稳定性依赖于两条杂交链间的实质互补性。并且如上提及的,可允许一定程度的误配。因此,本发明的探针序列包括所述序列的突变(单个或多重)、缺失、插入及其组合,其中所述突变、插入或缺失允许形成与靶目的多核苷酸形成稳定杂交体。突变、插入及缺失可以多种方法在给定多核苷酸序列中进行产生,并且这些方法对一般技术人员是已知的。其它方法将来可成为已知的。
PCR技术  聚合酶链反应(PCR)为核苷酸序列的重复性、酶促引发合成过程。该程序是公知的并是本领域技术人员常规应用的(参见Mullis,美国专利号4,683,195,4,683,202和4,800,159;Saiki,Randall K.,StephenScharf,Fred Faloona,Kary B.Mullis,Glenn T.Horn,Henry A.Erlich,Norman Arnheim[1985]“酶扩增β-球蛋白基因组序列及限制位点分析用于诊断镰状细胞贫血,”Science 230:1350-1354)。PCR是建立在酶扩增目的DNA片段基础上的,其中所述目的DNA片段的侧翼为与目的序列的相反链杂交的两个寡核苷酸引物。引物导向互相指向3’末端。模板进行重复循环的热变性,引物与它们的互补序列退火及经退火引物与DNA酶的延伸结果导致PCR引物5’末端定义的节段的扩增。每条引物的延伸产物可作为用于其它引物的模板,因此每次循环一般使在上一次循环中产生的DNA片段数量加倍。这导致特异靶片段的指数增加,在几小时内达到几百万倍。通过应用分离自嗜热细菌嗜热水生菌(Thermus aquaticus)的热稳定DNA聚合酶如Taq聚合酶,扩增过程可完成自动化。可进行应用的其它酶是本领域技术人员已知的。
本发明的DNA序列可用作用于PCR扩增的引物。进行PCR扩增时,引物及模板间可允许一定程度的误配。因此,示例引物的突变、缺失及插入(特别是向5’末端添加核苷酸)是在本发明的范围内。突变、插入及缺失在给定引物中可通过一般技术人员已知的方法进行产生。
基因与毒素的修饰  根据本发明有用的基因与毒素不仅包括特定示例的全长序列,也包括这些序列的部分、节段和/或片段(与全长分子相比包括内部和/或末端缺失)、变体、突变体、嵌合体及其融合体。例如,本发明的毒素可以通过两个或多个毒素/蛋白质部分组合产生的嵌合毒素的形式应用。
本发明的蛋白质可具有经替代氨基酸,只要它们保持文中特定的示例蛋白质的特征性杀虫/功能活性。“变体”基因的核苷酸序列编码相同毒素或与文中示例蛋白质有相同杀虫活性的等同毒素。术语“变体蛋白质”及“等同毒素”是指对靶害虫有相同或基本上相同生物学/功能活性,并与示例毒素有等同序列的毒素。如文中应用的,谈及“等同”序列是指经改进或不对杀虫活性有副作用的其中存在氨基酸替代、缺失、添加或插入的序列。保持杀虫活性的片段也包括在本定义中。片段及保持相同或相似功能的其它等同物或示例毒素对应片段的“毒素活性”在本发明的范围内。可进行变化,如氨基酸替代或添加用于多种目的,如增加(或降低)蛋白质的蛋白酶稳定性(基本上/一般不降低毒素的功能活性)。
用文中提供的教导,等同毒素和/或编码这些等同毒素的基因可获自/来自野生型或重组细菌和/或其它野生型或重组生物体。例如其它芽孢杆菌,类芽孢杆菌,光杆状菌及致病杆菌种,可用作源分离株。
例如,基因的改变通过使用制备点突变的标准技术易于构建。此外,例如,美国专利号5,605,793描述了随机片段化后,通过用DNA重组装用于产生额外分子多样性的方法。可用变体基因产生变体蛋白质;重组宿主可用于产生变体蛋白质。用这些“基因改组”技术,包含文中示例任何序列的任意5、10或20个连续残基(氨基酸或核苷酸)的等同基因及蛋白质可进行构建。如本领域技术人员已知的,可将基因改组技术进行调整以获得具有,例如1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,3132,33,34,35 36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100,101,102,103,104,105,106,107,108,109,110,111,112,113,114,115,116,117,118,119,120,121,122,123,124,125,126,127,128,129,130,131,132,133,134,135,136,137,138,139,140,141,142,143,144,145,146,147,148,149,150,151,152,153,154,155,156,157,158,159,160,161,162,163,164,165,166,167,168,169,170,171,172,173,174,175,176,177,178,179,180,181,182,183,184,185,186,187,188,189,190,191,192,193,194,195,196,197,198,199,200,201,202,203,204,205,206,207,208,209,210,211,212,213,214,215,216,217,218,219,220,221,222,223,224,225,226,227,228,229,230,231,232,233,234,235,236,237,238,239,240,241,242,243,244,245,246,247,248,249,250,251,252,253,254,255,256,257,258,259,260,261,262,263,264,265,266,267,268,269,270,271,272,273,274,275,276,277,278,279,280,281,282,283,284,285,286,287,288,289,290,291,292,293,294,295,296,297,298,299,300,301,302,303,304,305,306,307,308,309,310,311,312,313,314,315,316,317,318,319,320,321,322,323,324,325,326,327,328,329,330,331,332,333,334,335,336,337,338,339,340,341,342,343,344,345,346,347,348,349,350,351,352,353,354,355,356,357,358,359,360,361,362,363,364,365,366,367,368,369,370,371,372,373,374,375,376,377,378,379,380,381,382,383,384,385,386,387,388,389,390,391,392,393,394,395,396,397,398,399,400,401,402,403,404,405,406,407,408,409,410,411,412,413,414,415,416,417,418,419,420,421,422,423,424,425,426,427,428,429,430,431,432,433,434,435,436,437,438,439,440,441,442,443,444,445,446,447,448,449,450,451,452,453,454,455,456,457,458,459,460,461,462,463,464,465,466,467,468,469,470,471,472,473,474,475,476,477,478,479,480,481,482,483,484,485,486,487,488,489,490,491,492,493,494,495,496,497,498,499或500或更多个连续残基(氨基酸或核苷酸),其中所述连续残基对应于任意示例序列(或其互补体(全长互补体))中的节段(相同大小)。类似大小的节段,特别对于保守区的节段,也可用作探针和/或引物。
全长基因片段可根据标准方法用商业上可获得的外切酶或内切酶进行制备。例如,酶如Bal31或定点诱变可用于从这些基因末端系统地切除核苷酸。同样,可用多种限制酶获得编码活性片段的基因。可用蛋白酶直接获得这些毒素的活性片段。
如文中公开的,可将毒素截短并仍保持功能活性,这也在本发明的范围内。“截短毒素”表示可将毒素蛋白质的部分进行切割并在切割后仍显示活性。切割可通过昆虫肠内或肠外的蛋白酶达到。此外,可用分子生物学技术产生有效切割的蛋白质,其中编码所述毒素的DNA碱基通过用限制性内切酶消化或其它本领域技术人员可获得的技术。进行截短后,所述蛋白质可在外源系统如大肠杆菌、杆状病毒、基于植物的病毒系统;酵母等等中进行表达并然后置于文中公开的昆虫测定中以确定活性。本领域熟知可成功产生截短毒素,这样虽然其小于全长的完整序列,但仍保留了功能活性。B.t.毒素可以以截短(核心毒素)形式进行应用是本领域公知的。参见,例如,Adang等人,Gene 36:289-300(1985),“苏云金芽孢杆菌库尔斯塔克HD-73亚种晶体蛋白质的全长及截短质粒克隆的定性及它们对烟草天蛾的毒性”。有保留杀虫活性的截短蛋白质的其它实例,包括昆虫保幼激素酯酶(加利福尼亚大学的美国专利号5,674,485)。如文中应用的,术语“毒素”也表示功能活性截短形式。另一方面,可添加原毒素部分(一般在模式B.t.Cry毒素的C末端部分)以形成有活性的全长蛋白质。参见,例如,美国专利号6,218,188。
文中也特别示例了本发明的某些毒素。由于这些毒素只是本发明毒素的示例,本发明包含与示例毒素有相同或相似杀虫活性的变体或等同毒素(及编码等同毒素的核苷酸序列)是显而易见的。等同毒素与示例毒素有氨基酸相似性(和/或同源性)。氨基酸同一性一般大于60%,优选大于75%,更优选大于80%,甚至更优选大于90%并可大于95%。也可将优选的本发明多核苷酸及蛋白质根据更特定的同一性和/或相似性范围进行定义。例如,与文中示例序列相比,同一性和/或相似性可为49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98或99%。除了另外详细说明外,如文中应用的两个核酸序列同一性和/或相似性的百分数用Karlin和Altschul(1990),Proc.Natl.Acad.Sci.USA 87:2264-2268,如在Karlin和Altschul(1993),Proc.Natl.Acad.Sci.USA 90:5873-5877中经改进的运算法则进行确定。此种运算法则在Altschul等人(1990),J.Mol.Biol.215:402-410的NBLAST和XBLAST程序中进行引用。用NBLAST程序进行BLAST核苷酸搜索,分值=100,字长=12。为获得用于比较的缺口比对,如Altschul等人(1997),Nucl.Acids Res.25:3389-3402描述应用缺口BLAST。当应用BLAST及缺口BLAST程序时,应用了各自程序(NBLAST及XBLAST)的默认系数。参见NCBI/NIH网站。分值可用以上背景部分描述的Crickmore等人的方法及运算法则进行计算。
在说明生物学特性或参与决定最终与生物学活性有关的三维构象的毒素的关键区中,氨基酸同源性/相似性/同一性最高。在这点上,某些氨基酸替代是可接受的并预计是可容忍的。例如,这些替代可在对活性不是关键的蛋白质区进行替代,分析蛋白质的晶体结构及基于软件的蛋白质结构模型可用于确定可进行修饰(用定点诱变、改组等)的蛋白质区以真正改变蛋白质的性质和/或增加蛋白质功能。
也可改变蛋白质的多种性质及靶向3D特征而对蛋白质的活性/功能性没有副面影响。预计可容忍/对分子的三维构象没有副面影响的保守氨基酸替代。氨基酸分为以下类:非极性、不带电荷极性、碱性及酸性。藉此一类氨基酸被另一同型的氨基酸取代,只要替代对化合物的生物学活性无害的氨基酸替代在本发明的范围内。表1提供了属于一类氨基酸的实例表。
                   表1
    氨基酸类   氨基酸实例
    非极性不带电荷极性酸性碱性   丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、甲硫氨酸、苯丙氨酸、色氨酸甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺、谷氨酰胺天冬氨酸、谷氨酸赖氨酸、精氨酸、组氨酸
在一些情况下,也可进行非保守性替代。关键因素是这些替代必需对毒素的功能性/生物学活性没有明显损害。
如文中应用的,谈及“经分离”多核苷酸和/或“经纯化”毒素是指它们与在自然界发现的其它相关分子不再相关的这些分子。因此,如文中描述的,谈及“经分离”和/或“经纯化”表示有“人工”的参与。例如,置于植物中用于表达的本发明细菌毒素“基因”为“经分离多核苷酸”。同样,如文中示例的,通过植物产生的类芽孢杆菌蛋白质是“经分离蛋白质。”
由于遗传密码的简并性/冗余性,多种不同DNA序列可编码文中公开的氨基酸序列。产生编码相同或基本上相同毒素的备选DNA序列是在本领域熟练技术人员的技术内。这些变体DNA序列在本发明的范围内。
优化用于在植物中表达的序列  为了在植物中获得异源基因的高表达,可优选重新改造所述基因使它们在植物细胞(的细胞质)中有效表达。玉米是在转化前可优选重新设计异源基因以增加其在所述植物中表达水平的此种植物。因此,在设计编码细菌毒素基因设计中的额外步骤是重新改造异源基因用于优化表达。
用于重新改造细菌毒素用于在玉米中表达的一个原因是由于天然基因的非最佳G+C含量。例如,许多天然细菌基因非常低的G+C含量(及随之发生的偏向高A+T含量)导致产生模拟或复制已知为高度富含A+T的植物基因控制序列的序列。导入植物基因的DNA中一些富含A+T序列的存在(例如,一般在基因启动子中发现的TATA盒区)可导致基因的异常转录。另一方面,在经转录mRNA存在的其它调控序列的存在(例如,多腺苷酸化信号序列(AAUAAA)或与参与前mRNA剪接的核内小RNA互补的序列)可导致RNA的不稳定性。因此,设计编码细菌毒素基因用于玉米表达,更优选是指植物优化基因的一个目标是产生有较高G+C含量,并优选地为与编码代谢酶的玉米基因相近的DNA序列。设计编码细菌毒素的植物优化基因的另一个目标是产生其中对序列修饰的不阻碍翻译的DNA序列。
下表(表2)表示了玉米中的G+C含量如何高。对于表2的数据,基因的编码区是从基因库(Release 71)得到的,其碱基组成用MacVector程序(Accelerys,Burlington,MA)进行计算。在计算中忽略了内含子序列。
由于通过遗传密码简并性/冗余性赋予的可塑性(即一些氨基酸由一种以上的密码子表示),不同生物体或生物体不同类的基因组的进化导致冗余密码子的不同选择。此“密码子偏倚性”反映在蛋白质编码区的平均碱基组成中。例如,有相对低G+C含量的生物体利用在简并密码子第三位有A或T的密码子,而有较高G+C含量的生物体利用在第三位有G或C的密码子。认为mRNA中“稀有”密码子的存在可降低mRNA的绝对翻译率,特别是当对应于稀有密码子的相对丰富的带电荷tRNA低时。此现象的延伸是个别稀有密码子翻译率降低可引起至少对多个稀有密码子进行叠加。因此,有相对高含量稀有密码子的mRNA可有对应的低翻译率。此翻译率通过随后低水平的经编码蛋白质反应出来。
在编码用于玉米(或其它植物,如棉花或大豆)表达的细菌毒素的重新改造基因中,确定了植物的密码子偏倚性。对于玉米的密码子偏倚性是统计该植物用于编码它的蛋白质的密码子分布并且优选的密码子选择在表3中进行显示。确定偏倚性后,确定目的基因中密码子的百分率。确定植物优选的第一密码子以及优选的第二及第三密码子的选择。然后,将目的细菌毒素的氨基酸序列进行反向翻译以使核酸序列正好编码天然基因进行异源表达时所产生的相同蛋白质。用密码子偏倚信息对新DNA序列进行设计,以使它对应目的植物的最优选密码子。然后对新序列用于通过修饰可产生的限制性内切酶位点进行分析。鉴定的位点通过用第二或第三选择的优选密码子替代进行进一步修饰。序列中可影响目的基因转录或翻译的其它位点为外显子:内含子连接处(5’或3’),多聚A添加信号或RNA聚合酶终止信号。将序列进一步进行分析及修饰以降低TA或GC双联体的频率。除了双联体外,具有同时多于约四个残基的G或C序列块可影响序列的转录。因此,序列块也可通过用下一选择的优选密码子替代第一或第二选择的密码子等将这些序列块进行修饰。
                        表2
          玉米基因蛋白质编码区G+C含量的编译
蛋白质类.sup.a   %G+C范围     平均%G+C.sup.b
代谢酶(76)结构蛋白(18)调节蛋白(5)非特征性蛋白质(9)所有蛋白质(108)   44.4-75.348.6-70.557.2-68.841.5-70.344.4-75.3      59.0(.+-.8.0)63.6(.+-.6.7)62.0(.+-.4.9)64.3(.+-.7.2)60.8(.+-.5.2)
.sup.a括号内给出类型基因数目。
.sup.b括号内给出了标准差。
.sup.c平均计算中忽略的组合组平均值
优选编码包含第一选择密码子约63%,第二选择密码子约22%至约37%之间及第三选择密码子约15%至约0%之间(其中总百分率为100%)的细菌毒素的植物优化基因。最优选包含第一选择密码子约63%,第二选择密码子至少约22%,第三选择密码子约7.5%及第四选择密码子约7.5%(其中总百分率为100%)的植物优化基因。用于玉米表达的改造基因优选的密码子选择在表3中显示。以上描述的方法使本领域技术人员能修饰用于特定植物的外源基因以使基因在植物中最佳表达。此方法在PCT申请WO97/13402中进一步阐明。
为了设计编码细菌毒素的植物优化基因,如表2显示的那样用建立自对特定植物基因序列编译的密码子偏倚表的非冗余遗传密码,将所述蛋白质的氨基酸序列反向翻译成DNA序列。将得到的密码子选择完全均一的DNA序列进一步修饰以建立这样的DNA序列,所述DNA序列除了有较高程度密码子多样性外,也包含战略上放置的限制性酶位点、需要的碱基组成及缺乏可能干扰基因转录或产物mRNA翻译的序列。
                   表3
  用于在玉米中表达的蛋白质的优选氨基酸密码子
氨基酸             密码子*
丙氨酸半胱氨酸天冬氨酸谷氨酸苯丙氨酸甘氨酸组氨酸异亮氨酸赖氨酸亮氨酸甲硫氨酸天冬酰胺脯氨酸谷氨酰胺精氨酸丝氨酸苏氨酸缬氨酸色氨酸酪氨酸终止子             GCC/GCGTGC/TGTGAC/GATGAG/GAATTC/TTTGGC/GGGCAC/CATATC/ATTAAG/AAACTG/CTCATGAAC/AATCCG/CCACAG/CAAAGG/CGCAGC/TCCACC/ACGGTG/GTCTGGTAC/TATTGA/TAG
*用于玉米的第一及第二优选密码子。
因此,与本发明毒素/基因功能性相等的合成基因可用于转化宿主,包括植物。关于产生合成基因的其它指导可在例如美国专利号5,380,831中找到。
在一些情况下,特别对于在植物中表达,用表达截短蛋白质的截短基因是有益的。例如在以上背景部分讨论的H_fte等人(1989)讨论了B.t.毒素的原毒素及核心毒素节段。优选的截短基因一般编码全长毒素的40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98或99%。
转基因宿主  可将本发明的毒素编码基因导入多种微生物或植物宿主中。在优选的实施方案中,应用转基因植物细胞及植物。优选的植物(及植物细胞)为谷物、玉米及棉花。
在优选的实施方案中,毒素基因的表达直接或间接地导致杀虫蛋白质的细胞内产生(及维持)。以这种方式可造成植物对昆虫有抗性。当害虫摄入转基因/重组/转化/转染的宿主细胞(或其内容物)时,害虫也摄入了毒素。这是引起害虫与毒素接触的优选方式。结果是控制(杀死或使得病)害虫。吸吮害虫也可用相似的方式进行控制。备选地,适当的微生物宿主,例如假单胞菌如荧光假单胞菌(P.fluorescens),可用于存在靶害虫的部位;微生物可在那里增殖,并被靶害虫摄入。带有毒素基因的微生物可在延长毒素活性及稳定细胞的条件下进行处理。然后保持毒素活性的经处理细胞可用于靶害虫的环境中。
如果将靶基因通过适当载体导入到微生物宿主,且所述宿主以存活状态应用于环境时,应该用某些宿主微生物。选择已知占据一种或多种目的作物“植物圈”(叶面,叶圈,根际和/或根面)的微生物宿主。选择这些微生物以便能在特定环境(作物及其它昆虫栖息地)中与野生型微生物进行成功竞争,提供表达多肽杀虫剂的基因稳定维持及表达,并且希望的是,对杀虫剂提供免受环境降解及灭活的经改进保护作用。
已知许多微生物栖息在很多种重要作物的叶面(植物叶的表面)和/或根际(植物根周围土壤)。这些微生物包括细菌、藻类及真菌。特别令人感兴趣的是微生物,如细菌,例如假单胞菌属(Pseudomonas),欧文氏菌属(Erwinia),沙雷氏菌属(Serratia),克雷伯氏菌属(Klebsiella),黄单胞菌属(Xanthomonas),链霉菌属(Streptomyces),根瘤菌属(Rhizobium),红假单胞菌属(Rhodopseudomonas),嗜甲基菌属(Methylophilius),农杆菌属(Agrobacterium),醋杆菌属(Acetobacter),乳杆菌属(Lactobacillus),节杆菌属(Arthrobacter),固氮菌属(Azotobacter),明串珠菌属(Leuconostoc)及产碱杆菌属(Alcaligenes);真菌,特别是酵母,例如,酵母属(Saccharomyces),隐球酵母属(Cryptococcus)、克鲁维酵母属(Kluyveromyces)、掷孢酵母属(Sporobolomyces)、红酵母属(Rhodotorula)及短柄霉属(Aureobasidium)。特别令人感兴趣的是植物圈细菌种如丁香假单胞菌(Pseudomonas syringae),荧光假单胞菌(Pseudomonas fluorescens),褪色沙雷氏菌(Serratia marcescens),木糖醋杆菌(Acetobacter xylinum),根癌农杆菌(Agrobacterium tumefaciens),类球红假单胞菌(Rhodopseudomonas spheroides),野油菜黄单胞菌(Xanthomonascampestris),苜蓿根瘤菌(Rhizobiurn melioti),富氧粪产碱菌(Alcaligenesentrophus)及瓦黑兰德固氮菌(Azotobacter vinlandii);及植物圈酵母种如深红酵母(Rhodotorula rubra),红酵母(R.glutinis),海滨红酵母(R.marina),橙黄红酵母(R.aurantiaca),浅白隐球酵母(Cryptococcusalbidus),流散隐球酵母(C.diffluens),变黄罗伦隐球酵母(C.laurentii),罗斯酵母(Saccharomyces rosei),普地酵母(S.pretoriensis),酿酒酵母(S.cerevisiae),掷孢酵母(Sporobolomyces roseus),香气掷孢酵母(S.odorus),佛地克鲁维酵母(Kluyveromyces veronae)及出芽短梗霉(Aureobasidium pollulans)也是令人感兴趣的色素微生物。
插入基因以形成转基因宿主  本发明的一方面是用表达本发明蛋白质的本发明多核苷酸转化/转染植物、植物细胞和其它宿主细胞。以这种方式转化的植物可对靶害虫的攻击产生抗性。
可获得很多种方法用于在允许基因稳定维持及表达条件下,将编码杀虫蛋白质的基因导入到靶宿主中。这些方法对本领域技术人员是公知的并例如,在美国专利号5,135,867中的描述。
例如,可获得许多包含大肠杆菌中的复制系统及允许选择经转化细胞的标记物的克隆载体用于向高等植物插入外源基因的制备。载体包括,例如pBR322,pUC系列,M13mp系列,pACYC184等。因此,编码毒素的序列可在适当的限制性位点插入到载体中。将获得的质粒转化到大肠杆菌中。将大肠杆菌细胞在适当的培养基中进行培养,然后进行收获并裂解。重新获得质粒。作为分析方法一般进行序列分析,限制性分析,电泳及其它生物化学-分子生物学方法。在每一操作后,应用的DNA序列可进行切割及与下一个DNA序列连接。每个质粒序列可克隆入相同或其它质粒中。根据向植物中插入目的基因的方法,可能需要其它DNA序列。例如,如果Ti或Ri质粒用于转化植物细胞,则Ti或Ri质粒T-DNA的至少右边界,但常常是右边界及左边界与将插入基因的侧翼区进行连接。用于转化植物细胞的T-DNA的应用已进行了深入研究并在EP 120 516;Hoekema(1985)在The Binary Plant Vector System,Offset-durkkerij Kanters B.V.,Alblasserdam,第5章;Fraley等人,Crit.Rev.Plant Sci.4:1-46;和An等人(1985)EMBO J.4:277-287中进行了与描述。
可获得许多用于向植物宿主细胞中插入DNA的技术。这些技术包括使用T-DNA通过根癌农杆菌(Agrobacterium tumefaciens)或发根农杆菌(Agrobacterium rhizogenes)转化、融合、注射、微粒轰击(biolistics)或电穿孔以及其它可能方法进行转化。如果应用农杆菌用于转化,将欲插入的DNA克隆到特定质粒中,即或插入到中间载体或插入到双元载体中。由于具有与T-DNA中序列同源的序列,中间载体可通过同源重组整合到Ti或Ri质粒中。Ti或Ri质粒也包含对T-DNA转移所必需的vir区。中间载体本身不能在农杆菌中复制。中间载体可通过辅助质粒(结合)转移到根癌农杆菌中。双元载体本身可在大肠杆菌及农杆菌中复制。它们包含构建在T-DNA右边界区及左边界区的选择标记基因及接头或多接头。它们可直接转化到农杆菌中(Holstersetal.[1978] Mol.Gen.Genet.163181-187)。用作宿主细胞的农杆菌包含携带vir区的质粒。Vir区是用于向植物细胞中转移T-DNA必需的。可包含额外T-DNA。如此转化的细菌用于转化植物细胞。植物外植体可与根癌农杆菌或发根农杆菌方便地进行培养,用于向植物细胞中转移DNA。然后整株植物在可包含用于筛选的抗生素或杀生物剂的适当培养基中从受感染植物材料(例如,叶片、茎段、根,还有原生质体或经悬浮培养细胞)再生。然后对如此获得的植物是否存在经插入DNA进行检测。关于注射及电穿孔的质粒无特殊需求,用常规质粒如例如pUC衍生物是可能的。
经转化细胞在植物体内以常规方式生长。它们可形成生殖细胞并将经转化特性传递给子代植物。此类植物可以正常方式进行生长并与具有相同的经转化遗传因子或其它遗传因子的植物进行杂交。得到的杂交个体具有相应的表型特征。
在本发明的一些优选实施方案中,编码细菌毒素的基因从插入到植物基因组中的转录单位进行表达。优选地,所述转录单位为能稳定整合到植物基因组中并能选择表达编码所述蛋白质的mRNA的经转化植物品系的重组载体。
一旦经插入的DNA整合到基因组中,则所述经插入DNA在基因组中相对稳定(并不再出来)。它通常包含使经转化植物细胞可抵抗杀生物剂或抗生素,如卡那霉素、G418、博来霉素、潮霉素或氯霉素等的选择标记。因此单独使用的标记允许选择经转化细胞,而不是选择不包含经插入DNA的细胞。目的基因优选通过组成型或可诱型导启动子在植物细胞中表达。mRNA一旦表达,即翻译成蛋白质,由此将目的氨基酸整合到蛋白质中。编码毒素的基因在植物细胞中的表达可在组成型启动子、组织特异型启动子或可诱导型启动子的控制下。
存在几种技术用于向植物细胞导入外源重组载体并用于获得稳定维持并表达所导入基因的植物。此类技术包括将包裹在微粒上的遗传物质直接导入到细胞中(Cornell的美国专利号4,945,050及DowElanco的,现在为Dow AgroSciences,LLC的5,141,131)。此外,植物可用农杆菌技术进行转化,参见Toledo大学的美国专利号5,177,010;Texas A&M的5,104,310;欧洲专利申请0131624B1;Schilperoot的欧洲专利申请120516,159418B1及176,112;Schilperoot的美国专利号5,149,645,5,469,976,5,464,763及4,940,838及Schilperoot的4,693,976;均属于Max Planck的欧洲专利申请116718,290799,320500;日本烟草局的欧洲专利申请604662及627752,及美国专利号5,591,616;均属于Ciba Geigy现在为Novartis的欧洲专利申请0267159及0292435,及美国专利号5,231,019;均属于Calgene的美国专利号5,463,174及4,762,785;及均属于Agracetus的美国专利号5,004,863及5,159,135。其它转化技术包括whiskers技术。参见均属于Zeneca的美国专利号5,302,523及5,464,765。电穿孔技术也用于转化植物。参见Boyce Thompson研究所的WO87/06614;均属于Dekalb的美国专利号5,472,869及5,384,253;及均属于Plant Genetic Systems的WO 92/09696及WO 93/21335。此外,病毒载体也可用于产生表达目的蛋白质的转基因植物。例如,单子叶植物可用属于Mycogen Plant Science和Ciba-Giegy,现在为Novartis的美国专利号5,569,597以及均属于Biosource的美国专利号5,589,367及5,316,931描述的方法用病毒载体进行转化。
如以前阐述的,DNA构建体导入到植物宿主的方式对本发明不是关键性的。可使用提供用于有效转化的任何方法。例如,用于植物细胞转化的多种方法在文中进行描述并包括用Ti或Ri质粒等进行农杆菌介导的转化。在许多情况下,希望将用于转化的构建体的一侧或两侧邻近T-DNA边界,更具体地为右边界。当构建体应用根癌农杆菌或发根农杆菌转化时,这是特别有用的,虽然T-DNA边界可在其它转化方式中找到其它用途。当农杆菌用于植物细胞转化时,可应用可导入到宿主中用于与宿主中存在的T-DNA或Ti或Ri质粒同源重组的载体。导入载体可通过电穿孔、三亲杂交及其它本领域技术人员已知的用于转化革兰氏阴性细菌的其它技术进行。载体导入到农杆菌宿主中的方式对本发明不是关键性的。包含T-DNA的用于重组的Ti或Ri质粒可能或不能引起菌瘿形成,并且只要在所述宿主中存在vir基因,这对所述发明并不是关键性的。
在农杆菌用于转化的一些情况下,如文中引用作为参考的Ditta等人描述的(PNAS USA(1980)77:7347-7351及EPO 0120 515),将在T-DNA边界内的表达构建体插入到广谱载体如pRK2或其衍生物中。表达构建体及T-DNA内包括文中描述的允许选择经转化农杆菌及经转化植物细胞的一个或多个标记。利用的特别标记对本发明不是必需的,优选的标记取决于所用的宿主及构建体。
对于用农杆菌转化植物细胞,可将外植体与经转化农杆菌进行组合并孵育足够时间以使其转化。转化后,通过用适当的抗生素筛选将农杆菌杀死并且植物细胞用适当的选择性培养基进行培养。一旦形成愈伤组织,根据本领域公知的植物组织培养及植物再生的方法,可通过利用适当植物激素促进枝条形成。然而,愈伤组织中间期不一定是必需的。枝条形成后,将所述植物细胞转移到促进根形成的培养基中,因此完成植物再生。然后植物可长大结种并且所述种子可用于建立后代。不管转化技术为何种技术,编码细菌毒素的基因优选整合到适合在植物细胞中表达所述基因的基因转移载体,其中所述载体中包括植物启动子调节元件以及3’非翻译转录终止区如Nos等。
除了用于转化植物的许多技术外,与外源基因接触的组织型也可变化。此类组织包括但不限于胚发生组织,愈伤组织组织I,II和III型,下胚轴,分生组织,根组织,用于在韧皮部表达的组织等。几乎所有植物组织可在去分化期间用文中描述的适当方法进行转化。
如以上阐述的,如果需要,可用多种可选择标记。对特定标记的优选是由技术人员决定的,但以下任何可选择标记可与任何文中没有列出的作为可选择标记发挥作用的其它基因一起应用。此类可选择标记包括但不限于编码抗抗生素卡那霉素、新霉素及G418的转座子Tn5(AphII)的氨基糖苷磷酸转移酶基因以及编码用于抵抗或耐受草甘瞵;潮霉素;氨甲蝶呤;膦丝菌素(双丙氨膦);咪唑啉酮,磺酰脲及三唑并嘧啶除草剂,如氯硫磺;溴草腈,茅草枯等的那些基因。
除可选择标记外,还希望应用报道基因。在一些情况下,报道基因可在有或无可选择标记时应用。报道基因为一般在受体生物体或组织中不存在,并且一般编码的蛋白质导致一些表型变化或具有酶特性的基因。K.Wising等人,Ann.Rev.Genetics,22,421(1988)提供了此类基因的实例。优选的报道基因包括大肠杆菌uidA基因座的β-葡糖苷酸酶(GUS),来自大肠杆菌Tn9的氯霉素乙酰转移酶基因,来自生物发光水母维多利亚水母(Aequorea victoria)的绿色荧光蛋白及来自北美萤火虫(Photinuspyralis)的萤光素酶基因。然后可在所述基因导入到受体细胞后的适当时间检测报道基因表达。优选的此种测定法需要如通过Jefferson等人(1987Biochem.Soc.Trans.15,17-19)描述的应用编码大肠杆菌uidA基因座β-葡糖苷酸酶(GUS)的基因以鉴定经转化细胞。
除植物启动子调节元件外,来自多种来源的启动子调节元件可有效用于在植物细胞中表达外源基因。例如可应用细菌源的启动子调节元件,如章鱼氨酸合酶启动子,胭脂氨酸合酶启动子,甘露氨酸合酶启动子;病毒源启动子,如花椰菜花叶病毒(35S及19S),35T(为重新改造的35S启动子,参见美国专利号6,166,302,特别是实施例7E)等等。植物启动子调节元件包括但不限于核酮糖-1,6-二磷酸(RUBP)羧化酶小亚单位(ssu),β-伴大豆球蛋白启动子,β-云扁豆蛋白启动子,ADH启动子,热休克启动子及组织特异的启动子。可存在其它元件如基质附着区,支架附着区,内含子,增强子,多聚腺苷酸化序列等等并因此可改进转录效率或DNA整合性。此类元件对DNA功能可需要或可不需要,虽然它们可通过影响转录、mRNA稳定性等提供更好的DNA表达或功能。由于希望获得经转录DNA在植物中的最佳性能,此类元件可包括在DNA中。典型的元件包括但不限于Adh-内含子1,Adh-内含子6,苜蓿花叶病毒包膜蛋白前导序列,玉米条纹病毒包膜蛋白前导序列,以及技术人员可获得的其它元件。因此组成型启动子调节元件也可在所有细胞型中于任何时候均指导持续的基因表达(例如,肌动蛋白,遍在蛋白,CaMV 35S等等)。组织特异启动子调节元件负责在特定细胞或组织型如叶或种子中的基因表达(例如玉米醇溶蛋白,油质蛋白,napin,ACP,球蛋白等等)并且也可应用此类启动子。
启动子调节元件也可在植物发育的某阶段有活性以及在植物组织及器官中有活性。此类实例包括但不限于花粉特异、胚特异、玉米穗特异、棉花纤维特异、根特异、种子胚乳特异的启动子调节元件等。在某些情况下,希望应用诱导型启动子调节元件,其负责对特异信号如物理刺激(热休克基因)、光(RUBP羧化酶)、激素(Em)、代谢物、化学物及应激作出反应的基因表达。可应用在植物中发挥作用的其它所需转录及翻译元件。许多植物特异的基因转移载体是本领域公知的。
可用标准分子生物学技术对文中描述的毒素进行克隆及测序。其它信息可在此处引用作为参考的Sambrook,J.,Fritsch,E.F.和Maniais,T.(1989),Molecular Cloning,A Laboratory Manual(Cold Spring Harbor出版社)一书中找到。
抗性控制  随着杀虫蛋白质在转基因植物中商品化应用的增加,一个须考虑的问题是抗性控制。有许多公司在他们的产品中应用苏云金芽孢杆菌毒素,然而一些昆虫会产生B.t.毒素抗性是令人担心的。一个用于昆虫抗性控制的策略是将致病杆菌,光杆状菌等产生的TC毒素等等与毒素如B.t.(晶体毒素,来自芽孢杆菌菌株的可溶性杀虫蛋白质(参见,例如WO98/18932及WO99/57282))或其它昆虫毒素进行组合。组合物可制备为用于可喷雾应用或可为分子组合物。植物可用产生两个或多个不同昆虫毒素的细菌基因进行转化(参见,例如Gould,38 Bioscience 26-33(1988)及美国专利号5,500,365;同样,欧洲专利申请0 400 246 A1及美国专利5,866,784;5,908,970及6,172,281也描述了用两个B.t.晶体毒素转化植物)。另一个产生包含多个昆虫抗性基因的转基因植物的方法是首先产生两种植物,每种植物包含一种昆虫抵抗基因。然后将这些植物用传统植物育种技术进行杂交以产生包含一种以上昆虫抗性基因的植物。因此,如文中应用的“包含多核苷酸”的短语除了另外特别指明外表示至少一个多核苷酸(且可能更多,为连续或不连续的)。
剂型及其它递送系统  制备成包含目标类芽孢杆菌分离株的芽孢和/或晶体的诱饵颗粒或包含获自文中公开分离株基因的重组微生物,可应用于土壤。经制成产物可作为种子包衣应用或在作物周期晚期进行根处理或整个植物处理而应用。植物及土壤处理细胞可通过与多种惰性物质,如无机矿物质(叶硅酸盐、碳酸盐、硫酸盐、磷酸盐等等)或植物材料(粉碎的玉米芯、稻壳、核桃壳等等)混合用作可湿性粉剂、颗粒剂或粉剂。剂型可包括展布-粘着(spreader-sticker)佐剂、稳定剂、其它杀虫添加剂或表面活性剂。液体剂型可为基于水的或非水的并用作泡沫、凝胶、悬液、乳油等等。成分可包括流变剂、表面活性剂、乳化剂、分散剂或聚合物。
如本领域技术人员理解的,杀虫浓度可有很大变化,这取决于特定的剂型特性,特别是其为浓缩物还是直接应用。杀虫剂可占重量的至少1%,并可占重量的100%。干燥剂型可具有约1-95%重量的杀虫剂,而液体剂型一般在液相中具有约1-60%的固体重量。剂型一般具有约从102至约104个细胞/毫克。这些剂型在每公倾上使用约50mg(液体或干燥物)至1kg或更多。
剂型可通过喷雾、撒粉、喷洒等等应用到害虫的环境中,例如土壤或树叶。
另一个递送方式是将毒素的遗传物质整合到杆状病毒载体中。杆状病毒感染特定昆虫宿主,包括希望用毒素靶向的宿主。可将携带毒素表达构建体的感染性杆状病毒导入到昆虫出没地区以毒死经感染的昆虫。
昆虫病毒或杆状病毒已知感染并对某些昆虫有不利作用。病毒对昆虫的作用缓慢,并且病毒不立即停止昆虫的摄食。因此,不认为病毒是最佳的虫害控制剂。然而,将毒素基因组合到杆状病毒载体中可提供传播毒素的有效途径。此外,由于不同杆状病毒对不同昆虫是特异的,用特定毒素选择性靶向特定实施损害的虫害是可能的。用于毒素基因的特别有用的载体是核多角体病毒。已对使用此病毒的转移载体进行了描述并且现在是用于转移外源基因进入昆虫的选择载体。病毒-毒素基因重组体可以经口传播形式进行构建。杆状病毒通常通过中肠肠粘膜感染昆虫。可将插入到强病毒包膜蛋白启动子后的毒素基因进行表达并快速杀死经感染昆虫。
除了用于本发明蛋白质毒素的昆虫病毒或杆状病毒或转基因植物递送体系外,蛋白质可用苏云金芽孢杆菌包囊技术(诸如但不限于文中引用作为参考的美国专利号4,695,455;4,695,462;4,861,595)进行包裹。用于本发明蛋白质毒素的另一递送体系为将蛋白质制入诱饵基质,然后将诱饵基质应用到地上及地下昆虫诱饵站中。此类技术的实例包括但不限于文中引用作为参考的PCT专利申请WO93/23998。
基于植物RNA病毒的系统也用于表达细菌毒素。在如此做时,可将编码毒素的基因插入到感染目的宿主植物的适当植物病毒的包膜启动子区。然后毒素进行表达,由此对来自昆虫损害的植物提供保护。基于植物RNA病毒的系统在Mycogen Plant Sciences,Inc.的美国专利号5,500,360 to及Biosource Genetics公司的美国专利号5,316,931及5,589,367中进行了描述。
除了产生经转化植物外,希望有对细菌基因进行重新改造的其它递送系统。例如,蛋白质毒素可通过与吸引昆虫的分子融合而构建,从而作为带毒素的食物源。在实验室中纯化后可将有“内部”诱饵的此种毒性剂包装进标准昆虫诱捕房中。
突变体  本发明DAS1529及DB482分离株的突变体可通过本领域公知的方法进行制备。例如,不产孢子突变体可通过用甲磺酸乙酯(EMS)诱变分离株而获得。突变体可通过本领域公知的方法用紫外线及亚硝基胍进行制备。
所有文中谈及的或引用的专利、专利申请、临时申请及出版物完整并入本文,使它们与本说明书的明确教导相一致的程度在文中引用作为参考。
以下为说明实行本发明步骤的实施例。这些实施例不作为限制。除非另外注明,所有百分率为重量百分率且所有溶剂混合物比例为体积比例。
实施例1-DAS1529作为类芽孢杆菌种的分离及杀虫活性的发现
发现称为DAS1529的细菌菌株产生对新生鳞翅目昆虫谷实夜蛾(cornearworm;CEW)、烟芽夜蛾(TBW)及烟草天蛾(THW)具有生长抑制的因子。
DAS1529在添加1.25%NaCl的2%蛋白酶蛋白胨3号(PP3)培养基(Difco Laboratories,Detroit,MI)或在添加0.2%葡萄糖的JB培养基中进行培养。细菌培养物于25℃,150转/分钟生长~40小时。
杀虫活性因子最初在5kDa分子量截止滤波器浓缩的发酵培养液中发现。这些因子是不耐热的(通过于85℃加热20分钟进行灭活)。这些数据表明因子为蛋白质性质的。也参见实施例4末尾。
为鉴定细胞沉淀物中的活性因子,将细菌培养物于8000转/分钟在4℃进行离心5分钟,用无菌蒸馏水洗涤一次,并在无菌蒸馏水中重新悬浮至33X原培养体积,并如以下实施例3描述的进行昆虫生物试验。对DAS1529菌株的生物测定数据在表4中进行了总结。数据显示培养培养液及经浓缩DAS1529细菌细胞对CEW(在33X时,有30至50%死亡率)及TBW(在33X时有100%死亡率)有好的活性。DAS1529中的这些毒素因子与靶向研发谷物及棉花中鳞翅目昆虫(例如,CEW及TBW)的商品化转基因产物有重要相关性。
              表4
    DAS1529菌株的生物测定
昆虫培养液活性沉淀物活性 TBW++++++ CEW+++++ 蛴螬n.d.-
*n.d.-没有测定;-,++,+++,分别为无,中等及高活性
实施例2-DAS1529的分类
进行了分子种系发生以确定DAS1529菌株的分类学关系。确定了DAS1529 16SrDNA的核苷酸序列并用于相似性及系统进化分析(用来自ABI的MicroSeq试剂盒)。序列作为SEQ ID NO:16进行提供。BLAST检索结果如下:
                                                                          核心E
                                                                          (比特)
gi|15395282|emb|AJ320490.1|PTH320490       解硫胺素类芽孢杆菌             2906
0.0
gi|3328014|gb|AF071859.1|AF071859          日本甲虫类芽孢杆菌s...         2834
0.0
gi|3328015|gb|AF071860.1|AF071860          日本甲虫类芽孢杆菌s...         2815
0.0
gi|2769591|emb|Y16129.1|PS16SC168          类芽孢杆菌C-168 1...           2699
0.0
gi|2769590|emb|Y16128.1|PS16ST168          类芽孢杆菌T-168 1...           2509
0.0
gi|2077917|dbj|D78475.1|D78475             解硫胺素类芽孢杆菌
                                                                          2503
0.0
gi|3328016|gb|AF071861.1|AF071861          缓病类芽孢杆菌                 2493
0.0
gi|2895560|gb|AF039408.1|                  Racillus tipchiralis 16S
                                           核糖体                         2493
0.0
gi|2077936|dbj|D88513.1|D88513             解硫胺素类芽孢杆菌
                                                                          2493
0.0
gi|15395283|emb|AJ320491.1|PAL320491       蜂房类芽孢杆菌pa...            2404
0.0
来自BLAST检索的这些相同高分值序列也用来自GCG 10.2版的缺口程序(Needleman和Wunsch,J.Mol.Biol.48;443-453(1970))进行比较,有以下结果:
                                                                          %Ident
%Sim
gi|15395282|emb|AJ320490.1|PTH320490       解硫胺素类芽孢杆菌             99.2  99.6
gi|3328014|gb|AF071859.1|AF071859          日本甲虫类芽孢杆菌s...         99.2
99.6
gi|3328015|gb|AF071860.1|AF071860          日本甲虫类芽孢杆菌s...         99.2
99.3
gi|2769591|emb|Y16129.1|PS16SC168          类芽孢杆菌C-168 1...           97.1
97.3
gi|2769590|emb|Y16128.1|PS16ST168          类芽孢杆菌T-168 1...           97.4
97.4
gi|2077917|dbj|D78475.1|D78475             解硫胺素类芽孢杆菌
                                                                          96.5
98.1
gi|3328016|gb|AF071861.1|AF071861          缓病类芽孢杆菌                 98.8
98.9
gi|2895560|gb|AF039408.1|                  Bacillus tipchiralis 16S
                                           核糖体                         96.0
96.9
gi|2077936|dbj|D88513.1|D88513             解硫胺素类芽孢杆菌
                                                                          96.7
98.7
gi|15395283|emb|AJ320491.1|PAL320491       蜂房类芽孢杆菌pa...            95.2
95.3
[%Ident:明确碱基的配对;%Sim:%Ident加上潜在匹配的不明确碱基]
许多相关序列,包括以上注明的高分值序列,也用序列对比程序CLUSTRAL W(Thompson,J.D.,D.G.Higgins和T.J.Gibson,NucleicAcids Res.22:4673-4680,1994),通过Shida等人的描述(Int.J.Syst.Bacteriol.47:289-298,1997)进行整理及排列。结果清楚地将DAS1529列入Pettersson等人鉴定的类芽孢杆菌属中的日本甲虫类芽孢杆菌/缓病类芽孢杆菌亚群(Int.J.Syst.Bacteriol.49:531-540,1999),并与以上报导的分析一致。此亚群包括昆虫相关种日本甲虫类芽孢杆菌、缓病类芽孢杆菌及解硫胺素类芽孢杆菌(类芽孢杆菌T-168及C-168种),及已知没有昆虫相关性的“Bacillus tipchiralis”(Pettersson等人,1999)。如Wayne等人(Int.J.Syst.Bacteriol.37:463-464,1987)及Vandamme等人(Microbiol.Rev.60:407-438)指出的,大于97%同一性的rDNA序列在没有额外信息时,一般不可用于将细菌菌株归入特定种中。对于DAS1529,对鳞翅目的杀虫活性及硫胺素酶的证据与已知的日本甲虫类芽孢杆菌及缓病类芽孢杆菌不一致,昆虫相关性与已知的解硫胺素类芽孢杆菌(以及其它亚群种)也不一致。
因为其它类芽孢杆菌菌株已知为对日本甲虫(Popillia jalonica)幼虫引起乳白病的病原因子(Harrison等人,2000),将DAS1529对日本甲虫的亲缘物种六月甲虫(June beetles)的活性进行检测。对于在JB与PP3培养基中生长的培养物没有发现活性。显微镜检查这些培养物显示菌体均匀着色,无可见孢子形成或不存在伴孢晶体。我们能显示DAS1529可在定义的培养基及培养条件以及烟草天蛾的血淋巴中形成孢子。已知具有日本甲虫活性的类芽孢杆菌菌株一般与多分孢子及类芽孢体相关(Harrison等人,2000)。
需要额外工作以确定DAS1529是否属于存在种或应归入新种命名。
实施例3-昆虫生物试验方法
应用两种昆虫生物试验方法以获得以下列出的结果。96孔形式及128孔形式用于最初筛选抗鳞翅目昆虫的活性。24孔加入食物的形式用于确定毒素的特异活性(LC50)。
对于96孔形式,人工食物分装到96孔微滴度板中。每孔测量为大约0.32cm2并包含150μl人工食物。样本/毒素以50μl/孔用于发酵培养液、细胞沉淀物及经纯化毒素。包括适当剂量的阳性对照(Cry1Ac)及高剂量的阴性对照(水,空白培养基,不表达靶毒素的细菌宿主菌株)。使样本干燥大约1-3小时以便样本丧失湿度,但食物仍保留湿度。将昆虫卵分散到经样本处理食物的表面上,或每孔种上单一昆虫幼虫。经感染板用铁上(iron-on)聚酯薄膜覆盖或用带孔粘性盖覆盖。在聚酯薄膜上制备小气孔以保证昆虫的空气供应。板于28℃孵育5天并对死亡率及发育障碍进行评分。这在每孔基础上进行,由于每孔中常沉积多个卵,故忽略每孔中幼虫的数目。然后指定每一处理的活性分值:0=无活性,幼虫健康度与水对照孔相同,1=幼虫发育障碍或有一些死亡率的发育障碍,2=所有幼虫死亡。
样本/毒素的特异活性(LC50)在24孔Nutrend板(Nu-TrendTMContainer Corp.,Jacksonville,FL)中通过掺入食物的生物试验进行确定。昆虫人工食物在应用前进行制备并于55℃水浴中保持液体状态。通过将27ml人工食物与不多于3ml样本/毒素混合进行系列稀释(≥5)。将样本与食物混合物总共30ml进行涡旋30秒,然后平均分装到每个板中,装满每孔容积的~50%。在感染前使板冷却至少30分钟。感染每个孔的受试昆虫,将清晰的聚酯薄膜封在每个包含昆虫的板上。用昆虫针在每孔的聚酯薄膜上打上小孔用于空气循环。试验一般于25℃进行6天,但如果需要更快出来结果,一些可于30℃进行4天。对每一试验进行一组阳性及一组阴性对照。试验基于死亡率进行评分,但对发育障碍的数据也进行记录。对受试样本应用统计学方法评估LC50并用ng或μg/ml食物进行表达。
实施例4-来自DAS1529发酵培养液的杀虫毒素-硫胺素酶的生物化学纯 化及表征
DAS1529发酵培养液包含对鳞翅目物种,如烟草蚜虫、谷实夜蛾及烟草天蛾的杀虫活性。通过生物化学纯化及表征对杀虫活性的性质进行了研究。在纯化过程中如实施例3所述进行了谷实夜蛾的生物试验,以了解杀虫活性。
DAS1529发酵培养液用添加1.25%NaCl的2%PP3产生,并如实施例1描述的进行处理。根据制造商推荐,用与Amicon M-12过滤装置连接的Amicon(Beverly,MA)螺旋超滤柱S1Y10(10kDa分子量截止)将四升培养液进行浓缩。将存留物用20mM磷酸钠,pH7.0(缓冲液A)进行渗滤,并以5ml/分钟上样于Q琼脂糖凝胶XL阴离子交换柱(1.6×10cm)。用5倍床体积的缓冲液A将柱进行洗涤以去除未结合的蛋白质。毒素活性通过在缓冲液A中的1.0M NaCl进行洗脱。
包含杀虫活性的级分以20ml等份上样至用缓冲液A平衡的凝胶过滤柱Macro-Prep SE 1000/40(2.6×100cm)上。蛋白质用缓冲液A以3ml/分钟流速进行洗脱。收集对谷实夜蛾有活性的级分并以1ml/分钟流速上样于用20mM Tris-HCl,pH7.0(缓冲液B)平衡的MonoQ(1.0×10cm)柱上。与柱结合的蛋白质用缓冲液B中的0至1M NaCl的线性梯度以2ml/分钟洗脱60分钟。对两毫升级分进行收集并如实施例1描述的对活性进行确定。
向以上活性蛋白质级分中加入固体(NH4)2SO4使终浓度为1.7M。然后以1ml/分钟将蛋白质上样于用在50mM磷酸钾缓冲液,pH7(缓冲液C)中含1.7M(NH4)2SO4平衡的苯基-Superose(1.0×10cm)柱。用10毫升缓冲液C洗柱后,将与柱结合的蛋白质用缓冲液C至5mM磷酸钾,pH7.0的线性梯度以1ml/分钟洗脱120分钟。对通过生物试验确定的最强活性级分合并,并用缓冲液A透析过夜。
经透析样本以1ml/分钟上样于用缓冲液B平衡的Mono Q(0.5×5cm)柱。与柱结合的蛋白质通过在缓冲液B中的0至1M NaCl的线性梯度以1ml/分钟进行洗脱。对活性级分合并,并调整(NH4)2SO4终浓度为1.7M。然后以1ml/分钟将蛋白质上样于用缓冲液C平衡的苯基-Superose(0.5×5cm)柱。与柱结合的蛋白质用缓冲液C至5mM磷酸钾,pH7.0的线性梯度以0.5ml/分钟洗脱40分钟。对经纯化级分合并,并用缓冲液A透析过夜。
最终经纯化毒素的分子量通过凝胶过滤柱Superdex S-200进行检查。毒素显示天然分子量大约为40kDa。经纯化毒素的SDS-PAGE显示大约40kDa的明显条带。这表明天然DAS1529毒素(在此级分中)是大约40kDa的单体。
经纯化毒素在4-20%SDS-PAGE中进行电泳并转印到PVDF膜上。将印迹进行氨基酸分析并进行N末端氨基酸序列测定(SEQ ID NO:17)。使用所述序列查询而搜索蛋白质数据库(NCBI-NR),显示它与来自解硫胺素芽孢杆菌的约42kDa硫胺素酶I有95%同一性(Campobasso等人,1998;基因库登录号2THIA;SEQ ID NO:18)。部分序列比对在图3中显示,它与基因库登录号AAC44156(硫胺素酶I前体;U17168是用于DNA基因库的相应登录号,所述硫胺素酶I前体可进行表达以得到产生并分泌自细菌细胞的硫胺素酶)存在同样比对。对来自DAS1529的经纯化硫胺素酶对谷实夜蛾(CEW)的作用进行了检测,结果在图4中显示。该毒素不能杀死谷实夜蛾(浓度达8μg/cm2)但在浓度低至5ng/cm2时显示95%的生长抑制作用。也发现经纯化硫胺素酶不被蛋白酶K灭活。
实施例5-克隆编码DAS1529产生的杀虫因子基因
为了克隆编码DAS1529产生的杀虫因子的核苷酸序列,用分离自DAS1529的总DNA构建了粘粒文库并对杀虫活性进行了筛选。鉴定了六个产生对谷实夜蛾有杀虫活性的重组粘粒克隆。所述粘粒克隆中有三个产生导致昆虫死亡的不耐热(当加热至85℃持续20分钟)因子。另外三个粘粒克隆产生对昆虫生长抑制的不耐热因子。选择一个产生昆虫死亡的粘粒,命名为粘粒SB12,用于核苷酸序列分析。
A.DAS1529粘粒文库的构建
用DNA纯化试剂盒(Qiagen Inc.,Valencia,CA)从DAS1529分离总DNA。载体及插入DNA的制备、连接及包装,按供应商(Stratagene,La Jolla,CA)的说明进行。将作为Sau3AI DNA片段的DAS1529 DNA插入片段克隆入SuperCos 1粘粒载体的BamHI位点。将经连接产物用Gigapack_III金包装提取物进行包装并转染宿主细胞XL1-Blue MRF’。将转化物在LB-卡那霉素琼脂板上进行筛选。粘粒文库由在200μl LB-卡那霉素(50μg/ml)中的10个96孔微滴度板上生长的960个随机挑选克隆组成,用于昆虫活性筛选及长期保存。
B. 筛选DAS1529粘粒文库的杀虫活性
对于抗鳞翅目昆虫(CEW及TBW)活性的克隆的初步筛选,作为单一菌落的总共960个粘粒克隆在96孔板的2ml培养基中生长。将培养物进行离心,以大约10X浓度重悬于原初培养基中并进行生物试验。包括SuperCos 1载体(SB1)作为阴性对照。从第一轮筛选分离到十六个阳性克隆(SB2至SB17)。进行第二及第三轮筛选以筛选抗TBW及CEW的活性。选择了一个一贯显示最高活性的粘粒克隆(SB12)用于进一步分析。表5总结了SB12粘粒的活性谱(作为经测试的活性谱)。(BAW为甜菜夜蛾(Spodoptera exigua);ECB为欧洲玉米螟(Ostrinia nubilalis);SCRW为南方谷类根虫(Diabrotica undecimzpucata howardi))。SB12大肠杆菌(E.coli)培养培养液均不包含CEW活性;因此,SB12中的活性因子与DAS1529菌株培养培养液中的活性因子不同。
                                表5SB12大肠杆菌克隆的生物试验
昆虫培养液活性沉淀物活性   TBW-+++   CEW-++   ECBn.d.*+     BAWn.d.++     蛴螬n.d.-     SCRn.d.-
*n.d.-未测定;-,++,+++,分别为无,中等,高活性
C.SB12粘粒插入片段的序列测定及tc样和cry样ORF的鉴定
粘粒SB12的核苷酸序列测定显示它包含一个大约34kb的基因组插入片段。这个序列分析令人惊讶地显示存在至少10个推定可读框(ORF)(参见图2)。令人惊讶地发现经鉴定ORF中六个与以前鉴定的来自发光光杆状菌(Waterfield等人,2001)、嗜线虫致病杆菌(Morgan等人,2001)、Serratia entonaophila(Hurst和Glare,2002;Hurst等人,2000)及鼠疫耶尔森氏菌(Yersinia pestis)(Cronin等人,2001)的tcaA,tcaB,tcaC及tccC有一些程度的氨基酸序列同一性(38-48%)。已显示那些来自光杆状菌,致病杆菌及沙雷氏菌的TC蛋白质基因编码杀虫因子。也非常令人感兴趣的是一个DAS1529 ORF与来自苏云金芽孢杆菌的Cry1Ac有~40%的氨基酸序列同一性,其中所述Cry1Ac为另一个以前鉴定为杀虫因子的基因(Schnepf等人,1998;de Maagd等人,2001)。这些发现对理解细菌界中毒素基因分布及研发用于毒素基因搜索及改造的进一步策略有重要意义。
确定了SB12粘粒的核苷酸序列。进一步分析了41,456bp长的经组装DNA。定位了三处缺口:两处位于粘粒载体中,一处位于插入片段中。大约34,000bp的最长毗连序列群的核苷酸序列分析显示存在至少10个推定的可读框(ORF),它们被鉴定为潜在的起始密码子及其后延伸的可读框。已知在与类芽孢杆菌相关的基因组中这个方法对翻译起始位点的错误鉴定率为19%(枯草芽孢杆菌((Bacillus subtilis))及22%(耐盐芽孢杆菌(Bacillus halodurans))(Besemer,J.,Lomsadze,A.,Borodovsky,M.,Nucleic Acids Res.29:2607-2618,2001)。因此,在鉴定天然翻译起始位点时,考虑了与枯草芽孢杆菌16S rRNA 5’末端互补的碱基(在Rocha,E.P.C.,Danchin,A.,Viari,A.,Nucleic Acids Res.27:3567-3576,1999中进行综述)的性质和位置、N末端氨基酸序列及与相关基因的比对。推定的ORF及注释总结在表6中,并在以下进行了更详细的讨论。
                                表6对SB12粘粒序列的序列注释
SEQ ID NO: 一些ORF类似于:   SB12上的ORF命名 评论   SEQ ID NO:1上的序列位置
1   SB12的完整插入片段 (1-33521)
2 tcaA(在5’截短) ORF1 1-3264
    3   翻译ORF1     (1-3261)
4 tcaB   ORF2(去除了IS元件)     3271-4740(5’端)6079-8226(3’端)
5   从最5’端ATG翻译ORF2(无插入片段) (氨基酸1-490/491-1205)
    6 tcaA   ORF3     9521-12820
    7   翻译ORF3     (9521-12817)
    8 tcaB   ORF4     12827-16453
9   从最5’端ATG翻译ORF4 (12827-16450)
    10 tcaC   ORF5     16516-20850
    11   翻译ORF5     (16516-20847)
    12 tccC   ORF6     20867-23659
13   翻译ORF6(从较好的RBS) (20867-23656)
14   ORF7(Cry1529) 24422-26213
    15   翻译ORF7
19 tccC   从最5’端ATG翻译ORF6 20798-23656
粘粒SB12中ORF1开始于DAS1529DNA克隆位点的第一个核苷酸,并因此丢失了其天然翻译起始位点。ORF1与ORF3有显著的DNA序列同源性,并且序列比较分析表明ORF1的头18bp被截短,如ORF3中发现的那样,这前六个密码子编码氨基酸甲硫氨酸-缬氨酸-丝氨酸-苏氨酸-苏氨酸。推测ORF1翻译起始与ORF3的翻译起始相似,从SEQ ID NO:1的大约9505碱基到9523碱基处。如以上提及的,基于备选的翻译起始位点,对于ORF2,ORF4及ORF6给出了两个预测的氨基酸序列(SEQ IDNO:19及13)。对于ORF2,以上讨论了SEQ ID NO:5。备选的及优选的起始位点位于ORF1的3295残基处。因此,从这个起始位点得到的蛋白质开始于SEQ ID NO:5的氨基酸残基9(从较好的RBS翻译)。同样,对于ORF4,以上讨论了SEQ ID NO:9。备选的及优选的起始位点位于SEQ ID NO:1的12,852残基处。得到的蛋白质也丢失了SEQ ID NO:9的前八个氨基酸(因此开始于SEQ ID NO:8的氨基酸残基9-从较好的RBS翻译)。
实施例6-“重复”TC的序列分析
将两个ORF2片段(tcaB1)与ORF4(tcaB2)比较确定序列的同一性程度,并将ORF1(tcaA1)与ORF3(tcaA2)比较确定序列的同一性程度这两对ORF观察到相似的序列关系。
因为本身插入(显然是自发产生的)了插入序列样元件并破坏了ORF2,所以通过合并两个片段而构建了该ORF。参见图2。这个插入片段的位置通过将全长SB12 DNA序列(SEQ ID NO:1)与SEQ ID NO:4的序列进行分析/比较而确定,其中所述后一序列不反映(非编码)插入片段。如图7的括号所指明的,SEQ ID NO:4残基490前的5’翻译产物及从残基491始的3’翻译产物的序列,与ORF4(SEQ ID NO:8)排列很好。在明显插入位点处的DNA序列显示为通常在插入元件侧翼发现的9bp直接重复(CACCGAGCA,SEQ ID NO:1的4734-4742及6071-6080碱基)。
实施例7-进一步的序列分析
总而言之,根据Vector NTI clustalW,GCG和/或Blastp分析,六个经鉴定的ORF(ORF1至ORF6)与tcaA、tcaB、tcaC及tccC(以前鉴定的光杆状菌tc基因)具有38-48%氨基酸序列同一性。ORF7编码与来自苏云金芽孢杆菌的Cry1Ac有~40%氨基酸序列同一性的蛋白质,其中所述Cry1Ac为另一个以前鉴定为杀虫因子的基因。通过将ORF7(Cry1529)与许多其它Cry蛋白质序列比较,产生种系图(图8)。这个系统发育树表明Cry1529与其它日本甲虫类芽孢杆菌Cry序列如Cry18s远缘相关(Zhang等人,1997,Zhang等人,1998),其中所述Cry18s与Cry2s是相近的。Cry1529落入这样一组Cry蛋白质组中(虽然与其并不接近,但仍是最接近的),所述组通常含有在鳞翅目中发现的(Cry1,Cry9)毒素、鞘翅目中发现的(Cry3,Cry8,Cry7)毒素及双翅目中发现的(Cry4)毒素,所述Cry蛋白质组与包括线虫毒素Cry5,-12,-13,-14和-21及Cry2,-18比较为不同的组。
在类芽孢杆菌中发现Cry及TC蛋白质基因(在SB12基因组插入片段中)是令人惊讶的并且是新的发现。新Cry及TC蛋白质基因的鉴定与本领域理解的光杆状菌、致病杆菌及苏云金芽孢杆菌相关,并扩展了发现其中存在Cry及TC蛋白质基因的细菌属的范围。文中鉴定的全长Cry1529的大小对应于Cry1s的核心毒素;Cry1529代表了一类新Cry蛋白质,所述蛋白质对于从苏云金芽孢杆菌及类芽孢杆菌分离进一步的cry基因也有意义。
为了证实这些令人惊讶的现象不是由于菌株污染的结果(即为了证实带有TC及Cry ORF的34kb插入片段真正来自DAS 1529的总DNA),通过Southern印迹杂交及PCR进行了分子分析。对于使用PCR的确认,应用ORF6(tccC样)及ORF7(Cry1529)特异引物(实施例8,表8)以从SB12粘粒及DAS1529总DNA扩增ORF6及ORF7。对于ORF6,用以下参数在PE9600热循环仪(Perkin Elmer)上进行PCR扩增:最初于95℃变性2分钟,然后于95℃变性30秒,于60℃退火45秒,于72℃延伸2分钟进行30个循环,最后于72℃延伸2分钟。对于ORF7,除了退火温度为55℃进行30秒及延伸为72℃进行4分钟外,扩增参数与ORF6相同。对ORF6及ORF7均扩增到预计大小单一条带的特异PCR产物。
最初southern印迹杂交建立在部分SB12 DNA序列基础上并根据标准方法(Sambrock等人,1990)进行。DNA样本包括来自两个独立制备的DAS1529总DNA、SB12粘粒DNA及一个来自NC1(光杆状菌)的阴性对照DNA样本。两个DAS1529 DNA样本均为经证实系类芽孢杆菌种来源的16SrDNA序列,并且一个样本最初用作粘粒文库构建;另一个为新制备物。DNA样本用EcoRI消化,印迹到膜上,并用扩增自SB12的经Roche DIG系统(Roche)标记的180bp PCR产物杂交。PCR引物为与载体及经截短ORF1(与全长ORF3相比较)部分退火的5’CCT CAC TAAAGG GAT CAC ACG G 3’,以及与经截短ORF1(tcaA样)及全长ORF3(tcaA样)退火的5’GGC TAA TTG ATG AAT CTC CTT CGC 3’。检测到了与PCR探针杂交的总共三个DNA片段(0.85kb,2.7kb及8.0kb),其中0.85及8.0kb为SB12中的,2.7及8.0kb为DAS1529 DNA中的。阴性对照中没有检测到信号。0.85kb(从第一个EcoRI ORF1内部片段到载体中的第一个EcoRI位点)及8.0kb(从ORF3中第一个5’EcoRI位点到ORF1中第三个EcoRI位点)与来自SB12的靶DNA片段的经计算大小相匹配。2.7kb片段的检测表明在DAS1529 DNA的ORF1第一个EcoRI位点2.7kb紧上游存在EcoRI位点。这些结果显示SB12插入片段来自DAS1529总DNA,并且基于杂交及限制性分析,可说明ORF的所有拷贝。
实施例8-SB12粘粒ORF编码的蛋白质杀虫活性的特征
进行了随机转座子插入诱变(以破坏单个ORF或整个操纵子)及异源表达(表达单个ORF或整个操纵子)以分离在SB12粘粒中赋予杀虫活性的单个ORF或操纵子。
A.SB12粘粒的随机转座子诱变
用GPS-1基因组启动系统(New England BioLabs,Beverly,MA)按试剂盒说明书自DAS1529粘粒SB12产生Tn诱变文库。简而言之,将2μl 10XGPS缓冲液,1μl pGPS2.1供体DNA(0.02μg),1μlSB12粘粒(0.1μg)及18μl无菌H2O加入到0.5ml管中。加入1μl TnsABC转座酶;将混合物涡旋及然后简短离心以收集管底物质。这个反应混合物于37℃孵育10分钟。加入1μl起始溶液并通过吸上吸下几次进行混合。反应于37℃孵育1小时,然后于75℃热灭活10分钟。将1μl反应混合物用无菌H2O稀释10倍;将1μl经稀释反应物电穿孔入100μl ElectroMAXDH5α大肠杆菌(Gibco BRL,Rockville,MD)中。在SOC培养基中于37℃生长1小时后,将10μl或100μl培养物涂布到包含20μg/ml培养物卡那霉素及15μg/ml氯霉素的LB平板上,接着于37℃孵育过夜。
将来自SB12 Tn诱变的单个菌落划线到包含20μg/ml卡那霉素及15μg/ml氯霉素的新鲜LB平板上。通过划线,进一步接种至包含20μg/ml卡那霉素及15μg/ml氯霉素的50ml LB培养物并于28℃,200转/分钟生长48小时。然后通过以3500转/分钟离心20分钟收集细胞。将上清弃去并将沉淀物用2.5ml培养上清重新悬浮进行20X浓缩。然后将经浓缩的细胞沉淀物用于抗谷实夜蛾的活性分析。将40μl 20X浓缩物表面应用于人造食物,在128孔板中每个样本用8孔。加入新孵育的谷实夜蛾幼虫并饲养5天,然后对死亡率及体重进行记录。
检测了总共184个克隆抗谷实夜蛾活性的丧失。结果总结于表7。Tn克隆的生物试验显示在Cry1529基因中Tn的插入导致活性完全丧失。最初的生物试验显示tc基因中携带Tn插入片段的克隆活性是可变的。与SB12比较,在生物试验前将所有培养物校正到同样的细胞密度,对这些克隆的进一步分析显示没有丧失活性。来自Tn分析的结果表明ORF7(Cry1529)是SB12粘粒的主要杀虫活性组分。
                                表7SB12,Cry1529及tctn插入片段大肠杆菌克隆的生物试验
   插入片段    TBW     CEW   THW   蛴螬     SCRW
   SB12Cry1529中的Tn    +++-     ++-   +++-   --     n.d.-
  tcs中的Tn   +++     ++     +++ - -
*n.d.-未测定;-,++,+++,分别为无,中等及高活性。
B.SB12 ORF/操纵子的异源表达
将Cry1529(ORF7)及五个tc ORF(参见以下表8)在pET101D_系统进行了表达。参见图5。这个表达载体具有经T7调节的基本pET表达系统的全部属性(Dubendorff和Studier,1991;Studier和Moffatt,1986)并可使钝端PCR产物定向克隆到载体中用于高水平的受调控表达,并简化大肠杆菌中的蛋白质纯化。优化的PCR扩增利用高度热稳定并具有3’至5’外切酶校正活性(以校正核苷酸误掺入错误)的高保真PfuTurboTM DNA聚合酶(Stratagene,La Jolla,CA)。当应用ThermalAceTM聚合酶(Invitrogen)时,将点突变导入到tc ORF中,所述点突变通过基于PfuTurboTM的Quick-ChangeTM XL定点诱变试剂盒(Stratagene)进行校正。由于大肠杆菌BL21starTM(DE3)菌株包含普遍增强mRNA稳定性及重组蛋白质产量的rne131突变,将该菌株用作进行表达的宿主(Lopez等人,1999)。
单个ORF是在定义条件下用ORF特异引物(表8)自SB12粘粒中进行PCR扩增得到的。作为定向克隆化必要条件,设计正向PCR引物在5’端包含序列CACC,以保证PCR产物与pET101.D载体中的突出序列GTGG进行碱基配对。反向引物与正向引物配对时会分别扩增每一ORF。PCR反应在包含50ng SB12粘粒DNA,1X Pfu反应缓冲液(Stratagene),每种dNTP 0.2mM,每条引物0.25mM及2U PfuTurbo DNA聚合酶(Stratagene)的50μl反应混合物中进行。PCR扩增在PE9600热循环仪(Perkin Elmer)上用以下参数进行扩增:最初于95℃持续2分钟,接下来于95℃变性30秒,于55℃退火30秒,每kb ORF于72℃延伸2分钟进行35个循环,最后于72℃延伸10分钟。
                                       表8总结用于克隆ORF1-7的PCR引物
ORFs  正向引物(5′至3′)  反向引物(5′至3′)
ORF1(tcaA1)ORF3(tcaA2)ORF4(tcaB2)ORF5(tcaC)ORF6(tccC)ORF7(Cry1529)  CACCATGCTTTATAAGGCCTGGCCACCATGGTGTCAACAACAGACAACACCACCATGACCAAGGAAGGTGATAAGCCACCATGCCACAATCTAGCAATGCCACCATGAAAATGATACCATGGACTCATCCACCATGAACTCAAATGAACCAAATTTATC  TCAGGCCTGCACCGCTCAGGCTTTCGCTGCAGCCTATTTCATAACATATCGAATTGGTCACCGCGCAGGCGGTGAAGCTACTTTCTCTTCATTGAAAACCGGCGGAACTGGAATTAACTTCGATTC
按照供应商(Invitrogen)的说明书将每个ORF的PCR产物克隆入pET101.D。经克隆ORF作为pET101.D质粒DNA进行纯化并对序列进行确定。由于Tn分析表明ORF7是用于控制受试害虫的SB12的主要组分,生物化学分析及昆虫生物试验集中于经异源表达的ORF7蛋白质。对于ORF7表达克隆,DNA序列分析显示与最初SB12DNA序列有100%匹配。根据试剂盒说明书(Invitrogen),ORF7的表达是通过0.5mM IPTG诱导4小时进行的。
C.用于ORF7及tc操纵子杀虫活性的生物试验
生物试验样本制备为完整大肠杆菌细胞、细胞裂解物及经纯化毒素。ORF7(Cry1529)谱及特异活性在表10中进行了总结。Cry1529对烟草天蛾活性最强,对烟芽夜蛾有高度活性(LC50为10μg/ml食物);观察到对于两种昆虫均为100%死亡率。在较高剂量时,Cry1529对谷实夜蛾、甜菜夜娥及黑切根虫(Agrotis ipsilon)具有一些死亡率(20至60%)及相当程度的生长抑制。对于欧洲玉米螟,Cry1529在较高剂量时有一些生长抑制作用。对于一些其它昆虫种(秋天行军虫(fall armyworm),棉子象鼻虫,南方根虫,蚊子),没有检测到活性。对Cry1A(Cry1Ac)抵抗的小菜蛾(diamondback moth;DBMr)及敏感的小菜蛾(DBMs),Cry1529LC50s分别为>50μg/ml及<1.0μg/ml,表明有潜在的交叉抗性。Cry1529对与日本甲虫有亲缘关系的草地蛴螬,没有可检测到的活性。
为检测DAS1529中其它非Cry1529因子的活性,对敲除了Cry1529 tn的SB12粘粒一个克隆(tn67)进行了抗TBW,CEW,SCRW,ECB,BW,BAW,THW,及蛴螬的作用分析;发现对这些害虫没有活性。为了回答tc ORF在SB12背景中潜在的非表达或低表达,将分别表达的tc ORF进行了单独检测,并与其它来自DAS1529的其它TC组合进行了检测;发现对TBW,CEW及蛴螬没有活性。此外,将四个ORF作为单一操纵子在大肠杆菌细胞中表达到很高水平。在体外检测时,全细胞不包含可检测的抗TBW、CEW及蛴螬活性。虽然缺少抗蛴螬活性有些令人感兴趣,但这些结果并不令人惊讶,因为类芽孢杆菌一般感染范围狭窄的蛴螬宿主。鉴于此,可以知道杀虫毒素活性谱也是相对狭窄的。因此需要涉及较宽范围害虫的筛选(用已知方法)及更多时间以鉴定易感害虫。文中列出的结果使人认识到目标TC蛋白质有与来自致病杆菌,光杆状菌等的其它TC蛋白质同样的作用。
将可溶性蛋白质用25mM磷酸钠pH8.0,100mM氯化钠进行提取,并在4-12%NuPAGE梯度凝胶上用1X MES缓冲液(Invitrogen)进行分析。ORF7蛋白质用标准程序进行纯化,N末端序列测定显示了预计的序列:MNSNEPNLSDV。用表达靶蛋白质的细胞密度经过标准化的整个大肠杆菌细胞进行了生物试验。参见图6。大量经纯化ORF7蛋白质用于通过体外生物试验获得ORF7的LC50。经纯化ORF7的热稳定性分析表明于75℃处理5分钟足可废除其抗TBW的活性。参见表9。
                表9.经纯化Cry1529(ORF7)的热稳定性
    样本     活性
    Cry1529,室温Cry1529,50℃进行5分钟Cry1529,50℃进行10分钟Cry1529,75℃进行5分钟Cry1529,75℃进行10分钟Cry1529,100℃进行5分钟     +++++++++---
-,+++,分别为无活性及完全活性
对于tc基因,ORF3及ORF6的无错误克隆用作中间克隆以产生表达ORF3(tcaA)、ORF4(tcaB)、ORF5(tcaC)及ORF6(tccC)的tc操纵子克隆。为了在pET101.D中构建tc操纵子,将包含部分tcaA、完全tcaB和tcaC以及部分tccC的NsiI/SacI片段自SB12粘粒中切除以替代pET101.D-tcaA中的NsiI/SacI插入片段;其接着插入来自pET101.D-tccC的208bp SacI片段,参见图5。将所有四个ORF通过标准的IPTG诱导进行表达到高水平。对于在tc操纵子中表达的ORF6(tccC),经表达蛋白质的大小比通过载体NTI从最5’ATG(SEQ ID NO:18)预测的ORF6略小并是单独表达的。因此,基于核糖体结合位点共有序列的所注释ORF6(SEQ ID NO:13)可能为在SB12及DAS1529中产生的天然蛋白质。
D.毒素的活性谱
Cry1529(ORF7)的毒素活性谱总结于表10中。
                                                表10.大肠杆菌及假单胞菌表达的Cry1529的活性谱
  活性(+++) 形式及方法 物质产生方法 LC50
烟芽夜蛾(TBW)    +++ 96孔上面上样及饮食掺入(分值,死亡率,抑制率) FCP,SE,经纯化,IC 11μg毒素/ml食物与大肠杆菌细胞制备物
谷实夜蛾(CEW)    + 96孔上面上样及饮食掺入(分数,死亡率,抑制率) FCP,SE,经纯化,IC >100μg毒素/g食物
甜菜夜蛾(BAW)    + 96孔上面(分值) FCP,经纯化, >78μg/cm2
草地夜蛾(S.frugiperda)(FAW)    - 96孔上面(分值) FCP,经纯化, >>10μg/cm2
菱形斑纹蛾(DBM)    +++ 96孔上面(分值) FCP,经纯化, 0.02μg毒素/g食物
Cry1抵抗菱形斑纹蛾(rDBM)    + 96孔上面(分值) FCP,经纯化, 59.7μg毒素/g食物
黑切根虫(BCW)    + 96孔上面(分值) FCP,经纯化, >43μg/cm2
欧洲玉米螟(ECB)    + 128孔上面(分值) FCP,经纯化, >43μg/cm2
Culex sp.(蚊子)    - 1oz杯(死亡率) FCP,经纯化, >20μg/mlH2O
南方谷类根虫(SCRW)    - 96孔上面(分值) FCP,经纯化, >>100μg毒素/cm2
Anthonomous grandisgran dis(BW)    - 128孔上面(重量) FCP,经纯化, >>43μg毒素/cm2
烟草天蛾(THW)    +++ (高活性)
Continis mutabilis(甲虫)代表蛴螬    - >>100μg毒素/克土壤
注解:-,+,++,+++分别为(无,低,中,高活性);FCP,经冷冻细胞沉淀物;SE,可溶性提取物;经纯化=柱纯化的Cry1529;IC,P.f.Cry1529包含体
在最初试图确定目标TC/tc ORF活性谱的测定中,只应用了有限范围的害虫。用ORF3-OR6操纵子,获得了以下数据:
                                 表11.对于TcORF的活性谱
  活性(+++) 形式及方法 高剂量   物质产生方法 评论
  烟芽夜蛾(TBW) - 96孔上面(分值) 10X FCP 无作用
  谷实夜蛾(CEW) - 96孔上面(分值) 10X FCP 无作用
  甜菜夜蛾(BAW) - 96孔上面(分值) 10X FCP 无作用
  草地夜蛾(FAW) - 96孔上面(分值) 10X FCP 无作用
  黑切根虫(BCW) - 96孔上面(分值) 10X FCP 无作用
此外,虽然这个初轮筛选没有显示这些TC对这些害虫的活性,本领域技术人员毫无疑问地认为对应于光杆状菌/致病杆菌蛋白质的这些目标蛋白质是有用的。此外,参见以下实施例10。
实施例9-应用PCR引物鉴定来自其它细菌属、种及菌株的Cry1529同系
对于从其它(类芽孢杆菌或其它)菌株中筛选其它的ORF7 cry1529同系物,设计了基因特异的简并PCR引物以扩增1kb的靶ORF7 DNA序列。PCR引物推导自在Cry蛋白质中高度保守的两个非常保守的蛋白质基序(QAANLHL,结构域I,第1区块(block 1)核心用于正向引物;GPGFTGGD,结构域III,第3区块用于反向引物)。这些引物在表12列出并在DAS1529中进行验证。PCR扩增在PE9600热循环仪(PerkinElmer)上用以下参数进行:最初于95℃变性2分钟;接下来于95℃变性30秒,于47℃退火45秒,于72℃延伸2分钟,进行35个循环,最后于72℃延伸10分钟。那些引物对用于通过PCR筛选细菌(非苏云金芽孢杆菌)培养收集物。192个菌株中有5个(3个类芽孢杆菌1个芽孢杆菌及一个未确定菌)产生预计大小的PCR产物。根据初步生物试验筛选也发现这些菌株有CEW活性。然而,用不同引物对获自这些菌株之一中的扩增子进行序列分析显示扩增子不是来自cry基因。
虽然这样,并且由于这些筛选不是穷尽性的,本发明包括对Cry1529样蛋白质及基因筛选类芽孢杆菌亚种、芽孢杆菌亚种(包括苏云金芽孢杆菌及球形芽孢杆菌)等的方法。鉴于在类芽孢杆菌中发现鳞翅目毒性Cry蛋白质的重要特性,本发明也包括总体上用于鳞翅目毒性Cry蛋白质及基因的筛选类芽孢杆菌亚种的方法。多种筛选方法是本领域公知的,包括PCR技术(如以上示例的)、探针及摄食试验(其中将整个细胞摄食靶害虫)。如本领域技术人员易于认识到的,本发明的筛选方法包括在这些筛选中制备及应用克隆文库(如粘粒文库)。
                      表12用于筛选ORF7同系物的PCR引物
    基因特异的简并引物     DNA序列(5′至3′)
    Cry1 529-FCry1 529-RCryPP-FCryPP-RCryPT-FCryPP-F2CryPP-R2CryPT-F2     CAAGCAGCCAACCTCCACCTAATCCCCTCCTGTAAAGCCTGGCAAGCNGCNAATYTWCATYTTCNCCNCCNGTAAANCCWGGCARGCSGCSAAYYTBCAYYTCAAGCWGCWAATYTWCATYTTCHCCWCCWGTAAAWCCWGGCAGGCSGCSAAYYTGCATYT
1529=基因特异;PP=日本甲虫类芽孢杆菌密码子偏倚;PT=解硫胺素类芽孢杆菌密码子偏倚
实施例10-致病杆菌XptA2 TC蛋白质毒素与DAS1529 TC蛋白质的互 补作用
这个实施例提供了用单一操纵子(ORF 3-6,tcaA,tcaB,TcaC及tccC;参见实施例8的C部分)表达的DAS1529 TC蛋白质与来自嗜线虫致病杆菌Xwi(参见SEQ ID NO:49)的XptA2毒素互补的实验证据。进行两个独立的实验以单独表达DAS1529 TC操纵子及XptA2,或在同一大肠杆菌细胞中共表达XptA2基因及TC操纵子。对表达不同毒素/毒素组合物的整个细胞抗鳞翅目昆虫:谷实夜蛾(CEW)及烟芽夜蛾(TBW)的活性进行检测。来自两个实验的数据表明DAS1529 TC蛋白质对受检测的两种昆虫均能增强致病杆菌TC蛋白质XptA2活性。
A.DAS 1529 TC及致病杆菌XptA2的共表达
TC操纵子的表达通过携带ColEl复制起点及氨苄青霉素抗性选择标记的pET101.D表达载体(Invitrogen)中的T7启动子/lac操纵基因进行调节。Tc操纵子的克隆与表达的综合性描述可在实施例8的C部分找到。将XptA2基因克隆入带有氯霉素抗性选择标记及与ColEl相容的复制起点的pCot-3表达载体中。pCot-3载体表达系统也通过T7启动子/lac操纵基因进行调节。因此,相容的复制起点及不同的选择标记形成了TC操纵子与XptA2在同一大肠杆菌细胞中共表达的基础。将带有TC操纵子及XptA2的质粒DNA单独或组合转化入大肠杆菌BL21StarTM(DE3)中。在包含50μg/ml羧苄青霉素的LB琼脂平板上用于pET101.D-TC操纵子转化体的筛选,在包含50μg/ml氯霉素的平板上用于pCot-3-XptA2转化体的筛选,并且在包含这两种抗生素的平板上用于pET101.D-TC操纵子/pCot-3-XptA2转化体的筛选。为抑制基础毒素的表达,在琼脂及液体LB培养基中均包括终浓度为50mM的葡萄糖。
对于毒素的产生,用在LB琼脂平板上生长的过夜培养物接种包含抗生素及50mM葡萄糖的5ml及50ml LB培养基。培养物在摇床上以300转/分钟于30℃生长。一旦培养物密度在600nm达到O.D.~0.4,向培养基中加入终浓度为75μM的IPTG以诱导基因表达。24小时后,将大肠杆菌细胞收获,用于通过NuPAGE系统(Invitrogen)进行蛋白质凝胶分析。来自0.5ml 1X培养培养液的细胞沉淀物用100μl 1X NuPAGE LDS样本缓冲液重悬。简要超声处理并煮沸5分钟后,将5μl样本上样到4至12%NuPAGE bis-tris梯度凝胶中用于总蛋白特性分析。当单独表达时或在存在TC操纵子表达时,XptA2表达到可检测水平。基于Personal密度计SI(Molecular Dynamics)凝胶扫描分析,XptA2与TC操纵子共表达时,与XptA2独自表达相比,其表达几乎高达8X。对于5ml诱导实验,XptA2有几乎相等的表达。
B.杀虫活性的生物试验
如实施例8描述的,单独表达或作为操纵子表达时,DAS 1529tc ORF显示对TBW及CEW没有活性。以下生物测定实验集中于确定类芽孢杆菌(DAS1529)TC蛋白质(ORF3-6的TC蛋白质;TcaA-,TcaB-,TcaC-及TccC-样蛋白质)是否能与致病杆菌TC蛋白质毒素活性(XptA2为示例)互补。生物测定样本制备为将完整大肠杆菌细胞在4X细胞浓缩物中用于5ml诱导实验,XptA2及XptA2/TC操纵子细胞均包含非常低但几乎等量的XptA2毒素。表13中的数据显示在受检测的4X细胞浓缩物中,TC蛋白质+致病杆菌XptA2对CEW有活性。这提供了类芽孢杆菌DAS1529 TC蛋白质对致病杆菌XptA2辅助作用的第一个证据。
表13  DAS1529 TC辅助致病杆菌XptA2抗谷实夜蛾作用的生物试验
  昆虫阴性对照TC(DAS1529)致病杆菌XptA2TC蛋白质+致病杆菌XptA2               CEW
              ---++
*-,++,+++=分别为无,中等及高活性
对于第二个生物测定实验,将XptA2细胞及XptA2+TC操纵子细胞中XptA2蛋白质的量在光密度计凝胶扫描分析的基础上进行校正。如表14中显示的,XptA2本身在40X时对TBW(烟芽夜蛾)有中等活性,但在20X及低于20X时,活性降到不可检测水平。然而,当与TC共表达时,在存在10X及5X的XptA2时高水平活性非常明显,在1.25X XptA2时仍检测到低活性。这些观察现象表明1529TC蛋白质对致病杆菌XptA2的抗烟芽夜蛾能力有显著的增强作用。在检测的最高剂量中,阴性对照及tc操纵子本身对这个害虫均没有任何活性。
            表14 DAS1529 TC辅助XptA2抗烟芽夜蛾作用的生物测定
  经校正的XptA2   40X   20X   10X     5X     2.5X     1.25X
 XptA2TCs+XptA2   +n.d.   -n.d.   -++     -++     n.d.+     n.d.-
*n.d.-未测定;-,+,++,+++=分别为无,低,中等及高活性
实施例11-Cry1529蛋白质对胰蛋白酶消化的稳定性
本实施例教导了SEQ ID NO:14公开的DNA序列的修饰,所述DNA序列编码Cry1529蛋白质(SEQ ID NO:15公开的)以至新的经编码蛋白质比天然蛋白质对蛋白水解消化更有抗性。蛋白质在昆虫肠中的消化限制了昆虫暴露于蛋白质毒素的时间。因此,降低蛋白质毒素对蛋白酶消化的易感性可用于增加蛋白质的效力。
对于这些检测,将胰蛋白酶(例如,Sigma Chemical#T1426)及胰蛋白酶抑制剂(例如,Sigma Chemical#T9008)在50mM Tris HCl缓冲液,pH8中制备成4mg/mL或10mg/mL的储存液。检测为:用多种浓度的胰蛋白酶及Cry1529蛋白质于37℃孵育1小时,并通过加入等体积的等浓度胰蛋白酶抑制剂进行终止(例如,接受35μl 4mg/mL胰蛋白酶溶液的消化通过加入35μl 4mg/mL胰蛋白酶抑制剂进行终止)。一个典型实验是,Cry1529蛋白质通过适当的改造的大肠杆菌细胞产生并通过以上描述的步骤进行纯化,所述纯化包括通过大小排阻柱与其它蛋白质分开。消化后,蛋白酶产物通过标准的丙烯酰胺凝胶电泳进行分析,接着用制备的抗Cry1529蛋白质的抗体进行免疫印迹分析。此种实验结果在图9中进行显示。
胰蛋白酶消化产生两个主要蛋白质产物,其中较小的分子量大约为50kDa。应当注意这个消化模式与来自Cry1529-His6蛋白质的胰蛋白酶消化产生的消化模式相同,其中所述Cry1529-His6蛋白质除了在羧基末端加入氨基酸KGELNSKLE GKPIPNPLLGLDSTRTGHHHHHH外,它与SEQ ID NO:15的天然Cry1529蛋白质氨基酸序列相同。Cry1529-His6的编码区通过将天然Cry1529蛋白质的编码区连接到pET101/D-TOPO_载体中(InvitrogenTM,Carlsbad,CA)而产生。制备的这个重组克隆通过结合到商业上可获得的其表位以氨基酸序列GKPIPNPLLGLDSTRTG(在上面序列中以下划线标出)表示的V5抗体,或通过利用六个组氨酸残基(在上面序列中以双下划线标出)的纯化策略有助于重组Cry1529蛋白质的纯化。用于这些操作的步骤根据pET101/D-TOPO_载体提供的说明书进行。
发现用胰蛋白酶消化Cry1529-His6蛋白质导致去除了在昆虫生物试验中其抗鳞翅目昆虫的活性。用MALDI-TOF分析确定包含50kDa肽N末端的氨基酸序列,确定了对应于SEQ ID NO:15氨基酸残基122位(R,精氨酸)及126位(K,赖氨酸)的两个蛋白酶加工位点。用Quick Change_诱变方法(Stratagene,La Jolla,CA)对天然DNA序列(SEQ ID NO:14)进行修饰以去除经编码蛋白质中的第一个胰蛋白酶切割位点。在SEQ ID NO:15的120至123位区域的氨基酸中进行了三个不同类型的突变:RARA至HANA,RARA至RARS及RARA至QANA。用于这些突变的DNA寡核苷酸引物(对每条链以5’至3’方向列出)在以下表15中列出。与天然DNA序列不同的碱基用下划线标出。
                                表15
突变 正向(编码链)引物  反向(互补链)引物
RARA至HANA(pMYC2865)RARA至QANA(pMYC2866)RARA至RARS(pMYC2867) AAAATGATTCTAATAATTTA CACGCG AACGCTGTAGTGAAAGACAAAATGATTCTAATAATTTA CAAGCG AACGCTGTAGTGAAAGACAAAATGATTCTAATAATTTAAGAGCGAGATCTGTAGTGAAAGAC  GTCTTTCACTACAGC GTTCGC GTGTAAATTATTAGAATCATTTTGTCTTTCACTACAGC GTTCGC TTGTAAATTATTAGAATCATTTTGTCTTTCACTAC AGATCTCGCTCTTAAATTATTAGAATCATTTT
野生型及通过这些引物导入的经突变编码区的比较在下表中进行了显示。相关的氨基酸残基以粗体显示。
                                        表16
野生型:氨基酸:RARA至HANA:氨基酸:RARA至QANA:氨基酸:RARA至RARS:氨基酸: gAA AAT GAT TCT AAT AAT TTA AGA GCG AGA GCT GTA GTG AAA GAC(E)  N   D   S   N   N   L   R   A   R   A   V   V   K   D115                 120     122 123     125 126gAA AAT GAT TCT AAT AAT TTA CACGCG AAC GCT GTA GTG AAA GAC(E)  N   D   S   N   N   L   H   A   N   A   V   V   K   DgAA AAT GAT TCT AAT AAT TTA CAAGCG AAC GCT GTA GTG AAA GAC(E)   N   D  S   N   N   L   Q   A   N   A   V   V   K   DgAA AAT GAT TCT AAT AAT TTA AGA GCG AGA TCTGTA GTG AAA GAC(E)  N   D   S   N   N   L   R   A   R   S   V   V   K   D
将单独的经突变编码区单个克隆到pET101/D-TOPO_载体中,这允许可诱导产生Cry1529变体蛋白质。包含所述构建体的大肠杆菌细胞生长,并通过供应商推荐的方法诱导Cry1529变体基因的表达。然后将经收获细胞在胰蛋白酶消化测定中进行检测并如以上进行分析。一般结果在图10中显示。对于这些实验,将10mg完整细胞沉淀物在50mM Tris HCl,pH8.0中进行悬浮,并在终体积为1mL中,用100μL的10mg/mL胰蛋白酶中于37℃消化3小时。在孵育期间,时常混合这些反应物。通过加入100μL的10mg/mL胰蛋白酶抑制剂将消化终止并将管保存在冰上。
这些结果证实天然Cry1529(RARA)及Cry1529-His6(RARA)蛋白质均被胰蛋白酶消化以产生约50kDa的主要产物。当将对应于胰蛋白酶切割位点的RARA序列突变为HANA或QANA时,获得了相当高程度的对胰蛋白酶消化的抗性。不产生50kDa肽,并存在易于检测的明显全长Cry1529-His6蛋白质的量。RARA位点向RARS的突变不消除产生50kDa肽,但相当程度地降低了蛋白酶切割的速率。因此,Cry1529蛋白质中蛋白酶加工位点的突变基本上降低了其对蛋白酶消化的易感性,这使蛋白质在摄入后在昆虫肠中定居较长时间期,导致杀死易感昆虫的效力增强。
实施例12-设计PCR引物,用于检测其它类芽孢杆菌株中IDAS1529 tc ORF同系物
如以上显示,类芽孢杆菌IDAS1529菌株产生对多种鳞翅目昆虫有毒性的细胞外蛋白质。该菌株的16S核糖体基因的分子种系发生表明它与解硫胺素类芽孢杆菌-缓病类芽孢杆菌-日本甲虫类芽孢杆菌群成员最相关。也显示类芽孢杆菌IDAS1529菌株包含毒素复合体基因(此后称为tc基因)及称为cry1529的新杀虫晶体包含体蛋白质基因这两者。试图确定在类芽孢杆菌属其它成员中是否存在tc同系物,对收集的类芽孢杆菌菌株通过聚合酶链反应(PCR)及杂交分析进行筛选。对于PCR分析,将分离自类芽孢杆菌菌株的总DNA用作模板,并用在类芽孢杆菌IDAS1529菌株、光杆状菌种及致病杆菌种中发现的tc基因特异的寡核苷酸引物进行筛选。将用tc引物组获得的扩增产物进行克隆及确定它们的核苷酸序列,并与获自类芽孢杆菌IDAS1529菌株的tc序列进行比较。以下实施例说明个人怎样设计tc特异寡核苷酸引物并用PCR在类芽孢杆菌分离株的总DNA中寻找与类芽孢杆菌IDAS1529菌株、光致病菌种及致病杆菌种中确定的tc基因同源的DNA序列。通过用PCR分析(如文中描述),可能在与类芽孢杆菌IDAS1529菌株及解硫胺素类芽孢杆菌-缓病类芽孢杆菌-日本甲虫类芽孢杆菌群不同的类芽孢杆菌种中确定tc同系物。
12.A.-从类芽孢杆菌菌株中提取总DNA
类芽孢杆菌菌株在营养琼脂平板(8g/l营养培养液,15g/l细菌用琼脂;Difco Laboratories,Detroit,MI)上于30℃生长3-5天。挑取单菌落并接种到包含100ml无菌营养培养液(8g/l营养培养液;Difco Laboratories,Detroit,MI)的500ml三挡板烧瓶中。在旋转摇床上以150转/分钟于30℃孵育24-72小时后,将培养物分装到无菌500ml聚乙烯瓶中并于4℃,6,500xg离心1小时。离心后,将上清液弃去并保留细菌细胞沉淀物。用QIAGEN Genomic tip系统100/G及相关的基因组DNA缓冲液组(QIAGEN Inc.,Valencia,CA,USA)按正如制造者描述的用于细菌的样本制备及裂解方法从细胞沉淀物中提取总DNA。经提取的总DNA在0.5ml TE缓冲液(10mM Tris-HCl,pH8.0;1mM EDTA,pH8.0)中进行溶解。
12.B.-用于PCR的tc特异寡核苷酸引物的选择
为了选择以前自类芽孢杆菌IDAS1529菌株鉴定的tc基因特异的寡核苷酸引物,将获自类芽孢杆菌IDAS1529菌株,光杆状菌W14菌株及致病杆菌Xwi菌株的tcaA,tcaB,tcdB及tccC的核苷酸序列使用在Vector NTI软件包(Informax,Inc.,Frederick,MD)中的比对程序进行比对。在表17中列出了用于此分析的核苷酸序列。
                     表17.用于tc特异引物选择的核苷酸序列
    基因 生物来源   核苷酸序列来源     基因名
tcaA1 类芽孢杆菌IDAS1529菌株 SEQ ID NO:2 tcaA1-1529
tcaA2 类芽孢杆菌IDAS1529菌株 SEQ ID NO:6 tcaA2-1529
tcaA 光杆状菌W14菌株   基因库:登录号AF346497 tcaA-W14
tcaB1 类芽孢杆菌IDAS1529菌株 SEQ ID NO:4 tcaB1-1529
tcaB2 类芽孢杆菌IDAS1529菌株 SEQ ID NO:8 tcaB2-1529
tcaB 光杆状菌W14菌株   基因库:登录号A F346497 tcaB-W14
    tcdB1 光杆状菌W14菌株   SEQ ID NO:42     tcdB1-W14
    tcdB2 光杆状菌W14菌株   SEQ ID NO:43     tcdB2-W14
    xptC1 致病杆菌Xwi菌株   SEQ ID NO:20     xptC1-Xwi
tcaC 类芽孢杆菌IDAS1529菌株 SEQ ID NO:10 tcaC-1529
    tccC1 光杆状菌W14菌株   SEQ ID NO:44     tccC1-W14
    tccC2 光杆状菌W14菌株   SEQ ID NO:45     tccC2-W14
    tccC3 光杆状菌W14菌株   SEQ ID NO:46     tccC3-W14
    tccC4 光杆状菌W14菌株   SEQ ID NO:47     tccC4-W14
    tccC5 光杆状菌W14菌株   SEQ ID NO:48     tccC5-W14
    xptB1 致病杆菌Xwi菌株   SEQ ID NO:21     xptBI-Xwi
tccC 类芽孢杆菌IDAS1529菌株 SEQ ID NO:19 tccC-1529
12.B.i.-tcaA特异引物的选择
tcaA1-1529,tcaA2-1529及tcaA-W14核苷酸序列的对比确定了核苷酸序列同一的具有足够长度的两个区域,用于选择具最小简并性的PCR引物(图10中显示的加框区)。选择这两个区域用于合成tcaA特异引物,将所述引物命名为SB105及SB106(表18及19)。
12.B.ii.-tcaB特异引物的选择
tcaB1-1529,tcaB2-1529及tcaB-W14核苷酸序列的对比确定了核苷酸序列同一的具有足够长度的四个区域,用于选择具最小简并性的PCR引物(图11)。选择这四个区域用于合成tcaB特异引物,将所述引物命名为SB101,SB102,SB103及SB104(表18及19)。
12.B.iii.-tcaC特异引物的选择
tcdB1-W14,tcedB2-W14,xptC1-Xwi及tcaC-1529核苷酸序列的对比确定了核苷酸序列同一的具有足够长度的两个区域,用于选择具最小简并性的PCR引物(图12)。选择这两个区域用于合成tcaC特异引物,将所述引物命名为SB215及SB217(表18及19)。
12.B.iv-tccC特异引物的筛选
tccCl-W14,tccC2-W14,tccC3-W14,tccC4-W14,tccC5-W14,xptB1-Xwi及tccC-1529核苷酸序列的对比确定了核苷酸序列同一的具有足够长度的两个区域,用于选择具最小简并性的PCR引物(图13)。选择这两个区域用于合成tccC特异引物,将所述引物命名为SB212及SB213(表18及19)。
                               表18 tc特异引物
    引物名称   引物长度 引物序列(5’至3’)   SEQ IDNO.
    SB101     32   GCKATGGCSGACCCGATGCAWTACAAGCTGGC*     22
    SB102     32   AGCGGYTGACCRTCCAGRCTCARATTGTGGCG     23
    SB103     28   TGTATAACTGGATGGCYGGWCGTCTSTC     24
    SB104     26   TCRAAAGGCAGRAAMCGGCTGTCGTT     25
    SB105     28   CTTCYCTKGATATCYTKYTGGATGTGCT     26
    SB106     30   ACGRCTGGYATTGGYAATCAGCCARTCCAA     27
    SB212     27   CGYTATIAATATGAYCCKGTVGGYAAT     28
    SB213     25   CATCBCGYTCTTTRCCIGARTARCG     29
    SB215     33   CGHAGCTCYICCCAGTWYTGGCTGGATGARAAA     30
    SB217     32   GTRTCATTTTCATCTTCRTTBACIRYAAACCA     31
*K=G或T;S=G或C;W=A或T;Y=C或T;R=G或A;M=A或C;V=G或C或A;B=G或T或C;H=A或C或T,I=次黄苷
                     表19.tc引物组合
靶基因 正向引物 反向引物 预计扩增产物的近似大小
    tcaAtcaBtcaBtcdBtccC     SB105SB101SB103SB215SB212     SB106SB102SB104SB217SB213     1.4kb0.4 kb0.65kb2.2kb0.9kb
实施例13-类芽孢杆菌DNA的PCR扩增
对于用tcaA特异引物组及tcaB特异引物组进行PCR扩增,将获自每一类芽孢杆菌菌株的3-5μl总DNA与50pmole的每种引物及1X EppendorfMasterMix(Eppendorf AG;Hamburg,德国)在20μl反应体积中进行混合。扩增条件为于94℃变性3分钟,接着于94℃变性1分钟,于52℃退火1.5分钟,于72℃延伸1.5分钟,进行30个循环,接着于72℃最后延伸5分钟。
对于用tcaC特异引物组及tccC特异引物组的PCR扩增,将获自每一类芽孢杆菌菌株的大约375ng总DNA与50pmole的每种引物及12.5μlEpicentre_ FailSafeTM缓冲液D及2.5U Epicentre_ FailSafeTM聚合酶(Epicentre;Madison,WI)在25μl反应体积中进行混合。扩增条件为于96℃变性4分钟,接着于94℃变性30秒,于64℃退火30秒,于70℃延伸30秒,进行40个循环。对每个循环,退火温度降低0.5℃,且延伸时间增加5秒。
13.A.-PCR扩增产物的凝胶电泳、克隆及核苷酸序列的确定
PCR扩增反应用0.8至1%Seakem LE琼脂糖(BioWhittakerMolecular Applications,Rockland,ME)在1X TAE缓冲液中通过凝胶电泳进行检查。将扩增产物正如厂商描述的那样用TOPOTA_克隆试剂盒(Invitrogen Life Technologies,Carlsbad,CA)克隆到载体pCR2.1-TOPO_中。经克隆扩增产物的核苷酸序列用M13正向、M13反向及如需要用tc序列特异的测序引物进行确定以获得每个经克隆扩增产物的双链序列。用CEQ Dye终止子循环测序快速启动试剂盒(Beckman Coulter,Fullerton,CA,USA)及CEQ 2000XL DNA分析系统(Beckman Coulter)正如制造者所指导的那样进行核苷酸序列的测定。将Sequencher(v.4.1.4)软件包(Gene Codes,Ann Arbor,MI)用于自测序数据中构建毗连序列群并确定用于每个扩增产物的共有序列。
13.B.-PCR扩增产物的核苷酸序列分析
13.B.i.-tcaA
当用获自收集的类芽孢杆菌菌株收集物的总DNA用tcaA-(引物组合SB105及SB106)进行PCR时,观察到获自蜂类芽孢杆菌菌株(NRRLNRS1438;此后称为DB482)的总DNA产生预计大小的扩增产物。将扩增产物进行克隆并测序。
将用SB105及SB106引物组合获得的扩增产物命名为tcaA2-DB482。当tcaA2-DB482的序列(SEQ ID NO:32)与获自类芽孢杆菌IDAS1529菌株及光杆状菌W14菌株的tcaA序列比较时,观察到tcaA2-DB482与tcaA2-1529有最大的核苷酸序列同一性(在1,239个核苷酸中同一性为90.5%)(表20)。由tcaA2-DB482编码的经推导氨基酸序列(命名为TcaA2-DB482;SEQ ID NO:33)与tcaA2-1529的相应经推导氨基酸序列(命名为TcaA2-1529;SEQ ID NO:7)有89.1%的同一性。
    表20.tcaA2-DB482的核苷酸及氨基酸序列与tcaA1-1529,tcaA2-1529及tcaA-W14对应区的同一性
    基因     与tcaA2-DB482的核苷酸同一性% 与tcaA2-DB482的经推导氨基酸序列同一性%
    tcaA1-1529tcaA2-1529tcaA-W14           579050           338932
13.B.ii-tcaB
将用SB101及SB102引物组合及SB103及SB104引物组合获得的扩增产物分别命名为tcaB2a-DB482及tcaB2b-DB482。当tcaB2a-DB482(SEQID NO:34)及tcaB2b-DB482(SEQ ID NO:35)与获自类芽孢杆状菌IDAS1529菌株及光杆状菌W14菌株的tcaB序列进行比较时,观察到这两个序列均与tcaB1-1529及tcaB2-1529有最大的核苷酸序列同一性(表21)。tcaB2a-DB482及tcaB2b-DB482与tcaB2-1529的核苷酸序列同一性分别为92.6%和89.8%。由tcaB2a-DB482(命名为TcaB2a-DB482;SEQID NO:36)与tcaB2b-DB482(命名为TcaB2b-DB482;SEQ ID NO:37)编码的经推导氨基酸序列与tcaB2-1529对应的经推导氨基酸序列(命名为TcaB2-1529;SEQ ID NO:9)同一性分别为91.2%和91.1%。
   表21.tcaB2a-DB482及tcaB2b-DB482与tcaB1-1529,tcaB2-1529及tcaB-W14对应区的核苷酸及推导氨基酸序列的同一性
 基因     与tcaB2a-DB482的核苷酸同一性%     与tcaB2b-DB482的核苷酸同一性%     与TcaB2a-DB482的经推导氨基酸序列同一性%     与TcaB2b-DB48的经推导氨基酸序列同一性%
 tcaB1-1529tcaB2-1529tcaB-W14     939363     939057     949159     929257
13.B.iii-tcdB
用tcaC特异引物组合(SB215及SB217)对获自DB482的总DNA进行PCR时,产生预计大小的扩增产物。将扩增产物进行克隆并测序。
将用SB215及SB217引物组合获得的扩增产物命名为tcaC-DB482。当tcaC-DB482序列(SEQ ID NO:38)与获自类芽孢杆菌IDAS1529菌株、致病杆菌Xwi菌株及光杆状菌W14菌株的tcaC序列进行比较时,观察到tcaC-DB482与tcaC-1529有最大的核苷酸序列同一性(在2,091个核苷酸中同一性为93.5%)(表22)。由tcaC-DB482编码的经推导氨基酸序列(命名为TcaC-DB482;SEQ ID NO:39)与tcaC-1529对应的经推导氨基酸序列(命名为TcaC-1529;SEQ ID NO:11)同一性为91.1%。
表22.tcaC-DB482与xptC1-Xwi、tcdB1-W14、tcdB2-W14及tcaC-1529对应区的核苷酸及推导氨基酸序列的同一性
    基因   与tcaC-DB482的核苷酸序列同一性% 与TcaC-DB482的经推倒氨基酸序列同一性%
    tcaC-1529xptC1-XwitcdB1-W14tcdB2-W14           93505050           91353636
13.B.iv.-tccC
当用tccC特异引物组合(SB212及SB213)将获自收集的类芽孢杆菌菌株的总DNA进行PCR时,观察到来自DB482的总DNA产生预计大小的扩增产物。将扩增产物进行克隆并测序。
将用SB212及SB213引物组合获得的扩增产物命名为tccC-DB482。当tccC-DB482序列(SEQ ID NO:40)与获自类芽孢杆菌IDAS1529菌株、致病杆菌Xwi菌株及光杆状菌W14菌株的tccC序列进行比较时,观察到tccC-DB482与tccC-1529有最大的核苷酸序列同一性(在858个核苷酸中同一性为93.7%)(表23)。由tccC-DB482编码的经推导氨基酸序列(命名为TccC-DB482;SEQ ID NO:41)与tccC-1529对应的经推导氨基酸序列(命名为TccC-1529;SEQ ID NO:13)同一性为95.5%。
表23.tccC-DB482与xptB1-Xwi、tc-W14、tccC-1529及来自光杆状菌W14菌株tcc基因对应区的核苷酸及推导氨基酸序列的同一性
    基因   与tccC-DB482的核苷酸序列同一性% 与TccC-DB482的经推倒氨基酸序列同一性%
    tccC-1529xptB1-XwitccC1-W14tccC2-W14tccC3-W14tccC4-W14tccC5-W14          94545456565654          96454845464644
13.C.-PCR分析总结
本实施例(及文中其它实施例)阐述了基于三个细菌属的tc基因设计寡核苷酸引物的方法及这些引物的用途,用于PCR筛选类芽孢杆菌菌株,由此可鉴定在那些菌株中存在的tc同系物。显示分离自蜜蜂幼虫的蜂类芽孢杆菌(作为NRRLB-30670保藏)的分离株DB482包含tcaA、tcaB、tcaC及tccC的同系物。这些tc同系物的发现证实类芽孢杆菌IDAS1529菌株在类芽孢杆菌属中不是唯一存在tc基因的菌株。因此,本领域技术人员可用这些及其它方法以确定在其它类芽孢杆菌种如软骨素类芽孢杆菌(P.chondroitinus),解藻酸类芽孢杆菌(P.alginolyticus),幼虫类芽孢杆菌(P.larvae),强壮类芽孢杆菌(P.validus),戈氏类芽孢杆菌(P.gordonae),蜂房类芽孢杆菌(P.alvei),缓病类芽孢杆菌,日本甲虫类芽孢杆菌,解硫胺素类芽孢杆菌,解菌多糖类芽孢杆菌(P.curdlanaolyticus),神户类芽孢杆菌(P.kobensis),解糖类芽孢杆菌(P.glucaizolyticus),灿烂类芽孢杆菌(P.lautus),千叶类芽孢杆菌(P.chibensis),马阔里类芽孢杆菌(P.macquariensis),固氮类芽孢杆菌(P.azotofxans),皮奥利亚类芽孢杆菌(P.peoriae),多粘类芽孢杆菌(P.polymyxa),依利诺斯类芽孢杆菌(P.illinoisensis),解淀粉类芽孢杆菌(P.amylolyticus),饲料类芽孢杆菌(P.pabuli)及浸麻类芽孢杆菌(P.macerans)中的其它tc同系物。
实施例14-通过Southern杂交在其它类芽孢杆菌菌株中检测IDAS1529 tcORF同系物
本实施例阐述了如何应用放射标记的DNA片段作为探针在类芽孢杆菌分离株基因组DNA中寻找DNA序列(优选与第一次在IDAS1529中检测到的已知tcORF有一些同源性)。结果证明在蜂类芽孢杆菌分离株DB482中检测到与两个tcORF同源的序列。
如以上在实施例12中描述的,制备来自多种类芽孢杆菌菌株(或来自作为阴性对照的大肠杆菌)的基因组DNA,并用限制酶进行消化以产生多个片段。一般消化通过在EcoRI酶的制造商(New England Biolabs,Beverly,MA)提供的400μl反应缓冲液的总体积中包含8μg DNA。将包含200单位酶的反应物于37℃孵育过夜,然后置于冰上。将经消化DNA进一步进行纯化并通过加入30μl 3M乙酸钠(pH5.2)及750μL冰冷的100%乙醇进行浓缩,接着进行离心。将DNA沉淀物用70%乙醇洗两次,真空下干燥并在50μl TE缓冲液[10mM Tris HCI,pH8.0;1mM乙二胺四乙酸(EDTA)]重新悬浮。通过凝胶电泳进行分析用于限制性消化的视觉确证。以类似方式将IDAS1529粘粒SB12的DNA用EcoRI消化,并用作杂交实验的阳性对照。
将用于Southern印迹分析的经EcoRI消化的基因组DNA片段在TEA缓冲液(40mM Tris-乙酸,2mM EDTA,pH8.0)(1μgDNA/孔)中通过0.7%或1.2%琼脂糖凝胶电泳分离。在每块凝胶上,用包含1kb DNA分子量梯度(Invitrogen,Carlsbad,CA)的泳道提供分子量大小标准。在这个梯度中大于500bp的15个片段大小(用千碱基表示)为:12.2,11.2,10.1,9.2,8.1,7.1,6.1,5.1,4.1,3.1,2.0,1.6,1.0,0.52及0.50。凝胶中的DNA用50μg/mL溴化乙锭染色,将凝胶照相,然后将凝胶中的DNA脱嘌呤(0.2M HCl中5分钟),变性(0.5M NaOH,1.5M NaCl中15分钟),中和(0.2M HCl中5分钟)并在2XSSC(20XSSC包含3M NaCl,0.3M柠檬酸钠,pH7.0)中转移到MAGNA 0.45微米尼龙转移膜(Osmonics,Westborough,MA)。DNA通过紫外线(Stratalinker_;Stratagene;La Jolla;CA)与膜进行交联并准备用于在“最低杂交”溶液[包含10%w/v聚乙二醇(分子量大约8000),7%w/v十二烷基硫酸钠;0.6XSSC,5mM EDTA,100μg/ml经变性鲑鱼精DNA及10mM磷酸钠缓冲液(来自包含95g/L NaH2PO4·1H2O及84.5g/L Na2HPO4·7H2O的1M储存液)]中于60℃或65℃杂交1至3小时。
用作杂交探针的tcORF DNA片段首先通过用SB12粘粒DNA作为模板(参见以前实施例)的聚合酶链反应(PCR)进行制备。用于这些扩增的正向及反向引物在以下(大写字母的碱基对应于蛋白质编码区)表24中列出(每条DNA链的5’至3’方向)。设计的引物组1从SB12粘粒DNA扩增包含所有tcORF5的DNA片段,所述DNA片段在SEQ ID NO:10公开并与光杆状菌tcaC基因有一些相似性(表6)。设计的引物组2用于从粘粒SB12扩增编码如SEQ ID NO:19公开的蛋白质DNA片段。这个DNA片段及编码的蛋白质比如SEQ ID NO:1 2公开的tc ORF6 DNA序列及所编码的如SEQ ID NO:13的蛋白质稍长。作为SEQ ID NO:13及SEQ ID NO:19公开的蛋白质与光杆状菌tccC基因(表6)编码的蛋白质均有一些相似性。将扩增的PCR产物克隆入pCR_2.1-TOPO_克隆载体(Invitrogen,Carlsbad,CA)中,并将包含tcORF的片段通过限制酶消化(在以下表中列出)从产生的克隆中切下,接着通过用Gen EluteTM琼脂糖离心柱(Sigma Chemical Co,St Louis,MO)从琼脂糖凝胶中纯化。回收的片段通过用Quick-PrecipTM Plus溶液按照供应商的说明书(EdgeBioSystems,Gaithersburg,MD)进行沉淀而浓缩。
                               表24.
PCR引物组1
SB12 tcORF5(SEQ ID NO:10)
正向引物SB126*gtacgtcatctagaaaggagatataccATGCCACAATCTAGCAATGCCGATATCAAGCTATTGTC反向引物SB127*tgacatcggtcgacattattaCCGCGCAGGCGGTGAAGCAAATAATGATGAGTCCATGGTA用SaII+XbaI+PvuI从pCR_2.1-topO_克隆切下并纯化4,368bp片段
PCR引物组2
编码SEQ ID NO:19的SB12 tcORF;其包括tcORF6(SEQ ID NO:12)
正向引物SB128***gtacgtcaactagtaaggagatataccATGAAAATGATACCgTGGACTCAcCATTATTTGCTTCACC反向引物SB129*tgacatcgctcgagattattaCTTTCTCTTCATTGAAAACCGGCGGAAAAAGTTCCCA用EcoRI+SphI/+PvuI从pCR_2.1-topO_克隆切下并纯化2,925bp片段
*在这个表中,引物5’端的小写碱基不与粘粒SB12 DNA序列互补。它们用于提供扩增产物末端上的限制性酶识别序列以有助于以后的克隆操作。
**将来自天然序列的那些碱基改变为小写粗体碱基以去除可能干扰以后克隆的功能性分析的潜在发夹结构。
放射性标记的DNA片段用高效引发放射性标记的试剂盒(RocheDiagnostics,Mannheim,德国)按照供应者的说明书进行制备。未掺入的核苷酸过通QIAquick_PCR纯化柱(Qiagen,Inc.Valencia,CA)按照制造者的说明书进行去除。通过这些方法标记的大约100ng DNA片段产生大约0.1μCi/ng的特异活性。经标记DNA片段通过煮沸5分钟进行变性,然后加入至最低杂交溶液中的杂交印迹中并于60℃或65℃孵育过夜。通过在2XSSC中于室温漂洗去除不牢固放射性,然后通过在0.3XSSC+0.1%十二烷基硫酸钠中于60℃或65℃洗涤印迹至少1小时去除较紧密结合的放射性。至少进行两次此种洗涤。将印迹于-80℃置于有两层增感屏的X射线胶片上,并在1至3天曝光后,将曝光胶片进行显影。通过在0.3XSSC+0.1%SDS中煮沸10分钟,将经杂交DNA片段从印迹中去除,并在以后的杂交中重新应用一次或两次。
在获自蜂类芽孢杆菌DB482菌株的基因组DNA中观察到与来自引物组1及引物组2的探针杂交的不同片段。检测与IDAS1529 tcORF5序列同源的衍生自引物组1(引物SB126及SB127)的探针与预计大小(以千碱基表示)为20、10.2及8.4的片段杂交。在这个分子大小的范围内,DNA片段的迁移只可提供对分子真实大小的估计。对估计为20kb及8.4kb片段的信号强度比对估计为10.2kb片段的信号强度更强。由于这些片段中的每一片段至少为探针片段(约4.4kb)大小的两倍,这些结果的一个解释为:与来自IDAS 1529 tcORF5的探针类似并因此与光杆状菌tcaC基因类似的基因的多重拷贝在蜂类芽孢杆菌DB482菌株中存在。然而,对这个结果的其它解释是可能的。
来自引物组2(引物SB128及SB129)的探针,其检测与IDAS 1529tcORF6及其侧翼5’端序列同源的序列,所述探针与估计大小(以千碱基表示)为7.8及4.5的片段杂交。估计为7.8kb片段的信号强度比估计为4.5kb片段见到的信号强度强的多。这个结果的一个解释为蜂类芽孢杆菌DB482菌株有与IDAS 1529 tcORF6及其5’侧翼序列相似的单一基因,并因此与光杆状菌tccC基因相似,并且EcoRI将该基因切割成该基因所包含的两个不等部分DNA序列的片段。然而,对这个结果的其它解释是可能的,包括与探针有不同量绝对同源性的多重基因的存在。
这些结果(通过PCR扩增接着通过DNA序列分析检测)证实了在蜂类芽孢杆菌DB482菌株中存在光杆状菌tcaC及tccC基因的相关物。
实施例15-DB482的杀虫活性
显示类芽孢杆菌DAS1529菌株产生对鳞翅目昆虫有毒性的细胞外蛋白质并且也显示此菌株包含名为Cry1529的cry基因。由于此菌株产生细胞外杀虫活性蛋白质及细胞内杀虫活性蛋白质,本发明包括筛选类芽孢杆菌其它菌株的细胞外(释放到培养基上清液)和/或细胞内(细胞相关)杀虫活性因子。该实施例阐述了如何产生类芽孢杆菌菌株的发酵培养液,如何处理这些培养液及如何检验来自这些培养液样本的杀虫活性。
15.A.类芽孢杆菌发酵培养液的产生及处理
类芽孢杆菌菌株在营养琼脂平板(8g/l营养培养液,15g/l细菌用琼脂;Difco Laboratories,Detroit,MI)于30℃生长3-5天。挑取单个菌落并接种到包含100ml无菌的改良胰胨豆胨培养液(胰蛋白胨10-g/l,蛋白胨7g/l,豆胨3g/l,KCl 5g/l,K2PO4 2.5g/l;Difco Laboratories,Detroit,MI)的500ml三挡板烧瓶中。于28℃在旋转摇床上以150转/分钟孵育72小时后,将培养物分装到无菌500ml聚乙烯瓶中并于4℃,以4,000xg离心45分钟。离心后,弃去上清液并通过0.22μm膜滤器(MilliporeCorporation,Bedford,MA)。然后将培养滤液用Centricon Plus-20离心过滤装置用5,000分子量截止膜通过4,000xg离心浓缩20X。细菌细胞沉淀物在10mM磷酸钾缓冲液(pH=8)中进行重悬。然后这些样本在昆虫生物试验中对经处理上清及细胞沉淀样本中包含的杀虫活性进行检验。
15.B.经处理上清及细胞沉淀物的昆虫生物试验
在这些测定中包括的昆虫种为南方谷类根虫(Southern cornrootworm,SCR),谷实夜蛾(CEW)及烟芽夜蛾(TBW)。用于喂养的人工食物及生物测定SCR在以前进行了描述(Rose,R.L.及McCabe,J.M.1973.J.Econ.Entomol.66,398-400)。标准人工鳞翅目食物(StonevilleYellow食物)用于喂养及ECB、CEW及TBW的生物测定。将40μl份经浓缩上清或细胞沉淀物样本直接应用于包含人工食物的孔(~1.5cm2)表面。使经处理的食物孔在无菌通风橱中空气干燥,并且将每孔感染孵育自表面无菌卵的单个新生昆虫。然后将测定板进行密封,置于湿度生长箱,并于28℃维持3-5天。然后对死亡率及确定的幼虫重量进行评分。每个处理应用八个昆虫。
15.C.DB482的杀虫活性
来自DB482菌株的经浓缩上清及细胞沉淀物对SCR、TBW及CEW相对于对照处理有杀虫活性(表25)。这可能是因为来自DB482的经浓缩上清及细胞沉淀物的杀虫活性是两个不同杀虫因子的结果,一个杀虫因子为细胞相关(即Cry样)而另一个是来自细胞释放(即TC样)。然而,也可能来自DB482的经浓缩上清及细胞沉淀物的杀虫活性为存在于这两种细胞级分中的同一杀虫因子的结果。
                 表25.DB482的杀虫活性
    受试昆虫   经浓缩上清活性   细胞沉淀物活性
    SCR     +++*     +++
    TBW     ++     ++
    CEW     +++     ++
    培养基对照     -     -
*-,++,+++;分别为无,中等及高活性
15.D.杀虫活性筛选的总结
这个实施例阐述了用于筛选来自类芽孢杆菌菌株的经浓缩培养上清及细胞沉淀物以确定对鞘翅目及鳞翅目昆虫具有杀虫活性菌株的方法。文中显示的蜂类芽孢杆菌分离株DB482包含tcaA,tcaB,tcaC及tccC的同系物。在DB482中发现的杀虫活性证实类芽孢杆菌DAS1529菌株在类芽孢杆菌属中不是唯一产生对鳞翅目昆虫杀虫活性的菌株。因此,本发明包括用于鉴定在其它类芽孢杆菌种如软骨素类芽孢杆菌,解藻酸类芽孢杆菌,幼虫类芽孢杆菌,强壮类芽孢杆菌,戈氏类芽孢杆菌,蜂房类芽孢杆菌,缓病类芽孢杆菌,缓病类芽孢杆菌,日本甲虫类芽孢杆菌,解硫胺素类芽孢杆菌,解菌多糖类芽孢杆菌,神户类芽孢杆菌,解糖类芽孢杆菌,灿烂类芽孢杆菌,千叶类芽孢杆菌,马阔里类芽孢杆菌,固氮类芽孢杆菌,皮奥利亚类芽孢杆菌,多粘类芽孢杆菌,依利诺斯类芽孢杆菌,解淀粉类芽孢杆菌,饲料类芽孢杆菌及浸麻类芽孢杆菌中对鳞翅目昆虫有杀虫活性的其它类芽孢杆菌菌株的方法。
                             序列表
<110>美国陶氏益农公司
<120>可获自类芽孢杆菌种的杀虫活性蛋白质及多核苷酸
<130>DAS-101XC2
<150>US 60/392,633
<151>2002-06-28
<150>US 60/441,647
<151>2003-01-21
<160>49
<170>PatentIn版本3.2
<210>1
<211>33521
<212>DNA
<213>人工序列
<220>
<223>SB12全部插入片段的核酸序列
<400>1
gatcacacgg ccggcgtatt ccggctcgga accgaagaat taacagaagc gcttcagcag     60
tccggttatc ggacagtctt tgatattgca tctgaaaatc ttgcggaatt tcagaaaagc    120
aatccggaga ttccctcttc cgacgcgaag gagattcatc aattagccgt ccagaggaca    180
gaaaacttat gcatgcttta taaggcctgg caactgcaca atgatccggt cgtccagagc    240
cttcccaaat tatccgcgga taccggcctg cgaggcatgc gtgccgcgtt ggagcggagt    300
cttggagggg gagccgattt tggagacttg ttcccggagc gatcgccaga gggctatgcg    360
gaagcctcct ctatacagtc gcttttttcg ccgggacgtt accttacggt gctgtataaa    420
attgcgcagg atctccacga cccaaaagac aaactgcata ttgacaaccg ccgtccagat    480
ttgaagtcgc tgatcctcaa taatgacaat atgaaccgtg aggtgtcttc cctggatatc    540
ctgctggatg tgctgcagtc cgaaggctcc ggcacactga catccctgaa ggatacctac     600
tatccgatga cccttccc tatgatgacgac cttgcgcaaa tcaatgccgt ggcggaggcg     660
cgctcatcca atttgctggg gatctgggat accctgctgg acacgcagcg gacttccatc     720
ctgcaggatt ccgccgctgt ccaccggata agcaagccgc ggcactcggc atacgtcaat     780
cagagagtct ccgatgatga accggtattg atcgcgggag aggaattcta cttggagacc     840
ggcggtgttg ccgacacgac cccgtctccg ccaacgaggg aagcgctttc cttgacgcca     900
aacagcttcc gtctgctggt caaccccgag ccgacagcag acgacatcgc caatcactac     960
aacgttaaga ctcaagatcc tgccgctctg gccgccgtct taaatgtggt cgatgacttt    1020
tgcctgaaaa ccggtttgag ctttaatgag ttgctggact taacgatgca gaaggatgat    1080
gaatcgatcg gcagcgagta caaaagccgg tttgtaaaat ttggcggcga ggccaatgtt    1140
ccggtttcaa cctatggagc tgtatttctg acaggaacgg aagaaactcc gttgtgggta    1200
ggaaaaggag ctgtgataag ccctgcagcg gacgcctatg ttcgtaatgg gacatatgca    1260
aacacgaatt atggatcaga cactagtctt gttgtgaagc aggatgggtc tagtggatac    1320
agtagggaag catatatcag gtttgatttg acaggtcttt ccggagttgt ggaggaagct    1380
aaaatttctc taacaactag agcgaaacaa ttgtctagct taagacacca agctcatttg    1440
gtcagtgaca acagttggga tgaattgaaa atcacatgga ataacaaacc tgcaggagga    1500
gcgatcatcg caagctggga tgttcccgaa gttggtgaga atgtaaaggt tgatgtgacc    1560
cggcaagtaa atgatgcgct cgcaaacggt caagataaac tatcaattgt tattcgttct    1620
agtgcaaatt atggcagtct gggcgatgtc tcttatgcct ctagagaaca ccctgaaaaa    1680
gcctcacgac cttctatgga aatcaaggcg ataacgggtg ctggtttaaa ttttacggcg    1740
gataatgttg tagctctggc aggaagggcg gaaaagcttg tccggctggc gcgcagcacg    1800
ggactttcct ttgagcagtt ggattggctg attaccaata ccagccgtgc cgtaatcgaa    1860
catggtggag aactgattct ggataagccg gtactggagt ctgtggccga attcacaagg    1920
ctccataagc gttatggcat cacagcggat atgttcgccg cgtttatcgg cgaagtcaat    1980
acgtatgctg aagcaggtaa agagagcttt tatcagacga ttttcagcac ggccgaccat    2040
tcggctgcct tacctttagg cgcaactttg caatttgagg tgagcaaaca ggatcgatat    2100
gaagcgattt gctgcggggc catgggggtg accgccgatg agttctctcg tatcggcaaa    2160
tactgctttg gcgacaacgc gcagcaagtt accgccaatg aaacaaccgt tgcgcagctt    2220
tatcgtttag gccgaattcc tcacatgctt ggattgcgtt ttaccgaggc ggagctgttg    2280
tggaaattga tggctggcgg cgaggatacc ttgctccgca cgattggcgc gaagcctcgc    2340
agtttacaag ccttagagat tattcgccgt actgaggtcc ttttggactg gatggatgct    2400
catcagcttg atgttgtctc cctgcaagcc atggttacca atcggtacag cggcacagcc    2460
acgccggagc tgtacaactt tttggcacag gtgcaccaat ccacaagcag tgccgcgaac    2520
gtgtccaaag cggatgctca ggataccctg cccgcggaca agctgttccg ggccttggcg    2580
gtaggcttca acctgaaggc caacgtgatg gcgcaggtca ttgactggtt ggacaaaacc    2640
gacggagcgt ttacgctgcg ggctttctgg gacaagcttc aagcgtattt cagcgccgat    2700
catgaagaag aactgacggc cttggaagga gaagccgact tgctgcagtg gtgccaacag    2760
atcagccagt atgcgctcat tgtccgctgg tgcgggttaa gcgatcagga tctggcgctg    2820
ctgaccgggc atcccgggca gcttctgtcc ggacaacata cggtgccggt accctcgctg    2880
catctcctgc tggtgctgac ccgcctgaag gaatggcagc agcgcgtcca ggtttccagc    2940
gaggaggcca tgcgctattt tgcccaggcc gatgcgccaa ccgtcacacg cgatgctgcg    3000
gtcaagctgc ttgcccgtat ccatggctgg aatgaacagg ataccgcctc gatgaatgac    3060
tacctgctgg gagagaacga atatcctaag aactttgagc agatctttac tttggaaagc    3120
tgggtcaacc tgggccgtca actgaatgtt ggcagccgaa cgttgggaga gctggttgac    3180
atgtcagaag aggatgatac cgcggaaaac acggatttga ttatctcggt cgcccaaagc    3240
ctgatggctg cggtgcaggc ctgaaccaac atgaccaagg aaggtggtaa gaatatgtct    3300
acttcaaccc tgttgcaatt gattaaggaa tcccgccggg atgcgttggt caaccattat    3360
atcgccaaca atgtcccgag agagcttacg gataagatta cagacgcaga cagcctgtat    3420
gagtatttgc tgctggatac caagatcagt gaactcgtaa aaacatcgcc gatagctgag    3480
gccattagca gcgttcagtt atacatgaac cgatgcgtgg aaggctatga aggcaagctg    3540
actccggaag gcaacagcca tttcgggccg ggaaaattcc tgaataattg ggatacctat    3600
aacaagcgtt attccacttg ggccggcaag gaacgtctga aatattatgc aggcagttat    3660
attgacccgt ccttgcgcta taacaaaacg gatccgttcc tgaacctgga acagaatatc    3720
agccagggaa gaatcaccga tgacaccgta aagaacgcgc tgcaacacta cctgactgaa    3780
tatgaagtgt tggcggattt ggaatatatc agcgtaaata aaggcgccga tgaaagtgta    3840
ttattcttcg taggccgcac caaaacaatg ccatacgaat attactggcg ccgattaacg    3900
ttgaaaaagg acaataacaa taaactggtg cctgccatct ggtctcaatg gaaaaaaata    3960
actgccaata tcggcgaagc agttaataat tatgtggtgc ttcactggca taataaccgc    4020
ttacatgtac aatggggttc tacagagaaa acacaaaatg atgacggaga acccattgag    4080
aaacgatatt tgaatgactg gttcatggat aagtccagtg tctggtcttc attccgaaag    4140
gtttcatata tagaaaatag ttttacttat actgagggca tcattgattc aagaaatatt    4200
actatagctg gaaatcaact gttctgtgat gattcaaata cttttaaggc aacaataacg    4260
gcacttccat ttgaccaaat acgtgtttac ttagaaaaga tttacggtac aggcggcagc    4320
atcacggtta ctggagaaaa taaaggctat attattaagg tgggggagcc aagagaagtc    4380
agtttctctc ctaatacgtt actagatgta ttcataggta gtaatgcaag ccctcgagac    4440
ccatatttca aagctacatt taatagagaa gctctccaaa attcatacgg ctcaattaaa    4500
ataaatcaat acacccctcc ttctggaagc aatatcaaag gtcctatcga ccttaccctg    4560
aaaaataaca tcgacctgtc ggcgttgttg gaagagagcc ttgacgtact gttcgactat    4620
accattcagg ggaataacca attgggcggc ttagaggcct ttaacgggcc ttacggactt    4680
tatttgtggg aaatcttcct ccatgttcca tttttaatgg cggttcgctt ccacaccgag    4740
cactgagaga tcccctcata atttccccaa agcgtaacca tgtgtgaata aattttgagc    4800
tagtagggtt gcagccacga gtaagtcttc ccttgttatt gtgtagccag aatgccgcaa    4860
aacttccatg cctaagcgaa ctgttgagag tacgtttcga tttctgactg tgttagcctg    4920
gaagtgcttg tcccaacctt gtttctgagc atgaacgccc gcaagccaac atgttagttg    4980
aagcatcagg gcgattagca gcatgatatc aaaacgctct gagctgctcg ttcggctatg    5040
gcgtaggcct agtccgtagg caggactttt caagtctcgg aaggtttctt caatctgcat    5100
tcgcttcgaa tagatattaa caagttgttt gggtgttcga atttcaacag gtaagttagt    5160
tgctagaatc catggctcct ttgccgacgc tgagtagatt ttaggtgacg ggtggtgaca    5220
atgagtccgt gtcgagcgct gattttttcg gcctttagag cgagatttat acaatagaat    5280
ttggcatgag attggattgc ttttagtcag cctcttatag cctaaagtct ttgagtgact    5340
agatgacata tcatgtaagt tgctgatagg tttccagttt tccgctccta ggtctgcata    5400
ttgtactttt cctcttactc gacttaacca gtaccaaccc agcttctcaa cggatttata    5460
ccatggcact ttaaagccag catcactgac aatgagcggt gtggtgttac tcggtagaat    5520
gctcgcaagg tcggctagaa attggtcatg agctttcttt gaacattgct ctgaaagcgg    5580
gaacgctttc tcataaagag taacagaacg accgtgtagt gcgactgaag ctcgcaatac    5640
cataagccgt ttttgctcac ggatatcaga ccagtcaaca agtacaatggg catcgtatt    5700
gcccgaacag ataaagctag catgccaacg gtatacagcg agtcgctc tttgtggaggtg    5760
acgattacct aacaatcggt cgattcgttt gatgttatgt tttgttctcg ctttggttgg    5820
caggttacgg ccaagttcgg taagagtgag agttttacag tcaagtaagg cgtggcaagc    5880
caacgttaag ctgttgagtc gttttaagtg taattcgggg cagaattggt aaagagagtc    5940
gtgtaaaata tcgagttcgc acattttgtt gtctgattat tgatttttgg cgaaaccatt    6000
tgatcatatg acaagatgtg tatctacctt aacttaatga ttttgataaa aatcattagg    6060
ggattcatca gcaccgagca gcggtatgag ttggcggaac gatggtttaa attcattttc    6120
aacagcgcag gttaccgtga tggctacggc aatctgctga cggatgacaa aggcaacgtg    6180
cgctactgga acgtcgtgcc tctgcaggag gatacggagt gggatgacac gttgtccctg    6240
gcaacgaccg acccggacga gattgcgatg gccgacccga tgcaatacaa gctggctatc    6300
tttattcaca ccttggactt cttgatcagc cgcggcgaca gcttgtaccg gatgctggag    6360
cgggatacct tgaccgaagc gaagatgtat tacattcagg ccagccaact gcttgggcct    6420
cgtcccgaga tccggatcaa tcacagctgg cctgatccga ccctgcaaag cgaagcggac    6480
gcggtaaccg ccgtgccgac gcgaagcgat tcgccggcag cgccaattct cgccttgcga    6540
gcgcttctga atgcggaaaa cgggcatttc ctgccgcctt ataatgatga actattagct    6600
ttctgggata aaatcgacct gcgtctctac aatttacgcc acaatctgag cctggacggt    6660
cagccgcttc atttgccgct ctttaccgaa ccggtcaatc ctcgtgagct gcaggttcag    6720
catggggcag gcgatggatt agggggaagc gccggttccg tccaaagccg tcaaagtgtc    6780
tatcgttttc ctctggtcat cgataaggcg cgcaatgccg cgagtagtgt tatccaattc    6840
gggaatgccc tggaaaacgc gctgacaaag caggacagcg aggccatgac tatgctgttg    6900
caatcccagc agcagattgt cctgcagcaa acccgcgata ttcaggagaa gaacctggcc    6960
tcgctgcaag caagtctgga agcaacgatg acagccaaag cgggcgcgaa atcccgaaag    7020
acccattttg ccggcctggc ggataactgg atgtcgcata atgaaaccgc ctcacttgca    7080
ctgcgtacca ctgcgggaat tatcaataca agctcgaccg tgccaatcgc tatcactggc    7140
ggcttggata tggctccgaa catttttggt ttcgcagttg gaggttcccg ctggggagca    7200
gccagcgcgg ctgtagccca aggattgcaa atcgccgccg gcgtaatgga acagacggcc    7260
aatatcatcg atatcagcga aagctaccgc cggcgccggg aggattggct gctgcagcgg    7320
gatgttgccg agaatgaagc ggcgcagttg gattcgcaga ttgcggccct gcgggaacag    7380
atggatatgg cgcgaaaaca acttgcgctg gcggagacgg aacaggcaca cgcgcaagcg    7440
gtctacgagc tgctaagcac ccgttttacg aatcaagctt tgtataactg gatggccgga    7500
cgtctgtcgt ctctatacta tcaaatgtat gacgccgcat tgccgctctg cttgatggcc    7560
aaacaggctt tagagaaaga aatcggcaat gataaaacgg ttggaatctt caccctcccg    7620
gcctggaatg atttgtatca gggattgcta gcgggcgagg cgctgctgct cgagcttcag    7680
aagctggaga atctgtggct ggaggaggac aagcgcggaa tggaagctgt aagaacggta    7740
tctttagata cccttctccg caaagaaaag ccagaatccg gttttgcaga tttcgtcaag    7800
gaagttctgg acggaaagac gcctgaccct gtaagcggag ttagcgtaca gctgcaaaac    7860
aatattttca gtgcaaccct tgacctgtcc acccttggcc tggatcgctt ttacaaccaa    7920
gcggaaaagg cccacaggat caaaaacctg tcggttacct tacccgcgct attgggacct    7980
tatcaggata ttgcggcaac cttatcgcta ggtggcgaga ccgttgcgct ttcccatggc    8040
gtggatgaca gcggcttgtt tatcacggat ctcaacgaca gccgtttcct gcctttcgag    8100
ggtatggatc ctttatccgg cacactcgtt ctgtcgatac tccatgccgg gcaagacggt    8160
gaccagcgcc tcctgctgga aagcctgaac gacgtcatct tccacattcg atatgtcatg    8220
aaatagaaga caaactcccg cgaaatagtt caaccgcggg agttctttat tttccaccca    8280
aatcattgac ataaatatac tttaataata tgttggagga agaagaggag gttgttattg    8340
gtgagaataa agaaaatgtt tgaagtagcg atgatgttat cattggcgtg tttgtttttt    8400
gttacatcag ctgcttcagc aaaaacaact aatttaactt cttccccgaa acttatgaac    8460
tgctttgatg tagctggtaa cgtaacctac aaaaccgctc ctgatggttc aattacgaaa    8520
ataatcgaag tacaagatgt tagtaaattc agtgaacaaa ccaatctcag gttggctcca    8580
gattctaaag ttaccattta tattcctgac tccagtgaca ataaccagcc caattactcc    8640
aataataatt ccaatgacta tagtgaacaa aattacctca atactaaccc caacgttgaa    8700
ccatttgttg aaccatttgt tgaacttata aagtatattg cgaacgtaag tgatccatat    8760
gaagcgtgtg gatcaaaatc gattagagat tctgattatg atcctcccgg cggaaaaatg    8820
ataataaaac aagggataca ggctacacac tcaaccacgg tttctatcga tgccaaaatc    8880
gtttcaactg ccttaaaata tgatgtaaca acgagttatt ccattgaaga ggagcaaaat    8940
attaaagtac cagacaataa aagaggaaga attattgctt atccaaagta tgatgtcaac    9000
cc tttgaaa tatgggaagc tggtctaata tataataaaa agattggaga cggtacggct    9060
ttctatccta aaggagtatg ttttgttaca attattaatt aactttcaaa taagagaagc    9120
tgtttcttaa gaataaagaa gcagcttctt gcatttttta ttatgatatt acactctatc    9180
ttctgtcaga tgctccctct caacttccat tcccaatccc ctcttcttaa aaggccataa    9240
aagttacact tatcatttcc gtcattgcta atctaccttg cagttaacct aaaatatacc    9300
ttccgggatt cctgaaggat gaaacatatt ttcacccatc agtgaaacta tctatgcttt    9360
tttgattgaa gcgagaggta tgcttgggtt gtaaatgaaa ggggggacct gttcatggga    9420
aactacctaa aacggtaacg gatagcttct atggttttga tgtctgcagt cattttgtct    9480
tggggagtac tcatcattca gaacacaaga ggaggagttc atggtgtcaa caacagacaa    9540
cacggccggc gtattccggc tcggaaccga agaattaaca gaagcgctta agcagtccgg    9600
ttatcggacc gtctttga tattgtatctga caatcttgcg gaatttcaga aaaacaatcc    9660
ggagattccc tcttctgacg cgaaggaga ttcatcaatta gccgtccaga ggacagaaaa    9720
cttatgcatg ctttataagg cctggcagct gcacaatgat ccggttgtcc agagccttcc    9780
caaattatcc gcggataccg gcctgcaagg catgcgtgcc gcgttggagc ggagtcttgg    9840
aggcggagcc gattttggag acttgttccc ggagcgatcg ccagagggct atgcggaagc    9900
ctcctctata cagtcgcttt tctcgccggg acgttacctg acggtgctgt ataaaattgc    9960
gcgggatctc cacgacccaa aagataaact gcatattgac aaccgccgtc cagatttgaa   10020
gtcgctgatc ctcaataatg acaatatgaa ccgagaggta tcttctctgg atatccttct   10080
ggatgtgctg cagcccgaag gctctgacac gctgacatcc ttgaaggata cctaccatcc   10140
gatgaccctt ccctatgatg acgaccttgc gcaaatcaat gccgtggcgg aggcgcgttc   10200
atctaatttg ctggggattt gggataccct gctggacacg cagcggactt ccatcctgca   10260
gaattccgcc gctgcccgcc ggataagcaa ggcgcggcac tcggcatacg ccaatcagaa   10320
agcctccaat gatgagccgg tattcatcac gggagaggaa atctacctgg aaaccggagg   10380
taaacggctt tttctggcgc ataaactcga gataggttca actattagcg ctaaaatcaa   10440
cattggaccg ccgcaagcgg ccgatatcgc gccggcaaag ttgcaactcg tatattacgg   10500
cagaggcggc agagggaact acttcctgcg cgtggcagac gatgtgtccc tcggtggaaa   10560
gctgctgacc aattgttatc tgaccagcga tgacggacag agcaacaata ttagcgggcc   10620
atactgccta atgatcaacc gaggcaccgg cagcatgcct agcgggactc accttccagt   10680
tcagattgaa agagtgaccg atacatccat ccgcattttt gtgccggatc acggctattt   10740
ggggctaggc gaaagccttg ccagcaactg gaatgaaccg ttggcgctga atctgggctt   10800
ggatgaagcg ttgaccttta ccttgagaaa gaaggagacg ggaaatgaca ccatttccat   10860
aatcgacatg ctgccgccgg tagcgaacac gactccgtct ccgccgacga gggaaacgct   10920
ttccttgacg ccaaacagct tccgtctgct ggtcaaccct gagccgacag cggaggacat   10980
cgccaagcac tacaacgtca cgacggtaac ccgggctcct gccgatctgg cctccgcctt   11040
aaatgttgtc gatgatttct gcttgaaaac cggtttgagc tttaacgaat tgctggattt   11100
aaccatgcag aaggattatc agtcaaaaag cagtgagtac aaaagccgat ttgtaaaatt    11160
cggcggcggg gagaatgttc cggtatcaag ctatggcgca gcctttctga caggagcgga    11220
agatactcct ttgtgggtga aacagtataa cagcgtgggg actgcaacaa gcacccctgt    11280
tttaaacttt acgccagata atgttgtggc tttggcagga agggcggaaa agcttgtccg    11340
gctgatgcgc agcacgggtc tttcctttga gcagttggat tggctgattg ccaatgccag    11400
ccgtgccgtt atcgaacacg gtggagagct ttttctggat aagccggtac tggaagctgt    11460
ggccgaattc acaaggctca ataagcgtta tggcgtcaca tcggatatgt tcgccgcgtt    11520
tatcggcgaa gtcaatacgt atacagaagc gggcaaggac agcttttatc aggcgagttt    11580
cagcacggcc gaccattcgg ctaccttacc tttgggcgct tctttgcaac ttgaggtgag    11640
caagcaggat cgatatgaag cgatttgctg cggggctatg ggggtgaccg ccgatgagtt    11700
ctcccgtatc ggcaaatact gctttgggga taaagcacag caaatcacgg ccaatgaaac    11760
aaccgttgcc cagctttatc gtttaggccg aattcctcat atgctaggct tgcgttttac    11820
cgaggcagag ctgttgtgga aattgatggc tgggggcgag gataccttgc tccgcacgat    11880
tggcgcgaac cctcgcagtt tagaagcgtt agagattatt cgccggacgg aggtcctttt    11940
ggactggatg gatgcccatc agctggatgt tgtctccctg caagccatgg ttaccaatcg    12000
gtacagcggc acagccacgc cggagctgta caattttttg gcacaggtgc atcaatccgc    12060
aagcagtgcc gcgaacgtgg ccagagcgga tggtcaggat acgttgcctg cggacaagct    12120
gctccgggca ttggcggcgg gcttcaaact gaaagccaac gtgatggcgc gagtaatcga    12180
ctggatggac aaaaccaata aagcgtttac gctgcgggct ttctgggaca agcttcaagc    12240
gtatttcagc gccgatcatg aagaagaact gaccgccctg gaaggagaag ccgcaatgct    12300
gcagtggtgc cagcagatca gccagtatgc gctcattgtc cgctggtgcg ggttaagcga    12360
gcaggatctg gcgctgctga ccgggaatcc ggagcagctt ctggacggac aacatacggt    12420
gcccgtaccc tcgctgcatc tcctgctggt gctgacccgc ctgaaggaat ggcagcagcg    12480
cgtccaggtt tccagcgagg aggctatgcg ctattttgcc caggccgatt cgccaaccgt    12540
cacgcgcgac gatgcggtta atctgcttgc ccgtatccat ggctggaatg aagcggatac    12600
cgtctcgatg aatgactacc tgctgggaga gaacgaatat cctaagaact ttgatcagat    12660
ctttgcactg gaaagctggg tcaacctggg ccgtcaactg aacgtgggca gcagaacgct    12720
gggagagctg gttgacatgg ctgaagagga taaaaccgcg gaaaacatgg atctgattac    12780
ttcggtggcc catagcctga tggctgcagc gaaagcctga accaacatga ccaaggaagg    12840
tgataagcat atgtctactt caaccctgtt gcaatcgatt aaagaagccc gccgggatgc    12900
gctggtcaac cattatattg ctaatcaggt tccgacagcg cttgcggaca agattacgga    12960
cgcggacagc ctgtatgagt acttgctgct ggataccaag atcagtgaac tcgtaaaaac    13020
atcgccgata gcggaggcca tcagcagcgt gcagttatac atgaaccgct gcgtcgaagg    13080
ctatgaaggc aagttgactc cggaaagtaa tactcatttt ggcccaggta aatttctata    13140
taactgggat acgtacaaca aacgtttttc cacctgggca ggaaaagaac gcttgaaata    13200
ttatgcaggc agctatattg agccgtcctt gcgctacaac aaaaccgatc cattcctgaa    13260
cctggaacag agcatcagcc agggaagaat tactgatgat accgtaaaga acgcgctgca    13320
acactacctg actgaatatg aagtgttggc ggatctggat tatatcagcg ttaataaagg    13380
cggcgacgaa agtgttttac tctttgttgg acgcaccaaa accgtaccgt atgaatacta    13440
ctggcgccgt ttgcttttaa aaagggacaa taataataag ctagtaccag cagtctggtc    13500
tcagtggaaa aaaatcagtg ccaatatcgg tgaagcggtt gatagttatg tggtgcctcg    13560
gtggcataaa aaccggctac atgtgcaatg gtgttctata gagaaaagtg aaaatgatgc    13620
cggtgaaccc attgagaaac gatatttgaa tgactggttc atggatagtt ccggagtctg    13680
gtcttcattt cgaaagattc cggttgtgga aaagagtttc gaatatttgg acggaagcct    13740
cgatccccga tttgtcgctc ttgttagaaa tcaaatatta attgatgagc cagaaatatt   13800
cagaattaca gtatcagccc ctaatccgat agatgcaaat ggaagagtag aggtacattt   13860
tgaagaaaac tatgcaaaca gatataatat taccattaaa tatgggacaa cgagtcttgc   13920
tattcctgca gggcaggtag ggcatccaaa tatctctatt aatgaaacat taagggttga   13980
attcggcacc aggccggatt ggtattatac tttcagatat ttaggaaata caatccaaaa   14040
ctcatacggt tcaattgtca ataatcaatt ttcacctcca tcaggaagca atattaaagg   14100
tcctatcgac cttaccctga aaaataacat cgacctgtcg gccttgttgg atgagagcct   14160
tgacgcactg ttcgactata ccattcaggg cgataaccaa ttgggcggct tagctgcctt   14220
taacgggcct tacggacttt acttgtggga aatcttcttc catgttcctt ttttaatggc   14280
ggttcgcttc cacaccgagc agcggtatga gttggcggaa cgttggttta aattcatctt   14340
caacagcgca ggataccgtg atgattacgg cagtctgctg acggatgaca aaggcaacgt   14400
gcgttactgg aacgtgatac cgctgcaaga ggacacggag tgggatgaca cgttgtccct   14460
ggcaacgacc gacccggacg agattgcgat ggccgacccg atgcaataca agctggctat   14520
atttattcac accatggact tcctgatcag ccgcggcgat agcttgtacc ggatgctgga   14580
gcgggatacc ctggccgaag ccaagatgta ttacattcag gccagccaac tgcttgggcc   14640
ccgccccgac atccggctca atcacagttg gcctaatccg accttgcaaa gcgaagcgga   14700
cgcggtaacc gccgtgccga cgcgaagcga ttcgccggca gcgccaattt tggccttgcg   14760
agcgcttctg acaggcgaaa acggtcattt cctgccgcct tataatgatg aactgttcgc   14820
tttctgggac aaaatcgatc tgcgtttata caatttgcgc cacaatttga gtctggacgg   14880
tcagccgctt catttgccgc tctttgccga accggtcaat ccgcgtgaat tgcaggttca   14940
gcatggcccg ggcgatggct tggggggaag cgcgggttcc gcccaaagcc gtcagagtgt   15000
ctatcgtttt cctctggtca tcgataaggc gcgcaatgcg gccaacagtg tcatccaatt   15060
cggcaatgcc ctggaaaacg cactgaccaa gcaagacagc gaagcaatga ccatgctgtt   15120
gcagtcccag cagcagattg tcctgcagca aacccgcgat attcaggaga agaacctggc   15180
cgcgctgcaa gcaagtctgg aagcaacgat gacagcgaaa gcgggggcgg agtcccggaa   15240
gacccatttt gccggcttgg cggacaactg gatgtcggac aatgaaaccg cctcactcgc   15300
actgcgtacc accgcgggaa tcatcaatac cagctcaacc gtgccgatcg ccatcaccgg   15360
cggcttggat atggctccga acatttttgg tttcgcagtt ggaggttccc gctggggagc   15420
agccagcgcg gctgtagccc aaggattgca aatcgccgcc ggcgtaatgg aacagacggc   15480
caatattatc gatattagcg aaagctaccg ccggcgccgg gaggattggc tgctgcagcg   15540
ggatgttgcc gaaaatgaag cggcgcagtt ggattcgcag attgcggccc tgcgggaaca   15600
gatggatatg gcgcgcaagc aacttgcgct ggcggagacg gaacaggcgc acgcgcaagc   15660
ggtctacgag ctgcaaagca cccgctttac gaatcaagct ttgtataact ggatggctgg   15720
acgtctgtcg tctctatact atcaaatgta tgacgccgca ttgccgctct gcttgatggc   15780
gaagcaggct ttagagaaag aaatcggttc ggataaaacg gtcggagtct tgtccctccc   15840
ggcctggaat gatctatatc agggattatt ggcgggcgag gcgctgctgc tcgagcttca   15900
gaagctggag aatctgtggc tggaggaaga caagcgcgga atggaagccg taaaaacagt   15960
ctctctggat actcttctcc gcaaaacaaa tccgaactcc gggtttgcgg atctcgtcaa   16020
ggaggcactg gacgaaaacg gaaagacgcc tgacccggtg agcggagtcg gcgtacagct   16080
gcaaaacaat attttcagcg caacccttga cctctccgtt cttggcctgg atcgctctta   16140
caatcaggcg gaaaagtccc gcaggatcaa aaatatgtcg gttaccttac ctgcgctatt   16200
ggggccttac caggatatag aggcaacctt atcgctaggc ggcgagaccg ttgcgctgtc   16260
ccatggcgtg gatgacagcg gcttgttcat cactgatctc aacgacagcc ggttcctgcc   16320
tttcgagggc atggatccgt tatccggcac actcgtcctg tcgatattcc atgccgggca   16380
agacggcgac cagcgcctcc tgctggaaag tctcaatgac gtcatcttcc acattcgata  16440
tgttatgaaa tagctttaca gtcagatata ttccggggct tgtattcaca agcccctcca  16500
aggaggaatt gggttatgcc acaatctagc aatgccgata tcaagctatt gtcgccatcg  16560
ctgccaaagg gcggcggttc catgaaggga atcgaagaaa acatcgcggc tcccggctcc  16620
gacggcatgg cacgttgtaa tgtgccgctg ccggtaacct ccggccgcta tattactcct  16680
gatataagcc tgtcctatgc gagcggccac ggcaacggcg cttatggaat gggctggacg  16740
atgggagtga tgagcattag ccggagaaca agccgaggga cccccagtta tacatccgaa  16800
gaccagttcc ttggtccgga tggggaggtg cttgttccgg aaagcaacga acaaggggag  16860
atcattaccc gccacaccga tacggcccaa gggataccgt taggcgagac gtttacggtt  16920
acacgctatt ttccccggat cgagagcgct tttcatttgc tggaatactg ggaagcgcaa  16980
gcaggaagcg caacagcgtc gttttggctt attcactctg ccgatggagt gctgcactgt  17040
ctgggtaaaa ctgctcaggc gaggatagcc gcccctgacg attccgccaa gatcgcagaa  17100
tggctagtgg aggagtccgt ctcccccttc ggagagcata tttattacca atacaaagaa  17160
gaagacaatc aaggcgtgaa tctggaggaa gacaatcatc aatatggggc gaaccgctat  17220
ctgaaatcga ttcgctatgg aaataaggtt gcctctcctt ctctctatgt ctggaagggg  17280
gaaattccgg cagacggcca atggctgtat tccgttatcc tggattatgg cgagaacgat  17340
acctcagcgg atgttcctcc cctatacacg ccccaagggg agtggctggt gcgcccggac  17400
cgtttttccc gctatgacta cggatttgag gtccggactt gccgcttgtg ccgccaggtc  17460
ttgatgttcc acgtctttaa ggagcttggc ggggagccgg cgctggtgtg gcggatgcag  17520
ttggaatacg acgagaaccc ggcggcgtcc atgctgagcg cggtccggca attggcttat  17580
gaagcagatg gggccattcg aagcttgccg ccgctggaat tcgattatac tccatttggc  17640
atcgagacaa cggccgattg gcagcctttt ctgcctgtgc ctgaatgggc ggatgaagaa   7700
cattatcagt tggtcgattt gtacggagaa ggcataccgg gcttattata tcagaacaat   17760
gaccactggc attatcgttc gcccgcccgg ggcgacacac cggacgggat cgcctataac   17820
agctggcggc cgcttcctca tatccccgtg aactcccgga acgggatgct gatggatctg   17880
aatggagacg ggtatctgga atggttgctt gcggaacccg gggttgcggg gcgctatagc   17940
atgaacccgg ataagagctg gtccggtttt gtgccgctcc aggcactgcc aacggaattc   18000
ttccatccgc aggcacagct tgccaatgtt accggatcgg gtttaaccga cttggttatg   18060
atcggtccga agagcgtccg gttttatgcc ggagaagaag cgggcttcaa gcgcgcatgt   18120
gaagtgtggc agcaagtggg cattactttg cctgtggaac gcgtggataa aaaggaactg   l8180
gtggcattca gcgatatgct gggatcgggt cagtctcatc tggtgcgcat ccggcatgat   18240
ggcgttacat gctggcctaa tctggggaac ggcgtgttcg gggcgccgtt ggcccttcac   18300
gggtttacgg catcggagcg ggaattcaat ccggaacgtg tatatcttgt ggaccttgat   18360
ggatccggcg cttccgatat catttatgct tctcgtgacg ctctactcat ttaccgaaat   18420
ctttccggca atggctttgc tgatccggtg cgggttccgc tgcctgacgg cgtgcggttt   18480
gataatctgt gccggctgct gcctgccgat atccgcgggt taggtgtggc cagtctggtg   18540
ctgcatgtac cttacatggc cccccgcagt tggaaattag atttctttgc ggcgaagccg   18600
tatttattgc aaacggtcag caacaatctt ggagcttcca gctcgttttg gtaccgaagc   18660
tccacccagt attggctgga tgagaaacag gcggcctcat cggctgtctc cgctttgccc   18720
ttcccgataa acgtggtatc ggatatgcac acggtggacg aaatcagcgg ccgcaccagg   18780
actcagaagt atacttaccg ccatggcgtg tatgaccgga ccgaaaagga atttgccgga   18840
ttcggccgca ttgacacatg ggaagaggag cgggattccg aaggaaccct gagcgtcagc   18900
actccgcccg tgctgacgcg gacctggtat cataccgggc aaaagcagga tgaggagcgt   18960
gccgtgcagc aatattggca aggcgaccct gcggcttttc aggttaaacc cgtccggctt   19020
actcgattcg atgcggcagc ggcccaggat ctgccgctag attctaataa tgggcagcaa   19080
atactggctg tgtaccgatc attacaaggg atgccgctgc ggactgagat ttttgcggga   19140
gatgttggcg ggtcgcctcc ttatcaggta gagagcttcc gttatcaagt gcgcttggtg   19200
cagagcatcg attcggaatg tgttgccttg cccatgcagt tggagcagct tacgtacaac   19260
tatgagcaaa tcgcctctga tccgcagtgt tcacagcaga tacagcaatg gttcgacgaa   19320
tacggcgtgg cggcacagag tgtaacaatc caatatccgc gccgggcaca gccggaggac   19380
aatccgtacc ctcgcacgct gccggatacc agctggagca gcagttatga ttcgcagcaa   19440
atgctgctgc ggttgaccag gcaaaggcaa aaagcgtacc accttgcaga tcctgaaggc   19500
tggcgcttga atattcccca tcagacacgc ctggatgcct tcatttattc tgctgacagc   19560
gtgcccgccg aaggaataag cgccgagctg ctggaggtgg acggcacgtt acgatcttcg   19620
gcgctggaac aggcttatgg cggccagtca gagatcatct atgcgggcgg gggcgaaccg   19680
gatttgcgag ccctggtcca ttacaccaga agcgcggttc ttgatgaaga ctgtttacaa   19740
gcctatgaag gcgtactgag cgatagccaa ttgaactcgc ttcttgcctc ttccggctat   19800
caacgaagcg caagaatatt gggttcgggc gatgaagtgg atatttttgt cgcggaacaa   19860
ggatttaccc gttatgcgga tgaaccgaat tttttccgta ttctggggca acaatcctct   19920
ctcttgtccg gggaacaagt attaacatgg gatgataatt tctgtgcggt tacatccatc   19980
gaagacgcgc ttggcaatca aattcagatt gcatatgatt accgctttgt ggaggccatc   20040
cagattaccg atacgaataa taatgtgaat caggtcgccc tggatgctct cggccgggtc   20100
gtatacagcc ggacctgggg cacggaggaa gggataaaga ccggcttccg cccggaggtg   20160
gaattcgcga cgcccgagac aatggagcag gcgcttgccc tggcatctcc cttgccggtt   20220
gcatcctgct gtgtatatga tgcgcatagc tggatgggaa cgataactct tgcacaactg   20280
tcagagcttg ttccagatag tgaaaagcaa tggtcgttct tgatagacaa tcgcttgatt   20340
atgccggacg gcagaatcag atcccgcggt cgggatccat ggtcgcttca ccggctattg  20400
ccgcctgctg tgggcgaatt gctgagcgag gcggaccgta aaccgccgca tacggtaatt  20460
ttggcagcag atcgttaccc ggatgaccca tcccagcaaa ttcaggcgag catcgtgttt  20520
agcgatggct ttgggcgtac gatacaaact gctaaaagag aagatacccg atgggcgatt  20580
gcggaacggg tggactatga cggaaccgga gccgtaatcc gcagctttca gcctttttat  20640
cttgacgact ggaattatgt gggcgaagag gctgtcagca gctctatgta cgcaacgatc  20700
tattattatg atgctctggc acgacaatta aggatggtca acgctaaagg atatgagagg  20760
agaactgctt tttacccatg gtttacagta aacgaagatg aaaatgatac catggactca  20820
tcattatttg cttcaccgcc tgcgcggtga gatggaggtt aaacctatga acacaacgtc  20880
catatatagg ggcacgccta cgatttcagt tgtggataac cggaacttgg agattcgcat  20940
tcttcagtat aaccgtatcg cggctgaaga tccggcagat gagtgtatcc tgcggaacac  21000
gtatacgccg ttaagctatc ttggcagcag catggatccc cgtttgttct cgcaatatca  21060
ggatgatcgc ggaacaccgc cgaatatacg aaccatggct tccctgagag gcgaagcgct  21120
gtgttcggaa agtgtggatg ccggccgcaa ggcggagctt tttgatatcg aggggcggcc  21180
cgtctggctt atcgatgcca acggcacaga gacgactctc gaatatgatg tcttaggcag  21240
gccaacagcc gtattcgagc aacaggaagg tacggactcc ccccagtgca gggagcggtt  21300
tatttatggt gagaaggagg cggatgccca ggccaacaat ttgcgcggac aactggttcg  21360
ccactacgat accgcgggcc ggatacagac cgacagcatc tccttggctg gactgccgtt  21420
gcgccaaagc cgtcaactgc tgaaaaattg ggatgaacct ggcgactgga gtatggatga  21480
ggaaagcgcc tgggcctcgt tgctggctgc cgaagcttat gatacgagct ggcggtatga  21540
cgcgcaggac agggtgctcg cccaaaccga cgccaaaggg aatctccagc aactgactta  21600
caatgacgcc ggccagccgc aggcggtcag cctcaagctg caaggccaag cggagcaacg  21660
gatttggaac cggatcgagt acaacgcggc gggtcaagtg gatctcgccg aagccgggaa  21720
tggaatcgta acggaatata cttacgagga aagcacgcag cggttaatcc gaaaaaaaga  21780
ttcccgcgga ctgtcctccg gggaaagaga agtgctgcag gattatcgtt atgaatatga  21840
tccggtaggc aatatccttt ctatttacaa tgaagcggag ccggttcgtt atttccgcaa  21900
tcaggccgtt gctccgaaaa ggcaatatgc ctacgatgcc ttgtatcagc ttgtatctag  21960
ttcggggcgg gaatccgacg cgcttcggca gcagacgtcg cttcctccct tgatcacgcc  22020
tatccctctg gacgatagcc aatacgtcaa ttacgctgaa aaatacagct atgatcaggc  22080
gggcaattta atcaagctta gccataacgg ggcaagtcaa tatacaacga atgtgtatgt  22140
ggacaaaagc tcaaaccggg ggatttggcg gcaaggggaa gacatcccgg atatcgcggc  22200
ttcctttgac agagcaggca atcaacaagc tttattcccg gggagaccgt tggaatggga  22260
tacacgcaat caattaagcc gtgtccatat ggtcgtgcgc gaaggcggag acaacgactg  22320
ggaaggctat ctctatgaca gctcgggaat gcgtatcgta aaacgatcta cccgcaaaac  22380
acagacaacg acgcaaacgg atacgaccct ctatttgccg ggcctggagc tgcgaatccg  22440
ccagaccggg gaccgggtca cggaagcatt gcaggtcatt accgtggatg agggagcggg  22500
acaagtgagg gtgctgcact gggaggatgg aaccgagccg ggcggcatcg ccaatgatca  22560
gtaccggtac agcctgaacg atcatcttac ctcctcttta ttggaagttg acgggcaagg  22620
tcagatcatt agtaaggaag aattttatcc ctatggcggc acagccctgt ggacagcccg  22680
gtcagaggta gaggcaagct acaagaccat ccgctattca ggcaaagagc gggatgccac  22740
aggcctgtat tattacggac accgctacta tatgccatgg ttgggtcgct ggctgaatcc  22800
ggacccggcc ggaatggtag atggactaaa cctgtaccgt atggtcagga acaatcctat  22860
aggactgatg gatccgaatg ggaatgcgcc aatcaacgtg gcggattata gcttcgtgca  22920
tggtgattta gtttatggtc ttagtaagga aagaggaaga tatctaaagc tatttaatcc  22980
aaactttaat atggaaaaat cagactctcc tgctatggtt atagatcaat ataataataa  23040
tgttgcattg agtataacta accaatataa agtagaagaa ttgatgaaat ttcaaaaaga  23100
cccacaaaaa gccgcacgga aaataaaggt tccagaaggg aatcgtttat cgaggaacga  23160
aaattatcct ttgtggcacg attatattaa cattggagaa gctaaagctg catttaaggc  23220
ctctcatatt ttccaagaag tgaaggggaa ttatgggaaa gattattatc ataaattatt  23280
attagacaga atgatagaat cgccgttgct gtggaaacga ggcagcaaac tcgggctaga  23340
aatcgccgct accaatcaga gaacaaaaat acactttgtt cttgacaatt taaatatcga  23400
gcaggtggtt acgaaagagg gtagcggcgg tcagtcaatc acagcttcgg agctccgtta  23460
tatttatcga aatcgcgaaa gattgaacgg gcgtgtcatt ttctatagaa ataatgaaag  23520
gctagatcag gctccatggc aagaaaatcc ggacttatgg agcaaatatc aaccgggtct  23580
tagacaaagc agcagttcaa gagtcaaaga acgagggatt gggaactttt tccgccggtt  23640
ttcaatgaag agaaagtagc atgtaactaa aattgctccc cattggttgt gtaaactaat  23700
ggggagttgt gattcactcc tgttcaacgc cattcatgta gaattgtttt gggaggttaa  23760
accgattgga tgccggcccc aaggcggagc tttttgatac cgaggggctt cgagtgtggc  23820
ttatcgatat caacggcaca cagacgactc tcgaatatga tgtattaggc aggcctgcag  23880
ccgtattcga gcatcaggaa ggcaaggaat ttcctaagtg ccgggatcgg tttagaatga  23940
gtctgatgcc aagccaacaa tttgcgaggg cagttgatgc gccactacga tacaatcccg  24000
ttacattcct tgataataag gggcttaaaa tcgtaattac cctaagtctc gtcgaggttg  24060
ctatagaatt gtatcgtctt catggtggcg ttcttttgct tcataatagt acgtgctgct  24120
agaattgtgc aggacgtcgc acattgctga tgtaaatgta tgtctttttc ttggaatagt  24180
agatccgctc cttgttctga tgtgttcatt ctactagccc ttattttttc tggccaacta  24240
agtcctatat ataattataa aaaaagcata gatatcttca tctataggtg aggatatcta  24300
tgcttttcat tttttgatta gagatatact tgtagtgcaa ggaaaagtag ataggagggt  24360
gaatttaaca gaagttacaa actgttgttt acttaaaaaa ttaatatgga gggaaataaa  24420
tatgaactca aatgaaccaa atttatctga tgttgttaat tgtttaagtg accccaatag  24480
tgacttggag aagtctggcg gtggagtagc gctagatgtt ggaatgtcat tgatatccga  24540
acttcttggt acggttccag ttgctggatc aattcttcaa tttgtattcg ataaattgtg  24600
gtttattttt ggcccttctg agtgggactc acttatggaa catgttgaag cattaattga  24660
tagtaaaata caagagcagg taaaaagaag tgcacaagat gaactaaatg caattacaaa  24720
taacttatct acgtatttga aatttctaga tgcatgggaa aatgattcta ataatttaag  24780
agcgagagct gtagtgaaag accaatttgt aggccttgaa cagactcttg aaagaaaaat  24840
ggttagtgtt tttggaagta cgggtcatga agtgcatctt ttgccaattt tcgctcaagc  24900
agccaacctc cacctaattc tattaagaga tgctgagaaa tatggaaaga gatggggttg  24960
ggcagataga gaaattcaag tatattatga taaccagatt cgttatatcc atgaatatac  25020
ggaccattgt attaaatatt ataatcaagg attaagtaaa ctgaaaggtt ctacctatca  25080
agattgggat aagtataatc gttttagaag agaaatgacc ctaactgttc ttgatttgat  25140
ttcaattttc ccatcgtatg atactagaac ttacccaatt gatacaatag gtcaattgac  25200
aagggaagtt tattcggatt tacttattgc taacccgtct gggatgcaga ctttcactaa  25260
tgtagatttc gacaatattc ttattagaaa acctcattta atggatttct taagaactct  25320
tgagattttt accgatcgac ataacgcaag cagacacaac gtatattggg gcggacatcg  25380
agtgcattct tcttacacag gaggtaattt tgaaaatttt gaatctccct tatatggcag  25440
tgaagcaaat gtagaacccc gaacatggtt gagttttgga gaatctcaag tctataatat  25500
acgttcgaag cctgagtggg atagaggaag tactgcaatt agtggctcct atgaatttcg  25560
aggagtgaca ggatgttctt tttatcgaat gggaaatttt gctggcaccg tagccctaac  25620
ttaccgacag tttggtaacg aaggttctca aatcccattg cacaggctat gtcatgttac  25680
ttattttaga agatctcaag ctgtgggggc gacttcgaga cagacgttaa caagtggtcc  25740
gctattttcc tggacacata gtagtgctac ggaaacgaat atcattcacc cgacaaaaat  25800
tacacaaata ccaatggtga aggctagttc ccttggatca ggtacttctg ttgtccaagg  25860
accaggcttt acaggagggg atgtacttcg aagaaatagc cccggtagca caggaacttt  25920
aagagttaac gtcaattcac cattatcaca gagatatcgt ataagaattc gttacgcttc  25980
tactacggat ttagattttt ttgtcattcg cggaaatacg acagttaata attttagatt  26040
tgggaacact atgcgtaaag gagaccctat aacctctcga tcatttagat ttgcggcttt  26100
tagtacacca tttacttttg ctagctcaca ggatgaactt agaataaatg tacaaaattt  26160
caataatggt gaagaagttt atatagatag aatcgaagtt attccagttt gatactacag  26220
atgtttatgt tgatacccta ggtaatacac ctactgagac gttgggaaga agtgtaaaaa  26280
actcatctca aaatcgaaag taaaagagcc cttcttaaaa ttttaagagg ggctcagctc  26340
attgttgcac agttactcca gggtctgtca aggattttgc ttaaattgat ttatatgaac  26400
ctaccccgag ggggagacga gcctcaaggc aaaatgctgg ccgatgcgtt ctggaaagaa  26460
tacggagaac tgcagcagca ttttcggaca gcaggcggaa atagcctgag agaagacgat  26520
gaggttgtcg acccaggtga tcaggatgtc ctggactccc cgattcttaa gatcgttcag  26580
aatgctgagc cagaacttcg tggactcgtt ttccccgatc cacatgctca gtacgacctt  26640
attgccgtcc aaatcgatgc cgtacacatt ctggagatga tcttcaatct cccgtgtact  26700
tacgtcctct tggcgtagag ggcgaatatc agtcctcgat gccggttacg ctcgtttgat  26760
tcttcttcac aacgatgggc tcgaacttga ttaggcggtc tcgggaacgg aaatcgcctg  26820
tacgccgtac tcacctggtg atcgtcttct tgctcttacc attgcggcta tttgccgtct  26880
gctggttctg cacatcatac ctctcataac ccagatgcgt gtcctccccc aacctttcta  26940
gtcctttcat tgttagtgga tttgattgag tttacacgaa gtatttacga ctcttggaac  27000
ccgggtgttt tttgcaagtg aaaaatgctg agttttgctg caaaaagtgc caggctccct  27060
tgccagccaa aacattactg cggaatgcgt tccattgcct gcttgaggcg gaaactctcg  27120
cctgtgaacg agagaatatg cgcgtggtgc acgagacggt cgaccaaggc tgaggtgagc  27180
ttagtatccc caaatatgga ggtccattgg ccaaactcca ggtactgggc tgtgggtttt  27240
gcgcttgcga agggcggcgt tccagtcgct ctggtcggca tagcgtttgg ccgttcgcca  27300
gtgaatgccc acctaccttg cgatttcgct cactgagcag ccttctgttt cgcgtaaaaa  27360
agttgttgag gcattttcag catccttccc gtctccttcg tcaagttctc ggcaaaccta  27420
acgataggag gattttaagg ggctgacaag tgcctttttt gcatctgact tcagcatttt  27480
tacgctgcaa ttctaggcat ttttagtatg caataaacac ccgggtctcc atctctgaca  27540
tgagcctgcc gggcactcat ataatataaa aagcatcaga gctgaatgag tcggctgctg  27600
atgcttattt attggaccga acgatatctc tgcaagtaca agtacgaatg gagcccggta  27660
ttgttgatac ccccgttttt ataaggatag actaagcagt tctttaatag actttaaatc  27720
tttcaggatg agtttatctg gtatccaaat gacaggaatt tgagttttat tgattttgta  27780
attggttata atgaaatcga atttgaccgt attgcttggt tcggtttgaa ggtttagaac  27840
gttacccaat tcattattta atttgtgata gatgaatttt ttccaattgg ttggtccgga  27900
taaaagcaat aaaacctttt ttttataatt tgacaggaga atagataaaa tatgaaacgt  27960
gatgtggtag ctctcatctt cagataatct attttcattt atttctttat tccatgcgac  28020
aataagaggg tgaatgatgt tgtagccctc tattaattca ttaggaatcg tcttaaatct  28080
accccaatag tattctaacg gtaaattgag atttttaaat atatagatct tgtggaaaga  28140
aaaatggatg ttatgtctta tttcttctat tactttggca ttcatattta cttcacttga  28200
aatcatgtca attaaagcaa ggtgcttatc gtaaagttgt ttatatgatc cacgatagta  28260
attcttgatt ttactttttt cattatcatc cccctcggag atgaggaaaa aaaatagtgt  28320
aaaaaactta agttcatttt gctggaagct gaccttatag aaattttcaa tggcagagac  28380
aatggcatag gtgcaatcta acttttgaga gctaaatatg tagtccatat taaaactttt  28440
ggaaataaaa tgcttgtata tatttctatt tacagacaca ttgatgagta tggttaatag  28500
attataatcg atctccattt tatagaaacg aatatagttc tcaatttttt gttgcaagtc  28560
taggtccggt ttaaagattt ctttatactt ttgcacgtga aaaaaaagaa ccatatagaa  28620
gtatctaata ttcagttcct ttccaattat ttggatcgtt gttctgaaat taaaatcaag  28680
gttaaaatgt ctaagtattt ttctgaaatt atttaatttt ttcttcaatg ttaatttatc  28740
taagtacaat atttgagacc atttttccaa gctataatac ttctgattga atattcccat  28800
taaaatgatg taaagttcac tgtttattat ataagtagct ataatagtgg aaaggtgatc  28860
taaaggatct ttttttagaa cgtaaccttt ggaattaatg cttattatat cccaattatc  28920
tggaagatcc tgttttaatt gagaaatgtc acttataatc gttctgcttg tacattgcag  28980
cttacgggct aaagaactgg aagacacgat accttcgctg tcaattaagg attctaatat  29040
ttggattttt cgaataattg aatgattttg aattaagtga gcggtgaatt catccattta  29100
gtctccccct cgaaaagcga taactggtta aagtgcagat gtactatcct ttgttcgaag  29160
ttgctagtaa tcaattctgc ggatctcttc aaagtgctcc aggtgctatg gatttacgaa  29220
tttcccctaa acatatcttt ctaatgtttg tcttcttaat gaaaatcttt attatttttc  29280
tccttttcac aatttaaatt tcaattagaa agtaacgtaa ttttggaatg aaaaacgata  29340
cataatttca ttaatagatg aaaatatgta tggtttttaa aatgtttgta aaggtcagct  29400
taatgcggtt aatagaaggt taagagattt tattgtgcaa ggggggacga agaaggatat  29460
aagatagaac atatccgaaa gggaggaggc taacgaaatt tgaaattatt tgttgggtag  29520
tgtttgcaaa actcgaatta tatggtaatc tatagatggt caattatttg caatgccaaa  29580
ggaaggtgag gctgtgagta ccgttgctgc gaagccacag aggttggggg agctaataca  29640
gtactatcgg cagaagaagg aattgagtct gtcgaagctg caagaagcgg tcggcattga  29700
taaaggcagc ctgtcgagaa ttgaaaacag cgaggtcaaa cgccctgatt ttcgatccat  29760
cttgtcgatc gccgcggtat tggacattcc ccatgacgcc atcgtagaac agtacatcga  29820
gatcggacat aaatcggaag tcatatacac tattttacag aacgaattga caaccctcga  29880
gcatccatcg ctcataccga aaattgccgc aaagtttctt gaagcgccca atgaagacag  29940
tctggatgca gtagagaagt tgtaccgaac gataggctcc gtgaatcatc cttccactca  30000
gttatcttta tacaccctca tcgtagacta ctcacgcgcc catggaatca tgccttacat  30060
tgccaaagga ttatttcgga agtacatgat tgaacgaaat gatttcagca ggttgaagga  30120
aacgtatcag gttggaaaaa atgtgctgga ctatgctaat tttttgagcg agaaagagcg  30180
gatacttcta tactatggct tgagtgttca cgcttatagt cttatgtttt atcatgatgc  30240
cataaaattc ggtaattatg ttgtggaaaa tggggaagaa gaaccgctag caaatgcaac  30300
tcataatgtt tgcaatgcct attaccattt ggggaattat gacgattgca atacctatct  30360
cgaaaagtat agtcatttcc catatccttt cgtcaaagag aatgttaaat taatgactgc  30420
ctttcttaac gggaagaaag ggaatattga gtccgccatt actcagttta ataactgttt  30480
agataccctg tcctcatata atttgattca tgccgtaact gaattaatgg aactatatct  30540
ccataaaaac gatcttgttg cagcagatca actccttatg tatgaagaac aaataattga  30600
gagcatcacc caaccacgaa ctacgccata taaaaggtca agattagcgc actactttcg  30660
catcaaagga caattgttaa ctcgtaaaca acatgaaaaa gacgctgttg atagtttctt  30720
gaaaagtaca ttagagtacg taaaaattgg tcgttttacg gaagcttttg aatcattgtc  30780
gtttgtgacg cattcaatga tacataatca gtcaatcatt aatagtgaaa taattaaaaa  30840
ggttgataat attttacaaa taattgctgc aaaataatta aggaggaata tggtgccatg  30900
agaaaacgta aacttctttt cattgcctct cttctagttt ttggagcaat cagcatggag  30960
catattgttt catacatcga tgccccgtgg ataactaact tctaatgaat ataacatctc  31020
ataacgctag tcatggcccc gccattcgtt ggtggggtaa catccttcga aagcccgatt  31080
cttttactgg caatgttgct gcaattgtaa ggggcctcac tcactccaag tgctgtctct  31140
gcagatcctc tttggtttat gccatcggtc tatagcagca gtaactcgat cgacagataa  31200
aaatttgaaa attctcttcg aaaggagatt gacgcattaa gacgccttta tgggcgtttt  31260
tttgtttttt atgtataaag ttgttgcata ataatccaga atcaagtcat atttaccaac  31320
ttcatctata atcaggtcaa ataatacagt ttatggatga ggtgtggaaa tgagccatca  31380
accggtatac aaaggtgact taatcccttt tacttatagc tatgagaaag ctggctgttt  31440
aattgaaatc attgagagca ctcgacagga gcttatagta gcggccacgg aaaaaaagtg  31500
tcttaccgac gaaactgttg taagattaag ccaaaagtta gatacatacc tattggaatt  31560
tcaaagaagg agctgcggct agaagaatag gatgtgataa tccggattat taggggaagg  31620
tgaggctgtg agtatcggtt ctgtgaagcc taaaagcttg ggggagttaa tcaagtatta  31680
tcgaaaaatg aatagcgaaa tcgcagatca gacattgaga ttgagcaaaa acctaaagtc  31740
attttctcaa tcttgcagaa cgaattggaa acactcgagc atccagcatt aatacccgaa  31800
atagccgcca aatttcttga cttatcaaat ggtatggagg gggtaaaaga gctttacaga  31860
gtaattgact cggtagaaga tacctccatt caattagctg tgtacaacct tattattgat  31920
tactctcgcg ctcatggaat gatgccctat attgctaagg gattataccg aaaatacatg  31980
atcgaacgaa atgatttcag caaattgaaa gaaacctatc aactaggtaa gtgtgtattg  32040
gactatatac agtttctggg cgacgaagaa cgaattgtat tttattattc aataggagtt  32100
cacgctgaca gcttaatgaa ctatgatgac tctgtaccct atatgaaata tgtggtggag  32160
aacgataact cagaaaatgg tgcctataga gcgaatgctt atcttagtct atgcaattct  32220
tcctataata ctggtgatta caaagcaagc caggaatatt tagatgagta cagtaagtac  32280
tctttttcat atgtagccga taatgtgcat tttatgtcgg cttgtataga gggcaagatg  32340
gggaacgtgg atagttcgat ttcaaagtta cgttcttatt tacaaagttc atgggaagta  32400
tcccgttgaa aagggaacct aaatatattc aaacgccttg tggtgtctca gattgttgaa  32460
aaaccctgtc cttttctaaa ggtacagggt ttctcacatg aaaaggactc acgaaacgaa  32520
ccttccgatg aacccggcca cggttttttc gtacgtttcc cgatccatcc ggtatgcttc  32580
tccatgtccg gctttcggaa cgatgtatag ctctttctcg gcggggcaat tttcgtaaac  32640
tttatgcacc atctccgtcg gcacaaaagt atcgttggcc ccatgaatga agagagtcgg  32700
ggttttcgac tttttcacct gctccagtgc ggaggcttct ccgaaaaagt accctgcccg  32760
tagcctggtc agcaggctgg tggtatccac gatcgggaat gccggaagat gatacatgcg  32820
ccgcagctgg aaggaaagct gatccttcac agaggtataa ccacagtctt cgacgatggc  32880
tttcacgttc ggcggcaaat tctcgccgct ggtcatcatc acggttgccc ctcccatcga  32940
cacgccgtgg agaacgattt gtgaattcgt cccattcgtg tccaaaaccc gctgaatcca  33000
tttcaaataa tccttacgct cgggccagcc gaaaccgata taatggcctt cgctttcccc  33060
atgtccccga gcatcgggga gcaggatgtt gtagccccat ttctcgtggt acattctggc  33120
gtaaccgctc atttgcgttg cgttcccgga atatccgtgc gcgatgatga ccgttttgtc  33180
cgacggcttg gatgccggca aataatacgc cttcagatga atgccgtcat ccgagtccat  33240
ctcccagcgc tcaaagcttt ggttgttcca ccattccttg tccgccagcg tggtttgctt  33300
tgattcctcc acctcaggac tggttttcag gtcgggattg tcgctcaaaa agtctttcga  33360
agcgcgcgca atcgccactt gataaaagta aaagctcccg gcggtaagga taataatgac  33420
aaatacaatc aaggaaataa agcctgtcac catttttttc ttcaattctg ttctctccta  33480
gtaaactctc atgttagtta ttttaatata tcataatgat c                      33521
<210>2
<211>3264
<212>DNA
<213>类芽孢杆菌IDAS 1529菌株
<400>2
gatcacacgg ccggcgtatt ccggctcgga accgaagaat taacagaagc gcttcagcag    60
tccggttatc ggacagtctt tgatattgca tctgaaaatc ttgcggaatt tcagaaaagc   120
gaaaacttat gcatgcttta taaggcctgg caactgcaca atgatccggt cgtccagagc   240
cttcccaaat tatccgcgga taccggcctg cgaggcatgc gtgccgcgtt ggagcggagt   300
cttggagggg gagccgattt tggagacttg ttcccggagc gatcgccaga gggctatgcg   360
gaagcctcct ctatacagtc gcttttttcg ccgggacgtt accttacggt gctgtataaa   420
attgcgcagg atctccacga cccaaaagac aaactgcata ttgacaaccg ccgtccagat   480
ttgaagtcgc tgatcctcaa taatgacaat atgaaccgtg aggtgtcttc cctggatatc   540
ctgctggatg tgctgcagtc cgaaggctcc ggcacactga catccctgaa ggatacctac   600
tatccgatga cccttcccta tgatgacgac cttgcgcaaa tcaatgccgt ggcggaggcg   660
cgctcatcca atttgctggg gatctgggat accctgctgg acacgcagcg gacttccatc   720
ctgcaggatt ccgccgctgt ccaccggata agcaagccgc ggcactcggc atacgtcaat   780
cagagagtct ccgatgatga accggtattg atcgcgggag aggaattcta cttggagacc   840
ggcggtgttg ccgacacgac cccgtctccg ccaacgaggg aagcgctttc cttgacgcca   900
aacagcttcc gtctgctggt caaccccgag ccgacagcag acgacatcgc caatcactac   960
aacgttaaga ctcaagatcc tgccgctctg gccgccgtct taaatgtggt cgatgacttt  1020
tgcctgaaaa ccggtttgag ctttaatgag ttgctggact taacgatgca gaaggatgat  1080
gaatcgatcg gcagcgagta caaaagccgg tttgtaaaat ttggcggcga ggccaatgtt  1140
ccggtttcaa cctatggagc tgtatttctg acaggaacgg aagaaactcc gttgtgggta    1200
ggaaaaggag ctgtgataag ccctgcagcg gacgcctatg ttcgtaatgg gacatatgca    1260
aacacgaatt atggatcaga cactagtctt gttgtgaagc aggatgggtc tagtggatac    1320
agtagggaag catatatcag gtttgatttg acaggtcttt ccggagttgt ggaggaagct    1380
aaaatttctc taacaactag agcgaaacaa ttgtctagct taagacacca agctcatttg    1440
gtcagtgaca acagttggga tgaattgaaa atcacatgga ataacaaacc tgcaggagga    1500
gcgatcatcg caagctggga tgttcccgaa gttggtgaga atgtaaaggt tgatgtgacc    1560
cggcaagtaa atgatgcgct cgcaaacggt caagataaac tatcaattgt tattcgttct    1620
agtgcaaatt atggcagtct gggcgatgtc tcttatgcct ctagagaaca ccctgaaaaa    1680
gcctcacgac cttctatgga aatcaaggcg ataacgggtg ctggtttaaa ttttacggcg    1740
gataatgttg tagctctggc aggaagggcg gaaaagcttg tccggctggc gcgcagcacg    1800
ggactttcct ttgagcagtt ggattggctg attaccaata ccagccgtgc cgtaatcgaa    l860
catggtggag aactgattct ggataagccg gtactggagt ctgtggccga attcacaagg    1920
ctccataagc gttatggcat cacagcggat atgttcgccg cgtttatcgg cgaagtcaat    1980
acgtatgctg aagcaggtaa agagagcttt tatcagacga ttttcagcac ggccgaccat    2040
tcggctgcct tacctttagg cgcaactttg caatttgagg tgagcaaaca ggatcgatat    2100
gaagcgattt gctgcggggc catgggggtg accgccgatg agttctctcg tatcggcaaa    2160
tactgctttg gcgacaacgc gcagcaagtt accgccaatg aaacaaccgt tgcgcagctt    2220
tatcgtttag gccgaattcc tcacatgctt ggattgcgtt ttaccgaggc ggagctgttg    2280
tggaaattga tggctggcgg cgaggatacc ttgctccgca cgattggcgc gaagcctcgc    2340
agtttacaag ccttagagat tattcgccgt actgaggtcc ttttggactg gatggatgct    2400
catcagcttg atgttgtctc cctgcaagcc atggttacca atcggtacag cggcacagcc    2460
acgccggagc tgtacaactt tttggcacag gtgcaccaat ccacaagcag tgccgcgaac  2520
gtgtccaaag cggatgctca ggataccctg cccgcggaca agctgttccg ggccttggcg  2580
gtaggcttca acctgaaggc caacgtgatg gcgcaggtca ttgactggtt ggacaaaacc  2640
gacggagcgt ttacgctgcg ggctttctgg gacaagcttc aagcgtattt cagcgccgat  2700
catgaagaag aactgacggc cttggaagga gaagccgact tgctgcagtg gtgccaacag  2760
atcagccagt atgcgctcat tgtccgctgg tgcgggttaa gcgatcagga tctggcgctg  2820
ctgaccgggc atcccgggca gcttctgtcc ggacaacata cggtgccggt accctcgctg  2880
catctcctgc tggtgctgac ccgcctgaag gaatggcagc agcgcgtcca ggtttccagc  2940
gaggaggcca tgcgctattt tgcccaggcc gatgcgccaa ccgtcacacg cgatgctgcg  3000
gtcaagctgc ttgcccgtat ccatggctgg aatgaacagg ataccgcctc gatgaatgac  3060
tacctgctgg gagagaacga atatcctaag aactttgagc agatctttac tttggaaagc  3120
tgggtcaacc tgggccgtca actgaatgtt ggcagccgaa cgttgggaga gctggttgac  3180
atgtcagaag aggatgatac cgcggaaaac acggatttga ttatctcggt cgcccaaagc  3240
ctgatggctg cggtgcaggc ctga                                         3264
<210>3
<211>1087
<212>PRT
<213>类芽孢杆菌IDAS 1529菌株
<400>3
Asp His Thr Ala Gly Val Phe Arg Leu Gly Thr Glu GIU Leu Thr Glu
1               5                   10                  15
Ala Leu Gln Ser Gly Tyr Arg Thr Val Phe Asp Ile Ala Ser Glu
        20          25                          30
Asn Leu Ala Glu Phe Gln Lys Ser Asn Pro Glu Ile Pro Ser Ser Asp
        35                  40                  45
Ala Lys Glu Ile His Gln Leu Ala Val Gln Arg Thr Glu Asn Leu Cys
    50                  55                  60
Met Leu Tyr Lys Ala Trp Gln Leu His Asn Asp Pro Val Val Gln Ser
65                  70                  75                   80
Leu Pro Lys Leu Ser Ala Asp Thr Gly Leu Arg Gly Met Arg Ala Ala
                85                  90                  95
Leu Glu Arg Ser Leu Gly Gly Gly Ala Asp Phe Gly Asp Leu Phe Pro
            100                 105                 110
Glu Arg Ser Pro Glu Gly Tyr Ala Glu Ala Ser Ser Ile Gln Ser Leu
        115                 120                 125
Phe Ser Pro Gly Arg Tyr Leu Thr Val Leu Tyr Lys Ile Ala Gln Asp
    130                 135                 140
Leu His Asp Pro Lys Asp Lys Leu His Ile Asp Asn Arg Arg Pro Asp
145                 150                 155                 160
Leu Lys Ser Leu Ile Leu Asn Asn Asp Asn Met Asn Arg Glu Val Ser
                165                 170                 175
Ser Leu Asp Ile Leu Leu Asp Val Leu Gln Ser Glu Gly Ser Gly Thr
            180                 185                 190
Leu Thr Ser Leu Lys Asp Thr Tyr Tyr Pro Met Thr Leu Pro Tyr Asp
        195                 200                 205
Asp Asp Leu Ala Gln Ile Asn Ala Val Ala Glu Ala Arg Ser Ser Asn
    210                 215                 220
Leu Leu Gly Ile Trp Asp Thr Leu Leu Asp Thr Gln Arg Thr Ser Ile
225                 230                 235                 240
Leu Gln Asp Ser Ala Ala Val His Arg Ile Ser Lys Pro Arg His Ser
                245                 250                 255
Ala Tyr Val Asn Gln Arg Val Ser Asp Asp Glu Pro Val Leu Ile Ala
            260                 265                 270
Gly Glu Glu Phe Tyr Leu Glu Thr Gly Gly Val Ala Asp Thr Thr Pro
        275                 280                 285
Ser Pro Pro Thr Arg Glu Ala Leu Ser Leu Thr Pro Asn Ser Phe Arg
    290                 295                 300
Leu Leu Val Asn Pro Glu Pro Thr Ala Asp Asp Ile Ala Asn His Tyr
305                 310                 315                 320
Asn Val Lys Thr GIn Asp Pro Ala Ala Leu Ala Ala Val Leu Asn Val
                325                 330                 335
Val  Asp Asp Phe Cys Leu Lys Thr Gly Leu Ser Phe Asn Glu Leu Leu
             340                 345                 350
Asp Leu Thr Met Gln Lys Asp Asp Glu Ser Ile Gly Ser Glu Tyr Lys
        355                 360                 365
Ser Arg Phe Val Lys Phe Gly Gly Glu Ala Asn Val Pro Val Ser Thr
    370                 375                 380
Tyr Gly Ala Val Phe Leu Thr Gly Thr Glu Glu Thr Pro Leu Trp Val
385                 390                 395                 400
Gly Lys Gly Ala Val Ile Ser Pro Ala Ala Asp Ala Tyr Val Arg Asn
                405                 410                 415
Gly Thr Tyr Ala Asn Thr Asn Tyr Gly Ser Asp Thr Ser Leu Val Val
            420                 425                 430
Lys Gln Asp Gly Ser Ser Gly Tyr Ser Arg Glu Ala Tyr Ile Arg Phe
        435                 440                 445
Asp Leu Thr Gly Leu Ser Gly Val Val Glu Glu Ala Lys Ile Ser Leu
    450                 455                 460
Thr Thr Arg Ala Lys Gln Leu Ser Ser Leu Arg His Gln Ala His Leu
465                 470                 475                 480
Val Ser Asp Asn Ser Trp Asp Glu Leu Lys Ile Thr Trp Asn Asn Lys
                485                 490                 495
Pro Ala Gly Gly Ala Ile Ile Ala Ser Trp Asp Val Pro Glu Val Gly
            500                 505                 510
Glu Asn Val Lys Val Asp Val Thr Arg Gln Val Asn Asp Ala Leu Ala
        515                 520                 525
Asn Gly Gln Asp Lys Leu Ser Ile Val Ile Arg Ser Ser Ala Asn Tyr
    530                 535                 540
Gly Ser Leu Gly Asp Val Ser Tyr Ala Ser Arg Glu His Pro Glu Lys
545                  550                555                 560
Ala Ser Arg Pro Ser Met Glu Ile Lys Ala Ile Thr Gly Ala Gly Leu
                565                 570                 575
Asn Phe Thr Ala Asp Asn Val Val Ala Leu Ala Gly Arg Ala Glu Lys
            580                 585                 590
Leu Val Arg Leu Ala Arg Ser Thr Gly Leu Ser Phe Glu Gln Leu Asp
        595                 600                 605
Trp Leu Ile Thr Asn Thr Ser Arg Ala Val Ile Glu His Gly Gly Glu
    610                 6l5                 620
Leu Ile Leu Asp Lys Pro Val Leu Glu Ser Val Ala Glu Phe Thr Arg
625                 630                 635                 640
Leu His Lys Arg Tyr Gly Tle Thr Ala Asp Met Phe Ala Ala Phe Ile
                645                 650                 655
Gly Glu Val Asn Thr Tyr Ala Glu Ala Gly Lys Glu Ser Phe Tyr Gln
            660                 665                 670
Thr Ile Phe Ser Thr Ala Asp His Ser Ala Ala Leu Pro Leu Gly Ala
        675                 680                 685
Thr Leu Gln Phe Glu Val Ser Lys Gln Asp Arg Tyr Glu Ala Ile Cys
    690                 695                 700
Cys Gly Ala Met Gly Val Thr Ala Asp Glu Phe Ser Arg Ile Gly Lys
705                 710                 715                 720
Tyr Cys Phe Gly Asp Asn Ala Gln Gln Val Thr Ala Asn Glu Thr Thr
                725                 730                 735
Val Ala Gln Leu Tyr Arg Leu Gly Arg Ile Pro His Met Leu Gly Leu
            740                 745                 750
Arg Phe Thr Glu Ala Glu Leu Leu Trp Lys Leu Met Ala Gly Gly Glu
        755                 760                 765
Asp Thr Leu Leu Arg Thr Ile Gly Ala Lys Pro Arg Ser Leu Gln Ala
    770                 775                780
Leu Glu Ile Ile Arg Arg Thr Glu Val Leu Leu Asp Trp Met Asp Ala
785                 790                 795                 800
His Gln Leu Asp Val Val Ser Leu Gln Ala Met Val Thr Asn Arg Tyr
                805                 810                 815Ser Gly Thr Ala Thr Pro Glu Leu Tyr Asn Phe Leu Ala Gln Val His
           820                 825                 830
Gln Ser Thr Ser Ser Ala Ala Asn Val Ser Lys Ala Asp Ala Gln Asp
        835                 840                 845
Thr Leu Pro Ala Asp Lys Leu Phe Arg Ala Leu Ala Val Gly Phe Asn
    850                 855                 860
Leu Lys Ala Asn Val Met Ala Gln Val Ile Asp Trp Leu Asp Lys Thr
865                 870                 875                 880
Asp Gly Ala Phe Thr Leu Arg Ala Phe Trp Asp Lys Leu Gln Ala Tyr
                885                 890                 895
Phe Ser Ala Asp His Glu Glu Glu Leu Thr Ala Leu Glu Gly Glu Ala
            900                 905                 910
Asp Leu Leu Gln Trp Cys Gln Gln Ile Ser Gln Tyr Ala Leu Ile Val
        915                 920                 925
Arg Trp Cys Gly Leu Ser Asp Gln Asp Leu Ala Leu Leu Thr Gly His
    930                 935                 940
Pro Gly Gln Leu Leu Ser Gly Gln His Thr Val Pro Val Pro Ser Leu
945                 950                 955                 960
His Leu Leu Leu Val Leu Thr Arg Leu Lys Glu Trp Gln Gln Arg Val
                965                 970                 975
GIn Val Ser Ser Glu Glu Ala Met Arg Tyr Phe Ala Gln Ala Asp Ala
            980                 985                 990
Pro Thr Val Thr Arg Asp Ala Ala Val Lys Leu Leu Ala Arg Ile His
        995                 1000                1005
Gly Trp Asn Glu Gln Asp Thr Ala Ser Met Asn Asp Tyr Leu Leu
    1010                1015                1020
Gly Glu Asn Glu Tyr Pro Lys Asn Phe Glu Gln Ile Phe Thr Leu
    1025                1030                1035
Glu Ser Trp Val Asn Leu Gly Arg Gln Leu Asn Val Gly Ser Arg
    1040                1045                1050
Thr Leu Gly Glu Leu Val Asp Met Ser Glu Glu Asp Asp Thr Ala
    1055                1060                1065
Glu Asn Thr Asp Leu Ile Ile Ser Val Ala Gln Ser Leu Met Ala
    1070                1075                1080
Ala Val Gln Ala
    1085
<210>4
<211>3618
<212>DNA
<213>类芽孢杆菌IDAS 1529菌株
<400>4
atgaccaagg aaggtggtaa gaatatgtct acttcaaccc tgttgcaatt gattaaggaa     60
tcccgccggg atgcgttggt caaccattat atcgccaaca atgtcccgag agagcttacg    120
gaactcgtaa aaacatcgcc gatagctgag gccattagca gcgttcagtt atacatgaac    240
cgatgcgtgg aaggctatga aggcaagctg actccggaag gcaacagcca tttcgggccg    300
ggaaaattcc tgaataattg ggatacctat aacaagcgtt attccacttg ggccggcaag    360
gaacgtctga aatattatgc aggcagttat attgacccgt ccttgcgcta taacaaaacg    420
gatccgttcc tgaacctgga acagaatatc agccagggaa gaatcaccga tgacaccgta    480
aagaacgcgc tgcaacacta cctgactgaa tatgaagtgt tggcggattt ggaatatatc    540
agcgtaaata aaggcgccga tgaaagtgta ttattcttcg taggccgcac caaaacaatg    600
ccatacgaat attactggcg ccgattaacg ttgaaaaagg acaataacaa taaactggtg    660
cctgccatct ggtctcaatg gaaaaaaata actgccaata tcggcgaagc agttaataat    720
tatgtggtgc ttcactggca taataaccgc ttacatgtac aatggggttc tacagagaaa    780
acacaaaatg atgacggaga acccattgag aaacgatatt tgaatgactg gttcatggat    840
aagtccagtg tctggtcttc attccgaaag gtttcatata tagaaaatag ttttacttat    900
actgagggca tcattgattc aagaaatatt actatagctg gaaatcaact gttctgtgat    960
gattcaaata cttttaaggc aacaataacg gcacttccat ttgaccaaat acgtgtttac   1020
ttagaaaaga tttacggtac aggcggcagc atcacggtta ctggagaaaa taaaggctat   1080
attattaagg tgggggagcc aagagaagtc agtttctctc ctaatacgtt actagatgta    1140
ttcataggta gtaatgcaag ccctcgagac ccatatttca aagctacatt taatagagaa    1200
gctctccaaa attcatacgg ctcaattaaa ataaatcaat acacccctcc ttctggaagc    1260
aatatcaaag gtcctatcga ccttaccctg aaaaataaca tcgacctgtc ggcgttgttg    1320
gaagagagcc ttgacgtact gttcgactat accattcagg ggaataacca attgggcggc    1380
ttagaggcct ttaacgggcc ttacggactt tatttgtggg aaatcttcct ccatgttcca    1440
tttttaatgg cggttcgctt ccacaccgag cagcggtatg agttggcgga acgatggttt    1500
aaattcattt tcaacagcgc aggttaccgt gatggctacg gcaatctgct gacggatgac    1560
aaaggcaacg tgcgctactg gaacgtcgtg cctctgcagg aggatacgga gtgggatgac    1620
acgttgtccc tggcaacgac cgacccggac gagattgcga tggccgaccc gatgcaatac    1680
aagctggcta tctttattca caccttggac ttcttgatca gccgcggcga cagcttgtac    1740
cggatgctgg agcgggatac cttgaccgaa gcgaagatgt attacattca ggccagccaa    1800
ctgcttgggc ctcgtcccga gatccggatc aatcacagct ggcctgatcc gaccctgcaa    1860
agcgaagcgg acgcggtaac cgccgtgccg acgcgaagcg attcgccggc agcgccaatt    1920
ctcgccttgc gagcgcttct gaatgcggaa aacgggcatt tcctgccgcc ttataatgat    1980
gaactattag ctttctggga taaaatcgac ctgcgtctct acaatttacg ccacaatctg    2040
agcctggacg gtcagccgct tcatttgccg ctctttaccg aaccggtcaa tcctcgtgag    2100
ctgcaggttc agcatggggc aggcgatgga ttagggggaa gcgccggttc cgtccaaagc    2160
cgtcaaagtg tctatcgttt tcctctggtc atcgataagg cgcgcaatgc cgcgagtagt    2220
gttatccaat tcgggaatgc cctggaaaac gcgctgacaa agcaggacag cgaggccatg    2280
actatgctgt tgcaatccca gcagcagatt gtcctgcagc aaacccgcga tattcaggag    2340
aagaacctgg cctcgctgca agcaagtctg gaagcaacga tgacagccaa agcgggcgcg    2400
aaatcccgaa agacccattt tgccggcctg gcggataact ggatgtcgca taatgaaacc   2460
gcctcacttg cactgcgtac cactgcggga attatcaata caagctcgac cgtgccaatc   2520
gctatcactg gcggcttgga tatggctccg aacatttttg gtttcgcagt tggaggttcc   2580
cgctggggag cagccagcgc ggctgtagcc caaggattgc aaatcgccgc cggcgtaatg   2640
gaacagacgg ccaatatcat cgatatcagc gaaagctacc gccggcgccg ggaggattgg   2700
ctgctgcagc gggatgttgc cgagaatgaa gcggcgcagt tggattcgca gattgcggcc   2760
ctgcgggaac agatggatat ggcgcgaaaa caacttgcgc tggcggagac ggaacaggca   2820
cacgcgcaag cggtctacga gctgctaagc acccgtttta cgaatcaagc tttgtataac   2880
tggatggccg gacgtctgtc gtctctatac tatcaaatgt atgacgccgc attgccgctc   2940
tgcttgatgg ccaaacaggc tttagagaaa gaaatcggca atgataaaac ggttggaatc   3000
ttcaccctcc cggcctggaa tgatttgtat cagggattgc tagcgggcga ggcgctgctg   3060
ctcgagcttc agaagctgga gaatctgtgg ctggaggagg acaagcgcgg aatggaagct   3120
gtaagaacgg tatctttaga tacccttctc cgcaaagaaa agccagaatc cggttttgca   3180
gatttcgtca aggaagttct ggacggaaag acgcctgacc ctgtaagcgg agttagcgta   3240
cagctgcaaa acaatatttt cagtgcaacc cttgacctgt ccacccttgg cctggatcgc   3300
ttttacaacc aagcggaaaa ggcccacagg atcaaaaacc tgtcggttac cttacccgcg   3360
ctattgggac cttatcagga tattgcggca accttatcgc taggtggcga gaccgttgcg   3420
ctttcccatg gcgtggatga cagcggcttg tttatcacgg atctcaacga cagccgtttc   3480
ctgcctttcg agggtatgga tcctttatcc ggcacactcg ttctgtcgat actccatgcc   3540
gggcaagacg gtgaccagcg cctcctgctg gaaagcctga acgacgtcat cttccacatt   3600
cgatatgtca tgaaatag                                                 3618
<210>5
<211>1205
<212>PRT
<213>类芽孢杆菌IDAS 1529菌株
<400>5
Met Thr Lys Glu Gly Gly Lys Asn Met Ser Thr Ser Thr Leu Leu Gln
1               5                   10                  15
Leu Ile Lys Glu Ser Arg Arg Asp Ala Leu Val Asn His Tyr Ile Ala
            20                  25                  30
Asn Asn Val Pro Arg Glu Leu Thr Asp Lys Ile Thr Asp Ala Asp Ser
        35                  40                  45
Leu Tyr Glu Tyr Leu Leu Leu Asp Thr Lys I le Ser Glu Leu Val Lys
    50                  55                   60
Thr Ser Pro Ile Ala Glu Ala Ile Ser Ser Val Gln Leu Tyr Met Asn
65                  70                  75                   80
Arg Cys Val Glu Gly Tyr Glu Gly Lys Leu Thr Pro Glu Gly Asn Ser
                85                  90                  95
His Phe Gly Pro Gly Lys Phe Leu Asn Asn Trp Asp Thr Tyr Asn Lys
            100                 105                 110
Arg Tyr Ser Thr Trp Ala Gly Lys Glu Arg Leu Lys Tyr Tyr Ala Gly
        115                 120                 125
Ser Tyr Ile Asp Pro Ser Leu Arg Tyr Asn Lys Thr Asp Pro Phe Leu
    130                 135                 140
Asn Leu Glu Gln Asn Ile Ser Gln Gly Arg Ile Thr Asp Asp Thr Val
145                 150                 155                 160
Lys Asn Ala Leu Gln His Tyr Leu Thr Glu Tyr Glu Val Leu Ala Asp
                165                 170                 175
Leu Glu Tyr Ile Ser Val Asn Lys Gly Ala Asp Glu Ser Val Leu Phe
            180                 185                 190
Phe Val Gly Arg Thr Lys Thr Met Pro Tyr Glu Tyr Tyr Trp Arg Arg
        195                 200                 205
Leu Thr Leu Lys Lys Asp Asn Asn Asn Lys Leu Val Pro Ala Ile Trp
    210                 215                 220
Ser Gln Trp Lys Lys Ile Thr Ala Asn Ile Gly Glu Ala Val Asn Asn
225                 230                 235                 240
Tyr Val Val Leu His Trp His Asn Asn Arg Leu His Val Gln Trp Gly
                245                 250                 255
Ser Thr Glu Lys Thr Gln Asn Asp Asp Gly Glu Pro Ile Glu Lys Arg
            260                 265                 270
Tyr Leu Asn Asp Trp Phe Met Asp Lys Ser Ser Val Trp Ser Ser Phe
        275                 280                 285
Arg Lys Val Ser Tyr Ile Glu Asn Ser Phe Thr Tyr Thr Glu Gly Ile
    290                 295                 300
Ile Asp Ser Arg Asn Ile Thr Ile Ala Gly Asn Gln Leu Phe Cys Asp
305                 310                 315                 320
Asp Ser Asn Thr Phe Lys Ala Thr Ile Thr Ala Leu Pro Phe Asp Gln
                325                 330                 335
Ile Arg Val Tyr Leu Glu Lys Ile Tyr Gly Thr Gly Gly Ser Ile Thr
            340                 345                 350
Val Thr Gly Glu Asn Lys Gly Tyr Ile Ile Lys Val Gly Glu Pro Arg
        355                 360                 365
Glu Val Ser Phe Ser Pro Asn Thr Leu Leu Asp Val Phe Ile Gly Ser
    370                 375                 380
Asn Ala Ser Pro Arg Asp Pro Tyr Phe Lys Ala Thr Phe Asn Arg Glu
385                 390                 395                 400
Ala Leu Gln Asn Ser Tyr Gly Ser Ile Lys Ile Asn Gln Tyr Thr Pro
            405                     410                 415
Pro Ser Gly Ser Asn Ile Lys Gly Pro Ile Asp Leu Thr Leu Lys Asn
            420                 425                 430
Asn Ile Asp Leu Ser Ala Leu Leu Glu Glu Ser Leu Asp Val Leu Phe
        435                 440                 445
Asp Tyr Thr Ile Gln Gly Asn Asn Gln Leu Gly Gly Leu Glu Ala Phe
    450                 455                 460
Asn Gly Pro Tyr Gly Leu Tyr Leu Trp Glu Ile Phe Leu His Val Pro
465                 470                 475                 480
Phe Leu Met Ala Val Arg Phe His Thr Glu Gln Arg Tyr Glu Leu Ala
                485                 490                 495
Glu Arg Trp Phe Lys Phe Ile Phe Asn Ser Ala Gly Tyr Arg Asp Gly
            500                 505                 510
Tyr Gly Asn Leu Leu Thr Asp Asp Lys Gly Asn Val Arg Tyr Trp Asn
        515                 520                 525
Val Val Pro Leu Gln Glu Asp Thr Glu Trp Asp Asp Thr Leu Ser Leu
    530                 535                 540
Ala Thr Thr Asp Pro Asp Glu Ile Ala Met Ala Asp Pro Met Gln Tyr
545                 550                 555                 560
Lys Leu Ala Ile Phe Ile His Thr Leu Asp Phe Leu Ile Ser Arg Gly
                565                 570                 575
Asp Ser Leu Tyr Arg Met Leu Glu Arg Asp Thr Leu Thr Glu Ala Lys
            580                 585                 590
Met Tyr Tyr Ile Gln Ala Ser Gln Leu Leu Gly Pro Arg Pro Glu Ile
        595                 600                 605
Arg Ile Asn His Ser Trp Pro Asp Pro Thr Leu Gln Ser Glu Ala Asp
    610                 615                 620
Ala Val Thr Ala Val Pro Thr Arg Ser Asp Ser Pro Ala Ala Pro Ile
625                 630                 635                 640
Leu Ala Leu Arg Ala Leu Leu Asn Ala Glu Asn Gly His Phe Leu Pro
                645                 650                 655
Pro Tyr Asn Asp Glu Leu Leu Ala Phe Trp Asp Lys Ile Asp Leu Arg
            660                 665                 670
Leu Tyr Asn Leu Arg His Asn Leu Ser Leu Asp Gly Gln Pro Leu His
        675                 680                 685
Leu Pro Leu Phe Thr Glu Pro Val Asn Pro Arg Glu Leu Gln Val Gln
    690                 695                 700
His Gly Ala Gly Asp Gly Leu Gly Gly Ser Ala Gly Ser Val Gln Ser
705                 710                 715                 720
Arg Gln Ser Val Tyr Arg Phe Pro Leu Val Ile Asp Lys Ala Arg Asn
                725                 730                 735
Ala Ala Ser Ser Val Ile Gln Phe Gly Asn Ala Leu Glu Asn Ala Leu
            740                 745                 750
Thr Lys Gln Asp Ser Glu Ala Met Thr Met Leu Leu Gln Ser Gln Gln
        755                 760                 765
Gln Ile Va1 Leu Gln Gln Thr Arg Asp Ile Gln Glu Lys Asn Leu Ala
    770                 775                 780
Ser Leu Gln Ala Ser Leu Glu Ala Thr Met Thr Ala Lys Ala Gly Ala
785                 790                 795                 800
Lys Ser Arg Lys Thr His Phe Ala Gly Leu Ala Asp Asn Trp Met Ser
                805                 810                 815
His Asn Glu Thr Ala Ser Leu Ala Leu Arg Thr Thr Ala Gly Ile Ile
            820                 825                 830
Asn Thr Ser Ser Thr Val Pro Ile Ala Ile Thr Gly Gly Leu Asp Met
        835                 840                 845
Ala Pro Asn Ile Phe Gly Phe Ala Val Gly Gly Ser Arg Trp Gly Ala
    850                 855                 860
Ala Ser Ala Ala Val Ala Gln Gly Leu Gln Ile Ala Ala Gly Val Met
865                 870                 875                 880
Glu Gln Thr Ala Asn Ile Ile Asp Ile Ser Glu Ser Tyr Arg Arg Arg
                885                 890                 895
Arg Glu Asp Trp Leu Leu Gln Arg Asp Val Ala Glu Asn Glu Ala Ala
            900                 905                 910
Gln Leu Asp Ser Gln Ile Ala Ala Leu Arg Glu Gln Met Asp Met Ala
        915                 920                 925
Arg Lys Gln Leu Ala Leu Ala Glu Thr Glu Gln Ala His Ala Gln Ala
    930                 935                 940
Val Tyr Glu Leu Leu Ser Thr Arg Phe Thr Asn Gln Ala Leu Tyr Asn
945                 950                 955                 960
Trp Met Ala Gly Arg Leu Ser Ser Leu Tyr Tyr Gln Met Tyr Asp Ala
                963                 970                 975
Ala Leu Pro Leu Cys Leu Met Ala Lys Gln Ala Leu Glu Lys Glu Ile
            980                 985                 990
Gly Asn Asp Lys Thr Val Gly Ile Phe Thr Leu Pro Ala Trp Asn Asp
        995                 1000                1005
Leu Tyr Gln Gly Leu Leu Ala Gly Glu Ala Leu Leu Leu Glu Leu
    1010                10l5                1020
Gln Lys Leu Glu Asn Leu Trp Leu Glu Glu Asp Lys Arg Gly Met
    1025                1030                1035
Glu Ala Val Arg Thr Val Ser Leu Asp Thr Leu Leu Arg Lys Glu
    1040                1045                1050
Lys Pro Glu Ser Gly Phe Ala Asp Phe Val Lys Glu Val Leu Asp
    1055                1060                1065
Gly Lys Thr Pro Asp Pro Val Ser Gly Val Ser Val Gln Leu Gln
    1070                1075                1080
Asn Asn Ile Phe Ser Ala Thr Leu Asp Leu Ser Thr Leu Gly Leu
    1085                1090                1095
Asp Arg Phe Tyr Asn Gln Ala Glu Lys Ala His Arg Ile Lys Asn
    1100                1105                1110
Leu Ser Val Thr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp Ile
    1115                1120                1125
Ala Ala Thr Leu Ser Leu Gly Gly Glu Thr Val Ala Leu Ser His
    1130                1135                1140
Gly Val Asp Asp Ser Gly Leu Phe Ile Thr Asp Leu Asn Asp Ser
    1145                1150                1155
Arg Phe Leu Pro Phe Glu Gly Met Asp Pro Leu Ser Gly Thr Leu
    1160                1165                1170
Val Leu Ser Ile Leu His Ala Gly Gln Asp Gly Asp Gln Arg Leu
    1175                1180                1185
Leu Leu Glu Ser Leu Asn Asp Val Ile Phe His Ile Arg Tyr Val
    1190                 1195                1200
Met Lys
    1205
<210>6
<211>3300
<212>DNA
<213>类芽孢杆菌IDAS 1529菌株
<400>6
atggtgtcaa caacagacaa cacggccggc gtattccggc tcggaaccga agaattaaca   60
gaagcgctta agcagtccgg ttatcggacc gtctttgata ttgtatctga caatcttgcg  120
gccgtccaga ggacagaaaa cttatgcatg ctttataagg cctggcagct gcacaatgat  240
ccggttgtcc agagccttcc caaattatcc gcggataccg gcctgcaagg catgcgtgcc  300
gcgttggagc ggagtcttgg aggcggagcc gattttggag acttgttccc ggagcgatcg  360
ccagagggct atgcggaagc ctcctctata cagtcgcttt tctcgccggg acgttacctg  420
acggtgctgt ataaaattgc gcgggatctc cacgacccaa aagataaact gcatattgac  480
aaccgccgtc cagatttgaa gtcgctgatc ctcaataatg acaatatgaa ccgagaggta  540
tcttctctgg atatccttct ggatgtgctg cagcccgaag gctctgacac gctgacatcc  600
ttgaaggata cctaccatcc gatgaccctt ccctatgatg acgaccttgc gcaaatcaat  660
gccgtggcgg aggcgcgttc atctaatttg ctggggattt gggataccct gctggacacg  720
cagcggactt ccatcctgca gaattccgcc gctgcccgcc ggataagcaa ggcgcggcac  780
tcggcatacg ccaatcagaa agcctccaat gatgagccgg tattcatcac gggagaggaa  840
atctacctgg aaaccggagg taaacggctt tttctggcgc ataaactcga gataggttca  900
actattagcg ctaaaatcaa cattggaccg ccgcaagcgg ccgatatcgc gccggcaaag  960
ttgcaactcg tatattacgg cagaggcggc agagggaact acttcctgcg cgtggcagac    1020
gatgtgtccc tcggtggaaa gctgctgacc aattgttatc tgaccagcga tgacggacag    1080
agcaacaata ttagcgggcc atactgccta atgatcaacc gaggcaccgg cagcatgcct    1140
agcgggactc accttccagt tcagattgaa agagtgaccg atacatccat ccgcattttt    1200
gtgccggatc acggctattt ggggctaggc gaaagccttg ccagcaactg gaatgaaccg    1260
ttggcgctga atctgggctt ggatgaagcg ttgaccttta ccttgagaaa gaaggagacg    1320
ggaaatgaca ccatttccat aatcgacatg ctgccgccgg tagcgaacac gactccgtct    1380
ccgccgacga gggaaacgct ttccttgacg ccaaacagct tccgtctgct ggtcaaccct    1440
gagccgacag cggaggacat cgccaagcac tacaacgtca cgacggtaac ccgggctcct    1500
gccgatctgg cctccgcctt aaatgttgtc gatgatttct gcttgaaaac cggtttgagc    1560
tttaacgaat tgctggattt aaccatgcag aaggattatc agtcaaaaag cagtgagtac    1620
aaaagccgat ttgtaaaatt cggcggcggg gagaatgttc cggtatcaag ctatggcgca    1680
gcctttctga caggagcgga agatactcct ttgtgggtga aacagtataa cagcgtgggg    1740
actgcaacaa gcacccctgt tttaaacttt acgccagata atgttgtggc tttggcagga    1800
agggcggaaa agcttgtccg gctgatgcgc agcacgggtc tttcctttga gcagttggat    l860
tggctgattg ccaatgccag ccgtgccgtt atcgaacacg gtggagagct ttttctggat    1920
aagccggtac tggaagctgt ggccgaattc acaaggctca ataagcgtta tggcgtcaca    1980
tcggatatgt tcgccgcgtt tatcggcgaa gtcaatacgt atacagaagc gggcaaggac    2040
agcttttatc aggcgagttt cagcacggcc gaccattcgg ctaccttacc tttgggcgct    2100
tctttgcaac ttgaggtgag caagcaggat cgatatgaag cgatttgctg cggggctatg    2160
ggggtgaccg ccgatgagtt ctcccgtatc ggcaaatact gctttgggga taaagcacag    2220
caaatcacgg ccaatgaaac aaccgttgcc cagctttatc gtttaggccg aattcctcat    2280
atgctaggct tgcgttttac cgaggcagag ctgttgtgga aattgatggc tgggggcgag  2340
gataccttgc tccgcacgat tggcgcgaac cctcgcagtt tagaagcgtt agagattatt  2400
cgccggacgg aggtcctttt ggactggatg gatgcccatc agctggatgt tgtctccctg  2460
caagccatgg ttaccaatcg gtacagcggc acagccacgc cggagctgta caattttttg  2520
gcacaggtgc atcaatccgc aagcagtgcc gcgaacgtgg ccagagcgga tggtcaggat  2580
acgttgcctg cggacaagct gctccgggca ttggcggcgg gettcaaact gaaagccaac  2640
gtgatggcgc gagtaatcga ctggatggac aaaaccaata aagcgtttac gctgcgggct  2700
ttctgggaca agcttcaagc gtatttcagc gccgatcatg aagaagaact gaccgccctg  2760
gaaggagaag ccgcaatgct gcagtggtgc cagcagatca gccagtatgc gctcattgtc  2820
cgctggtgcg ggttaagcga gcaggatctg gcgctgctga ccgggaatcc ggagcagctt  2880
ctggacggac aacatacggt gcccgtaccc tcgctgcatc tcctgctggt gctgacccgc  2940
ctgaaggaat ggcagcagcg cgtccaggtt tccagcgagg aggctatgcg ctattttgcc  3000
caggccgatt cgccaaccgt cacgcgcgac gatgcggtta atctgcttgc ccgtatccat  3060
ggctggaatg aagcggatac cgtctcgatg aatgactacc tgctgggaga gaacgaatat  3120
cctaagaact ttgatcagat ctttgcactg gaaagctggg tcaacctggg ccgtcaactg  3180
aacgtgggca gcagaacgct gggagagctg gttgacatgg ctgaagagga taaaaccgcg  3240
gaaaacatgg atctgattac ttcggtggcc catagcctga tggctgcagc gaaagcctga  3300
<210>7
<211>1099
<212>PRT
<213>类芽孢杆菌IDAS 1529菌株
<400>7
Met Val Ser Thr Thr Asp Asn Thr Ala Gly Val Phe Arg Leu Gly Thr
1               5                   10                  15
Glu Glu Leu Thr Glu Ala Leu Lys Gln Ser Gly Tyr Arg Thr Val Phe
            20                  25                  30
Asp Ile Val Ser Asp Asn Leu Ala Glu Phe Gln Lys Asn Asn Pro Glu
        35                  40                  45
Ile Pro Ser Ser Asp Ala Lys Glu Ile His Gln Leu Ala Val Gln Arg
    50                  55                  60
Thr Glu Asn Leu Cys Met Leu Tyr Lys Ala Trp Gln Leu His Asn Asp
65                  70                  75                  80
Pro Val Val Gln Ser Leu Pro Lys Leu Ser Ala Asp Thr Gly Leu Gln
                85                  90                  95
Gly Met Arg Ala Ala Leu Glu Arg Ser Leu Gly Gly Gly Ala Asp Phe
            100                 105                 110
Gly Asp Leu Phe Pro Glu Arg Ser Pro Glu Gly Tyr Ala Glu Ala Ser
        115                 120                 125
Ser Ile Gln Ser Leu Phe Ser Pro Gly Arg Tyr Leu Thr Val Leu Tyr
    130                 135                 140
Lys Ile Ala Arg Asp Leu His Asp Pro Lys Asp Lys Leu His Ile Asp
145                 150                 155                 160
Asn Arg Arg Pro Asp Leu Lys Ser Leu Ile Leu Asn Asn Asp Asn Met
                165                 170                 175
Asn Arg Glu Val Ser Ser Leu Asp Ile Leu Leu Asp Val Leu Gln Pro
            180                 185                 190
Glu Gly Ser Asp Thr Leu Thr Ser Leu Lys Asp Thr Tyr His Pro Met
        195                 200                 205
Thr Leu Pro Tyr Asp Asp Asp Leu Ala Gln Ile Asn Ala Val Ala Glu
    210                 215                 220
Ala Arg Ser Ser Asn Leu Leu Gly Ile Trp Asp Thr Leu Leu Asp Thr
225                 230                 235                 240
Gln Arg Thr Ser Ile Leu Gln Asn Ser Ala Ala Ala Arg Arg Ile Ser
                245                 250                 255
Lys Ala Arg His Ser Ala Tyr Ala Asn Gln Lys Ala Ser Asn Asp Glu
            260                 265                 270
Pro Val Phe Ile Thr Gly Glu Glu Ile Tyr Leu Glu Thr Gly Gly Lys
        275                 280                 285
Arg Leu Phe Leu Ala His Lys Leu Glu Ile Gly Ser Thr Ile Ser Ala
    290                 295                 300
Lys Ile Asn Ile Gly Pro Pro Gln Ala Ala Asp Ile Ala Pro Ala Lys
305                 310                 315                 320
Leu Gln Leu Val Tyr Tyr Gly Arg Gly Gly Arg Gly Asn Tyr Phe Leu
                325                 330                 335
Arg Val Ala Asp Asp Val Ser Leu Gly Gly Lys Leu Leu Thr Asn Cys
            340                 345                 350
Tyr Leu Thr Ser Asp Asp Gly Gln Ser Asn Asn Ile Ser Gly Pro Tyr
        355                 360                 365
Cys Leu Met Ile Asn Arg Gly Thr Gly Ser Met Pro Ser Gly Thr His
    370                 375                 380
Leu Pro Val Gln Ile Glu Arg Val Thr Asp Thr Ser Ile Arg Ile Phe
385                 390                 395                 400
Val Pro Asp His Gly Tyr Leu Gly Leu Gly Glu Ser Leu Ala Ser Asn
                405                 410                 415
Trp Asn Glu Pro Leu Ala Leu Asn Leu Gly Leu Asp Glu Ala Leu Thr
            420                 425                 430
Phe Thr Leu Arg Lys Lys Glu Thr Gly Asn Asp Thr Ile Ser Ile Ile
        435                 440                 445
Asp Met Leu Pro Pro Val Ala Asn Thr Thr Pro Ser Pro Pro Thr Arg
    450                 455                 460
Glu Thr Leu Ser Leu Thr Pro Asn Ser Phe Arg Leu Leu Val Asn Pro
465                 470                 475                 480
Glu Pro Thr Ala Glu Asp Ile Ala Lys His Tyr Asn Val Thr Thr Val
                485                 490                 495
Thr Arg Ala Pro Ala Asp Leu Ala Ser Ala Leu Asn Val Val Asp Asp
            500                 505                 510
Phe Cys Leu Lys Thr Gly Leu Ser Phe Asn Glu Leu Leu Asp Leu Thr
        515                 520                 525
Met Gln Lys Asp Tyr Gln Ser Lys Ser Ser Glu Tyr Lys Ser Arg Phe
    530                 535                 540
Val Lys Phe Gly Gly Gly Glu Asn Val Pro Val Ser Ser Tyr Gly Ala
545                 550                 555                 560
Ala Phe Leu Thr Gly Ala Glu Asp Thr Pro Leu Trp Val Lys Gln Tyr
                565                 570                 575
Asn Ser Val Gly Thr Ala Thr Ser Thr Pro Va1 Leu Asn Phe Thr Pro
            580                 585                 590
Asp Asn Val Val Ala Leu Ala Gly Arg Ala Glu Lys Leu Val Arg Leu
        595                 600                 605
Met Arg Ser Thr Gly Leu Ser Phe Glu Gln Leu Asp Trp Leu Ile Ala
    610                 615                 620
Asn Ala Ser Arg Ala Val Ile Glu His Gly Gly Glu Leu Phe Leu Asp
625                 630                 635                 640
Lys Pro Val Leu Glu Ala Val Ala Glu Phe Thr Arg Leu Asn Lys Arg
                645                 650                 655
Tyr Gly Val Thr Ser Asp Met Phe Ala Ala Phe Ile Gly Glu Val Asn
            660                 665                 670
Thr Tyr Thr Glu Ala G1y Lys Asp Ser Phe Tyr Gln Ala Ser Phe Ser
        675                 680                 685
Thr Ala Asp His Ser Ala Thr Leu Pro Leu Gly Ala Ser Leu Gln Leu
    690                 695                 700
Glu Val Ser Lys Gln Asp Arg Tyr Glu Ala Ile Cys Cys Gly Ala Met
705                 710                 715                 720
Gly Val Thr Ala Asp Glu Phe Ser Arg Ile Gly Lys Tyr Cys Phe Gly
                725                 730                 735
Asp Lys Ala Gln Gln Ile Thr Ala Asn Glu Thr Thr Val Ala Gln Leu
            740                 745                 750
Tyr Arg Leu Gly Arg Ile Pro His Met Leu Gly Leu Arg Phe Thr Glu
        755                 760                 765
Ala Glu Leu Leu Trp Lys Leu Met Ala Gly Gly Glu Asp Thr Leu Leu
    770                 775                 780
Arg Thr Ile Gly Ala Asn Pro Arg Ser Leu Glu Ala Leu Glu Ile Ile
785                 790                 795                 800
Arg Arg Thr Glu Val Leu Leu Asp Trp Met Asp Ala His Gln Leu Asp
                805                 810                 815
Val Val Ser Leu Gln Ala Met Val Thr Asn Arg Tyr Ser Gly Thr Ala
            820                 825                 830
Thr Pro Glu Leu Tyr Asn Phe Leu Ala Gln Val His Gln Ser Ala Ser
        835                 840                 845
Ser Ala Ala Asn Val Ala Arg Ala Asp Gly Gln Asp Thr Leu Pro Ala
    850                 855                 860
Asp Lys Leu Leu Arg Ala Leu Ala Ala Gly Phe Lys Leu Lys Ala Asn
865                 870                 875                 880
Val Met Ala Arg Val Ile Asp Trp Met Asp Lys Thr Asn Lys Ala Phe
                885                 890                 895
Thr Leu Arg Ala Phe Trp Asp Lys Leu Gln Ala Tyr Phe Ser Ala Asp
            900                 905                 910
His Glu Glu Glu Leu Thr Ala Leu Glu Gly Glu Ala Ala Met Leu Gln
        915                 920                 925
Trp Cys Gln Gln Ile Ser Gln Tyr Ala Leu Ile Val Arg Trp Cys Gly
    930                 935                 940
Leu Ser Glu Gln Asp Leu Ala Leu Leu Thr Gly Asn Pro Glu Gln Leu
945                 950                 955                 960
Leu Asp Gly Gln His Thr Val Pro Val Pro Ser Leu His Leu Leu Leu
                965                 970                 975
Val Leu Thr Arg Leu Lys Glu Trp Gln Gln Arg Val Gln Val Ser Ser
            980                 985                 990
Glu Glu Ala Met Arg Tyr Phe Ala Gln Ala Asp Ser Pro Thr Val Thr
        995                 1000                1005
Arg Asp Asp Ala Val Asn Leu Leu Ala Arg Ile His Gly Trp Asn
    1010                1015                1020
Glu Ala Asp Thr Val Ser Met Asn Asp Tyr Leu Leu Gly Glu Asn
    1025                1030                1035
Glu Tyr Pro Lys Asn Phe Asp Gln Ile Phe Ala Leu Glu Ser Trp
    1040                1045                1050
Val Asn Leu Gly Arg Gln Leu Asn Val Gly Ser Arg Thr Leu Gly
    1055                1060                1065
Glu Leu Val Asp Met Ala Glu Glu Asp Lys Thr Ala Glu Asn Met
    1070                1075                1080
Asp Leu Ile Thr Ser Val Ala His Ser Leu Met Ala Ala Ala Lys
    1085                1090                1095
Ala
<210>8
<211>3627
<212>DNA
<213>类芽孢杆菌IDAS 1529菌株
<400>8
atgaccaagg aaggtgataa gcatatgtct acttcaaccc tgttgcaatc gattaaagaa    60
gcccgccggg atgcgctggt caaccattat attgctaatc aggttccgac agcgcttgcg   120
gaactcgtaa aaacatcgcc gatagcggag gccatcagca gcgtgcagtt atacatgaac   240
cgctgcgtcg aaggctatga aggcaagttg actccggaaa gtaatactca ttttggccca   300
ggtaaatttc tatataactg ggatacgtac aacaaacgtt tttccacctg ggcaggaaaa   360
gaacgcttga aatattatgc aggcagctat attgagccgt ccttgcgcta caacaaaacc   420
gatccattcc tgaacctgga acagagcatc agccagggaa gaattactga tgataccgta   480
aagaacgcgc tgcaacacta cctgactgaa tatgaagtgt tggcggatct ggattatatc   540
agcgttaata aaggcggcga cgaaagtgtt ttactctttg ttggacgcac caaaaccgta   600
ccgtatgaat actactggcg ccgtttgctt ttaaaaaggg acaataataa taagctagta   660
ccagcagtct ggtctcagtg gaaaaaaatc agtgccaata tcggtgaagc ggttgatagt   720
tatgtggtgc ctcggtggca taaaaaccgg ctacatgtgc aatggtgttc tatagagaaa   780
agtgaaaatg atgccggtga acccattgag aaacgatatt tgaatgactg gttcatggat    840
agttccggag tctggtcttc atttcgaaag attccggttg tggaaaagag tttcgaatat    900
ttggacggaa gcctcgatcc ccgatttgtc gctcttgtta gaaatcaaat attaattgat    960
gagccagaaa tattcagaat tacagtatca gcccctaatc cgatagatgc aaatggaaga   1020
gtagaggtac attttgaaga aaactatgca aacagatata atattaccat taaatatggg   1080
acaacgagtc ttgctattcc tgcagggcag gtagggcatc caaatatctc tattaatgaa   1140
acattaaggg ttgaattcgg caccaggccg gattggtatt atactttcag atatttagga   1200
aatacaatcc aaaactcata cggttcaatt gtcaataatc aattttcacc tccatcagga   1260
agcaatatta aaggtcctat cgaccttacc ctgaaaaata acatcgacct gtcggccttg   1320
ttggatgaga gccttgacgc actgttcgac tataccattc agggcgataa ccaattgggc   1380
ggcttagctg cctttaacgg gccttacgga ctttacttgt gggaaatctt cttccatgtt   1440
ccttttttaa tggcggttcg cttccacacc gagcagcggt atgagttggc ggaacgttgg   1500
tttaaattca tcttcaacag cgcaggatac cgtgatgatt acggcagtct gctgacggat   1560
gacaaaggca acgtgcgtta ctggaacgtg ataccgctgc aagaggacac ggagtgggat   1620
gacacgttgt ccctggcaac gaccgacccg gacgagattg cgatggccga cccgatgcaa   1680
tacaagctgg ctatatttat tcacaccatg gacttcctga tcagccgcgg cgatagcttg   1740
taccggatgc tggagcggga taccctggcc gaagccaaga tgtattacat tcaggccagc   1800
caactgcttg ggccccgccc cgacatccgg ctcaatcaca gttggcctaa tccgaccttg   1860
caaagcgaag cggacgcggt aaccgccgtg ccgacgcgaa gcgattcgcc ggcagcgcca   1920
attttggcct tgcgagcgct tctgacaggc gaaaacggtc atttcctgcc gccttataat   1980
gatgaactgt tcgctttctg ggacaaaatc gatctgcgtt tatacaattt gcgccacaat   2040
ttgagtctgg acggtcagcc gcttcatttg ccgctctttg ccgaaccggt caatccgcgt   2100
gaattgcagg ttcagcatgg cccgggcgat ggcttggggg gaagcgcggg ttccgcccaa   2160
agccgtcaga gtgtctatcg ttttcctctg gtcatcgata aggcgcgcaa tgcggccaac   2220
agtgtcatcc aattcggcaa tgccctggaa aacgcactga ccaagcaaga cagcgaagca   2280
atgaccatgc tgttgcagtc ccagcagcag attgtcctgc agcaaacccg cgatattcag   2340
gagaagaacc tggccgcgct gcaagcaagt ctggaagcaa cgatgacagc gaaagcgggg   2400
gcggagtccc ggaagaccca ttttgccggc ttggcggaca actggatgtc ggacaatgaa   2460
accgcctcac tcgcactgcg taccaccgcg ggaatcatca ataccagctc aaccgtgccg   2520
atcgccatca ccggcggctt ggatatggct ccgaacattt ttggtttcgc agttggaggt   2580
tcccgctggg gagcagccag cgcggctgta gcccaaggat tgcaaatcgc cgccggcgta   2640
atggaacaga cggccaatat tatcgatatt agcgaaagct accgccggcg ccgggaggat   2700
tggctgctgc agcgggatgt tgccgaaaat gaagcggcgc agttggattc gcagattgcg   2760
gccctgcggg aacagatgga tatggcgcgc aagcaacttg cgctggcgga gacggaacag   2820
gcgcacgcgc aagcggtcta cgagctgcaa agcacccgct ttacgaatca agctttgtat   2880
aactggatgg ctggacgtct gtcgtctcta tactatcaaa tgtatgacgc cgcattgccg   2940
ctctgcttga tggcgaagca ggctttagag aaagaaatcg gttcggataa aacggtcgga   3000
gtcttgtccc tcccggcctg gaatgatcta tatcagggat tattggcggg cgaggcgctg   3060
ctgctcgagc ttcagaagct ggagaatctg tggctggagg aagacaagcg cggaatggaa   3120
gccgtaaaaa cagtctctct ggatactctt ctccgcaaaa caaatccgaa ctccgggttt   3180
gcggatctcg tcaaggaggc actggacgaa aacggaaaga cgcctgaccc ggtgagcgga   3240
gtcggcgtac agctgcaaaa caatattttc agcgcaaccc ttgacctctc cgttcttggc   3300
ctggatcgct cttacaatca ggcggaaaag tcccgcagga tcaaaaatat gtcggttacc   3360
ttacctgcgc tattggggcc ttaccaggat atagaggcaa ccttatcgct aggcggcgag   3420
accgttgcgc tgtcccatgg cgtggatgac agcggcttgt tcatcactga tctcaacgac  3480
agccggttcc tgcctttcga gggcatggat ccgttatccg gcacactcgt cctgtcgata  3540
ttccatgccg ggcaagacgg cgaccagcgc ctcctgctgg aaagtctcaa tgacgtcatc  3600
ttccacattc gatatgttat gaaatag                                      3627
<210>9
<211>1208
<212>PRT
<213>类芽孢杆菌IDAS 1529菌株
<400>9
Met Thr Lys Glu Gly Asp Lys His Met Ser Thr Ser Thr Leu Leu Gln
1               5                   10                  15
Ser Ile Lys Glu Ala Arg Arg Asp Ala Leu Val Asn His Tyr Ile Ala
            20                  25                  30
Asn Gln Val Pro Thr Ala Leu Ala Asp Lys Ile Thr Asp Ala Asp Ser
        35                  40                  45
Leu Tyr Glu Tyr Leu Leu Leu Asp Thr Lys Ile Ser Glu Leu Val Lys
    50                  55                  60
Thr Ser Pro Ile Ala Glu Ala Ile Ser Ser Val Gln Leu Tyr Met Asn
65                  70                  75                  80
Arg Cys Val Glu Gly Tyr Glu Gly Lys Leu Thr Pro Glu Ser Asn Thr
                85                  90                  95
His Phe Gly Pro Gly Lys Phe Leu Tyr Asn Trp Asp Thr Tyr Asn Lys
            100                 105                 110
Arg Phe Ser Thr Trp Ala Gly Lys Glu Arg Leu Lys Tyr Tyr Ala Gly
        115                 120                 125
Ser Tyr Ile Glu Pro Ser Leu Arg Tyr Asn Lys Thr Asp Pro Phe Leu
    130                 135                 140
Asn Leu Glu Gln Ser Ile Ser Gln Gly Arg Ile Thr Asp Asp Thr Val
145                 150                 155                 160
Lys Asn Ala Leu Gln His Tyr Leu Thr Glu Tyr Glu Va1 Leu Ala Asp
                165                 170                 175
Leu Asp Tyr Ile Ser Val Asn Lys Gly Gly Asp Glu Ser Val Leu Leu
            180                 185                 190
Phe Val Gly Arg Thr Lys Thr Val Pro Tyr Glu Tyr Tyr Trp Arg Arg
        195                 200                 205
Leu Leu Leu Lys Arg Asp Asn Asn Asn Lys Leu Val Pro Ala Val Trp
    210                 215                 220
Ser Gln Trp Lys Lys Ile Ser Ala Asn Ile Gly Glu Ala Val Asp Ser
225                 230                 235                 240
Tyr Val Val Pro Arg Trp His Lys Asn Arg Leu His Val Gln Trp Cys
                245                 250                 255
Ser Ile Glu Lys Ser Glu Asn Asp Ala Gly Glu Pro Ile Glu Lys Arg
            260                 265                 270
Tyr Leu Asn Asp Trp Phe Met Asp Ser Ser Gly Val Trp Ser Ser Phe
        275                 280                 285
Arg Lys Ile Pro Val Val Glu Lys Ser Phe Glu Tyr Leu Asp Gly Ser
    290                 295                 300
Leu Asp Pro Arg Phe Val Ala Leu Val Arg Asn Gln Ile Leu Ile Asp
305                 310                 315                 320
Glu Pro Glu Ile Phe Arg Ile Thr Val Ser Ala Pro Asn Pro Ile Asp
                325                 330                 335
Ala Asn Gly Arg Val Glu Val His Phe Glu Glu Asn Tyr Ala Asn Arg
            340                 345                 350
Tyr Asn Ile Thr Ile Lys Tyr Gly Thr Thr Ser Leu Ala Ile Pro Ala
        355                 360                 365
Gly Gln Val Gly His Pro Asn Ile Ser Ile Asn Glu Thr Leu Arg Val
    370                 375                 380
Glu Phe Gly Thr Arg Pro Asp Trp Tyr Tyr Thr Phe Arg Tyr Leu Gly
385                 390                 395                 400
Asn Thr Ile Gln Asn Ser Tyr Gly Ser Ile Val Asn Asn Gln Phe Ser
                405                 410                 415
Pro Pro Ser Gly Ser Asn Ile Lys Gly Pro Ile Asp Leu Thr Leu Lys
            420                 425                 430
Asn Asn Ile Asp Leu Ser Ala Leu Leu Asp Glu Ser Leu Asp Ala Leu
        435                 440                 445
Phe Asp Tyr Thr Ile Gln Gly Asp Asn Gln Leu Gly Gly Leu Ala Ala
    450                 455                 460
Phe Asn Gly Pro Tyr Gly Leu Tyr Leu Trp Glu Ile Phe Phe His Val
465                 470                 475                 480
Pro Phe Leu Met Ala Val Arg Phe His Thr Glu Gln Arg Tyr Glu Leu
                485                 490                 495
Ala Glu Arg Trp Phe Lys Phe Ile Phe Asn Ser Ala Gly Tyr Arg Asp
            500                 505                 510
Asp Tyr Gly Ser Leu Leu Thr Asp Asp Lys Gly Asn Val Arg Tyr Trp
        515                 520                 525
Asn Val Ile Pro Leu Gln Glu Asp Thr Glu Trp Asp Asp Thr Leu Ser
    530                 535                 540
Leu Ala Thr Thr Asp Pro Asp Glu Ile Ala Met Ala Asp Pro Met Gln
545                 550                 555                 560
Tyr Lys Leu Ala Ile Phe Ile His Thr Met Asp Phe Leu Ile Ser Arg
                565                 570                 575
Gly Asp Ser Leu Tyr Arg Met Leu Glu Arg Asp Thr Leu Ala Glu Ala
            580                 585                 590
Lys Met Tyr Tyr Ile Gln Ala Ser Gln Leu Leu Gly Pro Arg Pro Asp
        595                 600                 605
Ile Arg Leu Asn His Ser Trp Pro Asn Pro Thr Leu Gln Ser Glu Ala
    610                 615                 620
Asp Ala Val Thr Ala Val Pro Thr Arg Ser Asp Ser Pro Ala Ala Pro
625                 630                 635                 640
Ile Leu Ala Leu Arg Ala Leu Leu Thr Gly Glu Asn Gly His Phe Leu
                645                 650                 655
Pro Pro Tyr Asn Asp Glu Leu Phe Ala Phe Trp Asp Lys Ile Asp Leu
            660                 665                 670
Arg Leu Tyr Asn Leu Arg His Asn Leu Ser Leu Asp Gly Gln Pro Leu
        675                 680                 685
His Leu Pro Leu Phe Ala Glu Pro Val Asn Pro Arg Glu Leu Gln Val
    690                 695                 700
Gln His Gly Pro Gly Asp Gly Leu Gly Gly Ser Ala Gly Ser Ala Gln
705                 710                 715                 720
Ser Arg Gln Ser Val Tyr Arg Phe Pro Leu Val Ile Asp Lys Ala Arg
                725                 730                 735
Asn Ala Ala Asn Ser Val Ile Gln Phe Gly Asn Ala Leu Glu Asn Ala
            740                 745                 750
Leu Thr Lys Gln Asp Ser Glu Ala Met Thr Met Leu Leu Gln Ser Gln
        755                 760                 765
Gln Gln Ile Val Leu Gln Gln Thr Arg Asp Ile Gln Glu Lys Asn Leu
    770                 775                 780
Ala Ala Leu Gln Ala Ser Leu Glu Ala Thr Met Thr Ala Lys Ala Gly
785                 790                 795                 800
Ala Glu Ser Arg Lys Thr His Phe Ala Gly Leu Ala Asp Asn Trp Met
                805                 810                 815
Ser Asp Asn Glu Thr Ala Ser Leu Ala Leu Arg Thr Thr Ala Gly Ile
            820                 825                 830
Ile Asn Thr Ser Ser Thr Val Pro Ile Ala Ile Thr Gly Gly Leu Asp
        835                 840                 845
Met Ala Pro Asn Ile Phe Gly Phe Ala Val Gly Gly Ser Arg Trp Gly
    850                 855                 860
Ala Ala Ser Ala Ala Val Ala Gln Gly Leu Gln Ile Ala Ala Gly Val
865                 870                 875                 880
Met Glu Gln Thr Ala Asn Ile Ile Asp Ile Ser Glu Ser Tyr Arg Arg
                885                 890                 895
Arg Arg Glu Asp Trp Leu Leu Gln Arg Asp Val Ala Glu Asn Glu Ala
            900                 905                 910
Ala Gln Leu Asp Ser Gln Ile Ala Ala Leu Arg Glu Gln Met Asp Met
        915                 920                 925
Ala Arg Lys Gln Leu Ala Leu Ala Glu Thr Glu Gln Ala His Ala Gln
    930                 935                 940
Ala Val Tyr Glu Leu Gln Ser Thr Arg Phe Thr Asn Gln Ala Leu Tyr
945                 950                 955                 960
Asn Trp Met Ala Gly Arg Leu Ser Ser Leu Tyr Tyr Gln Met Tyr Asp
                965                 970                 975
Ala Ala Leu Pro Leu Cys Leu Met Ala Lys Gln Ala Leu Glu Lys Glu
            980                 985                 990
Ile Gly Ser Asp Lys Thr Val Gly Val Leu Ser Leu Pro Ala Trp Asn
        995                 1000                1005
Asp Leu Tyr Gln Gly Leu Leu Ala Gly Glu Ala Leu Leu Leu Glu
    1010                1015                1020
Leu Gln Lys Leu Glu Asn Leu Trp Leu Glu Glu Asp Lys Arg Gly
    1025                1030                1035
Met Glu Ala Val Lys Thr Val Ser Leu Asp Thr Leu Leu Arg Lys
    1040                1045                1050
Thr Asn Pro Asn Ser Gly Phe Ala Asp Leu Val Lys Glu Ala Leu
    1055                1060                1065
Asp Glu Asn Gly Lys Thr Pro Asp Pro Val Ser Gly Val Gly Val
    1070                1075                1080
Gln Leu Gln Asn Asn Ile Phe Ser Ala Thr Leu Asp Leu Ser Val
    1085                1090                1095
Leu Gly Leu Asp Arg Ser Tyr Asn Gln Ala Glu Lys Ser Arg Arg
    1100                1105                1110
Ile Lys Asn Met Ser Val Thr Leu Pro Ala Leu Leu Gly Pro Tyr
    1115                1120                1125
Gln Asp Ile Glu Ala Thr Leu Ser Leu Gly Gly Glu Thr Val Ala
    1130                1135                1140
Leu Ser His Gly Val Asp Asp Ser Gly Leu Phe Ile Thr Asp Leu
    1145                1150                1155
Asn Asp Ser Arg Phe Leu Pro Phe Glu Gly Met Asp Pro Leu Ser
    1160                1165                1170
Gly Thr Leu Val Leu Ser Ile Phe His Ala Gly Gln Asp Gly Asp
    1175                1180                1185
Gln Arg Leu Leu Leu Glu Ser Leu Asn Asp Val Ile Phe His Ile
    1190                1195                1200
Arg Tyr Val Met Lys
    1205
<210>10
<211>4335
<212>DNA
<213>类芽孢杆菌IDAS 1529菌株
<400>10
atgccacaat ctagcaatgc cgatatcaag ctattgtcgc catcgctgcc aaagggcggc    60
ggttccatga agggaatcga agaaaacatc gcggctcccg gctccgacgg catggcacgt   120
tgtaatgtgc cgctgccggt aacctccggc cgctatatta ctcctgatat aagcctgtcc   180
tatgcgagcg gccacggcaa cggcgcttat ggaatgggct ggacgatggg agtgatgagc   240
attagccgga gaacaagccg agggaccccc agttatacat ccgaagacca gttccttggt   300
ccggatgggg aggtgcttgt tccggaaagc aacgaacaag gggagatcat tacccgccac   360
accgatacgg cccaagggat accgttaggc gagacgttta cggttacacg ctattttccc   420
cggatcgaga gcgcttttca tttgctggaa tactgggaag cgcaagcagg aagcgcaaca   480
gcgtcgtttt ggcttattca ctctgccgat ggagtgctgc actgtctggg taaaactgct   540
caggcgagga tagccgcccc tgacgattcc gccaagatcg cagaatggct agtggaggag   600
tccgtctccc ccttcggaga gcatatttat taccaataca aagaagaaga caatcaaggc   660
gtgaatctgg aggaagacaa tcatcaatat ggggcgaacc gctatctgaa atcgattcgc    720
tatggaaata aggttgcctc tccttctctc tatgtctgga agggggaaat tccggcagac    780
ggccaatggc tgtattccgt tatcctggat tatggcgaga acgatacctc agcggatgtt    840
cctcccctat acacgcccca aggggagtgg ctggtgcgcc cggaccgttt ttcccgctat    900
gactacggat ttgaggtccg gacttgccgc ttgtgccgcc aggtcttgat gttccacgtc    960
tttaaggagc ttggcgggga gccggcgctg gtgtggcgga tgcagttgga atacgacgag   1020
aacccggcgg cgtccatgct gagcgcggtc cggcaattgg cttatgaagc agatggggcc   1080
attcgaagct tgccgccgct ggaattcgat tatactccat ttggcatcga gacaacggcc   1140
gattggcagc cttttctgcc tgtgcctgaa tgggcggatg aagaacatta tcagttggtc   1200
gatttgtacg gagaaggcat accgggctta ttatatcaga acaatgacca ctggcattat   1260
cgttcgcccg cccggggcga cacaccggac gggatcgcct ataacagctg gcggccgctt   1320
cctcatatcc ccgtgaactc ccggaacggg atgctgatgg atctgaatgg agacgggtat   1380
ctggaatggt tgcttgcgga acccggggtt gcggggcgct atagcatgaa cccggataag   1440
agctggtccg gttttgtgcc gctccaggca ctgccaacgg aattcttcca tccgcaggca   1500
cagcttgcca atgttaccgg atcgggttta accgacttgg ttatgatcgg tccgaagagc   1560
gtccggtttt atgccggaga agaagcgggc ttcaagcgcg catgtgaagt gtggcagcaa   1620
gtgggcatta ctttgcctgt ggaacgcgtg gataaaaagg aactggtggc attcagcgat   1680
atgctgggat cgggtcagtc tcatctggtg cgcatccggc atgatggcgt tacatgctgg   1740
cctaatctgg ggaacggcgt gttcggggcg ccgttggccc ttcacgggtt tacggcatcg   1800
gagcgggaat tcaatccgga acgtgtatat cttgtggacc ttgatggatc cggcgcttcc   1860
gatatcattt atgcttctcg tgacgctcta ctcatttacc gaaatctttc cggcaatggc   1920
tttgctgatc cggtgcgggt tccgctgcct gacggcgtgc ggtttgataa tctgtgccgg   1980
ctgctgcctg ccgatatccg cgggttaggt gtggccagtc tggtgctgca tgtaccttac   2040
atggcccccc gcagttggaa attagatttc tttgcggcga agccgtattt attgcaaacg   2100
gtcagcaaca atcttggagc ttccagctcg ttttggtacc gaagctccac ccagtattgg   2160
ctggatgaga aacaggcggc ctcatcggct gtctccgctt tgcccttccc gataaacgtg   2220
gtatcggata tgcacacggt ggacgaaatc agcggccgca ccaggactca gaagtatact   2280
taccgccatg gcgtgtatga ccggaccgaa aaggaatttg ccggattcgg ccgcattgac   2340
acatgggaag aggagcggga ttccgaagga accctgagcg tcagcactcc gcccgtgctg   2400
acgcggacct ggtatcatac cgggcaaaag caggatgagg agcgtgccgt gcagcaatat   2460
tggcaaggcg accctgcggc ttttcaggtt aaacccgtcc ggcttactcg attcgatgcg   2520
gcagcggccc aggatctgcc gctagattct aataatgggc agcaagaata ctggctgtac   2580
cgatcattac aagggatgcc gctgcggact gagatttttg cgggagatgt tggcgggtcg   2640
cctccttatc aggtagagag cttccgttat caagtgcgct tggtgcagag catcgattcg   2700
gaatgtgttg ccttgcccat gcagttggag cagcttacgt acaactatga gcaaatcgcc   2760
tctgatccgc agtgttcaca gcagatacag caatggttcg acgaatacgg cgtggcggca   2820
cagagtgtaa caatccaata tccgcgccgg gcacagccgg aggacaatcc gtaccctcgc   2880
acgctgccgg ataccagctg gagcagcagt tatgattcgc agcaaatgct gctgcggttg   2940
accaggcaaa ggcaaaaagc gtaccacctt gcagatcctg aaggctggcg cttgaatatt   3000
ccccatcaga cacgcctgga tgccttcatt tattctgctg acagcgtgcc cgccgaagga   3060
ataagcgccg agctgctgga ggtggacggc acgttacgat cttcggcgct ggaacaggct   3120
tatggcggcc agtcagagat catctatgcg ggcgggggcg aaccggattt gcgagccctg   3180
gtccattaca ccagaagcgc ggttcttgat gaagactgtt tacaagccta tgaaggcgta   3240
ctgagcgata gccaattgaa ctcgcttctt gcctcttccg gctatcaacg aagcgcaaga   3300
atattgggtt cgggcgatga agtggatatt tttgtcgcgg aacaaggatt tacccgttat  3360
gcggatgaac cgaatttttt ccgtattctg gggcaacaat cctctctctt gtccggggaa  3420
caagtattaa catgggatga taatttctgt gcggttacat ccatcgaaga cgcgcttggc  3480
aatcaaattc agattgcata tgattaccgc tttgtggagg ccatccagat taccgatacg  3540
aataataatg tgaatcaggt cgccctggat gctctcggcc gggtcgtata cagccggacc  3600
tggggcacgg aggaagggat aaagaccggc ttccgcccgg aggtggaatt cgcgacgccc  3660
gagacaatgg agcaggcgct tgccctggca tctcccttgc cggttgcatc ctgctgtgta  3720
tatgatgcgc atagctggat gggaacgata actcttgcac aactgtcaga gcttgttcca  3780
gatagtgaaa agcaatggtc gttcttgata gacaatcgct tgattatgcc ggacggcaga  3840
atcagatccc gcggtcggga tccatggtcg cttcaccggc tattgccgcc tgctgtgggc  3900
gaattgctga gcgaggcgga ccgtaaaccg ccgcatacgg taattttggc agcagatcgt  3960
tacccggatg acccatccca gcaaattcag gcgagcatcg tgtttagcga tggctttggg  4020
cgtacgatac aaactgctaa aagagaagat acccgatggg cgattgcgga acgggtggac  4080
tatgacggaa ccggagccgt aatccgcagc tttcagcctt tttatcttga cgactggaat  4140
tatgtgggcg aagaggctgt cagcagctct atgtacgcaa cgatctatta ttatgatgct  4200
ctggcacgac aattaaggat ggtcaacgct aaaggatatg agaggagaac tgctttttac  4260
ccatggttta cagtaaacga agatgaaaat gataccatgg actcatcatt atttgcttca  4320
ccgcctgcgc ggtga                                                   4335
<210>11
<211>1444
<212>PRT
<213>类芽孢杆菌IDAS 1529菌株
<400>11
Met Pro Gln Ser Ser Asn Ala Asp Ile Lys Leu Leu Ser Pro Ser Leu
1               5                   10                  15
Pro Lys Gly Gly Gly Ser Met Lys Gly Ile Glu Glu Asn Ile Ala Ala
            20                  25                  30
Pro Gly Ser Asp Gly MeT Ala Arg Cys Asn Val Pro Leu Pro Val Thr
        35                  40                  45
Ser Gly Arg Tyr Ile Thr Pro Asp Ile Ser Leu Ser Tyr Ala Ser Gly
    50                  55                  60
His Gly Asn Gly Ala Tyr Gly Met Gly Trp Thr Met Gly Val Met Ser
65                  70                  75                  80
Ile Ser Arg Arg Thr Ser Arg Gly Thr Pro Ser Tyr Thr Ser Glu Asp
                85                  90                  95
Gln Phe Leu Gly Pro Asp Gly Glu Val Leu Val Pro Glu Ser Asn Glu
            100                 105                 110
Gln Gly Glu Ile Ile Thr Arg His Thr Asp Thr Ala Gln Gly Ile Pro
        115                 120                 125
Leu Gly Glu Thr Phe Thr Val Thr Arg Tyr Phe Pro Arg Ile Glu Ser
    130                 135                 140
Ala Phe His Leu Leu Glu Tyr Trp Glu Ala Gln Ala Gly Ser Ala Thr
145                 150                 155                 160
Ala Ser Phe Trp Leu Ile His Ser Ala Asp Gly Val Leu His Cys Leu
                165                 170                 175
Gly Lys Thr Ala Gln Ala Arg Ile Ala Ala Pro Asp Asp Ser Ala Lys
            180                 185                 190
Ile Ala Glu Trp Leu Val Glu Glu Ser Val Ser Pro Phe Gly Glu His
        195                 200                 205
Ile Tyr Tyr Gln Tyr Lys Glu Glu Asp Asn Gln Gly Val Asn Leu Glu
    210                 215                 220
Glu Asp Asn His Gln Tyr Gly Ala Asn Arg Tyr Leu Lys Ser Ile Arg
225                 230                 235                 240
Tyr Gly Asn Lys Val Ala Ser Pro Ser Leu Tyr Val Trp Lys Gly Glu
                245                 250                 255
Ile Pro Ala Asp Gly Gln Trp Leu Tyr Ser Val Ile Leu Asp Tyr Gly
            260                 265                 270
Glu Asn Asp Thr Ser Ala Asp Val Pro Pro Leu Tyr Thr Pro Gln Gly
        275                 280                 285
Glu Trp Leu Val Arg Pro Asp Arg Phe Ser Arg Tyr Asp Tyr Gly Phe
    290                 295                 300
Glu Val Arg Thr Cys Arg Leu Cys Arg Gln Val Leu Met Phe His Val
305                 310                 315                 320
Phe Lys Glu Leu Gly Gly Glu Pro Ala Leu Val Trp Arg Met Gln Leu
                325                 330                 335
Glu Tyr Asp Glu Asn Pro Ala Ala Ser Met Leu Ser Ala Val Arg Gln
            340                 345                 350
Leu Ala Tyr Glu Ala Asp Gly Ala Ile Arg Ser Leu Pro Pro Leu Glu
        355                 360                 365
Phe Asp Tyr Thr Pro Phe Gly Ile Glu Thr Thr Ala Asp Trp Gln Pro
    370                 375                 380
Phe Leu Pro Val Pro Glu Trp Ala Asp Glu Glu His Tyr Gln Leu Val
385                 390                 395                 400
Asp Leu Tyr Gly Glu Gly Ile Pro Gly Leu Leu Tyr Gln Asn Asn Asp
                405                 410                 415
His Trp His Tyr Arg Ser Pro Ala Arg Gly Asp Thr Pro Asp Gly Ile
            420                 425                 430
Ala Tyr Asn Ser Trp Arg Pro Leu Pro His Ile Pro Val Asn Ser Arg
        435                 440                 445
Asn Gly Met Leu Met Asp Leu Asn Gly Asp Gly Tyr Leu Glu Trp Leu
    450                 455                 460
Leu Ala Glu Pro Gly Val Ala Gly Arg Tyr Ser Met Asn Pro Asp Lys
465                 470                 475                 480
Ser Trp Ser Gly Phe Val Pro Leu Gln Ala Leu Pro Thr Glu Phe Phe
                485                 490                 495
His Pro Gln Ala Gln Leu Ala Asn Val Thr Gly Ser Gly Leu Thr Asp
            500                 505                 510
Leu Val Met Ile Gly Pro Lys Ser Val Arg Phe Tyr Ala Gly Glu Glu
        515                 520                 525
Ala Gly Phe Lys Arg Ala Cys Glu Val Trp Gln Gln Val Gly Ile Thr
    530                 535                 540
Leu Pro Val Glu Arg Val Asp Lys Lys Glu Leu Val Ala Phe Ser Asp
545                 550                 555                 560
Met Leu Gly Ser Gly Gln Ser His Leu Val Arg Ile Arg His Asp Gly
                565                 570                 575
Val Thr Cys Trp Pro Asn Leu Gly Asn Gly Val Phe Gly Ala Pro Leu
            580                 585                 590
Ala Leu His Gly Phe Thr Ala Ser Glu Arg Glu Phe Asn Pro Glu Arg
        595                 600                 605
Val Tyr Leu Val Asp Leu Asp Gly Ser Gly Ala Ser Asp Ile Ile Tyr
    610                 615                 620
Ala Ser Arg Asp Ala Leu Leu Ile Tyr Arg Asn Leu Ser Gly Asn Gly
625                 630                 635                 640
Phe Ala Asp Pro Val Arg Val Pro Leu Pro Asp Gly Val Arg Phe Asp
                645                 650                 655
Asn Leu Cys Arg Leu Leu Pro Ala Asp Ile Arg Gly Leu Gly Val Ala
            660                 665                 670
Ser Leu Val Leu His Val Pro Tyr Met Ala Pro Arg Ser Trp Lys Leu
        675                 680                 685
Asp Phe Phe Ala Ala Lys Pro Tyr Leu Leu Gln Thr Val Ser Asn Asn
    690                 695                 700
Leu Gly Ala Ser Ser Ser Phe Trp Tyr Arg Ser Ser Thr Gln Tyr Trp
705                 710                 715                 720
Leu Asp Glu Lys Gln Ala Ala Ser Ser Ala Val Ser Ala Leu Pro Phe
                725                 730                 735
Pro Ile Asn Val Val Ser Asp Met His Thr Val Asp Glu Ile Ser Gly
            740                 745                 750
Arg Thr Arg Thr Gln Lys Tyr Thr Tyr Arg His Gly Val Tyr Asp Arg
        755                 760                 765
Thr Glu Lys Glu Phe Ala Gly Phe Gly Arg Ile Asp Thr Trp Glu Glu
    770                 775                 780
Glu Arg Asp Ser Glu Gly Thr Leu Ser Val Ser Thr Pro Pro Val Leu
785                 790                 795                 800
Thr Arg Thr Trp Tyr His Thr Gly Gln Lys Gln Asp Glu Glu Arg Ala
                805                 810                 815
Val Gln Gln Tyr Trp Gln Gly Asp Pro Ala Ala Phe Gln Val Lys Pro
            820                 825                 830
Val Arg Leu Thr Arg Phe Asp Ala Ala Ala Ala Gln Asp Leu Pro Leu
        835                 840                 845
Asp Ser Asn Asn Gly Gln Gln Glu Tyr Trp Leu Tyr Arg Ser Leu Gln
    850                 855                 860
Gly Met Pro Leu Arg Thr Glu Ile Phe Ala Gly Asp Val Gly Gly Ser
865                 870                 875                 880
Pro Pro Tyr Gln Val Glu Ser Phe Arg Tyr Gln Val Arg Leu Val Gln
                885                 890                 895
Ser Ile Asp Ser Glu Cys Val Ala Leu Pro Met Gln Leu Glu Gln Leu
            900                 905                 910
Thr Tyr Asn Tyr Glu Gln Ile Ala Ser Asp Pro Gln Cys Ser Gln Gln
        915                 920                 925
Ile Gln Gln Trp Phe Asp Glu Tyr Gly Val Ala Ala Gln Ser Val Thr
    930                 935                 940
Ile Gln Tyr Pro Arg Arg Ala Gln Pro Glu Asp Asn Pro Tyr Pro Arg
945                 950                 955                 960
Thr Leu Pro Asp Thr Ser Trp Ser Ser Ser Tyr Asp Ser Gln Gln Met
                965                 970                 975
Leu Leu Arg Leu Thr Arg Gln Arg Gln Lys Ala Tyr His Leu Ala Asp
            980                 985                 990
Pro Glu Gly Trp Arg Leu Asn Ile Pro His Gln Thr Arg Leu Asp Ala
        995                 1000                1005
Phe Ile Tyr Ser Ala Asp Ser Val Pro Ala Glu Gly Ile Ser Ala
    1010                1015                1020
Glu Leu Leu Glu Val Asp Gly Thr Leu Arg Ser Ser Ala Leu Glu
    1025                1030                1035
Gln Ala Tyr Gly Gly Gln Ser Glu Ile Ile Tyr Ala Gly Gly Gly
    1040                1045                1050
Glu Pro Asp Leu Arg Ala Leu Val His Tyr Thr Arg Ser Ala Val
    1055                1060                1065
Leu Asp Glu Asp Cys Leu Gln Ala Tyr Glu Gly Val Leu Ser Asp
    1070                1075                1080
Ser Gln Leu Asn Ser Leu Leu Ala Ser Ser Gly Tyr Gln Arg Ser
    1085                1090                1095
Ala Arg Ile Leu Gly Ser Gly Asp Glu Val Asp Ile Phe Val Ala
    1100                1105                1110
Glu Gln Gly Phe Thr Arg Tyr Ala Asp Glu Pro Asn Phe Phe Arg
    1115                1120                1125
Ile Leu Gly Gln Gln Ser Ser Leu Leu Ser Gly Glu Gln Val Leu
    1130                1135                1140
Thr Trp Asp Asp Asn Phe Cys Ala Val Thr Ser Ile Glu Asp Ala
    1145                1150                1155
Leu Gly Asn Gln Ile Gln Ile Ala Tyr Asp Tyr Arg Phe Val Glu
    1160                1165                1170
Ala Ile Gln Ile Thr Asp Thr Asn Asn Asn Val Asn Gln Val Ala
    1175                1180                1185
Leu Asp Ala Leu Gly Arg Val Val Tyr Ser Arg Thr Trp Gly Thr
    1190                1195                1200
Glu Glu Gly Ile Lys Thr Gly Phe Arg Pro Glu Val Glu Phe Ala
    1205                1210                1215
Thr Pro Glu Thr Met Glu Gln Ala Leu Ala Leu Ala Ser Pro Leu
    1220                1225                1230
Pro Val Ala Ser Cys Cys Val Tyr Asp Ala His Ser Trp Met Gly
    1235                1240                1245
Thr Ile Thr Leu Ala Gln Leu Ser Glu Leu Val Pro Asp Ser Glu
    1250                1255                1260
Lys Gln Trp Ser Phe Leu Ile Asp Asn Arg Leu Ile Met Pro Asp
`   1265                1270                1275
Gly Arg Ile Arg Ser Arg Gly Arg Asp Pro Trp Ser Leu His Arg
    1280                1285                1290
Leu Leu Pro Pro Ala Val Gly Glu Leu Leu Ser Glu Ala Asp Arg
    1295                1300                1305
Lys Pro Pro His Thr Val Ile Leu Ala Ala Asp Arg Tyr Pro Asp
    1310                1315                1320
Asp Pro Ser Gln Gln Ile Gln Ala Ser Ile Val Phe Ser Asp Gly
    1325                1330                1335
Phe Gly Arg Thr Ile Gln Thr Ala Lys Arg Glu Asp Thr Arg Trp
    1340                1345                1350
Ala Ile Ala Glu Arg Val Asp Tyr Asp Gly Thr Gly Ala Val Ile
    1355                1360                1365
Arg Ser Phe Gln Pro Phe Tyr Leu Asp Asp Trp Asn Tyr Val Gly
    1370                1375                1380
Glu Glu Ala Val Ser Ser Ser Met Tyr Ala Thr Ile Tyr Tyr Tyr
    1385                1390                1395
Asp Ala Leu Ala Arg Gln Leu Arg Met Val Asn Ala Lys Gly Tyr
    1400                1405                1410
Glu Arg Arg Thr Ala Phe Tyr Pro Trp Phe Thr Val Asn Glu Asp
    1415                1420                1425
Glu Asn Asp Thr Met Asp Ser Ser Leu Phe Ala Ser Pro Pro Ala
    1430                1435                1440
Arg
<210>12
<211>2793
<212>DNA
<213>类芽孢杆菌IDAS 1529菌株
<400>12
atgaacacaa cgtccatata taggggcacg cctacgattt cagttgtgga taaccggaac     60
ttggagattc gcattcttca gtataaccgt atcgcggctg aagatccggc agatgagtgt    120
atcctgcgga acacgtatac gccgttaagc tatcttggca gcagcatgga tccccgtttg    180
ttctcgcaat atcaggatga tcgcggaaca ccgccgaata tacgaaccat ggcttccctg    240
agaggcgaag cgctgtgttc ggaaagtgtg gatgccggcc gcaaggcgga gctttttgat    300
atcgaggggc ggcccgtctg gcttatcgat gccaacggca cagagacgac tctcgaatat    360
gatgtcttag gcaggccaac agccgtattc gagcaacagg aaggtacgga ctccccccag    420
tgcagggagc ggtttattta tggtgagaag gaggcggatg cccaggccaa caatttgcgc    480
ggacaactgg ttcgccacta cgataccgcg ggccggatac agaccgacag catctccttg    540
gctggactgc cgttgcgcca aagccgtcaa ctgctgaaaa attgggatga acctggcgac     600
tggagtatgg atgaggaaag cgcctgggcc tcgttgctgg ctgccgaagc ttatgatacg     660
agctggcggt atgacgcgca ggacagggtg ctcgcccaaa ccgacgccaa agggaatctc     720
cagcaactga cttacaatga cgccggccag ccgcaggcgg tcagcctcaa gctgcaaggc     780
caagcggagc aacggatttg gaaccggatc gagtacaacg cggcgggtca agtggatctc     840
gccgaagccg ggaatggaat cgtaacggaa tatacttacg aggaaagcac gcagcggtta     900
atccgaaaaa aagattcccg cggactgtcc tccggggaaa gagaagtgct gcaggattat     960
cgttatgaat atgatccggt aggcaatatc ctttctattt acaatgaagc ggagccggtt    1020
cgttatttcc gcaatcaggc cgttgctccg aaaaggcaat atgcctacga tgccttgtat    1080
cagcttgtat ctagttcggg gcgggaatcc gacgcgcttc ggcagcagac gtcgcttcct    1140
cccttgatca cgcctatccc tctggacgat agccaatacg tcaattacgc tgaaaaatac    1200
agctatgatc aggcgggcaa tttaatcaag cttagccata acggggcaag tcaatataca    1260
acgaatgtgt atgtggacaa aagctcaaac cgggggattt ggcggcaagg ggaagacatc    1320
ccggatatcg cggcttcctt tgacagagca ggcaatcaac aagctttatt cccggggaga    1380
ccgttggaat gggatacacg caatcaatta agccgtgtcc atatggtcgt gcgcgaaggc    1440
ggagacaacg actgggaagg ctatctctat gacagctcgg gaatgcgtat cgtaaaacga    1500
tctacccgca aaacacagac aacgacgcaa acggatacga ccctctattt gccgggcctg    1560
gagctgcgaa tccgccagac cggggaccgg gtcacggaag cattgcaggt cattaccgtg    1620
gatgagggag cgggacaagt gagggtgctg cactgggagg atggaaccga gccgggcggc    1680
atcgccaatg atcagtaccg gtacagcctg aacgatcatc ttacctcctc tttattggaa    1740
gttgacgggc aaggtcagat cattagtaag gaagaatttt atccctatgg cggcacagcc    1800
ctgtggacag cccggtcaga ggtagaggca agctacaaga ccatccgcta ttcaggcaaa    1860
gagcgggatg ccacaggcct gtattattac ggacaccgct actatatgcc atggttgggt  1920
cgctggctga atccggaccc ggccggaatg gtagatggac taaacctgta ccgtatggtc  1980
aggaacaatc ctataggact gatggatccg aatgggaatg cgccaatcaa cgtggcggat  2040
tatagcttcg tgcatggtga tttagtttat ggtcttagta aggaaagagg aagatatcta  2100
aagctattta atccaaactt taatatggaa aaatcagact ctcctgctat ggttatagat  2160
caatataata ataatgttgc attgagtata actaaccaat ataaagtaga agaattgatg  2220
aaatttcaaa aagacccaca aaaagccgca cggaaaataa aggttccaga agggaatcgt  2280
ttatcgagga acgaaaatta tcctttgtgg cacgattata ttaacattgg agaagctaaa  2340
gctgcattta aggcctctca tattttccaa gaagtgaagg ggaattatgg gaaagattat  2400
tatcataaat tattattaga cagaatgata gaatcgccgt tgctgtggaa acgaggcagc  2460
aaactcgggc tagaaatcgc cgctaccaat cagagaacaa aaatacactt tgttcttgac  2520
aatttaaata tcgagcaggt ggttacgaaa gagggtagcg gcggtcagtc aatcacagct  2580
tcggagctcc gttatattta tcgaaatcgc gaaagattga acgggcgtgt cattttctat  2640
agaaataatg aaaggctaga tcaggctcca tggcaagaaa atccggactt atggagcaaa  2700
tatcaaccgg gtcttagaca aagcagcagt tcaagagtca aagaacgagg gattgggaac  2760
tttttccgcc ggttttcaat gaagagaaag tag                               2793
<210>13
<211>930
<212>PRT
<213>类芽孢杆菌IDAS 1529菌株
<400>13
Met Asn Thr Thr Ser Ile Tyr Arg Gly Thr Pro Thr Ile Ser Val Val
1               5                   10                  15
Asp Asn Arg Asn Leu Glu Ile Arg Ile Leu Gln Tyr Asn Arg Ile Ala
            20                  25                  30
Ala Glu Asp Pro Ala Asp Glu Cys Ile Leu Arg Asn Thr Tyr Thr Pro
        35                  40                  45
Leu Ser Tyr Leu Gly Ser Ser Met Asp Pro Arg Leu Phe Ser Gln Tyr
    50                  55                  60
Gln Asp Asp Arg Gly Thr Pro Pro Asn Ile Arg Thr Met Ala Ser Leu
65                  70                  75                  80
Arg Gly Glu Ala Leu Cys Ser Glu Ser Val Asp Ala Gly Arg Lys Ala
                85                  90                  95
Glu Leu Phe Asp lle Glu Gly Arg Pro Val Trp Leu Ile Asp Ala Asn
            100                 105                 110
Gly Thr Glu Thr Thr Leu Glu Tyr Asp Val Leu Gly Arg Pro Thr Ala
        115                 120                 125
Val Phe Glu Gln Gln Glu Gly Thr Asp Ser Pro Gln Cys Arg Glu Arg
    130                 135                 140
Phe Ile Tyr Gly Glu Lys Glu Ala Asp Ala Gln Ala Asn Asn Leu Arg
145                 150                 155                 160
Gly Gln Leu Val Arg His Tyr Asp Thr Ala Gly Arg Ile Gln Thr Asp
                165                 170                 175
Ser Ile Ser Leu Ala Gly Leu Pro Leu Arg Gln Ser Arg Gln Leu Leu
            180                 185                 190
Lys Asn Trp Asp Glu Pro Gly Asp Trp Ser Met Asp Glu Glu Ser Ala
        195                 200                 205
Trp Ala Ser Leu Leu Ala Ala Glu Ala Tyr Asp Thr Ser Trp Arg Tyr
    210                 215                 220
Asp Ala Gln Asp Arg Val Leu Ala Gln Thr Asp Ala Lys Gly Asn Leu
225                 230                 235                 240
Gln Gln Leu Thr Tyr Asn Asp Ala Gly Gln Pro Gln Ala Val Ser Leu
                245                 250                 255
Lys Leu Gln Gly Gln Ala Glu Gln Arg Ile Trp Asn Arg Ile Glu Tyr
            260                 265                 270
Asn Ala Ala Gly Gln Val Asp Leu Ala Glu Ala Gly Asn Gly Ile Val
        275                 280                 285
Thr Glu Tyr Thr Tyr Glu Glu Ser Thr Gln Arg Leu Ile Arg Lys Lys
    290                 295                 300
Asp Ser Arg Gly Leu Ser Ser Gly Glu Arg Glu Val Leu Gln Asp Tyr
305                 310                 315                 320
Arg Tyr Glu Tyr Asp Pro Val Gly Asn Ile Leu Ser Ile Tyr Asn Glu
                325                 330                 335
Ala Glu Pro Val Arg Tyr Phe Arg Asn Gln Ala Val Ala Pro Lys Arg
            340                 345                 350
Gln Tyr Ala Tyr Asp Ala Leu Tyr Gln Leu Val Ser Ser Ser Gly Arg
        355                 360             365
Glu Ser Asp Ala Leu Arg Gln Gln Thr Ser Leu Pro Pro Leu Ile Thr
    370                 375                 380
Pro Ile Pro Leu Asp Asp Ser Gln Tyr Val Asn Tyr Ala Glu Lys Tyr
385                 390                 395                 400
Ser Tyr Asp Gln Ala Gly Asn Leu Ile Lys Leu Ser His Asn Gly Ala
                405                 410                  415
Ser Gln Tyr Thr Thr Asn Val Tyr Val Asp Lys Ser Ser Asn Arg Gly
            420                 425                 430
Ile Trp Arg Gln Gly Glu Asp Ile Pro Asp Ile Ala Ala Ser Phe Asp
        435                 440                 445
Arg Ala Gly Asn Gln Gln Ala Leu Phe Pro Gly Arg Pro Leu Glu Trp
    450                 455                 460
Asp Thr Arg Asn Gln Leu Ser Arg Val His Met Val Val Arg Glu Gly
465                 470                 475                 480
Gly Asp Asn Asp Trp Glu Gly Tyr Leu Tyr Asp Ser Ser Gly Met Arg
                485                 490                 495
Ile Val Lys Arg Ser Thr Arg Lys Thr Gln Thr Thr Thr Gln Thr Asp
            500                 505                 510
Thr Thr Leu Tyr Leu Pro Gly Leu Glu Leu Arg Ile Arg Gln Thr Gly
        515                 520                 525
Asp Arg Val Thr Glu Ala Leu Gln Val Ile Thr Val Asp Glu Gly Ala
    530                 535                 540
Gly Gln Val Arg Val Leu His Trp Glu Asp Gly Thr Glu Pro Gly Gly
545                 550                 555                 560
Ile Ala Asn Asp Gln Tyr Arg Tyr Ser Leu Asn Asp His Leu Thr Ser
                565                 570                 575
Ser Leu Leu Glu Val Asp Gly Gln Gly Gln Ile Ile Ser Lys Glu Glu
            580                 585                 590
Phe Tyr Pro Tyr Gly Gly Thr Ala Leu Trp Thr Ala Arg Ser Glu Val
        595                 600                 605
Glu Ala Ser Tyr Lys Thr Ile Arg Tyr Ser Gly Lys Glu Arg Asp Ala
    610                 615                 620
Thr Gly Leu Tyr Tyr Tyr Gly His Arg Tyr Tyr Met Pro Trp Leu Gly
625                  630                 635                640
Arg Trp Leu Asn Pro Asp Pro Ala Gly Met Val Asp Gly Leu Asn Leu
                645                 650                 655
Tyr Arg Met Val Arg Asn Asn Pro Ile Gly Leu Met Asp Pro Asn Gly
            660                 665                 670
Asn Ala Pro Ile Asn Val Ala Asp Tyr Ser Phe Val His Gly Asp Leu
        675                 680                 685
Val Tyr Gly Leu Ser Lys Glu Arg Gly Arg Tyr Leu Lys Leu Phe Asn
    690                 695                 700
Pro Asn Phe Asn Met Glu Lys Ser Asp Ser Pro Ala Met Val Ile Asp
705                 710                 715                 720
Gln Tyr Asn Asn Asn Val Ala Leu Ser Ile Thr Asn Gln Tyr Lys Val
                725                 730                 735
Glu Glu Leu Met Lys Phe Gln Lys Asp Pro Gln Lys Ala Ala Arg Lys
            740                 745                  750
Ile Lys Val Pro Glu Gly Asn Arg Leu Ser Arg Asn Glu Asn Tyr Pro
        755                 760                  765
Leu Trp His Asp Tyr Ile Asn Ile Gly Glu Ala Lys Ala Ala Phe Lys
    770                 775                 780
Ala Ser His Ile Phe Gln Glu Val Lys Gly Asn Tyr Gly Lys Asp Tyr
 785                790                 795                 800
Tyr His Lys Leu Leu Leu Asp Arg Met Ile Glu Ser Pro Leu Leu Trp
                805                 810                 815
Lys Arg Gly Ser Lys Leu Gly Leu Glu Ile Ala Ala Thr Asn Gln Arg
            820                 825                  830
Thr Lys Ile His Phe Val Leu Asp Asn Leu Asn Ile Glu Gln Val Val
        835                 840                 845
Thr Lys Glu Gly Ser Gly Gly Gln Ser Ile Thr Ala Ser Glu Leu Arg
    850                 855                 860
Tyr Ile Tyr Arg Asn Arg Glu Arg Leu Asn Gly Arg Val Ile Phe Tyr
865                 870                 875                 880
Arg Asn Asn Glu Arg Leu Asp Gln Ala Pro Trp Gln Glu Asn Pro Asp
                885                 890                 895
Leu Trp Ser Lys Tyr Gln Pro Gly Leu Arg Gln Ser Ser Ser Ser Arg
            900                 905                 910
Val Lys Glu Arg Gly Ile Gly Asn Phe Phe Arg Arg Phe Ser Met Lys
        915                 920                 925
Arg Lys
    930
<210>14
<211>1791
<212>DNA
<213>人工序列
<220>
<223>ORF7的核酸序列,其编码cry-样蛋白
<400>14
atgaactcaa atgaaccaaa tttatctgat gttgttaatt gtttaagtga ccccaatagt     60
gacttggaga agtctggcgg tggagtagcg ctagatgttg gaatgtcatt gatatccgaa    120
cttcttggta cggttccagt tgctggatca attcttcaat ttgtattcga taaattgtgg    180
tttatttttg gcccttctga gtgggactca cttatggaac atgttgaagc attaattgat    240
agtaaaatac aagagcaggt aaaaagaagt gcacaagatg aactaaatgc aattacaaat    300
aacttatcta cgtatttgaa atttctagat gcatgggaaa atgattctaa taatttaaga    360
gcgagagctg tagtgaaaga ccaatttgta ggccttgaac agactcttga aagaaaaatg    420
gttagtgttt ttggaagtac gggtcatgaa gtgcatcttt tgccaatttt cgctcaagca    480
gccaacctcc acctaattct attaagagat gctgagaaat atggaaagag atggggttgg    540
gcagatagag aaattcaagt atattatgat aaccagattc gttatatcca tgaatatacg    600
gaccattgta ttaaatatta taatcaagga ttaagtaaac tgaaaggttc tacctatcaa    660
gattgggata agtataatcg ttttagaaga gaaatgaccc taactgttct tgatttgatt   720
tcaattttcc catcgtatga tactagaact tacccaattg atacaatagg tcaattgaca   780
agggaagttt attcggattt acttattgct aacccgtctg ggatgcagac tttcactaat   840
gtagatttcg acaatattct tattagaaaa cctcatttaa tggatttctt aagaactctt   900
gagattttta ccgatcgaca taacgcaagc agacacaacg tatattgggg cggacatcga   960
gtgcattctt cttacacagg aggtaatttt gaaaattttg aatctccctt atatggcagt  1020
gaagcaaatg tagaaccccg aacatggttg agttttggag aatctcaagt ctataatata  1080
cgttcgaagc ctgagtggga tagaggaagt actgcaatta gtggctccta tgaatttcga  1140
ggagtgacag gatgttcttt ttatcgaatg ggaaattttg ctggcaccgt agccctaact  1200
taccgacagt ttggtaacga aggttctcaa atcccattgc acaggctatg tcatgttact  1260
tattttagaa gatctcaagc tgtgggggcg acttcgagac agacgttaac aagtggtccg  1320
ctattttcct ggacacatag tagtgctacg gaaacgaata tcattcaccc gacaaaaatt  1380
acacaaatac caatggtgaa ggctagttcc cttggatcag gtacttctgt tgtccaagga  1440
ccaggcttta caggagggga tgtacttcga agaaatagcc ccggtagcac aggaacttta  1500
agagttaacg tcaattcacc attatcacag agatatcgta taagaattcg ttacgcttct  l560
actacggatt tagatttttt tgtcattcgc ggaaatacga cagttaataa ttttagattt  1620
gggaacacta tgcgtaaagg agaccctata acctctcgat catttagatt tgcggctttt  1680
agtacaccat ttacttttgc tagctcacag gatgaactta gaataaatgt acaaaatttc  1740
aataatggtg aagaagttta tatagataga atcgaagtta ttccagtttg a           1791
<210>15
<211>596
<212>PRT
<213>人工序列
<220>
<223>ORF7编码的氨基酸序列
<400>15
Met Asn Ser Asn Glu Pro Asn Leu Ser Asp Val Val Asn Cys Leu Ser
1               5                   10                  15
Asp Pro Asn Ser Asp Leu Glu Lys Ser Gly Gly Gly Val Ala Leu Asp
            20                  25                  30
Val Gly Met Ser Leu Ile Ser Glu Leu Leu Gly Thr Val Pro Val Ala
        35                  40                  45
Gly Ser Ile Leu Gln Phe Val Phe Asp Lys Leu Trp Phe Ile Phe Gly
    50                  55                  60
Pro Ser Glu Trp Asp Ser Leu Met Glu His Val Glu Ala Leu Ile Asp
65                  70                  75                  80
Ser Lys Ile Gln Glu Gln Val Lys Arg Ser Ala Gln Asp Glu Leu Asn
                85                  90                  95
Ala Ile Thr Asn Asn Leu Ser Thr Tyr Leu Lys Phe Leu Asp Ala Trp
            100                 105                 110
Glu Asn Asp Ser Asn Asn Leu Arg Ala Arg Ala Val Val Lys Asp Gln
        115                 120                 125
Phe Val Gly Leu Glu Gln Thr Leu Glu Arg Lys Met Val Ser Val Phe
    130                 135                 140
Gly Ser Thr Gly His Glu Val His Leu Leu Pro Ile Phe Ala Gln Ala
145                 150                 155                 160
Ala Asn Leu His Leu Ile Leu Leu Arg Asp Ala Glu Lys Tyr Gly Lys
                165                 170                 175
Arg Trp Gly Trp Ala Asp Arg Glu Ile Gln Val Tyr Tyr Asp Asn Gln
            180                 185                 190
Ile Arg Tyr Ile His Glu Tyr Thr Asp His Cys Ile Lys Tyr Tyr Asn
        195                 200                 205
Gln Gly Leu Ser Lys Leu Lys Gly Ser Thr Tyr Gln Asp Trp Asp Lys
    210                 210                 220
Tyr Asn Arg Phe Arg Arg Glu Met Thr Leu Thr Val Leu Asp Leu Ile
225                 230                 235                 240
Ser Ile Phe Pro Ser Tyr Asp Thr Arg Thr Tyr Pro Ile Asp Thr Ile
                245                 250                 255
Gly Gln Leu Thr Arg Glu Val Tyr Ser Asp Leu Leu Ile Ala Asn Pro
            260                 265                 270
Ser Gly Met Gln Thr Phe Thr Asn Val Asp Phe Asp Asn Ile Leu Ile
        275                 280                 285
Arg Lys Pro His Leu Met Asp Phe Leu Arg Thr Leu Glu Ile Phe Thr
    290                 295                 300
Asp Arg His Asn Ala Ser Arg His Asn Val Tyr Trp Gly Gly His Arg
305                 310                 315                 320
Val His Ser Ser Tyr Thr Gly Gly Asn Phe Glu Asn Phe Glu Ser Pro
                325                 330                 335
Leu Tyr Gly Ser Glu Ala Asn Val Glu Pro Arg Thr Trp Leu Ser Phe
            340                 345                 350
Gly Glu Ser Gln Val Tyr Asn Ile Arg Ser Lys Pro Glu Trp Asp Arg
        355                 360                 365
Gly Ser Thr Ala Ile Ser Gly Ser Tyr Glu Phe Arg Gly Val Thr Gly
    370                 375                 380
Cys Ser Phe Tyr Arg Met Gly Asn Phe Ala Gly Thr Val Ala Leu Thr
385                 390                 395                 400
Tyr Arg Gln Phe Gly Asn Glu Gly Ser Gln Ile Pro Leu His Arg Leu
                405                 410                 415
Cys His Val Thr Tyr Phe Arg Arg Ser Gln Ala Va1 Gly Ala Thr Ser
            420                 425                 430
Arg Gln Thr Leu Thr Ser Gly Pro Leu Phe Ser Trp Thr His Ser Ser
        435                 440                 445
Ala Thr Glu Thr Asn Ile Ile His Pro Thr Lys Ile Thr Gln Ile Pro
    450                 455                 460
Met Val Lys Ala Ser Ser Leu Gly Ser Gly Thr Ser Val Val Gln Gly
465                 470                 475                 480
Pro Gly Phe Thr Gly Gly Asp Val Leu Arg Arg Asn Ser Pro Gly Ser
                485                 490                 495
Thr Gly Thr Leu Arg Val Asn Val Asn Ser Pro Leu Ser Gln Arg Tyr
            500                 505                 510
Arg Ile Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Asp Phe Phe Val
        515                 520                 525
Ile Arg Gly Ash Thr Thr Val Asn Asn Phe Arg Phe Gly Asn Thr Met
    530                 535                 540
Arg Lys Gly Asp Pro Ile Thr Ser Arg Ser Phe Arg Phe Ala Ala Phe
545                 550                 555                 560
Ser Thr Pro Phe Thr Phe Ala Ser Ser Gln Asp Glu Leu Arg Ile Asn
                565                 570                 575
Val Gln Asn Phe Asn Asn Gly Glu Glh Val Tyr Ile Asp Arg Ile Glu
            580                 585                 590
Val Ile Pro Val
        595
<210>16
<211>1547
<212>DNA
<213>人工序列
<220>
<223>IDAS1529 16S rDNA的核酸序列
<400>16
tggagagttt gatcctggct caggacgaac gctggcggcg tgcctaatac atgcaagtcg    60
agcggakcaa cggtttcctt cgggaaaccr ttagcttagc ggcggacggg tgagtaatac   120
gtaggtaacc tgcccttaag accgggataa ctcacggaaa cgtgggctaa taccggatag   180
gcgatttcct cgcatgaggg aatcgggaaa ggcggagcaa tctgccactt atggatggac   240
ctacggcgca ttagctagtt ggtggggtaa cggctcacca aggcgacgat gcgtagccga   300
cctgagaggg tgatcggcca cactgggact gagacacggc ccagactcct acgggaggca    360
gcagtaggga atcttccgca atggacgcaa gtctgacgga gcaacgccgc gtgagtgatg    420
aaggttttcg gatcgtaaag ctctgttgcc agggaagaac gctatggaga gtaactgttc    480
cataggtgac ggtacctgag aagaaagccc cggctaacta cgtgccagca gccgcggtaa    540
tacgtagggg gcaagcgttg tccggaatta ttgggcgtaa agcgcgcgca ggcggtcatg    600
taagtctggt gtttaaaccc ggggctcaac tccgggtcgc atcggaaact gtgtgacttg    660
agtgcagaag aggaaagtgg aattccacgt gtagcggtga aatgcgtaga gatgtggagg    720
aacaccagtg gcgaaggcga ctttctgggc tgtaactgac gctgaggcgc gaaagcgtgg    780
ggagcaaaca ggattagata ccctggtagt ccacgccgta aacgatgaat gctaggtgtt    840
aggggtttcg atacccttgg tgccgaagtt aacacattaa gcattccgcc tggggagtac    900
ggtcgcaaga ctgaaactca aaggaattga cggggacccg cacaagcagt ggagtatgtg    960
gtttaattcg aagcaacgcg aagaacctta ccaggtcttg acatccctct gaccgtccta   1020
gagatagggc ttcccttcgg ggcagaggag acaggtggtg catggttgtc gtcagctcgt   1080
gtcgtgagat gttgggttaa gtcccgcaac gagcgcaacc cttaacttta gttgccagca   1140
ttaagttggg cactctagag tgactgccgg tgacaaaccg gaggaaggtg gggatgacgt   1200
caaatcatca tgccccttat gacctgggct acacacgtac tacaatggct ggtacaacgg   1260
gaagcgaagc cgcgaggtgg agcgaatcct aaaaagccag tctcagttcg gattgcaggc   1320
tgcaactcgc ctgcatgaag tcggaattgc tagtaatcgc ggatcagcat gccgcggtga   1380
atacgttccc gggtcttgta cacaccgccc gtcacaccac gagagtttac aacacccgaa   1440
gtcggtgggg taaccgcaag gagccagccg ccgaaggtgg ggtagatgat tggggtgaag   1500
tcgtaacaag gtagccgtat cggaaggtgc ggytggatca cctcctt                 1547
<210>17
<211>20
<212>PRT
<213>人工序列
<220>
<223>来自IDAS1529培养液级分的经纯化毒素的N-末端氨基酸序列
<400>17
Asp Ile Thr Leu Lys Val Ala Ile Tyr Pro Tyr Val Pro Asp Pro Ser
1               5                   10                  15
Arg Phe Gln Ala
            20
<210>18
<211>379
<212>PRT
<213>人工序列
<220>
<223>来自解硫胺素芽孢杆菌(Bacillus thiaminolyticus)的硫胺素酶I的氨基酸序列
<400>18
Ala His Ser Asp Ala Ser Ser Asp Ile Thr Leu Lys Val Ala Ile Tyr
1               5                   10                  15
Pro Tyr Val Pro Asp Pro Ala Arg Phe Gln Ala Ala Val Leu Asp Gln
            20                  25                  30
Trp Gln Arg Gln Glu Pro Gly Val Lys Leu Glu Phe Thr Asp Trp Asp
        35                  40                  45
Ser Tyr Ser Ala Asp Pro Pro Asp Asp Leu Asp Val Phe Val Leu Asp
    50              55                      60
Ser Ile Phe Leu Ser His Phe Val Asp Ala Gly Tyr Leu Leu Pro Phe
65                  70                  75                  80
Gly Ser Gln Asp Ile Asp Gln Ala Glu Asp Val Leu Pro Phe Ala Leu
                85                  90                  95
Gln Gly Ala Lys Arg Asn Gly Glu Val Tyr Gly Leu Pro Gln Ile Leu
            100                 105                 110
Cys Thr Asn Leu Leu Phe Tyr Arg Lys Gly Asp Leu Lys Ile Gly Gln
        115                 120                 125
Val Asp Asn Ile Tyr Glu Leu Tyr Lys Lys Ile Gly Thr Ser His Ser
    130                 135                 140
Glu Gln Ile Pro Pro Pro Gln Asn Lys Gly Leu Leu Ile Asn Met Ala
145                 150                 155                 160
Gly Gly Thr Thr Lys Ala Ser Me tTyr Leu Glu Ala Leu Ile Asp Val
                l65                 170                 175
Thr Gly Gln Tyr Thr Glu Tyr Asp Leu Leu Pro Pro Leu Asp Pro Leu
            180                 185                 190
Asn Asp Lys Val Ile Arg Gly Leu Arg Leu Leu Ile Asn Met Ala Gly
        195                 200                 205
Glu Lys Pro Ser Gln Tyr Val Pro Glu Asp Gly Asp Ala Tyr Val Arg
    210                 215                 220
Ala Ser Trp Phe Ala Gln Gly Ser Gly Arg Ala Phe Ile Gly Tyr Ser
225                 230                 235                 240
Glu Ser Met Met Arg Met Gly Asp Tyr Ala Glu Gln Val Arg Phe Lys
                245                 250                 255
Pro Ile Ser Ser Ser Ala Gly Gln Asp Ile Pro Leu Phe Tyr Ser Asp
            260                 265                 270
Val Val Ser Val Asn Ser Lys Thr Ala His Pro Glu Leu Ala Lys Lys
        275                 280                 285
Leu Ala Asn Val Met Ala Ser Ala Asp Thr Val Glu Gln Ala Leu Arg
    290                 295                 300
Pro Gln Ala Asp Gly Gln Tyr Pro Gln Tyr Leu Leu Pro Ala Arg His
305                 310                 315                 320
Gln Val Tyr Glu Ala Leu Met Gln Asp Tyr Pro Ile Tyr Ser Glu Leu
                325                 330                 335
Ala Gln Ile Val Asn Lys Pro Ser Asn Arg Val Phe Arg Leu Gly Pro
            340                 345                 350
Glu Val Arg Thr Trp Leu Lys Asp Ala Lys Gln Val Leu Pro Glu Ala
        355                 360                 365
Leu Gly Leu Thr Asp Val Ser Ser Leu Ala Ser
    370                 375
<210>19
<211>953
<212>PRT
<213>类芽孢杆菌IDAS 1529菌株
<400>19
Met Lys Met Ile Pro Trp Thr His His Tyr Leu Leu His Arg Leu Arg
1               5                   10                  15
Gly Glu Met Glu Val Lys Pro Met Asn Thr Thr Ser Ile Tyr Arg Gly
            20                  25                  30
Thr Pro Thr Ile Ser Val Val Asp Asn Arg Asn Leu Glu Ile Arg Ile
        35                  40                  45
Leu Gln Tyr Asn Arg Ile Ala Ala Glu Asp Pro Ala Asp Glu Cys Ile
    50                  55                  60
Leu Arg Asn Thr Tyr Thr Pro Leu Ser Tyr Leu Gly Ser Ser Met Asp
65                  70                  75                  80
Pro Arg Leu Phe Ser Gln Tyr Gln Asp Asp Arg Gly Thr Pro Pro Asn
                85                  90                  95
Ile Arg Thr Met Ala Ser Leu Arg Gly Glu Ala Leu Cys Ser Glu Ser
            100                 105                 110
Val Asp Ala Gly Arg Lys Ala Glu Leu Phe Asp Ile Glu Gly Arg Pro
        115                 120                 125
Val Trp Leu Ile Asp Ala Asn Gly Thr Glu Thr Thr Leu Glu Tyr Asp
    130                 135                 140
Val Leu Gly Arg Pro Thr Ala Val Phe Glu Gln Gln Glu Gly Thr Asp
145                 150                 155                 160
Ser Pro Gln Cys Arg Glu Arg Phe Ile Tyr Gly Glu Lys Glu Ala Asp
                165                 170                 175
Ala Gln Ala Asn Asn Leu Arg Gly Gln Leu Val Arg His Tyr Asp Thr
            180                 185                 190
Ala Gly Arg Ile Gln Thr Asp Ser Ile Ser Leu Ala Gly Leu Pro Leu
        195                 200                 205
Arg Gln Ser Arg Gln Leu Leu Lys Asn Trp Asp Glu Pro Gly Asp Trp
    210                 215                 220
Ser Met Asp Glu Glu Ser Ala Trp Ala Ser Leu Leu Ala Ala Glu Ala
225                 230                 235                 240
Tyr Asp Thr Ser Trp Arg Tyr Asp Ala Gln Asp Arg Val Leu Ala Gln
                245                 250                 255
Thr Asp Ala Lys Gly Asn Leu Gln Gln Leu Thr Tyr Asn Asp Ala Gly
            260                 265                 270
Gln Pro Gln Ala Val Ser Leu Lys Leu Gln Gly Gln Ala Glu Gln Arg
        275                 280                 285
Ile Trp Asn Arg Ile Glu Tyr Asn Ala Ala Gly Gln Val Asp Leu Ala
    290                 295                 300
Glu Ala Gly Asn Gly Ile Val Thr Glu Tyr Thr Tyr Glu Glu Ser Thr
305                 310                 315                 320
Gln Arg Leu Ile Arg Lys Lys Asp Ser Arg Gly Leu Ser Ser Gly Glu
                325                 330                 335
Arg Glu Va1 Leu Gln Asp Tyr Arg Tyr Glu Tyr Asp Pro Val Gly Asn
            340                 345                 350
Ile Leu Ser Ile Tyr Asn Glu Ala Glu Pro Val Arg Tyr Phe Arg Asn
        355                 360                 365
Gln Ala Val Ala Pro Lys Arg Gln Tyr Ala Tyr Asp Ala Leu Tyr Gln
    370                 375                 380
Leu Val Ser Ser Ser Gly Arg Glu Ser Asp Ala Leu Arg Gln Gln Thr
385                 390                 395                 400
Ser Leu Pro Pro Leu Ile Thr Pro Ile Pro Leu Asp Asp Ser Gln Tyr
                405                 410                 415
Val Asn Tyr Ala Glu Lys Tyr Ser Tyr Asp Gln Ala Gly Asn Leu Ile
            420                 425                 430
Lys Leu Ser His Asn Gly Ala Ser Gln Tyr Thr Thr Asn Val Tyr Val
        435                 440                 445
Asp Lys Ser Ser Asn Arg Gly Ile Trp Arg Gln Gly Glu Asp Ile Pro
    450                 455                 460
Asp Ile Ala Ala Ser Phe Asp Arg Ala Gly Asn Gln Gln Ala Leu Phe
465                 470                 475                 480
Pro Gly Arg Pro Leu Glu Trp Asp Thr Arg Asn Gln Leu Ser Arg Val
                485                 490                 495
His Met Val Val Arg Glu Gly Gly Asp Asn Asp Trp Glu Gly Tyr Leu
            500                 505                 510
Tyr Asp Ser Ser Gly Met Arg Ile Val Lys Arg Ser Thr Arg Lys Thr
        515                 520                 525
Gln Thr Thr Thr Gln Thr Asp Thr Thr Leu Tyr Leu Pro Gly Leu Glu
    530                 535                 540
Leu Arg Ile Arg Gln Thr Gly Asp Arg Val Thr Glu Ala Leu Gln Val
545                 550                 555                 560
Ile Thr Val Asp Glu Gly Ala Gly Gln Val Arg Val Leu His Trp Glu
                565                 570                 575
Asp Gly Thr Glu Pro Gly Gly Ile Ala Asn Asp Gln Tyr Arg Tyr Ser
            580                 585                 590
Leu Asn Asp His Leu Thr Ser Ser Leu Leu Glu Val Asp Gly Gln Gly
        595                 600                 605
Gln Ile Ile Ser Lys Glu Glu Phe Tyr Pro Tyr Gly Gly Thr Ala Leu
    610                 615                 620
Trp Thr Ala Arg Ser Glu Val Glu Ala Ser Tyr Lys Thr Ile Arg Tyr
625                 630                 635                 640
Ser Gly Lys Glu Arg Asp Ala Thr Gly Leu Tyr Tyr Tyr Gly His Arg
                645                 650                 655
Tyr Tyr Met Pro Trp Leu Gly Arg Trp Leu Asn Pro Asp Pro Ala Gly
            660                 665                 670
Met Val Asp Gly Leu Asn Leu Tyr Arg Met Val Arg Asn Asn Pro Ile
        675                 680                 685
Gly Leu Met Asp Pro Asn Gly Asn Ala Pro Ile Asn Val Ala Asp Tyr
    690                 695                 700
Ser Phe Val His Gly Asp Leu Val Tyr Gly Leu Ser Lys Glu Arg Gly
705                 710                 715                 720
Arg Tyr Leu Lys Leu Phe Asn Pro Asn Phe Asn Met Glu Lys Ser Asp
                725                 730                 735
Ser Pro Ala Met Val Ile Asp Gln Tyr Asn Asn Asn Val Ala Leu Ser
            740                 745                 750
Ile Thr Asn Gln Tyr Lys Val Glu Glu Leu Met Lys Phe Gln Lys Asp
        755                 760                 765
Pro Gln Lys Ala Ala Arg Lys Ile Lys Val Pro Glu Gly Asn Arg Leu
    770                 775                 780
Ser Arg Asn Glu Asn Tyr Pro Leu Trp His Asp Tyr Ile Asn Ile Gly
785                 790                 795                 800
Glu Ala Lys Ala Ala Phe Lys Ala Ser His Ile Phe Gln Glu Val Lys
                805                 810                 815
Gly Asn Tyr Gly Lys Asp Tyr Tyr His Lys Leu Leu Leu Asp Arg Met
             820                825                 830
Ile Glu Ser Pro Leu Leu Trp Lys Arg Gly Ser Lys Leu Gly Leu Glu
        835                 840                 845
Ile Ala Ala Thr Asn Gln Arg Thr Lys Ile His Phe Val Leu Asp Asn
    850                 855                 860
Leu Asn Ile Glu Gln Val Val Thr Lys Glu Gly Ser Gly Gly Gln Ser
865                 870                 875                 880
Ile Thr Ala Ser Glu Leu Arg Tyr Ile Tyr Arg Asn Arg Glu Arg Leu
                885                 890                 895
Asn Gly Arg Val Ile Phe Tyr Arg Asn Asn Glh Arg Leu Asp Gln Ala
            900                 905                 910
Pro Trp Gln Glu Asn Pro Asp Leu Trp Ser Lys Tyr Gln Pro Gly Leu
        915                 920                 925
Arg Gln Ser Ser Ser Ser Arg Val Lys Glu Arg Gly Ile Gly Asn Phe
    930                 935                 940
Phe Arg Arg Phe Ser Met Lys Arg Lys
945                 950
<210>20
<211>4482
<212>DNA
<213>致病杆菌(Xenorhabdus)Xwi菌株
<400>20
atgcagggtt caacaccttt gaaacttgaa ataccgtcat tgccctctgg gggcggatca    60
ctaaaaggaa tgggagaagc actcaatgcc gtcggagcgg aagggggagc gtcattttca   120
ctgcccttgc cgatctctgt cgggcgtggt ctggtgccgg tgctatcact gaattacagc   180
agtactgccg gcaatgggtc attcgggatg gggtggcaat gtggggttgg ttttatcagc   240
ctgcgtaccg ccaagggcgt tccgcactat acgggacaag atgagtatct cgggccggat   300
ggggaagtgt tgagtattgt gccggacagc caagggcaac cagagcaacg caccgcaacc   360
tcactgttgg ggacggttct gacacagccg catactgtta cccgctatca gtcccgcgtg   420
gcagaaaaaa tcgttcgttt agaacactgg cagccacagc agagacgtga ggaagagacg   480
tctttttggg tactttttac tgcggatggt ttagtgcacc tattcggtaa gcatcaccat   540
gcacgtattg ctgacccgca ggatgaaacc agaattgccc gctggctgat ggaggaaacc   600
gtcacgcata ccggggaaca tatttactat cactatcggg cagaagacga tcttgactgt    660
gatgagcatg aacttgctca gcattcaggt gttacggccc agcgttatct ggcaaaagtc    720
agctatggca atactcagcc ggaaaccgct tttttcgcgg taaaatcagg tattcctgct    780
gataatgact ggctgtttca tctggtattt gattacggtg agcgctcatc ttcgctgaac    840
tctgtacccg aattcaatgt gtcagaaaac aatgtgtctg aaaacaatgt gcctgaaaaa    900
tggcgttgtc gtccggacag tttctcccgc tatgaatatg ggtttgaaat tcgaacccgt    960
cgcttgtgtc gccaagttct gatgtttcat cagctgaaag cgctggcagg ggaaaaggtt   1020
gcagaagaaa caccggcgct ggtttcccgt cttattctgg attatgacct gaacaacaag   l080
gtttccttgc tgcaaacggc ccgcagactg gcccatgaaa cggacggtac gccagtgatg   1140
atgtccccgc tggaaatgga ttatcaacgt gttaatcatg gcgtgaatct gaactggcag   1200
tccatgccgc agttagaaaa aatgaacacg ttgcagccat accaattggt tgatttatat   1260
ggagaaggaa tttccggcgt actttatcag gatactcaga aagcctggtg gtaccgtgct   1320
ccggtacggg atatcactgc cgaaggaacg aatgcggtta cctatgagga ggccaaacca   1380
ctgccacata ttccggcaca acaggaaagc gcgatgttgt tggacatcaa tggtgacggg   1440
cgtctggatt gggtgattac ggcatcaggg ttacggggct accacaccat gtcaccggaa   1500
ggtgaatgga caccctttat tccattatcc gctgtgccaa tggaatattt ccatccgcag   1560
gcaaaactgg ctgatattga tggggctggg ctgcctgact tagcgcttat cgggccaaat   1620
agtgtacgtg tctggtcaaa taatcgggca ggatgggatc gcgctcagga tgtgattcat   1680
ttgtcagata tgccactgcc ggttcccggc agaaatgagc gtcatcttgt cgcattcagt   1740
gatatgacag gctccgggca atcacatctg gtggaagtaa cggcagatag cgtgcgctac   1800
tggccgaacc tggggcatgg aaaatttggt gagcctctga tgatgacagg cttccagatt   1860
agcggggaaa cgtttaaccc cgacagactg tatatggtag acatagatgg ctcaggcacc   1920
accgatttta tttatgcccg caatacttac cttgaactct atgccaatga aagcggcaat   1980
cattttgctg aacctcagcg tattgatctg ccggatgggg tacgttttga tgatacttgt   2040
cggttacaaa tagcggatac acaaggatta gggactgcca gcattatttt gacgatcccc   2100
catatgaagg tgcagcactg gcgattggat atgaccatat tcaagccttg gctgctgaat   2160
gccgtcaata acaatatggg aacagaaacc acgctgtatt atcgcagctc tgcccagttc   2220
tggctggatg agaaattaca ggcttctgaa tccgggatga cggtggtcag ctacttaccg   2280
ttcccggtgc atgtgttgtg gcgcacggaa gtgctggatg aaatttccgg taaccgattg   2340
accagccatt atcattactc acatggtgcc tgggatggtc tggaacggga gtttcgtggt   2400
tttgggcggg tgacacaaac tgatattgat tcacgggcga gtgcgacaca ggggacacat   2460
gctgaaccac cggcaccttc gcgcacggtt aattggtacg gcactggcgt acgggaagtc   2520
gatattcttc tgcccacgga atattggcag ggggatcaac aggcatttcc ccattttacc   2580
ccacgcttta cccgttatga cgaaaaatcc ggtggtgata tgacggtcac gccgagcgaa   2640
caggaagaat actggttaca tcgagcctta aaaggacaac gtttacgcag tgagctgtat   2700
ggggatgatg attctatact ggccggtacg ccttattcag tggatgaatc ccgcacccaa   2760
gtacgtttgt taccggtgat ggtatcggac gtgcctgcgg tactggtttc ggtggccgaa   2820
tcccgccaat accgatatga acgggttgct accgatccac agtgcagcca aaagatcgtc   2880
cttaaatctg atgcgttagg atttccgcag gacaatcttg agattgccta ttcgagacgt   2940
ccacagcctg agttctcgcc ttatccggat accctgcccg aaacactttt caccagcagt   3000
ttcgacgaac agcagatgtt ccttcgtctg acacgccagc gttcttctta tcatcatctg   3060
aatcatgatg ataatacgtg gatcacaggg cttatggata cctcacgcag tgacgcacgt   3120
atttatcaag ccgataaagt gccggacggt ggattttccc ttgaatggtt ttctgccaca   3180
ggtgcaggag cattgttgt tgcctgatgcc gcagccgatt atctgggaca tcagcgtgta   3240
gcatataccg gtccagaaga acaacccgct attcctccgc tggtggcata cattgaaacc    3300
gcagagtttg atgaacgatc gttggcggct tttgaggagg tgatggatga gcaggagctg    3360
acaaaacagc tgaatgatgc gggctggaat acggcaaaag tgccgttcag tgaaaagaca    3420
gatttccatg tctgggtggg acaaaaggaa tttacagaat atgccggtgc agacggattc    3480
tatcggccat tggtgcaacg ggaaaccaag cttacaggta aaacgacagt cacgtgggat    3540
agccattact gtgttatcac cgcaacagag gatgcggctg gcctgcgtat gcaagcgcat    3600
tacgattatc gatttatggt tgcggataac accacagatg tcaatgataa ctatcacacc    3660
gtgacgtttg atgcactggg gagggtaacc agcttccgtt tctgggggac tgaaaacggt    3720
gaaaaacaag gatatacccc tgcggaaaat gaaactgtcc cctttattgt ccccacaacg    3780
gtggatgatg ctctggcatt gaaacccggt atacctgttg cagggctgat ggtttatgcc    3840
cctctgagct ggatggttca ggccagcttt tctaatgatg gggagcttta tggagagctg    3900
aaaccggctg ggatcatcac tgaagatggt tatctcctgt cgcttgcttt tcgccgctgg    3960
caacaaaata accctgccgc tgccatgcca aagcaagtca attcacagaa cccaccccat    4020
gtactgagtg tgatcaccga ccgctatgat gccgatccgg aacaacaatt acgtcaaacg    4080
tttacgttta gtgatggttt tgggcgaacc ttacaaacag ccgtacgcca tgaaagtggt    4140
gaagcctggg tacgtgatga gtatggagcc attgtggctg aaaatcatgg cgcgcctgaa    4200
acggcgatga cagatttccg ttgggcagtt tccggacgta cagaatatga cggaaaaggc    4260
caagccctgc gtaagtatca accgtatttc ctgaatagtt ggcagtacgt cagtgatgac    4320
agtgcccggc aggatatata tgccgatacc cattactatg atccgttggg gcgtgaatat    4380
caggttatca cggccaaagg cgggtttcgt cgatccttat tcactccctg gtttgtggtg    4440
aatgaagatg aaaatgacac tgccggtgaa atgacagcat aa                       4482
<210>21
<211>3051
<212>DNA
<213>致病杆菌Xwi菌株
<400>21
atgaagaatt tcgttcacag caatacgcca tccgtcaccg tactggacaa ccgtggtcag     60
acagtacgcg aaatagcctg gtatcggcac cccgatacac ctcaggtaac cgatgaacgc    120
atcaccggtt atcaatatga tgctcaagga tctctgactc agagtattga tccgcgattt    180
tatgaacgcc agcagacagc gagtgacaag aacgccatta cacccaatct tattctcttg    240
tcatcactca gtaagaaggc attgcgtacg caaagtgtgg atgccggaac ccgtgtcgcc    300
ctgcatgatg ttgccgggcg tcccgtttta gctgtcagcg ccaatggcgt tagccgaacg    360
tttcagtatg aaagtgataa ccttccggga cgattgctaa cgattaccga gcaggtaaaa    420
ggagagaacg cctgtatcac ggagcgattg atctggtcag gaaatacgcc ggcagaaaaa    480
ggcaataatc tggccggcca gtgcgtggtc cattatgatc ccaccggaat gaatcaaacc    540
aacagcatat cgttaaccag catacccttg tccatcacac agcaattact gaaagatgac    600
agcgaagccg attggcacgg tatggatgaa tctggctgga aaaacgcgct ggcgccggaa    660
agcttcactt ctgtcagcac aacggatgct accggcacgg tattaacgag tacagatgct    720
gccggaaaca agcaacgtat cgcctatgat gtggccggtc tgcttcaagg cagttggttg    780
gcgctgaagg ggaaacaaga acaagttatc gtgaaatccc tgacctattc ggctgccagc    840
cagaagctac gggaggaaca tggtaacggg atagtgacta catataccta tgaacccgag    900
acgcaacgag ttattggcat aaaaacagaa cgtccttccg gtcatgccgc tggggagaaa    960
attttacaaa acctgcgtta tgaatatgat cctgtcggaa atgtgctgaa atcaactaat   1020
gatgctgaaa ttacccgctt ttggcgcaac cagaaaattg taccggaaaa tacttacacc   1080
tatgacagcc tgtaccagct ggtttccgtc actgggcgtg aaatggcgaa tattggccga   1140
caaaaaaacc agttacccat ccccgctctg attgataaca atacttatac gaattactct   1200
cgcacttacg actatgatcg tgggggaaat ctgaccagaa ttcgccataa ttcaccgatc   1260
accggtaata actatacaac gaacatgacc gtttcagatc acagcaaccg ggctgtactg   1320
gaagagctgg cgcaagatcc cactcaggtg gatatgttgt tcacccccgg cgggcatcag   1380
acccggcttg ttcccggtca ggatcttttc tggacacccc gtgacgaatt gcaacaagtg   1440
atattggtca atagggaaaa tacgacgcct gatcaggaat tctaccgtta tgatgcagac   1500
agtcagcgtg tcattaagac tcatattcag aagacaggta acagtgagca aatacagcga   1560
acattatatt tgccagagct ggaatggcgc acgacatata gcggcaatac attaaaagag   1620
tttttgcagg tcatcactgt cggtgaatcg ggtcaggcac aagtgcgggt gctgcattgg   1680
gaaacaggca aaccggcgga tatcagcaat gatcagctgc gctacagtta tggcaacctg   1740
attggcagta gcgggctgga attggacagt gacgggcaga tcattagtca ggaagaatat   1800
tacccctatg ggggaaccgc cgtgtgggca gcccgaagtc agtcagaagc tgattacaaa   1860
accgtgcgtt attctggcaa agagcgggat gcaacagggt tgtattacta cggttatcgt   1920
tattatcaat cgtggacagg gcgatggttg agtgtagatc ctgccggtga ggtcgatggt   1980
ctcaatttgt tccgaatgtg caggaataac cccatcgttt tttctgattc tgatggtcgt   2040
ttccccggtc agggtgtcct tgcctggata gggaaaaaag cgtatcgaaa ggcagtcaac   2100
atcacgacag aacacctgct tgaacaaggc gcttcctttg atacgttctt gaaattaaac   2160
cgaggattgc gaacgtttgt tttgggtgtg ggggtagcaa gtctgggggt gaaggcggcc   2220
acgattgcag gagcgtcgcc ttgggggatt gtcggggctg ccattggtgg ttttgtctcc   2280
ggggcggtga tggggttttt cgcgaacaac atctcagaaa aaattgggga agttttaagt   2340
tatctgacgc gtaaacgttc tgttcctgtt caggttggcg cttttgttgt cacatcgctt   2400
gtgacgtctg cactatttaa cagctcttcg acaggtaccg ccatttccgc agcaacagcg   2460
gtcaccgttg gaggattaat ggctttagcc ggagagcata acacgggcat ggctatcagt   2520
attgccacac ccgccggaca aggtacgctg gatacgctca ggcccggtaa tgtcagcgcg  2580
ccagagcggt taggggcact atcaggcgca attattggcg gcatattact tggccgccat  2640
cagggaagtt ctgagctggg tgaacgggca gcgattggtg ctatgtatgg tgctcgatgg  2700
ggaaggatca ttggtaatct atgggatggc ccttatcggt ttatcggcag gttactgctc  2760
agaagaggca ttagctctgc catttcccac gctgtcagtt ccaggagctg gtttggccga  2820
atgataggag aaagtgtcgg gagaaatatt tctgaagtat tattacctta tagccgtaca  2880
cccggtgaat gggttggtgc agccattggc gggacagccg cggccgctca tcatgccgtt  2940
ggaggggaag ttgccaatgc cgctagccgg gttacctgga gcggctttaa gcgggctttt  3000
aataacttct tctttaacgc ctctgcacgt cataatgaat ccgaagcata a           3051
<210>22
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物SB101
<400>22
gckatggcsg acccgatgca wtacaagctg gc                                  32
<210>23
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物SB102
<400>23
agcggytgac crtccagrct carattgtgg cg                                  32
<210>24
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物SB103
<400>24
tgtataactg gatggcyggw cgtctstc                                        28
<210>25
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物SB104
<400>25
tcraaaggca graamcggct gtcgtt                                          26
<210>26
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物SB105
<400>26
cttcyctkga tatcytkytg gatgtgct                                        28
<210>27
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物SB106
<400>27
acgrctggya ttggyaatca gccartccaa                                      30
<210>28
<211>27
<212>DNA
<213>人工序列
<220>
<223>引物SB212
<220>
<221>misc_feature
<222>(7)..(7)
<223>n=i(次黄苷)
<400>28
cgytatnaat atgaycckgt vggyaat                                         27
<210>29
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物SB213
<220>
<221>misc_feature
<222>(17)..(17)
<223>n=i(次黄苷)
<400>29
catcbcgytc tttrccngar tarcg                                           25
<210>30
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物SB215
<220>
<221>misc_feature
<222>(10)..(10)
<223>n=i(次黄苷)
<400>30
cghagctcyn cccagtwytg gctggatgar aaa                                  33
<210>31
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物SB217
<220>
<221>misc_feature
<222>(24)..(24)
<223>n=i(次黄苷)
<400>31
gtrtcatttt catcttcrtt bacnryaaac ca                                   32
<210>32
<211>1293
<212>DNA
<213>蜂类芽孢杆菌(蜂类芽孢杆菌)DB482菌株
<400>32
gcagcccgaa ggctccggca cgctggcatc cttgaaggat acctaccatc cgatgaccct     60
tccctatgat gacgaccttg cgcaaatcaa tgccgtggcg gaggcgcact catctaattt    120
gctggggatt tgggataccc tgctggacac gcagcggact tccatcctgc agaattccgc    l80
cgctgcctgc cggataagca aggcgcggca atcggcatcc ccggatcaga gagcctccga   240
tgatgagccg gtattgatta caggagaaga attctacctg gagacgggcg gcaaacggct   300
ttttctggcg cataaactcg agataggctc cacgataagc gccaaaatca acattggacc   360
gccgcaagcg gccgatatcg cgccagcaaa gttgcaactc gtttattacg gcagaggcgg   420
cagaggggac tacttccttc gtgtggcaga cgatgtgtcc ctcggtggaa aattgctgaa   480
caattgttat ctgaccagcg acgacggaca gagcaacaat attaacggac cattctgcct   540
aatgattaat cgaggcaccg gcagcatgcc cagcgggact cacctgccag ttcagattga   600
cagagtgaca gatacatccc tacgcatttt tgtgccgcaa cacggttact tgggactagg   660
agaaagcctt gccagcaact ggaatgaacc gttggcgctg aatctggact tggatcaagc   720
gttgaccttt accctaagaa agaatgagtc cggacaagat accatttcca taatcgatat   780
gatgccgcct gttgccgaca cgaccccgtc cccgccgacg agggaaacgc tttccttgac   840
gccaaacagc ttccgtctgc tggttaaccc cgagccgaca gaagaagaca tcgccaagca   900
ctacaacgtt aagactgcca taacccgagc tcctgccgat ctggccgccg ccttaaatgt   960
tgtcgatgat ttctgcatga agaccggctt gagctttgat gaattgctga acttaacgat  1020
gcagaaggat tatcagtcaa aaagcagtga gtacaaaagc cgatttgtaa aatttggcgg  1080
cggggagcat gttccggttt caacctatgg agctgtgttt ttgacaggta cggaagaaac  1140
tccgttgtgg gcaaaacagt ataacagcgc aggcgctgca acagacaccc ctgttttgaa  1200
ctttacggcg gataatgttg cagctttggc aggaagagcg gaaaagcttg tgcggctggc  1260
gcgaagcacg ggtctttcct ttgagcagtt gga                               1293
<210>33
<211>430
<212>PRT
<213>蜂类芽孢杆菌DB482菌株
<400>33
Gln Pro Glu Gly Ser Gly Thr Leu Ala Ser Leu Lys Asp Thr Tyr His
1               5                   10                  15
Pro Met Thr Leu Pro Tyr Asp Asp Asp Leu Ala Gln Ile Asn Ala Val
             20                 25                  30
Ala Glu Ala His Scr Ser Asn Leu Leu Gly Ile Trp Asp Thr Leu Leu
        35                  40                  45
Asp Thr Gln Arg Thr Ser Ile Leu Gln Asn Ser Ala Ala Ala Cys Arg
     50                 55                  60
Ile Ser Lys Ala Arg Gln Ser Ala Ser Pro Asp Gln Arg Ala Ser Asp
65                  70                  75                  80
Asp Glu Pro Val Leu Ile Thr Gly Glu Glu Phe Tyr Leu Glu Thr Gly
                85                  90                  95
Gly Lys Arg Leu Phe Leu Ala His Lys Leu Glu Ile Gly Ser Thr Ile
            100                 105                     110
Ser Ala Lys Ile Asn Ile Gly Pro Pro Gln Ala Ala Asp Ile Ala Pro
        115                 120                 125
Ala Lys Leu Gln Leu Val Tyr Tyr Gly Arg Gly Gly Arg Gly Asp Tyr
    130                 135                 140
Phe Leu Arg Val Ala Asp Asp Val Ser Leu Gly Gly Lys Leu Leu Asn
145                 150                 155                 160
Asn Cys Tyr Leu Thr SerA sp Asp Gly Gln Ser Asn Asn Ile Asn Gly
                165                 170                 175
Pro Phe Cys Leu Met Ile Asn Arg Gly Thr Gly Ser Met Pro Ser Gly
            180                 185                 190
Thr His Leu Pro Val Gln Ile Asp Arg Val Thr Asp Thr Ser Leu Arg
        195                 200                  205
Ile Phe Val Pro Gln His Gly Tyr Leu Gly Leu Gly Glu Ser Leu Ala
    210                 215                 220
Ser Asn Trp Asn Glu Pro Leu Ala Leu Asn Leu Asp Leu Asp Gln Ala
225                 230                 235                 240
Leu Thr Phe Thr Leu Arg Lys Asn Glu Ser Gly Gln Asp Thr Ile Ser
                245                 250                 255
Ile Ile Asp Met Met Pro Pro Val Ala Asp Thr Thr Pro Ser Pro Pro
            260                 265                 270
Thr Arg Glu Thr Leu Ser Leu Thr Pro Asn Ser Phe Arg Leu Leu Val
        275                 280                 285
Asn Pro Glu Pro Thr Glu Glu Asp Ile Ala Lys His Tyr Asn Val Lys
    290                 295                 300
Thr Ala Ile Thr Arg Ala Pro Ala Asp Leu Ala Ala Ala Leu Asn Val
305                 310                 315                 320
Val Asp Asp Phe Cys Met Lys Thr Gly Leu Ser Phe Asp Glu Leu Leu
                325                 330                 335
Asn Leu Thr Met Gln Lys Asp Tyr Gln Ser Lys Ser Ser Glu Tyr Lys
            340                 345                 350
Ser Arg Phe Val Lys Phe Gly Gly Gly Glu his Val Pro Val Ser Thr
        355                 360                 365
Tyr Gly Ala Val Phe Leu Thr Gly Thr Glu Glu Thr Pro Leu Trp Ala
    370                 375                 380
Lys Gln Tyr Asn Ser Ala Gly Ala Ala Thr Asp Thr Pro Val Leu Asn
385                 390                 395                 400
Phe Thr Ala Asp Asn Val Ala Ala Leu Ala Gly Arg Ala Glu Lys Leu
            405                     410                 415
Val Arg Leu Ala Arg Ser Thr Gly Leu Ser Phe Glu Gln Leu
            420                 425                 430
<210>34
<211>340
<212>DNA
<213>蜂类芽孢杆菌DB482菌株
<400>34
tatatttatt cacaccttgg acttcctgat caaccgcggc gacagcttgt accggctgct     60
ggagcgggat actctgaccg aagccaagat gtattacatc caggccagcc aactgcttgg    120
tccccgcccc gatatccgga tcaatcacag ttggcctaat ccgaccctgc aaagcgaagc    180
ggacgcggtg accgccgtac cgacgcgaag cgattcgcgg gcaacgccaa tcctcgcctt    240
gcgagcgctt ctgaaagcgg aaaacgggca tttcctgccg ccttataatg atgaactgtt    300
agctttctgg gataaaatcg atctgcgttt atacaattta                          340
<210>35
<211>565
<212>DNA
<213>蜂类芽孢杆菌DB482菌株
<400>35
gtctctatac tatcaaatgt atgacgccgc attgccgctc tgcttgatgg ccaaacaggc     60
tttagagaaa gaaatcggca ctgataaaac gggtggagtt ttcaccctcc cggcctggaa    120
tgatctgtat cagggattac tggcggggga ggcgctgctg ctcgagcttc agaagctgga    180
gaatctgtgg ctggaggaag acaagcgcgg aatggaagcc gtaaaaacgg tatctttaga    240
tacccttctc cgcaaagaaa cgccagagtc tagcttcgta gagctagtca aggaagttct    300
ggacggaaag acgcctgacc ctgtaggcgg agtcggcgta cagctgcaaa acaatatttt    360
cagcgcaacc cttgacctgt ccgttcttgg cttggatcgc tcttacaacc aagcggaaaa    420
gacccgcagg atcaaaaatc tgtcggttac cttacccgcg cttttgggac cttaccagga    480
tatagaagca accttatcgc taggcggcga gaccgttgcg ctttcccatg gcgtggatga    540
cagcggcttg ttcatcacgg atctt                                          565
<210>36
<211>113
<212>PRT
<213>蜂类芽孢杆菌DB482菌株
<400>36
Ile Phe Ile His Thr Leu Asp Phe Leu Ile Asn Arg Gly Asp Ser Leu
1               5                   10                  15
Tyr Arg Leu Leu Glu Arg Asp Thr Leu Thr Glu Ala Lys Met Tyr Tyr
            20                  25                  30
Tle Gln Ala Ser Gln Leu Leu Gly Pro Arg Pro Asp Ile Arg Ile Asn
        35                  40                  45
His Ser Trp Pro Asn Pro Thr Leu Gln Ser Glu Ala Asp Ala Val Thr
    50                  55                  60
Ala Val Pro Thr Arg Ser Asp Ser Arg Ala Thr Pro Ile Leu Ala Leu
65                  70                  75                  80
Arg Ala Leu Leu Lys Ala Glu Asn Gly His Phe Leu Pro Pro Tyr Asn
                85                  90                   95
Asp Glu Leu Leu Ala Phe Trp Asp Lys Ile Asp Leu Arg Leu Tyr Asn
            100                 105                 110
Leu
<210>37
<211>188
<212>PRT
<213>蜂类芽孢杆菌DB482菌株
<400>37
Ser Leu Tyr Tyr Gln Met Tyr Asp Ala Ala Leu Pro Leu Cys Leu Met
1               5                   10                  15
Ala Lys Gln Ala Leu Glu Lys Glu Ile Gly Thr Asp Lys Thr Gly Gly
            20                  25                  30
Val Phe Thr Leu Pro Ala Trp Asn Asp Leu Tyr Gln Gly Leu Leu Ala
        35                  40                  45
Gly Glu Ala Leu Leu Leu Glu Leu Gln Lys Leu Glu Asn Leu Trp Leu
    50                  55                  60
Glu Glu Asp Lys Arg Gly Met Glu Ala Val Lys Thr Val Ser Leu Asp
65                  70                  75                  80
Thr Leu Leu Arg Lys Glu Thr Pro Glu Ser Ser Phe Val Glu Leu Val
                85                  90                  95
Lys Glu Val Leu Asp Gly Lys Thr Pro Asp Pro Val Gly Gly Val Gly
            100                 105                 110
Val Gln Leu Gln Asn Asn Ile Phe Ser Ala Thr Leu Asp Leu Ser Val
        115                 120                 125
Leu Gly Leu Asp Arg Ser Tyr Asn Gln Ala Glu Lys Thr Arg Arg Ile
    130                 135                 140
Lys Asn Leu Ser Val Thr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp
145                 150                 155                 160
Ile Glu Ala Thr Leu Ser Leu Gly Gly Glu Thr Val Ala Leu Ser His
                165                 170                 175
Gly Val Asp Asp Ser Gly Leu Phe Ile Thr Asp Leu
            180                 185
<210>38
<211>2091
<212>DNA
<213>蜂类芽孢杆菌DB482菌株
<400>38
caggcaacct catcggctgt ctgtggtgtg ccattcccga tcaacgtggt atcggacata     60
cacacggtgg acgaaatcag cggcagcgcc aggattcaga agtatactta ccgcaatggc    120
gtgtatgacc ggaccgataa ggaatttgcc gggttcggcc acattgacac atgggaagag    180
gagcgggatt ccgagggaac ccttagcatc agcactcccc ccgtgctgac acggacctgg    240
tatcataccg ggcaaaagca ggatgaggag cgtgccgtgc agcaatattg gcaaggcgac    300
cctgccgctt ttcaggttaa acccgtccgg cttactcgat tcgatgcggc aacggcccag    360
gatgtcccgc tagactctcc caataggcgg gaagagtatt ggctgtatcg ctcgttgcga    420
gggatgccgc tgcgtaatga aatttttgct ggagatgttg tggggttgcc tccttatcag    480
gtggagagct tacgttatca agtgcgcttg atgcagagca ccgattcgga atgtgttaca    540
ttgcccatgc agttggagca gcttacgtac aactatgagc aaatcgcctc tgatccgcag    600
tgttcacagc agatacagca atggttcgac gaatacggcg tggcggcaca gagtataacg    660
atccaatatc cgcgccgggc acagccggag gacaatccgt accctcacac gctgccggat    720
accagctgga gcagcagtta tgattcgcag caaatgctgc tgcggttaac aaggcaaagg    780
caaaaagcgt accaccttgc agaccctgaa ggctggcgct tgaatatccc ccatcagaca    840
cgcctggatt ctttcatcta ttctgctgac agcgtgcctg ccgaaggaat aagcgcagag    900
ctgctggggg gtgacggcac gttacgatct ccggcgctgg aacaggctta tggcggccag    960
tcagagatca tctatgcggg cgggggggaa ccggattcgc gagctctggt ccattacacc   1020
agaagcgcga ttctcgatga agcctgtttg caagcctatg aaggcgtact gagcgatagc   1080
caattgaact cgcttcttgc atcttccggc tatcaacgaa gcgcaagaat attgggttcc   1140
ggcgatgaag cggatatttt tgttgcggaa caaggattta cccgttatgc ggatgaacag   1200
aattttttcc gtattctggg acaacaatcc tctctcttga ccggggaaca agtattaaca   1260
tgggatgata atttctgtgc ggtaacatcc atagaagacg cgcttggcaa tcaaattcag   1320
attgcatatg attaccgctt tgtggaggct atccagatta ccgatgcgaa taacaatgtg   1380
aatcaggtct ccctggatgc tctcggccgg gtcgtataca gccggacctg gggcacagag   1440
gaagggatag agacgggctt ccgcccggag gcggaattct cgccgcccga gacaatggag   1500
caggcgcttg ccctggcgtc tcccttgccg gttgcatcct gctgtgttta tgatgcgcat   1560
agctggatgg gaacgataac tcttgggcag ctgtcagcgc ttgttccaga tagtgaaaag  1620
caatggtcgt tcttgatagc caatcgcttg attatgccgg acggcaggat aagagcccgc  1680
ggccgggccc catggtggct tcaacggcta ttgccgcctg ccgtggccaa gctgctgagc  1740
gaggcggacc gtaagccgcc gcatacggta gttttggcag cagatcgcta cccggatgac  1800
ccatcccagc aaattcaggc cagcgtcgtg tttagcgatg gctttgggcg tacgatacaa  1860
accgctaaaa gagcagatac ccgatgggcg attacggaac ggattgacta tgacgaaacc  1920
ggagccgtaa tccgaagctt tcagcctttt tatattgatg actggaatta tgtgggcaaa  1980
gaggctgtca gcggctctat gtatgcaacg atctattact atgatgctct ggcacgccaa  2040
ctaaggatgg tcaacgccaa aggatatgag aggagaactg ctttttaccc a           2091
<210>39
<211>697
<212>PRT
<213>蜂类芽孢杆菌DB482菌株
<400>39
Gln Ala Thr Ser Ser Ala Val Cys Gly Val Pro Phe Pro Ile Asn Val
1               5                   10                  15
Val Ser Asp Ile His Thr Val Asp Glu Ile Ser Gly Ser Ala Arg Ile
            20                  25                  30
Gln Lys Tyr Thr Tyr Arg Asn Gly Val Tyr Asp Arg Thr Asp Lys Glu
        35                  40                  45
Phe Ala Gly Phe Gly his Ile Asp Thr Trp Glu Glu Glu Arg Asp Ser
    50                  55                  60
Glu Gly Thr Leu Ser Ile Ser Thr Pro Pro Val Leu Thr Arg Thr Trp
65                  70                  75                  80
Tyr His Thr Gly Gln Lys Gln Asp Glu Glu Arg Ala Val Gln Gln Tyr
                85                  90                  95
Trp Gln Gly Asp Pro Ala Ala Phe Gln Val Lys Pro Val Arg Leu Thr
            100                 105                 110
Arg Phe Asp Ala Ala Thr Ala Gln Asp Val Pro Leu Asp Ser Pro Asn
        115                 120                 125
Arg Arg Glu Glu Tyr Trp Leu Tyr Arg Ser Leu Arg Gly Met Pro Leu
    130                 135                 140
Arg Asn Glu Ile Phe Ala Gly Asp Val Val Gly Leu Pro Pro Tyr Gln
145                 150                 155                 160
Val Glu Ser Leu Arg Tyr Gln Va1 Arg Leu Met Gln Ser Thr Asp Ser
                165                 170                 175
Glu Cys Val Thr Leu Pro Met Gln Leu Glu Gln Leu Thr Tyr Asn Tyr
            180                 185                 190
Glu Gln Ile Ala Ser Asp Pro Gln Cys Ser Gln Gln Ile Gln Gln Trp
        195                 200                 205
Phe Asp Glu Tyr Gly Val Ala Ala Gln Ser Ile Thr Ile Gln Tyr Pro
    210                 215                 220
Arg Arg Ala Gln Pro Glu Asp Asn Pro Tyr Pro His Thr Leu Pro Asp
225                 230                 235                 240
Thr Ser Trp Ser Ser Ser Tyr Asp Ser Gln Gln Met Leu Leu Arg Leu
            245                     250                 255
Thr Arg Gln Arg Gln Lys Ala Tyr His Leu Ala Asp Pro Glu Gly Trp
            260                 265                 270
Arg Leu Asn Ile Pro His Gln Thr Arg Leu Asp Ser Phe Ile Tyr Ser
    275                     280                 285
Ala Asp Ser Val Pro Ala Glu Gly Ile Ser Ala Glu Leu Leu Gly Gly
    290                 295                 300
Asp Gly Thr Leu Arg Ser Pro Ala Leu Glu Gln Ala Tyr Gly Gly Gln
305                 310                 315                 320
Ser Glu Ile Ile Tyr Ala Gly Gly Gly Glu Pro Asp Ser Arg Ala Leu
                325                 330                 335
Val His Tyr Thr Arg Ser Ala Ile Leu Asp Glu Ala Cys Leu Gln Ala
            340                 345                 350
Tyr Glu Gly Val Leu Ser Asp Ser Gln Leu Asn Ser Leu Leu Ala Ser
        355                 360                 365
Ser Gly Tyr Gln Arg Ser Ala Arg Ile Leu Gly Ser Gly Asp Glu Ala
    370                 375                 380
Asp Ile Phe Val Ala Glu Gln Gly Phe Thr Arg Tyr Ala Asp Glu Gln
385                 390                 395                 400
Asn Phe Phe Arg Ile Leu Gl y Gln Gln Ser Ser Leu Leu Thr Gly Glu
                405                  410                 415
Gln Val Leu Thr Trp Asp Asp Asn Phe Cys Ala Val Thr Ser Ile Glu
            420                 425                 430
Asp Ala Leu Gly Asn Gln Ile Gln Ile Ala Tyr Asp Tyr Arg Phe Val
        435                 440                 445
Glu Ala Ile Gln Ile Thr Asp Ala Asn Asn Asn Val Asn Gln Val Ser
    450                 455                 460
Leu Asp Ala Leu Gly Arg Val Val Tyr Ser Arg Thr Trp Gly Thr Glu
465                 470                 475                 480
Glu Gly Ile Glu Thr Gly Phe Arg Pro Glu Ala Glu Phe Ser Pro Pro
                485                 490                 495
Glu Thr Met Glu Gln Ala Leu Ala Leu Ala Ser Pro Leu Pro Val Ala
            500                 505                 510
Ser Cys Cys Val Tyr Asp Ala His Ser Trp Met Gly Thr Ile Thr Leu
        515                 520                 525
Gly Gln Leu Ser Ala Leu Val Pro Asp Ser Glu Lys Gln Trp Ser Phe
    530                 535                 540
Leu Ile Ala Asn Arg Leu Ile Met Pro Asp Gly Arg Ile Arg Ala Arg
545                 550                 555                 560
Gly Arg Ala Pro Trp Trp Leu Gln Arg Leu Leu Pro Pro Ala Val Ala
                565                 570                 575
Lys Leu Leu Ser Glu Ala Asp Arg Lys Pro Pro His Thr Val Val Leu
            580                 585                 590
Ala Ala Asp Arg Tyr Pro Asp Asp Pro Ser Gln Gln Ile Gln Ala Ser
        595                 600                 605
Val Val Phe Ser Asp Gly Phe Gly Arg Thr Ile Gln Thr Ala Lys Arg
    610                 615                 620
Ala Asp Thr Arg Trp Ala Ile Thr Glu Arg Ile Asp Tyr Asp Glu Thr
625                 630                 635                 640
Gly Ala Val Ile Arg Ser Phe Gln Pro Phe Tyr Ile Asp Asp Trp Asn
                645                 650                 655
Tyr Val Gly Lys Glu Ala Val Ser Gly Ser Met Tyr Ala Thr Ile Tyr
            660                 665                 670
Tyr Tyr Asp Ala Leu Ala Arg Gln Leu Arg Met Val Asn Ala Lys Gly
        675                 680                 685
Tyr Glu Arg Arg Thr Ala Phe Tyr Pro
    690                 695
<210>40
<211>858
<212>DNA
<213>蜂类芽孢杆菌DB482菌株
<400>40
atcctgtcta tctgcaatga agcggagccg gtccgttatt tccgcaatca ggccgtcgct     60
ccgaaaaggc agtatgctta cgatgccctg tatcagcttg tatccagctc ggggcgggaa    120
tccgacgcgc ttcgtcagca gacgtcgctt cctcccttga tcacgcctat tcctctcgac    180
gatagccaat acgtcaatta tgctgagaga tacagctatg atcgggcggg caatctaatc    240
aagcttagcc atcatggggc aagtcaatat acaacgaatg tgcatgtgga caaaagttca    300
aaccggggga tttggcggca aggggaagac atcccggata tcgcggcttc ctttgacaga    360
gcaggcaatc aacaagattt attcccgggg agacggttgg aatgggatac acgcaatcag    420
ttatgccgtg tccatatggt cgtgcgcgaa ggcggcgata acgactggga gggctatctc    480
tatgacagct caggaatgcg catcgtaaaa cattctaccc gcaagacaca gacgacaacg    540
caaacggata cgacgatcta tttgccgggc ctggagcttc gcatccgcca aaccggggac    600
agggtcacgg aagcattgca ggtcattacc gtggatgagg gagcgggaca agtgagggtg    660
ctgcactggg aggatggaac cgagccgggc ggcatagcca atgatcagta tcggtacagc    720
ctaaacgatc atcttggctc ctctttattg gaagttgacg ggcaaagtca gatcattagc    780
aaggaagaat tttatcccta tggcggcaca gcattgtgga cagcccggtc agaggtggag    840
gcaagctaca agaccacg                                                  858
<210>41
<211>286
<212>PRT
<213>蜂类芽孢杆菌DB482菌株
<400>41
Ile Leu Ser Ile Cys Asn Glu Ala Glu Pro Val Arg Tyr Phe Arg Ash
1               5                   10                  15
Gln Ala Val Ala Pro Lys Arg Gln Tyr Ala Tyr Asp Ala Leu Tyr Gln
            20                  25                  30
Leu Val Ser Ser Ser Gly Arg Glu Ser Asp Ala Leu Arg Gln Gln Thr
        35                  40                  45
Ser Leu Pro Pro Leu Ile Thr Pro Ile Pro Leu Asp Asp Ser Gln Tyr
    50                  55                  60
Val Asn Tyr Ala Glu Arg Tyr Ser Tyr Asp Arg Ala Gly Asn Leu Ile
65                  70                  75                  80
Lys Leu Ser His His Gly Ala Ser Gln Tyr Thr Thr Asn Val His Val
                85                  90                  95
Asp Lys Ser Ser Asn Arg Gly Ile Trp Arg Gln Gly Glu Asp Ile Pro
            100                 105                 110
Asp Ile Ala Ala Ser Phe Asp Arg Ala Gly Asn Gln Gln Asp Leu Phe
        115                 120                 125
Pro Gly Arg Arg Leu Glu Trp Asp Thr Arg Asn Gln Leu Cys Arg Val
    130                 135                 140
His Met Val Val Arg Glu Gly Gly Asp Asn Asp Trp Glu Gly Tyr Leu
145                 L50                 155                 160
Tyr Asp Ser Ser Gly Met Arg Ile Val Lys His Ser Thr Arg Lys Thr
                165                 170                 175
Gln Thr Thr Thr Gln Thr Asp Thr Thr Ile Tyr Leu Pro Gly Leu Glu
            180                 185                 190
Leu Arg Ile Arg Gln Thr Gly Asp Arg Val Thr Glu Ala Leu Gln Val
        195                 200                 205
Ile Thr Val Asp Glu Gly Ala Gly Gln Val Arg Val Leu His Trp Glu
    210                 215                 220
Asp Gly Thr Glu Pro Gly Gly Ile Ala Asn Asp Gln Tyr Arg Tyr Ser
225                 230                 235                 240
Leu Asn Asp His Leu Gly Ser Ser Leu Leu Glu Val Asp Gly Gln Ser
                245                 250                 255
 Gln Ile Ile Ser Lys Glu Glu Phe Tyr Pro Tyr Gly Gly Thr Ala Leu
             260                 265                 270
 Trp Thr Ala Arg Ser Glu Val Glu Ala Ser Tyr Lys Thr Thr
         275                 280                 285
 <210>42
 <211>4434
 <212>DNA
 <213>光杆状菌(Photorhabdus)W14菌株
 <400>42
 atgatgcaga attcacaaac attcagtgtt accgagctgt cattacccaa aggcggcggc     60
 gctattaccg gtatgggtga agcattaaca ccagccgggc cggatggtat ggccgcctta    120
 tccctgccat tacccatttc cgccgggcgt ggttacgcac cctcgctcac tctgaattac    180
 aacagtggaa ccggtaacag cccatttggt ctcggttggg actgcggcgt catggcaatt    240
 cgtcgtcgca ccagtaccgg cgtaccgaat tacgatgaaa ccgatacttt tctggggccg    300
 gaaggtgaag tgttggtcgt agcattaaat gaggcaggtc aagctgatat ccgcagtgaa    360
 tcctcattgc agggcatcaa tttgggtgcg accttcaccg ttacctgtta tcgctcccgc    420
 ctagaaagcc actttaaccg gttggaatac tggcaacccc aaacaaccgg cgcaaccgat    480
 ttctggctga tatacagccc cgacggacag gtccatttac tgggcaaaaa tcctcaggca    540
 cgtatcagca atccactcaa tgttaaccaa acagcgcaat ggctgttgga agcctcgata    600
 tcatcccaca gcgaacagat ttattatcaa tatcgcgctg aagatgaagc aggttgtgaa    660
 accgacgagc tagcagccca ccccagcgca accgttcagc gctacctgca aacagtacat    720
 tacgggaacc tgaccgccag cgacgttttt cctacactaa acggagatga cccacttaaa    780
 tctggctgga tgttctgttt agtatttgac tacggtgagc gcaaaaacag cttatctgaa    840
atgccgctgt ttaaagccac aggcaattgg ctttgccgaa aagaccgttt ttcccgttat    900
gagtacggtt ttgaattgcg tactcgccgc ttatgccgcc aaatactgat gtttcaccgt    960
ctacaaaccc tatctggtca ggcaaagggg gatgatgaac ctgcgctagt gtcgcgtctg   1020
atactggatt atgacgaaaa cgcgatggtc agtacgctcg tttctgtccg ccgggtaggc   1080
catgaggaca acaacacggt taccgcgctg ccaccactgg aactggccta tcagcctttt   1140
gagccagaac aaaccgcact ctggcaatca atggatgtac tggcaaattt caacaccatt   1200
cagcgctggc aactgcttga cctgaaagga gaaggcgtgc ccggcattct ctatcaggat   1260
agaaatggct ggtggtatcg atctgcccaa cgtcaggccg gggaagagat gaatgcggtc   1320
acctggggga aaatgcaact ccttcccatc acaccagctg tgcaggataa cgcctcactg   1380
atggatatta acggtgacgg gcaactggac tgggtgatta ccgggccggg gctaaggggc   1440
tatcacagcc aacacccgga tggcagttgg acgcgtttta cgccattaca tgccctgccg   1500
atagaatatt ctcatcctcg cgctcaactt gccgatttaa tgggagccgg gctgtccgat   1560
ttagtgctaa ttggtcccaa aagtgtgcgc ttatatgtca ataaccgtga tggttttacc   1620
gaagggcggg atgtggtgca atccggtgat atcaccctgc cgctaccggg cgccgatgcc   1680
cgtaagttag tggcatttag tgacgtactg ggttcaggcc aagcacatct ggttgaagtt   1740
agtgcaactc aagtcacctg ctggccgaat ctggggcatg gccgttttgg tcagccaatc   1800
gtattgccgg gattcagcca atctgccgcc agttttaatc ctgatcgagt tcatctggcc   1860
gatttggatg ggagcggccc tgccgatttg atttatgttc atgctgaccg tctggatatt   1920
ttcagcaatg aaagtggcaa cggttttgca aaaccattca cactctcttt tcctgacggc   1980
ctgcgttttg atgatacctg ccagttgcaa gtagccgatg tacaagggtt aggcgttgtc   2040
agcctgatcc taagcgtacc gcatatggcg ccacatcatt ggcgctgcga tctgaccaac   2100
gcgaaaccgt ggttactcag tgaaacgaac aacaatatgg gggccaatca caccttgcat   2160
taccgtagct ctgtccagtt ctggctggat gaaaaagctg cggcattggc taccggacaa   2220
acaccggtct gttacctgcc cttcccggtc catacccttt ggcaaacaga aaccgaggat   2280
gaaatcagcg gcaataagtt agtgaccacg ttacgttatg ctcacggcgc ttgggatgga   2340
cgtgaacggg aatttcgtgg ctttggttat gttgagcaga cagacagcca tcaactcgct   2400
caaggcaatg cgccggaacg tacaccaccg gcactcacca aaagctggta tgccaccgga   2460
ttacctgcgg tagataatgc gttatccgcc gggtattggc gtggcgataa gcaagctttc   2520
gccggtttta cgccacgttt tactctctgg aaagagggca aagatgttcc actgacaccg   2580
gaagatgacc ataatctata ctggttaaac cgggcgctaa aaggtcagcc actgcgtagt   2640
gaactctacg ggctggatgg cagcgcacag caacagatcc cctatacagt gactgaatcc   2700
cgtccacagg tgcgccaatt acaagatggc gccaccgttt ccccggtgct ctgggcctca   2760
gtcgtggaaa gccgtagtta tcactacgaa cgtattatca gtgatcccca gtgcaatcag   2820
gatatcacgt tgtccagtga cctattcggg caaccactga aacaggtttc cgtacaatat   2880
ccccgccgca acaaaccaac aaccaatccg tatcccgata ccctaccgga tacgctgttt   2940
gccagcagtt atgacgatca acaacagcta ttgcgattaa cctgccgaca atccagttgg   3000
caccatctta ttggtaatga gctaagagtg ttgggattac cggatggcac acgcagtgat   3060
gcctttactt acgatgccaa acaggtacct gtcgatggct taaatctgga aaccctgtgt   3120
gctgaaaata gcctgattgc cgatgataaa cctcgcgaat acctcaatca gcaacgaacg   3180
ttctataccg acgggaaaaa ccaaacaccg ctgaaaacac cgacacgaca agcgttaatc   3240
gcctttaccg aaacggcggt attaacggaa tctctgttat ccgcgtttga tggcggtatt   3300
acgccagacg aattaccggg aatactgaca caggccggat accaacaaga gccttatctg   3360
tttccacgca ccggcgaaaa caaagtttgg gtagcgcgtc aaggctatac cgattacggg   3420
acggaagcac aattttggcg tcctgtcgca caacgtaaca gcctgttaac cgggaaaatg   3480
acgttaaaat gggatactca ctattgtgtc atcacccaaa cccaagatgc tgccggcctc  3540
accgtctcag ccaattatga ctggcgtttt ctcacaccaa cgcaactgac tgacatcaac  3600
gataatgtgc atctcatcac cttggatgct ctgggacgcc ctgtcacgca acgtttctgg  3660
gggatcgaaa gcggtgtggc aacaggttac tcttcatcag aagaaaaacc attctctcca  3720
ccaaacgata tcgataccgc tattaatcta accggaccac tccctgtcgc acagtgtctg  3780
gtctatgcac cggacagttg gatgccacta ttcagtcaag aaaccttcaa cacattaacg  3840
caggaagagc aggagacgct gcgtgattca cgtattatca cggaagattg gcgtatttgc  3900
gcactgactc gccgccgttg gctacaaagt caaaagatca gtacaccatt agttaaactg  3960
ttaaccaaca gcattggttt acctccccat aaccttacgc tgaccacaga ccgttatgac  4020
cgcgactctg agcagcaaat tcgccaacaa gtcgcattta gtgatggttt tggccgtctg  4080
ctacaagcgt ctgtacgaca tgaggcaggc gaagcctggc aacgtaacca agacggttct  4140
ctggtgacaa aagtggagaa taccaaaacg cgttgggcgg tcacgggacg caccgaatat  4200
gataataaag ggcaaacgat acgcacttat cagccctatt tcctcaacga ctggcgatat  4260
gtcagtgatg acagcgccag aaaagaagcc tatgcggata ctcatattta tgatccaatt  4320
gggcgagaaa tccgggttat tactgcaaaa ggctggctgc gccaaagcca atatttcccg  4380
tggtttaccg tgagtgagga tgagaatgat acggccgctg atgcgctggt gtaa        4434
<210>43
<211>4425
<212>DNA
<213>光杆状菌W14菌株
<400>43
atgcaaaatt cacaagattt tagtattacg gaactgtcac tgcccaaagg ggggggcgct    60
atcacgggaa tgggtgaagc attaaccccc actggaccgg atggtatggc cgcgctatct   120
ctaccattgc ctatttctgc cgggcgcggt tatgctcccg cattcactct gaattacaac   180
agcggcgccg gtaacagtcc atttggtctg ggttgggatt gcaacgttat gactatccgc    240
cgccgcaccc attttggcgt cccccattat gacgaaaccg ataccttttt ggggccagaa    300
ggcgaagtgc tggtggtagc ggatcaacct cgcgacgaat ccacattaca gggtatcaat    360
ttaggcgcca cctttaccgt taccggctac cgttcccgtc tggaaagcca tttcagccga    420
ttggaatatt ggcaacccaa aacaacaggt aaaacagatt tttggttgat atatagccca    480
gatgggcagg tgcatctact gggtaaatca ccgcaagcgc ggatcagcaa cccatcccaa    540
acgacacaaa cagcacaatg gctgctggaa gcctctgtat catcacgtgg cgaacaaatt    600
tattatcaat atcgcgccga agatgacaca ggttgcgaag cagatgaaat tacgcaccat    660
ttacaggcta cagcgcaacg ttatttacac atcgtgtatt acggcaaccg tacagccagc    720
gaaacattac ccggtctgga tggcagcgcc ccatcacaag cagactggtt gttctatctg    780
gtatttgatt acggcgaacg cagtaacaac ctgaaaacgc caccagcatt ttcgactaca    840
ggtagctggc tttgccgtca ggaccgtttt tcccgttatg aatatggctt tgagattcgt    900
acccgccgct tatgccgtca ggtattgatg taccatcacc tgcaagcact ggatagtaag    960
ataacagaac acaacggacc aacgctggtt tcacgcctga tactcaatta cgacgaaagc   1020
gcgatagcca gcacgctagt attcgttcgc cgagtgggac acgagcaaga tggtaatgtc   1080
gtcaccctgc cgccattaga attggcatat caggattttt caccgcgaca tcacgctcac   1140
tggcaaccaa tggatgtact ggcaaacttc aatgccattc agcgctggca gctagtcgat   1200
ctaaaaggcg aaggattacc cggcctgtta tatcaggata aaggcgcttg gtggtaccgc   1260
tccgcacagc gtctgggcga aattggctca gatgccgtca cttgggaaaa gatgcaacct   1320
ttatcggtta ttccttcttt gcaaagtaat gcctcgttgg tggatatcaa tggagacggc   1380
caacttgact gggttatcac cggaccggga ttacggggat atcatagtca acgcccggat   1440
ggcagttgga cacgttttac cccactcaac gctctgccgg tggaatacac ccatccacgc   1500
gcgcaactcg cagatttaat gggagccggg ctatccgatt tggtgctgat cggccctaag   1560
agcgtgcgtt tatatgccaa tacccgcgac ggctttgcca aaggaaaaga tgtggtgcaa   1620
tccggtgata tcacactgcc ggtgccgggc gccgatccac gtaagttggt ggcgtttagt   1680
gatgtattgg gttcaggtca agcccatctg gttgaagtaa gcgcgactaa agtcacctgc   1740
tggcctaatc tggggcgcgg acgttttggt caacccatta ccttaccggg attcagccag   1800
ccagcaaccg agtttaaccc ggctcaagtt tatctggccg atctggatgg cagcggtcca   186
acggatctga tttatgttca tacaaaccgt ctggatatct tcctgaacaa aagtggcaat   1920
ggctttgctg aaccagtgac attacgcttc ccggaaggtc tgcgttttga tcatacctgt   1980
cagttacaaa tggccgatgt acaaggatta ggcgtcgcca gcctgatact gagcgtgccg   2040
catatgtctc cccatcactg gcgctgcgat ctgaccaaca tgaagccgtg gttactcaat   2100
gaaatgaaca acaatatggg ggtccatcac accttgcgtt accgcagttc ctcccaattc   2160
tggctggatg aaaaagccgc ggcgctgact accggacaaa caccggtttg ctatctcccc   2220
ttcccgatcc acaccctatg gcaaacggaa acagaagatg aaatcagcgg caacaaatta   2280
gtcacaacac ttcgttatgc tcgtggcgca tgggacggac gcgagcggga atttcgcgga   2340
tttggttatg tagagcagac agacagccat caactggctc aaggcaacgc gccagaacgt   2400
acgccaccgg cgctgaccaa aaactggtat gccaccggac tgccggtgat agataacgca   2460
ttatcaaccg agtattggcg tgatgatcag gcttttgccg gtttctcacc gcgctttacg   2520
acttggcaag ataacaaaga tgtcccgtta acaccggaag atgataacag tcgttactgg   2580
ttcaaccgcg cgttgaaagg tcaactgcta cgtagtgaac tgtacggatt ggacgatagt   2640
acaaataaac acgttcccta tactgtcact gaatttcgt tcacaggtacg tcgattacag   2700
cataccgaca gccgataccc tgtactttgg tcatctgtag ttgaaagccg caactatcac   2760
tacgaacgta tcgccagcga cccgcaatgc agtcaaaata ttacgctatc cagtgatcga   2820
tttggtcagc cgctaaaaca gctttcggta cagtacccgc gccgccagca gccagcaatc   2880
aatctgtatc ctgatacatt gcctgataag ttgttagcca acagctatga tgaccaacaa   2940
cgccaattac ggctcaccta tcaacaatcc agttggcatc acctgaccaa caataccgtt   3000
cgagtattgg gattaccgga tagtacccgc agtgatatct ttacttatgg cgctgaaaat   3060
gtgcctgctg gtggtttaaa tctggaactt ctgagtgata aaaatagcct gatcgcggac   3120
gataaaccac gtgaatacct cggtcagcaa aaaaccgctt ataccgatgg acaaaataca   3180
acgccgttgc aaacaccaac acggcaagcc ctgattgcct ttaccgaaac aacggtattc   3240
aaccagtcca cattatcagc gtttaacgga agcatcccgt ccgataaatt atcaacgacg   3300
ctggagcaag ctggatatca gcaaacaaat tatctattcc ctcgcactgg agaagataaa   3360
gtttgggtag cccatcacgg ctataccgat tatggtacag cggcacagtt ctggcgcccg   3420
caaaaacaga gcaacaccca actcaccggt aaaatcaccc tcatctggga tgcaaactat   3480
tgcgttgtgg tacaaacccg ggatgctgct ggactgacaa cctcagccaa atatgactgg   3540
cgttttctga ccccggtgca actcaccgat atcaatgaca atcagcacct tatcacactg   3600
gatgcattgg gccgaccaat cacattgcgc ttttggggaa ctgaaaacgg caagatgaca   3660
ggttattcct caccggaaaa agcatcattt tctccaccat ccgatgttaa tgccgctatt   3720
gagttaaaaa aaccgctccc tgtagcacag tgtcaggtct acgcaccaga aagctggatg   3780
ccagtattaa gtcagaaaac cttcaatcga ctggcagaac aagattggca aaagttatat   3840
aacgcccgaa tcatcaccga agatggacgt atctgcacac tggcttatcg ccgctgggta   3900
caaagccaaa aggcaatccc tcaactcatt agcctgttaa acaacggacc ccgtttacct   3960
cctcacagcc tgacattgac gacggatcgt tatgatcacg atcctgagca acagatccgt   4020
caacaggtgg tattcagtga tggctttggc cgcttgctgc aagccgctgc ccgacatgag   4080
gcaggcatgg cccggcaacg caatgaagac ggctctttga ttataaatgt ccagcatact   4140
gagaaccgtt gggcagtgac tggacgaacg gaatatgaca ataaggggca accgatacgt  4200
acctatcagc cctatttcct caatgactgg cgatacgtca gcaatgatag tgcccggcag  4260
gaaaaagaag cttatgcaga tacccatgtc tatgatccca taggtcgaga aatcaaggtt  4320
atcaccgcaa aaggttggtt ccgtcgaacc ttgttcactc cctggtttac tgtcaatgaa  4380
gatgaaaatg acacagccgc tgaggtgaag aaggtaaaga tgtaa                  4425
<210>44
<211>3132
<212>DNA
<213>光杆状菌W14菌株
<400>44
atgagcccgt ctgagactac tctttatact caaaccccaa cagtcagcgt gttagataat     60
cgcggtctgt ccattcgtga tattggtttt caccgtattg taatcggggg ggatactgac    120
acccgcgtca cccgtcacca gtatgatgcc cgtggacacc tgaactacag tattgaccca    180
cgcttgtatg atgcaaagca ggctgataac tcagtaaagc ctaattttgt ctggcagcat    240
gatctggccg gtcatgccct gcggacagag agtgtcgatg ctggtcgtac tgttgcattg    300
aatgatattg aaggtcgttc ggtaatgaca atgaatgcga ccggtgttcg tcagacccgt    360
cgctatgaag gcaacacctt gcccggtcgc ttgttatctg tgagcgagca agttttcaac    420
caagagagtg ctaaagtgac agagcgcttt atctgggctg ggaatacaac ctcggagaaa    480
gagtataacc tctccggtct gtgtatacgc cactacgaca cagcgggagt gacccggttg    540
atgagtcagt cactggcggg cgccatgcta tcccaatctc accaattgct ggcggaaggg    600
caggaggcta actggagcgg tgacgacgaa actgtctggc agggaatgct ggcaagtgag    660
gtctatacga cacaaagtac cactaatgcc atcggggctt tactgaccca aaccgatgcg    720
aaaggcaata ttcagcgtct ggcttatgac attgccggtc agttaaaagg gagttggttg    780
acggtgaaag gccagagtga acaggtgatt gttaagtccc tgagctggtc agccgcaggt    840
cataaattgc gtgaagagca cggtaacggc gtggttacgg agtacagtta tgagccggaa    900
actcaacgtc tgataggtat caccacccgg cgtgccgaag ggagtcaatc aggagccaga    960
gtattgcagg atctacgcta taagtatgat ccggtgggga atgttatcag tatccataat   1020
gatgccgaag ctacccgctt ttggcgtaat cagaaagtgg agccggagaa tcgctatgtt   1080
tatgattctc tgtatcagct tatgagtgcg acagggcgtg aaatggctaa tatcggtcag   1140
caaagcaacc aacttccctc acccgttata cctgttccta ctgacgacag cacttatacc   1200
aattaccttc gtacctatac ttatgaccgt ggcggtaatt tggttcaaat ccgacacagt   1260
tcacccgcga ctcaaaatag ttacaccaca gatatcaccg tttcaagccg cagtaaccgg   1320
gcggtattga gtacattaac gacagatcca acccgagtgg atgcgctatt tgattccggc   1380
ggtcatcaga agatgttaat accggggcaa aatctggatt ggaatattcg gggtgaattg   1440
caacgagtca caccggtgag ccgtgaaaat agcagtgaca gtgaatggta tcgctatagc   1500
agtgatggca tgcggctgct aaaagtgagt gaacagcaga cgggcaacag tactcaagta   1560
caacgggtga cttatctgcc gggattagag ctacggacaa ctggggttgc agataaaaca   1620
accgaagatt tgcaggtgat tacggtaggt gaagcgggtc gcgcacaggt aagggtattg   1680
cactgggaaa gtggtaagcc gacagatatt gacaacaatc aggtgcgcta cagctacgat   1740
aatctgcttg gctccagcca gcttgaactg gatagcgaag ggcagattct cagtcaggaa   1800
gagtattatc cgtatggcgg tacggcgata tgggcggcga gaaatcagac agaagccagc   1860
tacaaattta ttcgttactc cggtaaagag cgggatgcca ctggattgta ttattacggc   1920
taccgttatt atcaaccttg ggtgggtcga tggttgagtg ctgatccggc gggaaccgtg   1980
gatgggctga atttgtaccg aatggtgagg aataacccca tcacattgac tgaccatgac   2040
ggattagcac cgtctccaaa tagaaatcga aatacatttt ggtttgcttc atttttgttt   2100
cgtaaacctg atgagggaat gtccgcgtca atgagacggg gacaaaaaat tggcagagcc  2160
attgccggcg ggattgcgat tggcggtctt gcggctacca ttgccgctac ggctggcgcg  2220
gctatccccg tcattctggg ggttgcggcc gtaggcgcgg ggattggcgc gttgatggga  2280
tataacgtcg gtagcctgct ggaaaaaggc ggggcattac ttgctcgact cgtacagggg  2340
aaatcgacgt tagtacagtc ggcggctggc gcggctgccg gagcgagttc agccgcggct  2400
tatggcgcac gggcacaagg tgtcggtgtt gcatcagccg ccggggcggt aacaggggct  2460
gtgggatcat ggataaataa tgctgatcgg gggattggcg gcgctattgg ggccgggagt  2520
gcggtaggca ccattgatac tatgttaggg actgcctcta cccttaccca tgaagtcggg  2580
gcagcggcgg gtggggcggc gggtgggatg atcaccggta cgcaagggag tactcgggca  2640
ggtatccatg ccggtattgg cacctattat ggctcctgga ttggttttgg tttagatgtc  2700
gctagtaacc ccgccggaca tttagcgaat tacgcagtgg gttatgccgc tggtttgggt  2760
gctgaaatgg ctgtcaacag aataatgggt ggtggatttt tgagtaggct cttaggccgg  2820
gttgtcagcc catatgccgc cggtttagcc agacaattag tacatttcag tgtcgccaga  2880
cctgtctttg agccgatatt tagtgttctc ggcgggcttg tcggtggtat tggaactggc  2940
ctgcacagag tgatgggaag agagagttgg atttccagag cgttaagtgc tgccggtagt  3000
ggtatagatc atgtcgctgg catgattggt aatcagatca gaggcagggt cttgaccaca  3060
accgggatcg ctaatgcgat agactatggc accagtgctg tgggagccgc acgacgagtt  3120
ttttctttgt aa                                                      3132
<210>45
<211>2748
<212>DNA
<2l3>光杆状菌W14菌株
<400>45
atgagcagtt acaattctgc aattgaccaa aagaccccct cgattaaggt attagataac    60
aggaaattaa atgtacgtac tttagaatat ctacgcactc aagctgacga aaacagtgat    120
gaattaatta cgttctatga gttcaatatt ccgggatttc aggtaaaaag caccgatcct    180
cgtaaaaata aaaaccagag cggcccaaat ttcattcgtg tctttaatct tgccggtcaa    240
gttttacgtg aagaaagtgt tgatgccggt cggactatta ccctcaatga tattgaaagt    300
cgcccggtgt tgatcatcaa tgcaaccggt gtccgccaaa accatcgtta tgaagataac    360
acccttcccg gtcgtctgct cgctatcacc gaacaagtac aggcaggaga gaaaacgacc    420
gaacgtctta tctgggccgg caatacgccg caagaaaaag attacaacct cgccggtcag    480
tgtgtccgcc attacgatac cgcgggactt actcaactca atagcctttc tctggctggc    540
gtcgtgctat cacaatctca gcaactactc gtcgatgata aaaatgctga ctggacaggt    600
gaagaccaaa gcctctggca gcaaaaactg agcagtgatg tctataccac ccaaaataaa    660
gccgatgcca ccggggcttt attgacccag accgatgcca aaggcaacat ccagcgtctg    720
gcctacgacg tagccgggca gctaaaaggc tgttggttga cactcaaagg tcaggccgag    780
caagtgatta tcaaatcgct gacctactcc gccgccggac aaaaattacg cgaagagcac    840
ggtaacgggg ttatcactga atacagctat gaaccagaaa cccaacggct tatcggtatt    900
gccacccgcc gtccgtcaga cgccaaagtg ttgcaagact tacgctatca atatgacccg    960
gtaggcaatg tgatcaatat ccgtaatgat gcggaagcca cccgcttttg gcgcaatcag   1020
aaagtggtcc cggagaatag ctatacctac gactccctgt atcagcttat cagtgccacc   1080
gggcgggaaa tggctaatat aggtcagcaa aataaccaac tgccctcccc tgcgctacct   1140
tctgacaaca atacctacac taactatact cgcagctaca gctatgatca cagtggtaat   1200
ctgacgcaaa ttcggcacag ctcgccagct acccagaaca actacaccgt ggctatcacc   1260
ctctcaaacc gcagcaatcg gggtgttctc agtacgctaa ccaccgatcc aaatcaagtg   1320
gatacgttgt ttgatgccgg tggtcaccaa accagtttat tacccggaca gacacttatc   1380
tggacaccac gaggagagtt aaagcaggtt aataatggcc cgggaaatga gtggtaccgc   1440
tacgacagca acggcatgag acaactgaaa gtgagtgaac agccaaccca gaatactacg   1500
cagcaacaac gggtaatcta tttgccggga ctggagctac gcacaaccca gagcaacgcc   1560
acaacaacgg aagagttaca cgttatcaca ctcggtgaag ccggtcgcgc acaggtacgg   1620
gtgttgcact gggagagcgg taagccagaa gatgtcaaca ataatcaact acgttacagc   1680
tacgataatc tgatcggctc cagccagctt gaactggaca accaaggaca aattatcagc   1740
gaggaagagt attatccatt tggcgggaca gcgctgtggg cagcaaacag ccaaacagaa   1800
gccagctata aaacgattcg ctattccggc aaagaacgag atgccaccgg gttgtattat   1860
tacggttatc gttattacca accgtgggcg ggcagatggt taagcgcgga cccggcagga   1920
accattgatg ggctgaatct ataccgaatg gtaagaaata atcctgtgag tttacaagat   1980
gaaaatggat tagcgccaga aaaagggaaa tataccaaag aggtaaattt ctttgatgaa   2040
ttaaaattca aattggcagc caaaagttca catgttgtca aatggaacga gaaagagagc   2100
agttatacaa aaaataaatc attgaaagtg gttcgtgtcg gtgattccga tccgtcgggt   2160
tatttgctaa gccacgaaga gttactaaaa ggtatagaaa aaagtcaaat catatatagc   2220
cgacttgaag aaaacagctc cctttcagaa aaatcaaaaa cgaatctttc tttaggatct   2280
gaaatatccg gttatatggc aagaaccata caagatacga tatcagaata tgccgaagag   2340
cataaatata gaagtaatca ccctgatttt tattcagaaa ccgatttctt tgcgttaatg   2400
gataaaagtg aaaaaaatga ttattccggt gaaagaaaaa tttatgcggc aatggaggtt   2460
aaggtttatc atgatttaaa aaataaacaa tcagaattac atgtcaacta tgcattggcc   2520
catccctata cgcaattgag taatgaagaa agagcgctgt tgcaagaaac agaacccgct   2580
attgcaatag atagagaata taatttcaaa ggtgttggca aattcctgac aatgaaagca   2640
attaaaaaat cattgaaagg acataaaatt aataggatat caacagaggc tattaatatt   2700
cgctctgcgg ctatcgctga gaatttagga atgcggagaa cttcataa                2748
<210>46
<211>2883
<212>DNA
<213>光杆状菌W14菌株
<400>46
atgaaaaaca ttgatcccaa actttatcaa aaaaccccta ctgtcagcgt ttacgataac    60
cgtggtctga taatccgtaa catcgatttt catcgtacta ccgcaaatgg tgatcccgat   120
acccgtatta cccgccatca atacgatatt cacggacacc taaatcaaag catcgatccg   180
cgcctatatg aagccaagca aaccaacaat acgatcaaac ccaattttct ttggcagtat   240
gatttgaccg gtaatcccct atgtacagag agcattgatg caggtcgcac tgtcaccttg   300
aatgatattg aaggccgtcc gctactaacg gtgactgcaa caggggttat acaaactcga   360
caatatgaaa cttcttccct gcccggtcgt ctgttatctg ttgccgaaca aacacccgag   420
gaaaaaacat cccgtatcac cgaacgcctg atttgggctg gcaataccga agcagagaaa   480
gaccataacc ttgccggcca gtgcgtgcgt cactatgaca cggcgggagt tacccggtta   540
gagagtttat cactgaccgg tactgtttta tctcaatcca gccaactatt gatcgacact   600
caagaggcaa actggacagg tgataacgaa accgtctggc aaaacatgct ggctgatgac   660
atctacacaa ccctgagcac cttcgatgcc accggtgctt tactgactca gaccgatgcg   720
aaagggaaca ttcagagact ggcttatgat gtggccgggc agctaaacgg gagctggcta   780
acactcaaag gccagacgga acaagtgatt atcaaatccc tgacctactc cgccgccgga   840
caaaaattac gtgaggaaca cggcaatgat gttatcaccg aatacagtta tgaaccggaa   900
acccaacggc tgatcggtat caaaacccgc cgtccgtcag acactaaagt gctacaagac   960
ctgcgctatg aatatgaccc ggtaggcaat gtcatcagca tccgtaatga cgcggaagcc  1020
acccgctttt ggcacaatca gaaagtgatg ccggaaaaca cttataccta cgattccctg   1080
tatcagctta tcagcgccac cgggcgcgaa atggcgaata taggtcaaca aagtcaccaa   1140
tttccctcac ccgctctacc ttctgataac aacacctata ccaactatac ccgtacttat   1200
acttatgacc gtggcggcaa tctgaccaaa atccagcaca gttcaccggc gacgcaaaac   1260
aactacacca ccaatatcac ggtttcaaat cgcagcaacc gcgcagtact cagcacattg   1320
accgaagatc cggcgcaagt agatgctttg tttgatgcag gcggacatca gaacaccttg   1380
atatcaggac aaaacctgaa ctggaatact cgtggtgaac tgcaacaagt aacactggtt   l440
aaacgggaca agggcgccaa tgatgatcgg gaatggtatc gttatagcgg tgacggaaga   1500
aggatgttaa aaatcaatga acagcaggcc agcaacaacg ctcaaacaca acgtgtgact   1560
tatttgccga acttagaact tcgtctaaca caaaacagca cggccacaac cgaagatttg   1620
caagttatca ccgtaggcga agcgggccgg gcacaggtac gagtattaca ttgggagagc   1680
ggtaaaccgg aagatatcga caataatcag ttgcgttata gttacgataa tcttatcggt   1740
tccagtcaac ttgaattaga tagcgaagga caaattatca gtgaagaaga atattatccc   1800
tatggtggaa cagcattatg ggccgccagg aatcagacag aagccagtta taaaactatc   1860
cgttattcag gcaaagagcg ggatgccacc gggctatatt actacggcta tcggtattac   1920
caaccgtgga taggacggtg gttaagctcc gatccggcag gaacaatcga tgggctgaat   1980
ttatatcgga tggtgaggaa taatccagtt accctccttg atcctgatgg attaatgcca   2040
acaattgcag aacgcatagc agcactaaaa aaaaataaag taacagactc agcgccttcg   2100
ccagcaaatg ccacaaacgt agcgataaac atccgcccgc ctgtagcacc aaaacctagc   2160
ttaccgaaag catcaacgag tagccaacca accacacacc ctatcggagc tgcaaacata   2220
aaaccaacga cgtctgggtc atctattgtt gctccattga gtccagtagg aaataaatct   2280
acttctgaaa tctctctgcc agaaagcgct caaagcagtt cttcaagcac tacctcgaca   2340
aatctacaga aaaaatcatt tactttatat agagcagata acagatcctt tgaagaaatg  2400
caaagtaaat tccctgaagg atttaaagcc tggactcctc tagacactaa gatggcaagg  2460
caatttgcta gtatctttat tggtcagaaa gatacatcta atttacctaa agaaacagtc  2520
aagaacataa gcacatgggg agcaaagcca aaactaaaag atctctcaaa ttacataaaa  2580
tataccaagg acaaatctac agtatgggtt tctactgcaa ttaatactga agcaggtgga  2640
caaagctcag gggctccact ccataaaatt gatatggatc tctacgagtt tgccattgat  2700
ggacaaaaac taaatccact accggagggt agaactaaaa acatggtacc ttccctttta  2760
ctcgacaccc cacaaataga gacatcatcc atcattgcac ttaatcatgg accggtaaat  2820
gatgcagaaa tttcatttct gacaacaatt ccgcttaaaa atgtaaaacc tcataagaga  2880
taa                                                                2883
<210>47
<211>2850
<212>DNA
<213>光杆状菌W14菌株
<400>47
atgaaaaaca ttgacccaaa actttatcaa catacgccca ccgttaacgt ctacgataac    60
cgtggcctga ccattcgtaa catcgacttt caccgtgacg tcgcgggagg cgatacagat   120
actcgtatta cccgccacca atatgatacc cgaggacact tgagccaaag cattgatcca   180
cggctgtatg acgccaaaca aaccaataac tcgacaaacc ccaacttcct ctggcaatac   240
aatctcaccg gcgacacttt gcggacagaa agtgtcgatg ccggccgtac cgtagccctc   300
aatgatattg aaggccgtca agtgttgatt gtaaccgcaa ccggcgccat tcagacccga   360
caatatgaag ccaataccct gcccggtcgt ctattatccg taagtgaaca agcccccgga   420
gaacagactc cccgcgttac tgagcatttt atttgggctg gtaatacaca ggcggagaaa   480
gatcataatc ttgccggcca gtatgtgcgc cactacgaca cagcaggagt gacgcaactg   540
gaaagcctgt cattgacaga aaacatctta tctcaatccc gtcagttatt agccgacggt    600
caggaagcag actggacagg taacgatgaa accctctggc agaccaaact caatagcgaa    660
acttacacga cacaaagcac ctttgatgct accggcgctt tgctgaccca aaccgatgca    720
aaaggcaaca tgcaacgtct ggcttacaac gtggcaggac aattacaagg tagctggctg    780
acattgaaaa accaaagtga gcaagtcatt gtcaaatccc tgacctattc cgccgcaggc    840
cagaaattgc gtgaagaaca cggtaatggc gttatcactg aatacagcta tgaaccggaa    900
actctacgat tgatcggtac cactactcgc cgtcaatcag atagcaaggt gttacaagat    960
ctacgctatg aacatgatcc tgtagggaat attattagtg tccgtaatga tgcagaagcc   1020
acccgcttct ggcgcaatca gaaaatagtc cctgaaaata cctacaccta cgattccctg   1080
tatcagctta tcagtgcaac aggacgtgag atggctaaca tcggccagca aagcaaccaa   1140
cttccttcgc caatcatccc tcttcctact gatgaaaact catataccaa ctatactcgc   1200
agctataatt acgatcgcgg cggcaatttg gttcaaatcc ggcacagttc ccccgccgcc   1260
caaaataact acaccacaga tatcaccgtt tcgaatcgca gtaaccgggc agtgctgagt   1320
tcgctaacct cagacccaac acaggtggag gcactgtttg atgccggcgg acatcaaaca   1380
aaattgttac cggggcaaga gctgagttgg aatacacgag gtgaactaaa acaggtaacg   1440
ccagtcagtc gcgagagcgc cagcgatcgg gaatggtatc gttacggcaa cgacggcatg   1500
cgacggttaa aagtcagtga gcaacagact ggcaacagca cgcagcagca acgagtaact   1560
tatcttcccg atctggagct acgtacaaca caaaatggga ctactacatc agaagacctg   1620
catgctatta ccgtgggagc agcaggccac gcacaagtgc gagttctaca ctgggaaact   1680
acgccaccag ccggtatcaa taacaatcag cttcgctata gctatgataa tttgattggt   1740
tccagtcaac ttgaactgga taacgcagga caaattatca gtcaggaaga gtattatcca   1800
tttggcggca cagcattatg ggcagcaaga aaccaaatag aagccagcta caaaatcctc   1860
cgttactcag gtaaagaacg cgatgctacc gggctctatt attacggcta ccgctattat  1920
cagccgtggg ttggtaggtg gttaagcgcc gatccggctg gaacaatcga tggactgaat  1980
ctataccgga tggtgagaaa taatccgtca acactggttg atatttctgg gcttgcacct  2040
acgaaataca atattcccgg atttgacttt gatgtagaaa tagatgagca aaaaagatct  2100
aaattaaaac caacgttgat aagaatcaaa gatgaatttt tacattatgg tcctgtagat  2160
aagctgttag aagaaaaaaa acccggcctc aatgtaccag aggagctatt tgatagaggt  2220
ccatccgaga atggagtgtc aacattaact ttcaaaaaag acctaccgat aagttgtatt  2280
agcaacacag aatataccct tgatatctta tacaacaaac atgagactaa accattccct  2340
tacgaaaacg aagcaacagt tggcgcagat ctgggagtaa taatgtccgt ggagtttgga  2400
aataaatcaa taggtaatgc ctctgacgaa gatttaaaag aagaacatct cccattagga  2460
aaatccacaa tggataaaac agacctgcca gatttaaaac aagggctaat gatcgcggag  2520
aagataaaaa gtggaaaagg ggcatatcct tttcattttg gtgctgcaat agctgttgta  2580
tatggtgagg ataaaaaagt agccgcttca attctgacag atttatctga acctaaaaga  2640
gacgaaggcg agtatttgca aagtacgaga aaggtaagcg caatgtttat cacaaacgtc  2700
aatgaatttc gcggccatga ttacccaaaa agtaaatata gtatcggatt agttacagct  2760
gaaaaacgtc agccagtaat aagcaaaaaa cgtgcaaacc cggaagaggc cccttcatca  2820
tccagaaata aaaaattgca tgtacattaa                                   2850
<210>48
<211>2817
<212>DNA
<213>光杆状菌W14菌株
<400>48
atggaaaaca ttgacccaaa actttatcac catacgccta ccgtcagtgt tcacgataac    60
cgtggactag ctatccgtaa tattagtttt caccgcacta ccgcagaagc aaataccgat    120
acccgtatta cccgccatca atataatgcc ggcggatatt tgaaccaaag cattgatcct    180
cgcctgtatg acgccaaaca gactaacaac gctgtacaac cgaattttat ctggcgacat    240
aatttgaccg gcaatatcct gcgaacagag agcgtcgatg ccggtcggac gattaccctc    300
aacgatattg aaggccgccc ggtgttgacc atcaatgcag ccggtgtccg gcaaaaccat    360
cgctacgaag ataacaccct gcccggtcgc ctgctcgcta tcagcgaaca aggacaggca    420
gaagagaaaa cgaccgagcg ccttatctgg gccggcaata cgccgcaaga aaaagaccac    480
aaccttgccg gtcagtgcgt ccgccattac gataccgcag gactcactca actcaacagc    540
cttgccctga ccggcgccgt tctatcacaa tctcaacaac tgcttaccga taaccaggat    600
gccgactgga caggtgaaga ccagagcctc tggcaacaaa aactgagtag tgatgtctat    660
atcacccaaa gtaacactga tgccaccggg gctttactga cccagaccga tgccaaaggc    720
aacattcagc ggctggccta tgatgtggcc gggcagctaa aagggagttg gttaacactc    780
aaaggtcagg cggaacaggt gattatcaaa tcgctaacct actccgccgc cgggcaaaaa    840
ttacgtgaag agcacggtaa cgggattgtc actgaataca gctacgaacc ggaaacccaa    900
cggcttatcg gcattaccac tcgccgtcca tcagacgcca aggtgttgca agacctacgc    960
tatcaatatg acccagtagg caatgtcatt agtatccgta atgatgcgga agccactcgc   1020
ttttggcgca atcagaaagt agccccggag aatagctata cctacgattc cctgtatcag   1080
cttatcagcg ccaccgggcg cgagatggcc aatatcggtc agcaaagcaa ccaacttccc   1140
tctccggcgc taccttctga taacaatacc tacaccaact atactcgcac ttatacttat   1200
gaccgtggcg gcaatttgac gaaaattcag catagttcac cagccgcgca aaataactac   1260
acgacggata taacggtttc aaatcgcagc aaccgcgcgg tactcagcac attgaccgca   1320
gatccaactc aagtcgatgc cttatttgat gcgggaggcc atcaaaccag cttgttatcc   1380
ggccaagttc taacttggac accgcgaggc gaattgaaac aagccaacaa tagcgcagga   1440
aatgagtggt atcgctacga tagcaacggc atacgccagc taaaagtgaa tgaacaacaa   1500
actcagaata tcccgcaaca acaaagggta acttatctac cggggctgga aatacgtaca   1560
acccagaaca acgccacaac aacagaagag ttacacgtta tcacactcgg taaagccggc   1620
cgcgcgcaag tccgagtatt gcattgggag agcggtaaac cagaagatat taataacaat   1680
cagcttcgtt acagctacga taatcttatt ggctccagcc aacttcaatt agatagcgac   1740
ggacaaatta tcagtgaaga agaatattat ccatttggtg gtacagcgct gtgggcggca   1800
aggaatcaaa ccgaagccag ctataaaacc attcgttatt ctggtaaaga gcgggatgtt   1860
accgggctgt attattatgg ctaccgttat taccaaccgt gggcgggcag atggttaagt   1920
gcagacccgg caggaaccat tgatggactg aatttatatc gcatggtgag aaataacccg   1980
gtgacgcaat ttgatgttca gggattatca ccggccaaca gaacagaaga agcgataata   2040
aaacagggtt cctttacggg aatggaagaa gctgtttata aaaaaatggc taaacctcaa   2100
actttcaaac gccaaagagc tatcgctgcc caaacagagc aagaagccca tgaatcattg   2160
accaacaacc ctagtgtaga tattagccca attaaaaact acaccacaga tagctcacaa   2220
attaatgccg cgataaggga aaatcgtatt acgccagcag tggaaagttt agacgccaca   2280
ttatcttccc tacaagatag acaaatgagg gtaacttatc gggtgatgac ctatgtagat   2340
aattccacgc catcgccttg gcactcgcca caggaaggaa atagtattaa tgttggtgat   2400
atcgtttcgg ataacgctta tttatcaaca tcggcccatc gtggttttct gaattttgtt   2460
cacaaaaaag aaaccagtga aactcgatac gtcaagatgg catttttaac gaatgcgggt   2520
gtcaatgtct cagcagcatc tatgtataat aatgctggcg aggagcaagt atttaaaatg   2580
gatttaaacg attcaagaaa aagccttgct gaaaaattaa aactaagagt cagtggacca   2640
caatcgggac aagcggaaat attactacct agggaaacac agttcgaagt tgtttcaatg   2700
aaacatcaag gcagagatac ctatgtatta ttgcaagata ttaaccaatc cgcagccact  2760
catagaaatg tacgtaacac ttacaccggt aatttcaaat catccagtgc aaattaa     2817
<210>49
<211>2538
<212>PRT
<213>嗜线虫致病杆菌Xenorhabdus nematophilus)
<400>49
Met Tyr Ser Thr Ala Val Leu Leu Asn Lys Ile Ser Pro Thr Arg Asp
1               5                   10                  15
Gly Gln Thr Met Thr Leu Ala Asp Leu Gln Tyr Leu Ser Phe Ser Glu
            20                  25                  30
Leu Arg Lys Ile Phe Asp Asp Gln Leu Ser Trp Gly Glu Ala Arg His
        35                  40                  45
Leu Tyr His Glu Thr Ile Glu Gln Lys Lys Asn Asn Arg Leu Leu Glu
    50                  55                  60
Ala Arg Ile Phe Thr Arg Ala Asn Pro Gln Leu Ser Gly Ala Ile Arg
65                  70                  75                  80
Leu Gly Ile Glu Arg Asp Ser Val Ser Arg Ser Tyr Asp Glu Met Phe
                85                  90                  95
Gly Ala Arg Ser Ser Ser Phe Val Lys Pro Gly Ser Val Ala Ser Met
            100                 105                 110
Phe Ser Pro Ala Gly Tyr Leu Thr Glu Leu Tyr Arg Glu Ala Lys Asp
        115                 120                 125
Leu His Phe Ser Ser Ser Ala Tyr His Leu Asp Asn Arg Arg Pro Asp
    130                 135                 140
Leu Ala Asp Leu Thr Leu Ser Gln Ser Asn Met Asp Thr Glu Ile Ser
145                 150                 155                 160
Thr Leu Thr Leu Ser Asn Glu Leu Leu Leu Glu His Ile Thr Arg Lys
                165                 170                 175
Thr Gly Gly Asp Ser Asp Ala Leu Met Glu Ser Leu Ser Thr Tyr Arg
            180                 185                 190
Gln Ala Ile Asp Thr Pro Tyr His Gln Pro Tyr Glu Thr Ile Arg Gln
        195                 200                 205
Val Ile Met Thr His Asp Ser Thr Leu Ser Ala Leu Ser Arg Asn Pro
    210                 215                 220
Glu Val Met Gly Gln Ala Glu Gly Ala Ser Leu Leu Ala Ile Leu Ala
225                 230                 235                 240
Asn Ile Ser Pro Glu Leu Tyr Asn Ile Leu Thr Glu Glu Ile Thr Glu
                245                 250                 255
Lys Asn Ala Asp Ala Leu Phe Ala Gln Asn Phe Ser Glu Asn Ile Thr
            260                 265                 270
Pro Glu Asn Phe Ala Ser Gln Ser Trp Ile Ala Lys Tyr Tyr Gly Leu
        275                 280                 285
Glu Leu Ser Glu Val Gln Lys Tyr Leu Gly Met Leu Gln Asn Gly Tyr
    290                 295                 300
Ser Asp Ser Thr Ser Ala Tyr Va1 Asp Asn Ile Ser Thr Gly Leu Val
305                 310                 315                 320
Val Asn Asn Glu Ser Lys Leu Glu Ala Tyr Lys Ile Thr Arg Val Lys
                325                 330                 335
Thr Asp Asp Tyr Asp Lys Asn Ile Asn Tyr Phe Asp Leu Met Tyr Glu
            340                 345                 350
Gly Asn Asn Gln Phe Phe Ile Arg Ala Asn Phe Lys Val Ser Arg Glu
    355                     360                 365
Phe Gly Ala Thr Leu Arg Lys Asn Ala Gly Pro Ser Gly Ile Val Gly
    370                 375                 380
Ser Leu Ser Gly Pro Leu Ile Ala Asn Thr Asn Phe Lys Ser Asn Tyr
385                 390                 395                 400
Leu Ser Asn Ile Ser Asp Ser Glu Tyr Lys Asn Gly Val Lys Ile Tyr
                405                 410                 415
Ala Tyr Arg Tyr Thr Ser Ser Thr Ser Ala Thr Asn Gln Gly Gly Gly
            420                 425                 430
Ile Phe Thr Phe Glu Ser Tyr Pro Leu Thr Ile Phe Ala Leu Lys Leu
        435                 440                 445
Asn Lys Ala Ile Arg Leu Cys Leu Thr Ser Gly Leu Ser Pro Asn Glu
    450                 455                 460
Leu Gln Thr Ile Val Arg Ser Asp Asn Ala Gln Gly Ile Ile Asn Asp
465                 470                 475                 480
Ser Val Leu Thr Lys Val Phe Tyr Thr Leu Phe Tyr Ser His Arg Tyr
                485                 490                 495
Ala Leu Ser Phe Asp Asp Ala Gln Val Leu Asn Gly Ser Val Ile Asn
            500                 505                 510
Gln Tyr Ala Asp Asp Asp Ser Val Ser His Phe Asn Arg Leu Phe Asn
        515                 520                 525
Thr Pro Pro Leu Lys Gly Lys ILe Phe Glu Ala Asp Gly Asn Thr Val
    530                 535                 540
Ser Ile Asp Pro Asp Glu Glu Gln Ser Thr Phe Ala Arg Ser Ala Leu
545                 550                 555                 560
Met Arg Gly Leu Gly Val Asn Ser Gly Glu Leu Tyr Gln Leu Gly Lys
                565                 570                 575
Leu Ala Gly Val Leu Asp Ala Gln Asn Thr Ile Thr Leu Ser Val Phe
            580                 585                 590
Val Ile Ser Ser Leu Tyr Arg Leu Thr Leu Leu Ala Arg Val His Gln
        595                 600                 605
Leu Thr Val Asn Glu Leu Cys Met Leu Tyr Gly Leu Ser Pro Phe Asn
    610                 615                 620
Gly Lys Thr Thr Ala Ser Leu Ser Ser Gly Glu Leu Pro Arg Leu Val
625                 630                 635                 640
Ile Trp Leu Tyr Gln Val Thr Gln Trp Leu Thr Glu Ala Glu Ile Thr
                645                 650                 655
Thr Glu Ala Ile Trp Leu Leu Cys Thr Pro Glu Phe Ser Gly Asn Ile
            660                 665                 670
Ser Pro Glu Ile Ser Asn Leu Leu Asn Asn Leu Arg Pro Ser Ile Ser
        675                 680                 685
Glu Asp Met Ala Gln Ser His Asn Arg Glu Leu Gln Ala Glu Ile Leu
    690                 695                 700
Ala Pro Phe Ile Ala Ala Thr Leu His Leu Ala Ser Pro Asp Met Ala
705                 710                 715                 720
Arg Tyr Ile Leu Leu Trp Thr Asp Asn Leu Arg Pro Gly Gly Leu Asp
                725                 730                 735
Ile Ala Gly Phe Met Thr Leu Val Leu Lys Glu Ser Leu Asn Ala Asn
            740                 745                 750
Glu Thr Thr Gln Leu Val Gln Phe Cys His Val Met Ala Gln Leu Ser
        755                 760                 765
Leu Ser Val Gln Thr Leu Arg Leu Ser Glu Ala Glu Leu Ser Va1 Leu
    770                 775                 780
Val Ile Ser Gly Phe Ala Val Leu Gly Ala Lys Asn Gln Pro Ala Gly
785                 790                 795                 800
Gln His Asn Ile Asp Thr Leu Phe Ser Leu Tyr Arg Phe His Gln Trp
                805                 810                 815
Ile Asn Gly Leu Gly Asn Pro Gly Ser Asp Thr Leu Asp Met Leu Arg
            820                 825                 830
Gln Gln Thr Leu Thr Ala Asp Arg Leu Ala Ser Val Met Gly Leu Asp
        835                 840                 845
Ile Ser Met Val Thr Gln Ala Met Val Ser Ala Gly Val Asn Gln Leu
    850                 855                 860
Gln Cys Trp Gln Asp Ile Asn Thr Val Leu Gln Trp Ile Asp Val Ala
865                 870                 875                 880
Ser Ala Leu His Thr Met Pro Ser Val Ile Arg Thr Leu Val Asn Ile
                885                 890                 895
Arg Tyr Val Thr Ala Leu Asn Lys Ala Glu Ser Asn Leu Pro Ser Trp
            900                 905                 910
Asp Glu Trp Gln Thr Leu Ala Glu Asn Met Glu Ala Gly Leu Ser Thr
        915                 920                 925
Gln Gln Ala Gln Thr Leu Ala Asp Tyr Thr Ala Glu Arg Leu Ser Ser
    930                 935                 940
Val Leu Cys Asn Trp Phe Leu Ala Asn Ile Gln Pro Glu Gly Val Ser
945                 950                 955                 960
Leu His Ser Arg Asp Asp Leu Tyr Ser Tyr Phe Leu Ile Asp Asn Gln
                965                 970                 975
Val Ser Ser Ala Ile Lys Thr Thr Arg Leu Ala Glu Ala Ile Ala Gly
            980                 985                 990
Ile Gln Leu Tyr Ile Asn Arg Ala Leu Asn Arg Ile Glu Pro Asn Ala
        995                 1000                1005
Arg Ala Asp Val Ser Thr Arg Gln Phe Phe Thr Asp Trp Thr Val
    1010                1015                1020
Asn Asn Arg Tyr Ser Thr Trp Gly Gly Val Ser Arg Leu Val Tyr
    1025                1030                1035
Tyr Pro Glu Asn Tyr Ile Asp Pro Thr Gln Arg Ile Gly Gln Thr
    1040                1045                1050
Arg Met Met Asp Glu Leu Leu Glu Asn Ile Ser Gln Ser Lys Leu
    1055                1060                1065
Ser Arg Asp Thr Val Glu Asp Ala Phe Lys Thr Tyr Leu Thr Arg
   1070                 1075                1080
Phe Glu Thr Val Ala Asp Leu Lys Val Val Ser Ala Tyr His Asp
    1085                1090                1095
Asn Val Asn Ser Asn Thr Gly Leu Thr Trp Phe Val Gly Gln Thr
    1100                1105                1110
Arg Glu Asn Leu Pro Glu Tyr Tyr Trp Arg Asn Val Asp Ile Ser
    1115                1120                1125
Arg Met Gln Ala Gly Glu Leu Ala Ala Asn Ala Trp Lys Glu Trp
    1130                1135                1140
Thr Lys Ile Asp Thr Ala Va1 Asn Pro Tyr Lys Asp Ala Ile Arg
    1145                1150                1155
Pro Val Ile Phe Arg Glu Arg Leu His Leu Ile Trp Val Glu Lys
    1160                1165                1170
Glu Glu Val Ala Lys Asn Gly Thr Asp Pro Val Glu Thr Tyr Asp
    1175                1180                1185
Arg Phe Thr Leu Lys Leu Ala Phe Leu Arg His Asp Gly Ser Trp
    1190                1195                1200
Ser Ala Pro Trp Ser Tyr Asp Ile Thr Thr Gln Val Glu Ala Val
    1205                1210                1215
Thr Asp Lys Lys Pro Asp Thr Glu Arg Leu Ala Leu Ala Ala Ser
    1220                1225                1230
Gly Phe Gln Gly Glu Asp Thr Leu Leu Val Phe Val Tyr Lys Thr
    1235                1240                1245
Gly Lys Ser Tyr Ser Asp Phe Gly Gly Ser Asn Lys Asn Val Ala
    1250                1255                1260
Gly Met Thr Ile Tyr Gly Asp Gly Ser Phe Lys Lys Met Glu Asn
    1265                1270                1275
Thr Ala Leu Ser Arg Tyr Ser Gln Leu Lys Asn Thr Phe Asp Ile
    1280                1285                1290
Ile His Thr Gln Gly Asn Asp Leu Val Arg Lys Ala Ser Tyr Arg
    1295                1300                1305
Phe Ala Gln Asp Phe Glu Val Pro Ala Ser Leu Asn Met Gly Ser
    1310                1315                1320
Ala Ile Gly Asp Asp Ser Leu Thr Val Met Glu Asn Gly Asn Ile
    1325                1330                1335
Pro Gln Ile Thr Ser Lys Tyr Ser Ser Asp Asn Leu Ala Ile Thr
    1340                1345                1350
Leu His Asn Ala Ala Phe Thr Val Arg Tyr Asp Gly Ser Gly Asn
    1355                l360                1365
Val Ile Arg Asn Lys Gln Ile Ser Ala Met Lys Leu Thr Gly Val
    1370                1375                1380
Asp Gly Lys Ser Gln Tyr Gly Asn Ala Phe Ile Ile Ala Asn Thr
    1385                1390                1395
Val Lys His Tyr Gly Gly Tyr Ser Asp Leu Gly Gly Pro Ile Thr
    1400                1405                1410
Val Tyr Asn Lys Thr Lys Asn Tyr Ile Ala Ser Val Gln Gly His
    1415                1420                1425
Leu Met Asn Ala Asp Tyr Thr Arg Arg Leu Ile Leu Thr Pro Val
    1430                1435                1440
Glu Asn Asn Tyr Tyr Ala Arg Leu Phe Glu Phe Pro Phe Ser Pro
    1445                1450                1455
Asn Thr Ile Leu Asn Thr Val Phe Thr Val Gly Ser Asn Lys Thr
    1460                1465                1470
Ser Asp Phe Lys Lys Cys Ser Tyr Ala Val Asp Gly Asn Asn Ser
    1475                1480                1485
Gln Gly Phe Gln Ile Phe Ser Ser Tyr Gln Ser Ser Gly Trp Leu
    1490                1495                1500
Asp Ile Asp Thr Gly Ile Asn Asn Thr Asp Ile Lys Ile Thr Val
    1505                1510                1515
Met Ala Gly Ser Lys Thr His Thr Phe Thr Ala Ser Asp His Ile
    1520                1525                1530
Ala Ser Leu Pro Ala Asn Ser Phe Asp Ala Met Pro Tyr Thr Phe
    1535                1540                1545
Lys Pro Leu Glu Ile Asp Ala Ser Ser Leu Ala Phe Thr Asn Asn
    1550                1555                1560
Ile Ala Pro Leu Asp Ile Val Phe Glu Thr Lys Ala Lys Asp Gly
    1565                1570                1575
Arg Val Leu Gly Lys Ile Lys Gln Thr Leu Ser Val Lys Arg Val
    1580                1585                1590
Asn Tyr Asn Pro Glu Asp Ile Leu Phe Leu Arg Glu ThrHis Ser
    1595                1600                1605
Gly Ala Gln Tyr Met Gln Leu Gly Val Tyr Arg Ile ArgLeu Asn
    1610                1615                1620
Thr Leu Leu Ala Ser Gln Leu Val Ser Arg Ala Asn Thr Gly Ile
    1625                1630                1635
Asp Thr Ile Leu Thr Met Glu Thr Gln Arg Leu Pro Glu Pro Pro
    1640                1645                1650
Leu Gly Glu Gly Phe Phe Ala Asn Phe Val Leu Pro Lys Tyr Asp
    1655                1660                1665
Pro Ala Glu His Gly Asp Glu Arg Trp Phe Lys Ile His Ile Gly
    1670                1675                1680
Asn Val Gly Gly Asn Thr Gly Arg Gln Pro Tyr Tyr Ser Gly Met
    1685                1690                1695
Leu Ser Asp Thr Ser Glu Thr Ser Met Thr Leu Phe Val Pro Tyr
    1700                1705                1710
Ala Glu Gly Tyr Tyr Met His Glu Gly Val Arg Leu Gly Val Gly
    1715                1720                1725
Tyr Gln Lys Ile Thr Tyr Asp Asn Thr Trp Glu Ser Ala Phe Phe
    1730                1735                1740
Tyr Phe Asp Glu Thr Lys Gln Gln Phe Val Leu Ile Asn Asp Ala
    1745                1750                1755
Asp His Asp Ser Gly Met Thr Gln Gln Gly Ile Val Lys Asn Ile
    1760                1765                1770
Lys Lys Tyr Lys Gly Phe Leu Asn Val Ser Ile Ala Thr Gly Tyr
    1775                1780                1785
Ser Ala Pro Met Asp Phe Asn Ser Ala Ser Ala Leu Tyr Tyr Trp
    1790                1795                1800
Glu Leu Phe Tyr Tyr Thr Pro Met Met Cys Phe Gln Arg Leu Leu
    1805                1810                1815
Gln Glu Lys Gln Phe Asp Glu Ala Thr Gln Trp Ile Asn Tyr Val
    1820                1825                1830
Tyr Asn Pro Ala Gly Tyr Ile Val Asn Gly Glu Ile Ala Pro Trp
    1835                1840                1845
Ile Trp Asn Cys Arg Pro Leu Glu GLu Thr Thr Ser Trp Asn Ala
    1850                1855                1860
Asn Pro Leu Asp Ala Ile Asp Pro Asp Ala Val Ala Gln Asn Asp
    1865                1870                1875
Pro Met His Tyr Lys Ile Ala Thr Phe Met Arg Leu Leu Asp Gln
    1880                1885                1890
Leu Ile Leu Arg Gly Asp Met Ala Tyr Arg Glu Leu Thr Arg Asp
    1895                1900                1905
Ala Leu Asn Glu Ala Lys Met Trp Tyr Val Arg Thr Leu Glu Leu
    1910                1915                1920
Leu Gly Asp Glu Pro Glu Asp Tyr Gly Ser Gln Gln Trp Ala Ala
    l925                1930                1935
Pro Ser Leu Ser Gly Ala Ala Ser Gln Thr Val Gln Ala Ala Tyr
    1940                1945                1950
Gln Gln Asp Leu Thr Met Leu Gly Arg Gly Gly Val Ser Lys Asn
    1955                1960                1965
Leu Arg Thr Ala Asn Ser Leu Val Gly Leu Phe Leu Pro Glu Tyr
    1970                1975                1980
Asn Pro Ala Leu Thr Asp Tyr Trp Gln Thr Leu Arg Leu Arg Leu
    1985                1990                1995
Phe Asn Leu Arg His Asn Leu Ser Ile Asp Gly Gln Pro Leu Ser
    2000                2005                2010
Leu Ala Ile Tyr Ala Glu Pro Thr Asp Pro Lys Ala Leu Leu Thr
    2015                2020                2025
Ser Met Val Gln Ala Ser Gln Gly Gly Ser Ala Val Leu Pro Gly
    2030                2035                2040
Thr Leu Ser Leu Tyr Arg Phe Pro Val Met Leu Glu Arg Thr Arg
    2045                2050                2055
Asn Leu Val Ala Gln Leu Thr Gln Phe Gly Thr Ser Leu Leu Ser
    2060                2065                2070
Met Ala Glu His Asp Asp Ala Asp Glu Leu Thr Thr Leu Leu Leu
    2075                2080                2085
Gln Gln Gly Met Glu Leu Ala Thr Gln Ser Ile Arg Ile Gln Gln
    2090                2095                2100
Arg Thr Val Asp Glu Val Asp Ala Asp Ile Ala Val Leu Ala Glu
    2105                2110                2115
Ser Arg Arg Ser Ala Gln Asn Arg Leu Glu Lys Tyr Gln Gln Leu
    2120                2l25                2130
Tyr Asp Glu Asp Ile Asn His Gly Glu Gln Arg Ala Met Ser Leu
    2135                2140                2145
Leu Asp Ala Ala Ala Gly Gln Ser Leu Ala Gly Gln Val Leu Ser
    2150                2155                2160
Ile Ala Glu Gly Val Ala Asp Leu Val Pro Asn Val Phe Gly Leu
    2165                2170                2175
Ala Cys Gly Gly Ser Arg Trp Gly Ala Ala Leu Arg Ala Ser Ala
    2180                2185                2190
Ser Val Met Ser Leu Ser Ala Thr Ala Ser Gln Tyr Ser Ala Asp
    2195                2200                2205
Lys Ile Ser Arg Ser Glu Ala Tyr Arg Arg Arg Arg Gln Glu Trp
    2210                2215                2220
Glu Ile Gln Arg Asp Asn Ala Asp Gly Glu Val Lys Gln Met Asp
    2225                2230                2235
Ala Gln Leu Glu Ser Leu Lys Ile Arg Arg Glu Ala Ala Gln Met
    2240                2245                2250
Gln Val Glu Tyr Gln Glu Thr Gln Gln Ala His Thr Gln Ala Gln
    2255                2260                2265
Leu Glu Leu Leu Gln Arg Lys Phe Thr Asn Lys Ala Leu Tyr Ser
    2270                2275                2280
Trp Met Arg Gly Lys Leu Ser Ala Ile Tyr Tyr Gln Phe Phe Asp
    2285                2290                2295
Leu Thr Gln Ser Phe Cys Leu Met Ala Gln Glu Ala Leu Arg Arg
    2300                2305               2310
Glu Leu Thr Asp Asn Gly Val Thr Phe Ile Arg Gly Gly Ala Trp
    2315                2320                2325
Asn Gly Thr Thr Ala Gly Leu Met Ala Gly Glu Thr Leu Leu Leu
    2330                2335                2340
Asn Leu Ala Glu Met Glu Lys Val Trp Leu Glu Arg Asp Glu Arg
    2345                2350                2355
Ala Leu Glu Val Thr Arg Thr Val Ser Leu Ala Gln Phe Tyr Gln
    2360                2365                2370
Ala Leu Ser Ser Asp Asn Phe Asn Leu Thr Glu Lys Leu Thr Gln
    2375                2380                2385
Phe Leu Arg Glu Gly Lys Gly Asn Val Gly Ala Ser Gly Asn Glu
    2390                2395                2400
Leu Lys Leu Ser Asn Arg Gln Ile Glu Ala Ser Val Arg Leu Ser
    2405                2410                2415
Asp Leu Lys Ile Phe Ser Asp Tyr Pro Glu Ser Leu Gly Asn Thr
    2420                2425                2430
Arg Gln Leu Lys Gln Val Ser Va1 Thr Leu Pro Ala Leu Val Gly
    2435                2440                2445
Pro Tyr Glu Asp Ile Arg Ala Val Leu Asn Tyr Gly Gly Ser Ile
    2450                2455                2460
Val Met Pro Arg Gly Cys Ser Ala Ile Ala Leu Ser His Gly Val
    2465                2470                2475
Asn Asp Ser Gly Gln Phe Met Leu Asp Phe Asn Asp Ser Arg Tyr
    2480                2485                2490
Leu Pro Phe Glu Gly Ile Ser Val Asn Asp Ser Gly Ser Leu Thr
    2495                2500                2505
Leu Ser Phe Pro Asp Ala Thr Asp Arg Gln Lys Ala Leu Leu Glu
    2510                2515                2520
Ser Leu Ser Asp Ile Ile Leu His Ile Arg Tyr Thr Ile Arg Ser
    2525                2530                2535

Claims (24)

1.筛选类芽孢杆菌(paenibacillus)分离株培养物用于编码选自对鳞翅目害虫有毒性的Cry蛋白及毒素复合体蛋白的基因的方法,其中所述方法包括至少一个以下步骤:
(a)自所述培养物获得DNA并分析所述DNA中所述基因的存在;及
(b)获得由所述培养物产生的蛋白质并分析所述蛋白质是否存在表明在所述分离株中存在所述基因的蛋白质。
2.筛选类芽孢杆菌分离株培养物抗鳞翅目害虫的具有毒素活性蛋白质的方法,其中所述方法包括至少一个以下步骤:
(a)获得由所述培养物产生的培养液并分析所述培养液抗鳞翅目害虫的毒素活性;及
(b)将多种所述分离株喂饲鳞翅目害虫,并观察毒素对所述害虫的作用。
3.权利要求1的方法,其中所述方法包括筛选一群类芽孢杆菌分离株的所述蛋白质,且所述分离株在所述群体中。
4.权利要求1的方法,其中所述蛋白质为毒素复合体蛋白。
5.权利要求4的方法,其中所述蛋白质增强毒素复合体毒素蛋白质的活性。
6.权利要求1的方法,其中所述蛋白质为对鳞翅目害虫有毒性的Cry蛋白。
7.权利要求1的方法,其中自所述培养物获得DNA的所述步骤包括产生来自所述DNA的克隆文库并分析至少一个所述克隆是否存在所述基因。
8.权利要求7的方法,其中用于分析所述克隆存在所述多核苷酸的所述步骤包括分析所述克隆对鳞翅目的毒素活性,由此表明存在所述多核苷酸。
9.权利要求1的方法,其中分析所述DNA的所述步骤包括用至少一个引物进行聚合酶链反应,其中所述引物设计为用以表明存在所述基因。
10.权利要求1的方法,其中分析所述蛋白质的所述步骤包括将抗体与所述蛋白质进行免疫反应,其中所述抗体设计为用以表明存在所述蛋白质。
11.权利要求1的方法,其中分析所述DNA的所述步骤包括将核酸探针与所述DNA杂交,其中所述探针设计为用以表明存在所述基因。
12.具有抗昆虫害虫毒素活性的经分离蛋白质,其中所述蛋白质由这样的多核苷酸序列编码,所述多核苷酸序列与选自SEQ ID NO:2,4,6,8,10,12,14,32,34,35,38及40的序列互补物杂交。
13.权利要求12的蛋白质,其中所述蛋白质为Cry蛋白,且所述探针为SEQ ID NO:14的互补物。
14.权利要求12的蛋白质,其中所述蛋白质为毒素复合体蛋白,且所述探针为选自SEQ ID NO:2,4,6,8,10,12,32,34,35,38及40的序列的互补物。
15.根据权利要求12所述蛋白质的免疫反应性片段。
16.经分离多核苷酸,其编码根据权利要求12所述的蛋白质。
17.细胞,其包含根据权利要求16所述的多核苷酸。
18.根据权利要求17所述的细胞,其中所述细胞选自植物细胞及微生物细胞。
19.控制昆虫害虫的方法,其中所述方法包括将所述害虫与蛋白质接触的步骤,其中所述蛋白质包含选自SEQ ID NO:3,5,7,9,11,13,15,18,19,33,36,37,39及41的氨基酸序列。
20.权利要求1的方法,其中所述类芽孢杆菌分离株为选自蜂类芽孢杆菌(P.apiarius)、软骨素类芽孢杆菌(P.chondroitinus)、解藻酸类芽孢杆菌(P.alginolyticus)、幼虫类芽孢杆菌(P.larvae)、强壮类芽孢杆菌(P.validus)、戈氏类芽孢杆菌(P.gordonae)、蜂房类芽孢杆菌(P.alvei)、缓病类芽孢杆菌(P.lentinnorbus)、日本甲虫类芽孢杆菌(P.popilliae)、解硫胺素类芽孢杆菌(P.thiaminolyticus)、解菌多糖类芽孢杆菌(P.curdlanolyticus)、神户类芽孢杆菌(P.kobensis)、解糖类芽孢杆菌(P.glucanolyticus)、灿烂类芽孢杆菌(P.lautus)、千叶类芽孢杆菌(P.chibensis)、马阔里类芽孢杆菌(P.macquariensis)、固氮类芽孢杆菌(P.azotofixans)、皮奥利亚类芽孢杆菌(P.peoriae)、多粘类芽孢杆菌(P.polymyxa)、依利诺斯类芽孢杆菌(P.illinoisensis)、解淀粉类芽孢杆菌(P.amylolyticus)、饲料类芽孢杆菌(P.pabuli)及浸麻类芽孢杆菌(P.macerans)的种。
21.权利要求11的方法,其中所述探针衍生自选自tcaA、tcaB、tcaC、tcbA、tccA、tccB、tccC、tcdA、tcdB、xptA1、xptD1、xptB1、xptC1、xptA2、sepA、sepB及sepC的基因。
22.权利要求9的方法,其中所述引物衍生自选自tcaA、tcaB、tcaC、tcbA、tccA、tccB、tccC、tcdA、tcdB、xptA1、xptD1、xptB1、xptC1、xptA2、sepA、sepB及sepC的基因。
23.权利要求9的方法,其中所述引物选自SEQ ID NO:22,23,24,25,26,27,28,29,30及31。
24.类芽孢杆菌菌株的生物学纯的培养物,其中所述类芽孢杆菌菌株选自DAS1529(可获自NRRL B-30599)及DB482(可获自NRRL B-30670)。
CNA038153378A 2002-06-28 2003-06-27 可获自类芽孢杆菌种的杀虫活性蛋白质及多核苷酸 Pending CN1684974A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US39263302P 2002-06-28 2002-06-28
US60/392,633 2002-06-28
US44164703P 2003-01-21 2003-01-21
US60/441,647 2003-01-21

Publications (1)

Publication Number Publication Date
CN1684974A true CN1684974A (zh) 2005-10-19

Family

ID=30003267

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA038153378A Pending CN1684974A (zh) 2002-06-28 2003-06-27 可获自类芽孢杆菌种的杀虫活性蛋白质及多核苷酸

Country Status (11)

Country Link
US (2) US20040110184A1 (zh)
EP (2) EP1532165B1 (zh)
JP (1) JP2005536198A (zh)
CN (1) CN1684974A (zh)
AT (1) ATE405581T1 (zh)
AU (1) AU2003247650A1 (zh)
BR (1) BR0312448A (zh)
CA (1) CA2486543A1 (zh)
DE (1) DE60323103D1 (zh)
ES (1) ES2311731T3 (zh)
WO (1) WO2004002223A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110257269A (zh) * 2018-03-12 2019-09-20 屏东科技大学 一种产细菌素的类芽孢杆菌及其应用
CN110786293A (zh) * 2019-11-01 2020-02-14 中国人民解放军陆军军医大学 能够导致斯氏按蚊传疟能力增强的生物杀虫剂及使用方法
CN114292799A (zh) * 2015-03-26 2022-04-08 拜耳作物科学有限合伙公司 新型类芽孢杆菌属菌株、抗真菌化合物以及它们的使用方法
CN114828880A (zh) * 2019-09-18 2022-07-29 达兰动物保健有限公司 蜜蜂疫苗和使用方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7491698B2 (en) 2003-01-21 2009-02-17 Dow Agrosciences Llc Mixing and matching TC proteins for pest control
CA2558656A1 (en) 2004-03-02 2005-09-15 Dow Agrosciences Llc Insecticidal toxin complex fusion proteins
BRPI0603879B1 (pt) * 2006-08-29 2018-02-06 Empresa Brasileira De Pesquisa Agropecuária - Embrapa COMPOSIÇÃO BASEADA EM BACILLUS spp. E GÊNEROS CORRELATOS E SEU USO NO CONTROLE DE PRAGAS
AR091910A1 (es) * 2012-07-26 2015-03-11 Pioneer Hi Bred Int Proteinas insecticidas y metodos de uso
US9475847B2 (en) 2012-07-26 2016-10-25 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
EA037469B1 (ru) * 2015-08-27 2021-03-31 Монсанто Текнолоджи Ллс Новые белки, проявляющие ингибирующую активность по отношению к насекомым
CN110618281B (zh) * 2019-09-10 2022-09-27 沈阳农业大学 一种昆虫体内生物素含量测定方法
EP4334457A1 (en) * 2021-05-06 2024-03-13 Agbiome, Inc. Pesticidal genes and methods of use
US12385050B1 (en) 2024-05-07 2025-08-12 United Arab Emirates University Heat resistant biopesticide and a method of preparing the same

Family Cites Families (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4762785A (en) 1982-08-12 1988-08-09 Calgene, Inc. Novel method and compositions for introducting alien DNA in vivo
EP0116718B2 (en) 1983-01-13 1996-05-08 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Process for the introduction of expressible genes into plant cell genomes and agrobacterium strains carrying hybrid Ti plasmid vectors useful for this process
EP0131624B1 (en) 1983-01-17 1992-09-16 Monsanto Company Plasmids for transforming plant cells
NL8300699A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; werkwijze voor het produceren van agrobacterium tumefaciens bacterien; stabiele cointegraat plasmiden; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US5567600A (en) 1983-09-26 1996-10-22 Mycogen Plant Sciences, Inc. Synthetic insecticidal crystal protein gene
NL8401048A (nl) 1984-04-03 1985-11-01 Rijksuniversiteit Leiden En Pr Werkwijze voor het inbouwen van vreemd dna in het genoom van eenzaadlobbige planten.
US5231019A (en) 1984-05-11 1993-07-27 Ciba-Geigy Corporation Transformation of hereditary material of plants
US5149645A (en) 1984-06-04 1992-09-22 Rijksuniversiteit Leiden Process for introducing foreign DNA into the genome of plants
NL8401780A (nl) 1984-06-04 1986-01-02 Rijksuniversiteit Leiden En Pr Werkwijze voor het inbouwen van vreemd dna in het genoom van planten.
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US4695455A (en) 1985-01-22 1987-09-22 Mycogen Corporation Cellular encapsulation of pesticides produced by expression of heterologous genes
US4695462A (en) 1985-06-28 1987-09-22 Mycogen Corporation Cellular encapsulation of biological pesticides
CA1288073C (en) 1985-03-07 1991-08-27 Paul G. Ahlquist Rna transformation vector
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US5569597A (en) 1985-05-13 1996-10-29 Ciba Geigy Corp. Methods of inserting viral DNA into plant material
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
AU7360087A (en) 1986-04-30 1987-11-24 Boyce Thompson Institute For Plant Research Inc. Electric field mediated dna transformation of plant cells and organelles
US5188958A (en) 1986-05-29 1993-02-23 Calgene, Inc. Transformation and foreign gene expression in brassica species
US5177010A (en) 1986-06-30 1993-01-05 University Of Toledo Process for transforming corn and the products thereof
EP0267159A3 (de) 1986-11-07 1990-05-02 Ciba-Geigy Ag Verfahren zur genetischen Modifikation monokotyler Pflanzen
SE455438B (sv) 1986-11-24 1988-07-11 Aga Ab Sett att senka en brennares flamtemperatur samt brennare med munstycken for oxygen resp brensle
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
ES2121803T3 (es) 1987-05-20 1998-12-16 Novartis Ag Plantas de zea mays y plantas transgenicas de zea mays generadas a partir de protoplastos o celulas derivadas de protoplastos.
US5316931A (en) 1988-02-26 1994-05-31 Biosource Genetics Corp. Plant viral vectors having heterologous subgenomic promoters for systemic expression of foreign genes
US5674485A (en) 1988-11-01 1997-10-07 The Regents Of The University Of California Insect diagnostic and control compositions with truncated JHE
US5135867A (en) 1988-11-01 1992-08-04 Mycogen Corporation Gene encoding a lepidopteran-active toxin from Bacillus thuringiensis isolate denoted B.t. .PS81GG active against lepidopteran pests
ATE206462T1 (de) 1989-02-24 2001-10-15 Monsanto Technology Llc Synthetische pflanzengene und verfahren zu ihrer herstellung
US5908970A (en) 1989-05-31 1999-06-01 Plant Genetic Systems N.V. Recombinant plant expressing non-competitively binding Bt insecticidal crystal proteins
EP0400246A1 (en) 1989-05-31 1990-12-05 Plant Genetic Systems, N.V. Prevention of Bt resistance development
US5302523A (en) 1989-06-21 1994-04-12 Zeneca Limited Transformation of plant cells
US5141131A (en) 1989-06-30 1992-08-25 Dowelanco Method and apparatus for the acceleration of a propellable matter
ES2260886T3 (es) 1990-11-23 2006-11-01 Bayer Bioscience N.V. Procedimiento para transformar plantas monocotiledoneas.
US5384253A (en) 1990-12-28 1995-01-24 Dekalb Genetics Corporation Genetic transformation of maize cells by electroporation of cells pretreated with pectin degrading enzymes
ATE244259T1 (de) 1992-02-12 2003-07-15 Chromagen Inc Verwendungen von fluoreszierenden n-nukleosiden und dessen analogen
US5712248A (en) * 1992-02-27 1998-01-27 Sandoz Ltd. Method of controlling insect with novel insecticidal protein
US5679558A (en) 1992-04-15 1997-10-21 Plant Genetic Systems, N.V. Transformation of monocot cells
IL105772A (en) 1992-06-01 1998-07-15 Univ Florida Methods and materials for pest control
US5591616A (en) 1992-07-07 1997-01-07 Japan Tobacco, Inc. Method for transforming monocotyledons
ATE290083T1 (de) 1993-03-25 2005-03-15 Syngenta Participations Ag Pestizid-proteine und stämme
US5469976A (en) 1993-04-30 1995-11-28 Burchell; James R. Shelf allocation and management system
US6528484B1 (en) * 1993-05-18 2003-03-04 Wisconsin Alumni Research Foundation Insecticidal protein toxins from Photorhabdus
EP0627752B1 (en) 1993-06-04 1997-07-23 CAVIS S.r.l. An inertia device for interrupting the electrical circuit of a vehicle with an internal combustion engine
JPH09500264A (ja) 1993-06-25 1997-01-14 コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガニゼーション Xenorhabdus nematophilusの毒性遺伝子
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
DE69638032D1 (de) 1995-10-13 2009-11-05 Dow Agrosciences Llc Modifiziertes bacillus thuringiensis gen zur kontrolle von lepidoptera in pflanzen
PL186242B1 (pl) * 1995-11-06 2003-12-31 Wisconsin Alumni Res Found Polinukleotyd kodujący zrekombinowane białko i zrekombinowane białko o aktywności toksycznej przeciwko szkodliwym owadom
US6083499A (en) 1996-04-19 2000-07-04 Mycogen Corporation Pesticidal toxins
GB9618083D0 (en) 1996-08-29 1996-10-09 Mini Agriculture & Fisheries Pesticidal agents
AU2829997A (en) 1996-08-29 1998-03-19 Dowelanco Insecticidal protein toxins from (photorhabdus)
US6110668A (en) * 1996-10-07 2000-08-29 Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. Gene synthesis method
CA2267996A1 (en) 1996-10-30 1998-05-07 Mycogen Corporation Novel pesticidal toxins and nucleotide sequences which encode these toxins
US6242669B1 (en) 1996-10-30 2001-06-05 Mycogen Corporation Pesticidal toxins and nucleotide sequences which encode these toxins
CN1137137C (zh) 1997-05-05 2004-02-04 道农业科学公司 来自致病杆菌的杀昆虫蛋白毒素
AUPO808897A0 (en) 1997-07-17 1997-08-14 Commonwealth Scientific And Industrial Research Organisation Toxin genes from the bacteria xenorhabdus nematophilus and photohabdus luminescens
US6218188B1 (en) 1997-11-12 2001-04-17 Mycogen Corporation Plant-optimized genes encoding pesticidal toxins
US6281413B1 (en) 1998-02-20 2001-08-28 Syngenta Participations Ag Insecticidal toxins from Photorhabdus luminescens and nucleic acid sequences coding therefor
WO1999042589A2 (en) 1998-02-20 1999-08-26 Novartis Pharma Ag. Insecticidal toxins from photorhabdus
US6174860B1 (en) 1999-04-16 2001-01-16 Novartis Ag Insecticidal toxins and nucleic acid sequences coding therefor
KR100649909B1 (ko) 1998-04-21 2006-11-27 신젠타 파티서페이션즈 아게 제노르하브두스 네마토필러스로부터의 신규한 살충 독소, 이를 암호화하는 핵산 서열 및 이의 생산 방법
GB9825418D0 (en) 1998-11-19 1999-01-13 Horticulture Res Int Insecticidal agents
GB9901499D0 (en) 1999-01-22 1999-03-17 Horticulture Res Int Biological control
AR025097A1 (es) 1999-08-11 2002-11-06 Dow Agrosciences Llc Plantas transgenicas expresando la toxina photorhabdus
US6639129B2 (en) 2000-03-24 2003-10-28 Wisconsin Alumni Research Foundation DNA sequences from photorhabdus luminescens

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114292799A (zh) * 2015-03-26 2022-04-08 拜耳作物科学有限合伙公司 新型类芽孢杆菌属菌株、抗真菌化合物以及它们的使用方法
CN110257269A (zh) * 2018-03-12 2019-09-20 屏东科技大学 一种产细菌素的类芽孢杆菌及其应用
CN110257269B (zh) * 2018-03-12 2022-11-25 屏东科技大学 一种产细菌素的类芽孢杆菌及其应用
CN114828880A (zh) * 2019-09-18 2022-07-29 达兰动物保健有限公司 蜜蜂疫苗和使用方法
CN110786293A (zh) * 2019-11-01 2020-02-14 中国人民解放军陆军军医大学 能够导致斯氏按蚊传疟能力增强的生物杀虫剂及使用方法

Also Published As

Publication number Publication date
EP1532165A2 (en) 2005-05-25
EP1532165B1 (en) 2008-08-20
US20040110184A1 (en) 2004-06-10
DE60323103D1 (de) 2008-10-02
EP2019115A2 (en) 2009-01-28
CA2486543A1 (en) 2004-01-08
AU2003247650A1 (en) 2004-01-19
WO2004002223A3 (en) 2004-11-04
US20080019914A1 (en) 2008-01-24
BR0312448A (pt) 2005-10-18
ES2311731T3 (es) 2009-02-16
JP2005536198A (ja) 2005-12-02
ATE405581T1 (de) 2008-09-15
US7902334B2 (en) 2011-03-08
EP2019115A3 (en) 2009-07-08
EP1532165A4 (en) 2006-05-17
WO2004002223A2 (en) 2004-01-08

Similar Documents

Publication Publication Date Title
US7902334B2 (en) Pesticidally active proteins and polynucleotides obtainable from Paenibacillus species
CN1751125A (zh) 混合并匹配tc蛋白质用于病虫害防治
CN1026497C (zh) 昆虫抗性植物
CN1849397A (zh) 苏云金芽孢杆菌分泌的杀虫蛋白及其应用
CN1296482C (zh) 杀虫毒素和编码这些毒素的核苷酸序列
CN1414973A (zh) 苏云金芽孢杆菌(bacillus thur_ingiensis)的杀虫蛋白
CN1119877A (zh) 新杀虫蛋白和菌株
CN1639338A (zh) 修饰的Cry3A毒素及编码它的核酸序列
CN1408023A (zh) 杀虫蛋白
CN1270497A (zh) 来源于嗜线虫致病杆菌细菌和发光光杆状菌细菌的毒素基因
JP2001502919A (ja) 新規殺虫性毒素およびこれらの毒素をコードする塩基配列
CN1250743C (zh) 测定核酸碱基序列的方法
CN1261572C (zh) 来源于侧孢芽孢杆菌菌株的杀虫毒素与基因
US7071386B2 (en) Xenorhabdus TC gene for pest control
CN1918296A (zh) 来自伯氏致病杆菌的毒素复合物蛋白和基因
CN1084565A (zh) 具有腈水合酶活性的新型蛋白和编码该蛋白的基因
CN1305528A (zh) 控制鞘翅目害虫的苏云金芽孢杆菌毒素和基因
CN1610744A (zh) 胃蛋白酶敏感经过修饰的苏云金芽孢杆菌杀虫毒素
CN1950395A (zh) 杀虫毒素复合体融合蛋白
CN1261569C (zh) 对大肠杆菌o145型的o-抗原特异的核苷酸
CN1257279C (zh) 对大肠杆菌o163的o-抗原特异的核苷酸
JP2025023671A (ja) Bst DNAポリメラーゼ、試薬組成物及び核酸増幅方法
CN1256433C (zh) 对大肠杆菌o36的o-抗原特异的核苷酸
CN1553956A (zh) 来自棉桃阿舒氏囊霉的与跨膜转运相关的新基因产物
JP2002335967A (ja) 新規な細菌、殺虫性タンパク質をコードする遺伝子及びタンパク質

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20051019