CN1684974A - 可获自类芽孢杆菌种的杀虫活性蛋白质及多核苷酸 - Google Patents
可获自类芽孢杆菌种的杀虫活性蛋白质及多核苷酸 Download PDFInfo
- Publication number
- CN1684974A CN1684974A CNA038153378A CN03815337A CN1684974A CN 1684974 A CN1684974 A CN 1684974A CN A038153378 A CNA038153378 A CN A038153378A CN 03815337 A CN03815337 A CN 03815337A CN 1684974 A CN1684974 A CN 1684974A
- Authority
- CN
- China
- Prior art keywords
- protein
- paenibacillus
- toxin
- gene
- dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/689—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/142—Toxicological screening, e.g. expression profiles which identify toxicity
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本主题发明提供了用于害虫控制的独特生物学备选物。更具体地,本发明涉及新杀虫蛋白质、杀虫蛋白质的新来源、编码此类毒素的多核苷酸及涉及用这些毒素控制昆虫及其它植物害虫的方法。本主题发明涉及类芽孢杆菌种及来自它的蛋白质对鳞翅目有毒性的令人惊讶的发现。类芽孢杆菌种、菌株或蛋白质对鳞翅目有毒性还未见已知报导。这也是第一个已知的对鳞翅目有毒性的类芽孢杆菌Cry蛋白质的实例。此外,这是类芽孢杆菌具有毒性复合体(TC)样蛋白质的首次已知报导。此处公开的DAS1529分离株也是产生Cry毒素及TC蛋白质这两者的天然细菌的首个已知实例。本发明也涉及新类型的具有杀虫活性的Cry及TC蛋白质。
Description
相关申请的交互参照
本申请要求2002年6月28日申请的临时申请序列号60/392,633及2003年1月21日申请的临时申请序列号60/441,647的优先权。
发明背景
昆虫和其它害虫在农作物损失及在控制这些害虫的花费上使农民每年损失数十亿美圆。虫害在农业生产环境中引起的损失包括农作物产量下降、农作物质量降低及收获成本升高。虫害也是菜农和果农的负担,也是观赏花的生产者及家庭园丁及家庭物主的负担。
耕作方法,如轮作法及应用高水平氮肥,部分解决了农业害虫引起的问题。然而,应用农田的经济需求限制了轮作法的应用。此外,一些昆虫的越冬特性破坏了在一些地区运用轮作法。
因此,最大程度依赖合成化学杀虫剂以达到足够水平的控制。然而,应用合成化学杀虫剂有几个缺点。例如,应用这些化学剂中的一些可对许多有益昆虫造成有害影响。靶昆虫对一些化学杀虫剂也发展了抗性。这已通过多种抵抗管理策略得到部分减轻,但对备选害虫控制剂有增加的需求。而且,非常多的幼虫、大雨及杀虫应用设备的标度不适当可导致控制失败。不适当应用杀虫剂引起环境忧虑如污染土壤及地表和地下供水系统。残留物也存在于经处理的水果、蔬菜及其它经处理植物上。操作一些杀虫剂也可对应用杀虫剂的人造成危害。因此,合成化学杀虫剂由于它们的潜在毒性环境后果受到越来越多的仔细审查。应用杀虫剂的严格新限制及从市场上去除一些有效杀虫剂对控制损害及费用大的害虫可对经济的和有效的选择产生限制。
由于与应用合成化学杀虫剂相关的问题,明确需要限制这些试剂的应用及需要确定备选控制剂。替代合成化学杀虫剂或将这些试剂与生物学杀虫剂组合可降低环境中毒性化学剂的水平。
现在正在应用的,已取得一些成功的一些生物学杀虫剂来源自土壤微生物苏云金芽孢杆菌(Bacillus thuringiensis)(B.t.)。土壤微生物苏云金芽孢杆菌(B.t.)为革兰氏阳性的产孢子细菌。B.t.的大多数菌株不表现杀虫活性。一些B.t.菌株产生并以形成伴胞晶体蛋白质包含体为特征。这些包含体在显微镜下常常呈现为特定形状的晶体。一些B.t.蛋白质对害虫如昆虫有高度毒性,并且它们的毒性活性是特异的。某些杀虫B.t.蛋白质与包含体相关。这些 “δ-内毒素”与有非特异宿主范围的外毒素不同。其它种的芽孢杆菌也产生杀虫蛋白质。
已对某些芽孢杆菌毒素基因进行了分离并测序,并产生了基于重组DNA的产物,且已批准应用。此外,随着基因工程技术的应用,多种向农业环境中递送这些毒素的方法正在完善。这些包括将针对昆虫抗性的毒素基因进行基因改造的植物及应用经稳定的完整微生物细胞作为毒素递送载体。因此,经分离的芽孢杆菌毒素基因正成为商业上有价值的物质。
B.t.杀虫剂的商业用途最初局限于靶向鳞翅目(毛虫)害虫的狭窄范围。苏云金芽孢杆菌库尔斯塔克(Kurstaki)亚种的芽孢和晶体制剂作为对鳞翅目害虫的商品化杀虫剂已应用多年。例如苏云金芽孢杆菌库尔斯塔克HD-1变种产生对许多鳞翅目昆虫有毒性的晶体δ-内毒素。
最近,已鉴定了B.t.的新亚种,并已分离了负责活性δ-内毒素蛋白质的基因。H_fte和Whiteley将B.t.晶体蛋白质基因分为四个主要类型(H_fte,H.,H.R.Whiteley[1989] Microbiological Reviews 52(2):242-255)。所述类型为CryI(鳞翅目特异),CryII(鳞翅目及双翅目特异),CryIII(鞘翅目特异)及CryIV(双翅目特异)。已报导发现对其它害虫有特异毒性的种。例如,提议将CryV和CryVI作为线虫特异的毒素基因类型。
鳞翅目特异CryI晶体蛋白质,在它们的天然状态下,为大约130-至140-kDa的蛋白质,此蛋白质是在苏云金芽孢杆菌芽孢形成期间在双锥体晶体包含体中积累。这些蛋白质为在昆虫中肠的碱性环境中稳定的原毒素(protoxin),通过晶体相关或幼虫中肠蛋白酶的蛋白水解转换成60至70kDa的毒性核心片段。该活化也可在体外用多种蛋白酶实现。毒性结构域位于原毒素的N-末端部分。这是对CryIA(b)及CryIC蛋白质通过对经胰蛋白酶活化毒素的N-末端氨基酸序列进行测定证实的。Hofte等人,1989。切割发生在称为“第5区块(Block 5)”保守区的C-末端,因此形成核心毒素的C-末端。短的N-末端原毒素节段也可进行加工去除。N-末端切割位点对CryIA及CryID蛋白质也高度保守,表明对于这些蛋白质,毒素片段的N末端位于同一位置。然而,在这个区域,CryIB与其它CryI蛋白质不同。该蛋白质是否也在N末端进行加工是未知的。H_fte等人1989。
几种cryI基因的缺失分析进一步证实原毒素的3’部分对毒素活性是不需要的。报导的最短毒性片段之一位于CryIAb的密码子29和607之间。进一步从3’末端去除四个密码子或从5’末端去除八个密码子使基因产物的毒素活性完全丧失。对cryIA(a)及cryIA(c)基因观察到同样现象。H_fte等人,1989。
cryII基因编码几株亚种菌株中形成立方型包含体的65-kDa蛋白质。以前将这些晶体蛋白质命名为“P2”蛋白质,以与存在于同一菌株中的130-kDa Pl晶体蛋白质进行区分。H_fte等人1989。
cryIIA基因克隆自苏云金芽孢杆菌库尔斯塔克HD-263亚种并在巨大芽孢杆菌(Bacillus megaterium)中进行表达。产生CryIIA蛋白质的细胞对鳞翅目中的烟芽夜蛾(Heliothis virescens)和舞毒蛾(Lymantriadispar),并且对双翅目埃及伊蚊(Aedes aegypti)的幼虫有毒性。Widner和Whitely (1989,J.Bacteriol.171:965-974)从苏云金芽孢杆菌库尔斯塔克HD-1亚种克隆了两个相关基因(cryIIA及cryIIB)。两个基因均编码预计分子量为71kDa的633个氨基酸(比苏云金芽孢杆菌产生的P2蛋白质确定的表观分子量稍大)。虽然CryIIA和CryIIB蛋白质有高度同源性(约87%氨基酸同一性),它们在杀虫谱上不同。CryIIA对鳞翅目(烟草天蛾(Manduca Sexta))和双翅目(埃及伊蚊)物种均有活性,而cryIIB只对鳞翅目昆虫有毒性。H_fte等人,1989。将CryII毒素作为一组,在序列水平上比其它组相对更保守(>80%同一性)。相反,有很多例如,包括一些低于60%同一性的CryI毒素。
H_fte和Whiteley 1989年对晶体蛋白质的命名与分类方案均是建立在毒素的推导氨基酸序列和宿主范围的基础上。该系统编辑为涵盖分为五个主要类的14个不同型的毒素基因。由于发现越来越多的编码有多种杀虫活性谱的蛋白质基因,1989年的命名方案变的不再适用。因此,采用了只建立在氨基酸同一性基础上的经修订命名方案(Crickmore等人,1998,Microbiology and Molecular Biology Reviews 62:807-813)。除了仍为单独类型的cytA及cytB外,对于所有毒素基因保留了有助于记忆的“cry”。第一位的罗马数字换成阿拉伯数字,将第三位的括号去除。虽然对许多进行了重新分类,但除了所指出的例外外,仍保留了许多最初的名称。现在至少有37个最初类别的Cry蛋白质及两个最初类别的cyt毒素。从苏云金芽孢杆菌中也发现了其它型的毒素,如WO98/18932及WO97/40162中所述的毒素。
将芽孢杆菌(和其它生物学)杀虫蛋白质成功用于农业有一些障碍。某些昆虫对芽孢杆菌毒素的作用有抗性。昆虫如棉子象鼻虫(boll weevils)、黑切根虫(black cutworm)及谷实夜蛾(Helicoverpa zea)以及大多数物种的成虫,迄今已证实对许多B.t.-δ内毒素没有明显敏感性。
另一个潜在障碍是昆虫对B.t.毒素的抗性发展。B.t.蛋白质毒素最初作为可喷洒的昆虫控制剂进行配制。更最近B.t.技术的应用是分离编码这些毒素的基因并转化植物。随后转基因植物产生毒素,因此提供昆虫控制。参见Mycogen公司的美国专利号5,380,831;5,567,600及5,567,862。转基因B.t.植物是非常有效的并且预计在一些农作物及一些地区应用率很高。这引起一些忧虑即抗性控制问题比传统可喷雾应用增加的更快。虽然已将许多昆虫对B.t.毒素的抗性在实验室中进行了筛选,只有菱形斑纹蛾(Plutella xylostella)在田间证实有抗性(Ferre,J.和Van Rie,J.,Annu.Rev.Etitoinol.47:501-533,2002)。
转基因植物技术中的抗性控制策略极令人感兴趣(例如,如在天然细菌中,多种不同毒素可暴露在同一植物上,因此大大降低了对一种毒素有抗性的昆虫存活而散布抗性的机会)。已提议了几种用于保留有效应用苏云金芽孢杆菌毒素能力的策略。这些策略包括使用高剂量的权宜之计,以及备选或共应用不同毒素(McGaughey等人,(1998),“B.t.抗性控制”,Nature Biotechnol 16:144-146)。
因此,非常需要研发在植物中表达的其它基因以有效控制多种昆虫。除继续尝试发现新B.t.毒素外,非常希望发现能产生在用于转基因植物策略中应用的毒素或能与B.t.组合产生昆虫控制的转基因植物的其它细菌源(不同于B.t.)。
从细菌光杆状菌属/致病杆菌属(Photorhabdus/Xenorhabdus)中克隆杀虫毒素基因的最近努力提出了来自苏云金芽孢杆菌毒素的潜在备选物。细菌致病杆菌种与斯氏线虫(Steinernema)共生相关是本领域已知的。不幸地是,如在许多文章中报导的,细菌只在注射到昆虫幼虫时有杀虫活性,而经口递送时不表现生物学活性。
有效的开发线虫或其细菌共生生物的杀虫特性是困难的。因此,非常需要从有口腔活性的致病杆菌细菌中发现蛋白质因子以使产生自所述细菌的产物可作为可喷雾杀虫剂进行制备,或可将编码所述蛋白质因子的细菌基因进行分离并在产生转基因植物中应用。WO95/00647涉及用致病杆菌蛋白毒素控制昆虫,但它不为经口活性毒素。WO98/08388涉及来自致病杆菌的经口施用杀虫剂。美国专利号6,048,838涉及获得自致病杆菌种及菌株的有口腔活性的蛋白质毒素/毒素复合体。
光杆状菌及致病杆菌种是与土壤线虫在昆虫病原学上相关并为共生相关的革兰氏阴性细菌。这些细菌在侵袭并杀死昆虫的昆虫病原性线虫的肠中发现。当线虫侵袭昆虫宿主时,将细菌释放到昆虫血腔(开放循环系统)中,细菌和线虫均进行多轮复制;昆虫宿主一般死亡。这些细菌可在它们的线虫宿主外进行培养。对这些细菌的更详细的讨论,参见Forst和Nealson,60 Microbiol.Rev.1(1996),第21-43页。
将致病杆菌属分类定义为肠杆菌科成员,但它有不属于这个科的某些特性。例如,该属的菌株一般为硝酸盐还原阴性及过氧化氢酶阴性。只是最近将致病杆菌进行再分类以产生第二个属,即光杆状菌属,其中包含一种发光光杆状菌(Photorhabdus luminescens)(以前称为发光致病杆菌(Xenorhabdus luminescens))(Boemare等人,1993 Int.J.Syst.Bacteriol.43,249-255)。此差异是建立在熟练技术人员易于鉴定的几个有区别特征的基础上的。所述差异包括下列差异:DNA-DNA特征研究;过氧化氢活性的表型存在(光杆状菌)或缺失(致病杆菌);生物发光存在(光杆状菌)或缺失(致病杆菌);线虫宿主家族的不同,因为在斯氏线虫(Steinernematidae)中发现致病杆菌, 而在异小杆线虫(Heterorhabditidae)中发现光杆状菌);以及比较性进行的细胞脂肪酸分析(Janse等人,1990,Lett.Appl.Microbiol.10,131-135;Suzuki等人,1990,J.Gen.Appl.Microbiol.,36,393-401)。此外,最近集中于16S rRNA基因的序列(Rainey等人,1995,Int.J.Syst.Bacteriol.,45,379-381)及限制性分析(Brunel等人,1997,App.Environ.Micro.,63,574-580)的分子研究也支持这两个属的分开。
致病杆菌的预期性状如下:为革兰氏染色阴性的杆菌,白色至黄色/棕色菌落着色,存在包含体,不存在过氧化氢酶,不能还原硝酸盐,不存在生物发光,能从培养基中摄取染料,明胶水解阳性,在肠杆菌科选择培养基上生长,生长温度低于37℃,在厌氧条件下存活及有运动性。
现在,细菌致病杆菌属由四个公认种组成,嗜线虫致病杆菌(Xenorhabdus nematophilus),波氏致病杆菌(Xenorhabdus poinarii),博氏致病杆菌(Xenorhabdus bovienii)以及贝氏致病杆菌(Xenorhabdusbeddingii)(Brunel等人,1997,App.Environ.Micro.,63,574-580)。在文献中对多个相关菌株进行了描述(例如,Akhurst和Boemare 1988 J.Gen.Microbiol.,134,1835-1845;Boemare等人,1993 Int.J.Syst.Bacteriol.43,第249-255页;Putz等人,1990,Appl.Environ.Microbiol.,56,181-186,Brunel等人,1997,App.Environ.Micro.,63,574-580,Rainey等人,1995,Int.J.Syst.Bacteriol.,45,379-381)。
致病杆菌及光杆状菌细菌向培养基中分泌多种物质;这些分泌物包括脂酶、蛋白酶、抗生素及脂多糖。对不同蛋白酶级分的纯化清楚证实了它们与发光光杆状菌培养基(随后确定该培养基只存在Tc蛋白质)的经口毒性活性无关。这些物质中的几种以前就与昆虫毒性有关但直到最近还没有对杀虫基因进行克隆。然而,蛋白酶的纯化及分离也有助于检查它们在例如,抑制抗细菌蛋白质如杀菌肽中的推定作用。R.H.ffrench-Constant和Bowen,Current Opinions in Micriobiology,1999,12:284-288。参见R.H.ffrench-Constant等,66 AEM No.8,第3310-3329页(2000年8月),与光杆状菌昆虫毒力有关的多种因素的综述。
对编码来自发光光杆状菌及嗜线虫致病杆菌这两者的杀虫毒素基因进行克隆已取得很大进展。来自发光光杆状菌的毒素复合体编码基因最先得以检验。参见,例如WO98/08932。“平行”基因是最近从嗜线虫致病杆菌克隆的。Morgan等人,Applied and Environmental Microbiology 2001,67:2062-69。
在光杆状菌种中已鉴定四个不同的毒素复合体(TC)-Tca,Tcb,Tcc及Tcd。这些毒素复合体中每种在天然琼脂糖凝胶上可作为单体或二聚体,但在变性凝胶上的分辨率显示每种复合物由25-280kDa范围的分子组成。来自光杆状菌的编码TC的ORF以及蛋白酶切割位点(垂直箭头)在图1中显示。也参见R.H.ffrench-Constant和Bowen,57 Cell.Mol.Life Sci.828-833(2000)。
将发光光杆状菌的基因文库用DNA探针及用针对毒素的单克隆和/或多克隆抗体进行了筛选。对四个tc基因座tca,tcb,tcc及tcd进行了克隆。Tca基因座为从同一DNA链转录的三个可读框(ORF)tcaA、tcaB和tcaC,以及一个从相反方向转录的小末端ORF(tcaZ)的推定操纵子。tcc基因座也由推定从同一方向(tccA,tccB及tccC)转录的三个ORF组成。tcb基因座为一个大ORF(tcbA),且tcd基因座由两个ORF(tcdA及tcdB)组成,tcbA及tcdA,每个大约7.5kb,编码大昆虫毒素。TcdB与TcaC有一些同源性。经确定这些基因的许多产物是由蛋白酶进行切割的。例如,TcbA及TcdA均被切割成三个称为i、ii、iii(例如,TcbAi,TcbAii及TcbAiii)片段。也将tca及tcc ORF的产物进行切割。参见图1。也参见R.H.ffrench-Constant和D.J.Bowen,Current Opinions in Microbiology,1999,12:284-288。
Tca毒素复合体的生物测试显示经口服用时,它们对第一龄期烟草天蛾(tobacco hornworm)有高度毒性(LD50为每平方厘米人工饮食875ng)。R.H.ffrench-Constant和Bowen 1999。Tca剂量低至40ng/cm2停止摄食。鉴于Tca的在摩尔基础上的高预计分子量,发光光杆状菌毒素为高活性并且显示需要相对少量分子发挥毒性作用。R.H.ffrench-Constant和Bowen,Current Opinions in Micriobiology,1999,12:284-288。
显示这四个基因座无一与基因库中已知功能的任何序列具有总体上的相似性。序列相似性区域暗示这些蛋白质(TcaC及TccA)可通过攻击昆虫血细胞克服昆虫免疫力。R.H.ffrench-Constant和Bowen,CurrentOpinions in Microbiology,1999,12:284-288。
将TcaB,TcbA及TcdA进行相互比较,在它们预测的蛋白酶切割位点附近,均显示氨基酸保守性(~50%同一性)。三个不同TC蛋白质间的此保守性表明它们都可通过相同或相似的蛋白酶进行加工。TcbA和TcdA总体也有~50%的同一性,并且在羧基及氨基末端的切割中有相似的预定模式。可以推定这些蛋白质为相互的同系物。此外,TcbA及TcdA相似的大小,以及这两种毒素均显示作用于昆虫肠的事实,可表明相似的作用方式。R.H.ffrench-Constant和Bowen,Current Opinions in Microbiology,1999,12:284-288。
缺失/敲除研究表明tca及tcd基因座的产物引起了对鳞翅目的大多数口服毒性。缺失tca或tcd基因大大降低了对烟草天蛾的口服毒性。即tca及tcd基因座产物自身为口服鳞翅目毒素;它们组合作用对大部分分泌的口服活性有贡献。R.H.ffrench-Constant和D.J.Bowen,57 Cell.Mol.Life.Sci.831(2000)。令人感兴趣的是,单独缺失tcb或tcc基因座也降低死亡率,表明不同基因产物有复合相互作用。因此,tca基因座的产物可增强tcd产物的毒性。备选地,tcd产物可调节tca产物及可能其它复合物的毒性。注意以上涉及针对单一昆虫物种的口服毒性,tcb或tcc基因座可产生对其它组昆虫活性更强的毒素(或通过直接注射到昆虫血腔有活性—这是通过细菌体内分泌时递送的正常途径)。R.H.ffrench-Constant和Bowen,Current Opinions in Microbiology,1999,12:284-288。
WO01/11029公开了编码TcdA及TcbA的核苷酸序列,并且其具有对天然基因已进行改变的碱基组成以使它们与植物基因更相似。也公开了表达毒素A及毒素B的转基因植物。
在分离自发光光杆状菌(W-14)的分离毒素中,对命名为毒素A及毒素B的毒素集中研究了它们对靶目的昆虫物种(例如,玉米根虫)的活性。毒素A包含两个不同亚单位。天然基因tcdA编码原毒素TcdA。如通过质谱测定法确定的,TcdA通过一种或多种蛋白酶进行加工以提供毒素A。更具体地,TcdA为大约282.9kDa蛋白质(2516个氨基酸),所述282.9kDa蛋白质进行加工以提供TcdAi(最初的88个氨基酸),TcdAii(接下来的1849个氨基酸;由tcdA核苷酸265-5811编码的大约208.2kDa蛋白质)及大约63.5kDa(579个氨基酸)蛋白质(由tcdA核苷酸5812-7551编码)的TcdAiii。显示TcdAii及TcdAiii装配成二聚体(可能通过TcdAi的帮助),并且二聚体装配成四个二聚体的四聚体。毒素B同样来自TcbA。
由于现在对TC蛋白质相互的确切分子相互作用及它们的作用机制还不了解,例如,已知光杆状菌的Tca毒素复合体对烟草天蛾有毒性。此外,一些TC蛋白质已知有“独特”杀虫活性,其它TC蛋白质已知加强或增强独特毒素的活性。已知TcdA蛋白质单独对烟草天蛾有活性,但TcdB和TccC一起,可用于增强TcdA的活性。Waterfield,N.等人,Appl.Environ.Microbiol.2001,67:5017-5024。TcbA(只有一个Tcb蛋白质)是来自光杆状菌的另一个独特毒素。该毒素(TcbA)的活性也可通过TcdB与TccC-样蛋白质进行增强。
美国专利申请20020078478提供了来自发光光杆状菌W-14基因组区的两个增效基因tcdB2及tccC2的核苷酸序列。其中显示tcdB及tccC1与tcdA的共表达与tcdA单独表达相比,前者导致获得的口服昆虫毒性水平增强。tcdB及tccC1与tcdA或tcbA共表达提供增强的口服昆虫毒性。
如下表中显示的,TccA与TcdA的N末端有一些水平的同源性,并且TccB与TcdA的C末端有一些水平的同源性。TccA及TccB对某些受试昆虫的活性远比TcdA低。来自发光光杆状菌W-14菌株的TccA及TccB称为“毒素D”。在下面对“毒素A”(TcdA),“毒素B”(TcbA)及“毒素C”(TcaA及TcaB)也进行了显示。此外,TcaA与TccA有一些水平的同源性并同样与TcdA的N末端有一些水平的同源性。又进一步,TcaB与TccB有一些水平的同源性及同样与TcdA的N末端有一些水平的同源性。TccA及TcaA大小相似,TccB及TcaB也大小相似。TcdB与Tcac有显著水平的相似性(序列及大小均相似)。
| 光杆状菌 | 光杆状茵W14菌株命名 | 一些同源性 |
| TcaA | 毒素C | TccA |
| TcaB | TccB | |
| TcaC TcdB | ||
| TcbA 毒素B | ||
| TccA | 毒素D | TcdA N末端 |
| TccB | TcdA C末端 | |
| TccC | ||
| TcdA | 毒素A | TccA+TccB |
| TcdB TcaC | ||
昆虫中肠上皮均包含柱状(结构)及杯形(分泌)细胞。烟草天蛾摄取tca产物导致柱状细胞的细胞质囊泡顶端肿胀并起泡,导致最终囊泡内的细胞核排入肠腔。杯形细胞也明显地以同样方式受到影响。tca产物在经口递送或注射后作用于昆虫中肠。R.H.french-Constant和D.J.Bowen,Current Opinions in Microbiology,1999,12:284-288。经纯化的tca产物对烟草天蛾显示有口服毒性(LD50为875ng/cm2)。R.H.french-Constant和D.J.Bowen,57 Cell.Mol.Life Sci.828-833(2000)。
WO99/42589及美国专利号6,281,413公开了来自发光光杆状菌的TC样ORF。WO00/30453及WO00/42855公开了来自致病杆菌的TC样蛋白质。WO99/03328及WO99/54472(及美国专利号6,174,860及6,277,823)涉及来自致病杆菌和光杆状菌的其它毒素。
嗜线虫致病杆菌的近期克隆结果也显示:经确定的新杀虫毒素基因与发光光杆状菌的tc基因座有同源性。参见,例如WO98/08388及Morgan等人,Applied and Environmental Microbiology 2001,67:2062-69。R.H.ffrench-Constant和D.J.Bowen,Current Opinions in Microbiology,1999,12:284-288。粘粒克隆对另一鳞翅目菜粉蝶(Pieris brassicae)的口服毒性直接进行筛选。将口服毒性粘粒克隆进行测序。对所述粘粒的序列分析表明五个不同的ORF与光杆状菌tc基因有相似性;orf2及orf5均与tcbA及tcdA有一些水平的序列相关性,而orf1与tccB相似,orf3与tccC相似及orf4与tcaC相似。重要的是,许多这些预计的ORF也有发光光杆状菌中记录的推定切割位点,表明活性毒素也是受蛋白水解加工的。
有五个典型的致病杆菌TC蛋白质:XptA1,XptA2,XptB1,XptC1及XptD1。XptA1是“独特”毒素。XptA2是来自致病杆菌有独特毒素活性的另一TC蛋白质。对来自嗜线虫致病杆菌的序列参见GENBANK登录号AJ308438。XptB1及XptC1为可增强一种(或两种)XptA毒素活性的致病杆菌增效物。XptD1与TccB有一些水平的同源性。XptC1与TcaC有一些水平的相似性。致病杆菌的XptA2蛋白质与TcdA蛋白质有一些程度的相似性。XptB1与TccC有一些水平的相似性。
在这两种不同细菌中发现多少有些相似的毒素编码基因座,这一点对在这些毒力基因的可能来源方面是令人感兴趣的。嗜线虫致病杆菌粘粒也显示包含转座酶样序列,该序列的存在可表明这些基因座可在不同细菌菌株或种间转移。许多这样的转移事件也可解释两种不同细菌中tc操纵子的明显不同的基因组构成。此外,只有嗜线虫致病杆菌及发光光杆状菌菌株亚群显示对烟草天蛾有毒性,这表明或是不同菌株缺乏tc基因或是它们携带不同的tc基因。对这些细菌种内或种间进行菌株及毒素种系发生的详细分析有助于阐明毒素基因的可能来源及它们在不同菌群中是如何维持的。R.H.ffrench-Constant和Bowen,Current Opinions in Microbiology,1999,12:284-288。
最近对来自其它的昆虫相关细菌如昆虫病原菌嗜虫沙雷氏菌(Serratiaentomophila)的TC蛋白质及基因进行了描述。Waterfield等人,TRENDSin Microbiology,第9卷,第4期,2001年4月。
总而言之,来自发光光杆状菌及嗜线虫致病杆菌的毒素复合体蛋白质显示与以前鉴定的细菌毒素同源性较低,并对来自苏云金芽孢杆菌的毒素提供了有用的备选物。虽然它们与其他口服活性毒素对昆虫中肠有相似的毒性作用,它们确切作用方式还是模糊的。进一步的工作可阐明它们的作用机制。
虽然发现一些致病杆菌TC蛋白质与一些光杆状菌TC蛋白质“对应”(有相似功能及一些水平的序列同源性),特定的光杆状菌蛋白质与“相关”的致病杆菌蛋白质只有约40%序列同一性。这在以下四个“独特”毒素中进行了示例:
| 与P.I.W-14 TcbA的同一性 | 与P.I.W-14 TcdA的同一性 | |
| Xwi XptA1 | 44% | 46% |
| Xwi XptA2 | 41% | 41% |
(对于更完整的综述,参见,例如Morgan等人“来自嗜线虫致病杆菌PMFI296的杀虫基因的序列分析,”第67卷,Applied and EnvironmentalMicrobiology,2001年5月,第2062-2069页)。
类芽孢杆菌属(paenibacillus)细菌与其它细菌在rRNA及表型特征方面是有区别的(C.Ash等人(1993),“用PCR探针检验分子鉴定rRNA第3组芽孢杆菌(Ash,Farrow,Wallbanks和Collins):产生新类芽孢杆菌属的建议,”Antonie Van Leeuwenhoek 64:253-260)。比较16S rRNA序列分析证实芽孢杆菌属由至少五个种系组成。核糖体RNA第3组芽孢杆菌(Ash,Farrow,Wallbanks和Collins(1991),包含多粘芽孢杆菌(Bacillus polymyxa)及其相关细菌),为系统发生的,因此从枯草芽孢杆菌(Bacillus subtilis)(本属的模式种及其它需氧芽孢形成杆菌)中去除,将它们进行重新分类作为新属,即类芽孢杆菌属。
该属的一些种已知对蜜蜂(幼虫类芽孢杆菌(Paenibacillus Larvae))及金龟子甲虫蛴螬(日本甲虫类芽孢杆菌(P.popilliae)及缓病类芽孢杆菌(P.lentinnorbus))有病原性是已知的。已发现蜜蜂相关的一些其它类芽孢杆菌种,但它们是不致病的。在该属中已知至少18个其它种,包括解硫胺素类芽孢杆菌(P.thianninolyticus);它们没有已知的昆虫相关性(Shida等人,1997;Pettersson等人,1999)。金龟子(鞘翅目)是全北美的草皮、苗圃及农作物的严重害虫,并有检疫价值。参见美国农业部,农业研究机构网。
认为幼虫类芽孢杆菌(P.larvae),日本甲虫类芽孢杆菌(P.popilliae)及缓病类芽孢杆菌(P.lentimiorbus)是与金龟子甲虫的乳白病相关的专性昆虫病原(在A.Balows等人编辑的The Procaryotes,第2版,第2卷,Springer-Verlag,纽约,NY一书中,D.P.Stahly等人(1992),“芽孢杆菌属:昆虫病原,”第1697-1745页)。这三个类芽孢杆菌种特征是生长缓慢,为通过侵袭过程引起疾病的难养生物,所述侵袭过程为细菌通过中肠并在血淋巴及其它组织中增殖到高数量。对于所有三个种,已提出了在昆虫致病性中一些常见蛋白相关的指征。然而,对特定蛋白质没有证实有特定作用。Stahly等人对幼虫类芽孢杆菌作出结论即毒素相关的问题是开放的,并且(甲虫)乳白病的确切原因还是未知的。
在日本甲虫类芽孢杆菌及缓病类芽孢杆菌中鉴定了甲虫(鞘翅目)毒素Cry18。Cry18与Cry2蛋白质有约40%同一性(Zhang等人,1997;Harrison等人,2000)。而Zhang等人(1997)推测Cry18攻击中肠以利于营养细胞进入血腔,Harrison等人认为对这个作用没有直接证据并进一步声明“乳白病中多分孢子蛋白质的作用,如果有,是未知的。”J.Zhang等人(1997),“来自日本甲虫芽孢杆菌的第一个cry基因的克隆及分析”,J.Bacteriol.179:4336-4341;H.Harrison等人(2000),“中美及南美金龟子中的类芽孢杆菌相关的乳白病,”J.Invertebr.Pathol.76(3):169-175。
Stahly等人,Zhang等人及Harrison等人均指出:与苏云金芽孢杆菌晶体蛋白质对昆虫毒性作用(昆虫症状的高频率可通过特定晶体蛋白质的性质进行解释)相比较,类芽孢杆菌及乳白病(特定毒素的作用没有此类联系)的情况呈现相反的证据。
因此,虽然已知一些类芽孢杆菌种对某些鞘翅目及一些与蜜蜂相关的昆虫有致病性,迄今为止已知还未知对鳞翅目有毒性的类芽孢杆菌菌株。同样,在类芽孢杆菌中还没有报导TC蛋白质及鳞翅目毒性Cry蛋白质。
发明简述
这是首次公开对鳞翅目害虫有活性的类芽孢杆菌蛋白质毒素。一些类芽孢杆菌种已知是有杀虫性的,但它们对蛴螬/甲虫/鞘翅目有活性。没有已知对鳞翅目有毒性的类芽孢杆菌种或菌株的报导。因此,本发明总体上涉及对鳞翅目有活性的类芽孢杆菌种,并涉及从类芽孢杆菌种筛选类芽孢杆菌亚种、其对鳞翅目有活性的蛋白质及克隆文库。
更具体地,本发明最初来源于对文中称为DAS1529的新类芽孢杆菌菌株的发现。这在多种原因上是一个令人惊讶的发现。该菌株产生独特的鳞翅目毒性Cry蛋白质。该菌株以及DB482,产生独特的毒性复合物(TC)样蛋白质(与致病杆菌/光杆状菌TC有一些相似性)。高度优选类芽孢杆菌DB482分离株及获自该菌株的毒素,并且均在本发明的范围内。
这是首次报导具有TC样蛋白质的类芽孢杆菌。因此,本发明涉及对类芽孢杆菌种筛选TC样基因及蛋白质的方法。文中显示本发明的类芽孢杆菌TC蛋白质用于例如增强或加强“独特”致病杆菌毒素蛋白质的活性。迄今为止,本文鉴定的TC样基因在类芽孢杆菌属中至今为止是未知的。本发明扩宽了发现TC样基因的生物体(细菌属)的范围。因此,本发明总体上涉及获自类芽孢杆菌种的TC样蛋白质,并涉及对类芽孢杆菌种筛选这些蛋白质的方法等。一个实例为发现了产生TC样蛋白质的蜂类芽孢杆菌(Paenibacillus apiarius)。
虽然目标TC样蛋白质与致病杆菌及光杆状菌TC蛋白质有一些序列相关性及共同特征,目标TC样蛋白质的序列与以前已知的TC蛋白质有很大差异。因此,本申请提供了新类型的获自类芽孢杆菌属、光杆状菌属、致病杆菌属等细菌的TC样蛋白质及编码这些蛋白质的基因。
DAS1529菌株的另一令人惊讶的特征为它产生对鳞翅目有毒性的独特B.t.样Cry蛋白质。将目标Cry毒素进行压缩/缩短并显示缺乏它野生型形态的典型原毒素部分。因此,本发明总体上涉及筛选具有鳞翅目毒性Cry蛋白质的类芽孢杆菌分离株。本发明也涉及对类芽孢杆菌亚种及苏云金芽孢杆菌种筛选例如具有该新类型Cry基因及蛋白质的方法。
DAS1529菌株是第一个已知均产生Cry样毒素及TC样蛋白质的天然细菌的实例。又令人惊讶的是这是第一个已知与TC蛋白质基因密切相关(基因近似)的cry毒素基因实例。这些前驱的观察现象有广泛含义并因此使本领域技术人员能对合适细菌种筛选这些类型的独特操纵子及这些类型的已知操纵子的其它组分。这些技术在本发明的范围内。
本发明的又一方面来源于DAS1529菌株也产生与硫胺素酶非常相似的可溶昆虫毒素这一令人惊讶的发现。令人惊讶的是发现类芽孢杆菌硫胺素酶蛋白有杀虫活性。虽然此类蛋白是已知的,但本领域不能预计该酶显示对昆虫/昆虫样害虫的毒素样活性。因此,本发明也涉及对类芽孢杆菌筛选具有杀虫硫胺素酶基因及蛋白质等的方法,并涉及这些基因及蛋白质对控制昆虫及相似害虫的用途。
本发明的其它目的、优点及特征对受益于本公开的本领域技术人员是明显的。
附图简述
图1显示了来自光杆状菌的TC操纵子。
图2显示了插入到“SBI2”克隆中的来自DAS1529的显示有杀虫活性的DNA,其中可读框用框状及线状箭头标出。
图3显示了SEQ ID NO:17与来自解硫胺素芽孢杆菌(Campobasso等人,1998)或AAC44156的硫胺素酶I的部分序列对比。
图4显示了来自DAS1529的经纯化硫胺素酶对CEW的测试结果。
图5显示了pEt101D中的ORF3-ORF6。
图6显示了针对烟芽夜蛾(TBW)的Cry1529(ORF7)活性。
图7显示了SEQ ID NO:9与SEQ ID NO:5(tcaB2与tcaB1)的比较/对比;括号显示了ORF2连接处。
图8显示了DAS1529 ORF7(Cry1529)与其它Cry蛋白质比较的系统发生树。
图9和10显示了野生型及经修饰Cry1529蛋白质的胰蛋白酶消化结果。
图11A和11B显示了用于tcaA引物设计的序列对比。
图12A-D显示了用于tcaB引物设计的序列对比。
图13A和13B显示了用于tcaC引物设计的序列对比。
图14A和14B显示了用于tccC引物设计的序列对比。
序列简述
SEQ ID NO:1为SB12整个插入片段的核苷酸序列。
SEQ ID NO:2为编码tcaA样蛋白质(基因tcaA1,来源生物为:类芽孢杆菌IDAS1529菌株,基因命名为tcaA1-1529)的ORF1核苷酸序列。
SEQ ID NO:3为ORF1编码的氨基酸序列。
SEQ ID NO:4为ORF2去除IS元件的核苷酸序列,其编码tcaB样蛋白质(基因tcaB1,来源生物为:类芽孢杆菌IDAS1529菌株,基因命名为tcaB1-1529)。
SEQ ID NO:5为ORF2编码的氨基酸序列。
SEQ ID NO:6为编码tcaA样蛋白质的ORF3的核苷酸序列(基因tcaA2,来源生物为:类芽孢杆菌IDAS1529菌株,基因命名为tcaA2-1529)。
SEQ ID NO:7为ORF3编码的氨基酸序列。
SEQ ID NO:8为编码tcaB样蛋白质的ORF4的核苷酸序列(基因tcaB2,来源生物为:类芽孢杆菌IDAS1529菌株,基因命名为tcaB2-1529)。
SEQ ID NO:9为ORF4编码的氨基酸序列。
SEQ ID NO:10为编码tcaC样蛋白质的ORF5的核苷酸序列(基因tcaC,来源生物为:类芽孢杆菌IDAS1529菌株,基因命名为tcaC-1529)。
SEQ ID NO:11为ORF5编码的氨基酸序列。
SEQ ID NO:12为编码tccC样蛋白质的ORF6的核苷酸序列。
SEQ ID NO:13为ORF6编码的氨基酸序列。
SEQ ID NO:14为编码Cry样蛋白质的ORF7的核苷酸序列。
SEQ ID NO:15为ORF7编码的氨基酸序列。
SEQ ID NO:16为用于分类的DAS1529 16S rDNA的部分核苷酸序列。
SEQ ID NO:17为来自DAS1529培养液级分中经纯化毒素的N末端氨基酸序列。
SEQ ID NO:18来自解硫胺素芽孢杆菌的硫胺素酶I的氨基酸序列(Campobasso等人,J.Biochem.37(45):15981-15989(1998))。
SEQ ID NO:19为ORF6蛋白质的ORF6核苷酸序列(基因tccC,来源生物:类芽孢杆菌IDAS1529菌株,基因命名为tccC-1529)编码的备选氨基酸序列。
SEQ ID NO:20为基因xptC1,来源生物:致病杆菌Xwi菌株,基因命名为xptC1-Xwi。
SEQ ID NO:21为基因xptB1,类源生物:致病杆菌Xwi菌株,基因命名为xptB1-Xwi。
SEQ ID NO:22为引物SB101。
SEQ ID NO:23为引物SB102。
SEQ ID NO:24为引物SB103。
SEQ ID NO:25为引物SB104。
SEQ ID NO:26为引物SB105。
SEQ ID NO:27为引物SB106。
SEQ ID NO:28为引物SB212。
SEQ ID NO:29为引物SB213。
SEQ ID NO:30为引物SB215。
SEQ ID NO:31为引物SB217。
SEQ ID NO:32为来自蜂类芽孢杆菌DB482菌株的tcaA样基因的核苷酸序列。
SEQ ID NO:33为来自蜂类芽孢杆菌DB482菌株的TcaA样蛋白质的氨基酸序列。
SEQ ID NO:34为来自蜂类芽孢杆菌DB482菌株的tcaB样基因的核苷酸序列。
SEQ ID NO:35为来自蜂类芽孢杆菌DB482菌株的tcaB样基因的核苷酸序列。
SEQ ID NO:36为来自蜂类芽孢杆菌DB482菌株的TcaB样蛋白质的氨基酸序列。
SEQ ID NO:37为来自蜂类芽孢杆菌DB482菌株的TcaB样蛋白质的氨基酸序列。
SEQ ID NO:38为来自蜂类芽孢杆菌DB482菌株的tcaC样基因的核苷酸序列。
SEQ ID NO:39为来自蜂类芽孢杆菌DB482菌株的TcaC样蛋白质的氨基酸序列。
SEQ ID NO:40来自蜂类芽孢杆菌DB482菌株的tccC样基因的核苷酸序列。
SEQ ID NO:41为来自蜂类芽孢杆菌DB482菌株的TccC样蛋白质的氨基酸序列。
SEQ ID NO:42为基因tcdB1,来源生物:光杆状菌W14菌株,基因命名为tcdB1-W14。
SEQ ID NO:43为基因tcdB2,来源生物为:光杆状菌W14菌株,基因命名为tcdB2-W14。
SEQ ID NO:44为基因tccC1,来源生物:光杆状菌W14菌株,基因命名为tccC1-W14。
SEQ ID NO:45为基因tccC2,来源生物:光杆状菌W14菌株,基因命名为tccC2-W14。
SEQ ID NO:46为基因tccC3,来源生物:光杆状菌W14菌株,基因命名为tccC3-W14。
SEQ ID NO:47为基因tccC4,来源生物:光杆状菌W14菌株,基因命名为tccC4-W14。
SEQ ID NO:48为基因tccC5,来源生物:光杆状菌W14菌株,基因命名为tccC5-W14。
SEQ ID NO:49为来自嗜线虫致病杆菌Xwi的XptA2 TC蛋白质的氨基酸序列。
发明详述
本发明提供了用于害虫控制的独特生物学备选物。更具体地,本发明提供了对昆虫,优选对鳞翅目及其它类似害虫有毒素活性蛋白质的新来源。本发明也涉及可用于编码此类毒素的新多核苷酸的新来源,并涉及毒素制备方法及用毒素及对应的核酸序列控制昆虫和其它类似植物害虫的方法。本发明提出需要新的昆虫控制剂。本发明涉及获自类芽孢杆菌及其它细菌的新杀虫蛋白质。
本发明最初源自新的类芽孢杆菌菌株的发现。该菌株在文中是指DAS1529。为证实本发明的广泛含义,也对另一类芽孢杆菌菌株的发现进行示例。这些菌株保藏在位于美国,1815 North University Street Peoria,Ill.61604的农业研究机构专利培养物保藏中心(NRRL)。保藏菌株及对应的保藏日期及保藏编号如下:
保藏菌株
保藏日期
保藏编号
DAS1529 2002年6月19日 NRRL B-30599
DB482 2003年6月17日 NRRL B-30670
这些培养物是为了本专利申请进行保藏并在保证这个专利申请未决期间专利和商标委员会确定的人可获得培养物的条件下保藏,所赋予的号为37 CFR 1.14及35 U.S.C.122。对本申请的副本或其随后的申请文本进行申请时,当其所在国家的外国专利法要求这些保藏物时,这些保藏物也是可获得的。然而,应当理解保藏物的可用性并不允许在损害政府授予的专利权下实施本发明。
此外,目标培养保藏物根据用于保藏微生物的布达佩斯公约的条款进行制备,即它们必需全力在最近用于提供保藏样本的需求后至少五年时期,并且在任何情况下,保藏日期后的至少三十(30)年时期或可发布公开培养物可实施期限内,使它们保持活力并不受污染下进行保存。如果由于保藏条件,在需要时对保藏物不能提供样本,保藏者有责任替代保藏物。一旦授予专利公开它们时,公众对目标培养保藏物可获得性的所有限制最终废止。
目标DAS1529菌株的发现有多种原因是令人惊讶的。该菌株产生独特的鳞翅目毒性Cry蛋白质。该菌株以及DB482,也产生独特的毒素复合体(TC)样蛋白质(与致病杆菌/光杆状菌TC)有相似性)。类芽孢杆菌DB482分离株及由其获得的毒素是高度优选的,并均在本发明的范围内。
这是第一个已知公开的有针对鳞翅目活性的类芽孢杆菌蛋白质毒素。发现DAS1529菌株对鳞翅目害虫有毒素活性。这是令人惊讶的发现。已知一些种的类芽孢杆菌对蛴螬/甲虫/鞘翅目有杀虫活性。还没有类芽孢杆菌种或菌株对鳞翅目有毒性的报导。因此,本发明总体上涉及对鳞翅目有活性的类芽孢杆菌种,并涉及针对鳞翅目具有活性的和/或编码“鳞翅目毒素”的基因,且更具体地,涉及用于鳞翅目毒性Cry蛋白质的类芽孢杆菌培养物、其蛋白质及其克隆文库的筛选。
这也是具有TC样蛋白质的类芽孢杆菌的第一次已知报导。因此,本发明涉及对类芽孢杆菌种筛选TC样基因及蛋白质的方法。非常令人惊讶的是发现DAS1529及DB482菌株有TC样操纵子并产生TC蛋白质(与致病杆菌及光杆状菌的TC蛋白质有一些水平的相似性)。迄今为止,在类芽孢杆菌属中还不知道存在文中鉴定的TC蛋白质及基因。此发现扩宽了发现TC蛋白质的生物体(细菌属)的范围。因此本发明总体上涉及获自类芽孢杆菌种的TC蛋白质,涉及对类芽孢杆菌种筛选此类蛋白质等的方法。用本发明的方法发现类芽孢杆菌种的实例为蜂类芽孢杆菌(Paenibacillus apairus)DB482菌株。此蜂类芽孢杆菌菌株也产生独特TC样蛋白质。
虽然目标TC蛋白质与致病杆菌及光杆状菌的TC蛋白质有一些共同特征,目标TC蛋白质是独特的并与以前已知的TC蛋白质不同。因此,本申请提供了获自类芽孢杆菌属,光杆状菌属,致病杆菌属,沙雷氏菌属等细菌的新类型TC样蛋白质及编码这些蛋白质的基因。
本发明也涉及获自类芽孢杆菌种的鳞翅目毒性Cry蛋白质。因此,本发明涉及对类芽孢杆菌种筛选针对鳞翅目害虫有毒素活性的cry基因及Cry蛋白质的方法。
DAS1529 Cry毒素为非常独特的B.t.样Cry蛋白质毒素。另一对蛴螬有活性的类芽孢杆菌菌株已知产生鞘翅目毒性Cry蛋白质。其为与Cry2蛋白质最相关的(但只有大约40%同一性)的Cry18蛋白质。文中示例的Cry蛋白质显示与以前已知的Cry蛋白质只有低水平的序列同一性及相似性。如果那样,在所有已知的B.t.Cry蛋白质中,目标Cry蛋白质与Cry1蛋白质有最大的相似性。目标Cry蛋白质的一个令人惊讶的方面是它非常小,即甚至比Cry1 Fa核心毒素小。目标Cry蛋白质在它的C末端或接近C末端有一个可鉴定的第5区块(Block 5)。此毒素的野生型状态没有原毒素部分,其中所述原毒素部分一般在Cry1毒素中发现。目标Cry毒素令人惊讶地进行了压缩。因此,本发明总体上涉及新类型的Cry蛋白质。此公开对从苏云金芽孢杆菌(B.t.)中寻找额外cry基因也是重要的。对从本公开获益的本领域技术人员清楚的是,可对其它细菌如B.t.及其它芽孢杆菌亚种(包括球形芽孢杆菌(B.sphaericus))筛选类似毒素及毒素基因。这些筛选方法在本发明的范围内。
DAS1529菌株是第一个已知可产生Cry样毒素及TC样蛋白质这两者的天然细菌的实例。又令人惊讶的是这是第一个已知与TC蛋白质基因密切相关(基因近似)的cry毒素基因的实例。这些先驱的观察现象使本领域技术人员能对适当细菌种筛选这些型的独特操纵子及这些型的已知操纵子的其他组分。这些技术在本发明的范围内。DAS1529菌株是具有同一类型的多个TC蛋白质基因(即在这种情况下,两个tca样及两个tcaB样基因)的TC样操纵子的野生型菌株的令人感兴趣的实例。这对进一步的基因发现有意义。
本发明的又一方面起源于类芽孢杆菌硫胺素酶蛋白质有杀虫活性的令人惊讶的发现。虽然此蛋白质是已知的,本领域决不会预计此酶显示对昆虫/昆虫样害虫的毒素样活性。
类芽孢杆菌TC蛋白质
关于示例TC蛋白质的更具体的说明,以下对来自DAS1529菌株的TC蛋白质文中进行了充分描述:两个TcaA样蛋白质(TcaA1及TcaA2),两个TcaB样蛋白质(TcaB1及TcaB2),一个TcaC蛋白质及一个TccC样蛋白质。TcaA1及TcaA2蛋白质相互在序列水平上有高度相似性,并且tcaB1及tcaB2蛋白质相互在序列水平上有高度相似性。获自蜂类芽孢杆菌的TC样蛋白质也本文也进行了示例,并在本发明的范围内。
本发明的TC蛋白质可与其它蛋白质一样进行应用。这对于在根据本领域已知的进行观察时具有本公开益处的本领域技术人员是很显然的。参见,例如R.H.ffrench-Constant和Bowen(2000))及美国专利号6,048,838讨论的以上背景部分。例如,光杆状菌的Tca毒素复合体对烟草天蛾有高度毒性是已知的。
虽然现在不了解TC蛋白质相互的确切分子相互作用及它们的作用机制,已知一些TC蛋白质有“独特”杀虫活性,并且已知其它TC蛋白质增强同一给定生物产生独特毒素的活性。例如已知TcdA蛋白质对烟草天蛾有活性。TcaC及TccC一起可用于增强TcdA的活性。TcdB(替代TcaC)与TccC可用作增强剂。TcbA是另一个有独特毒素活性的光杆状菌TC蛋白质。TcaC(或TcdB)与TccC一起可用于增强/加强TcbA的毒素活性。
以下对光杆状菌TC蛋白质及来自类芽孢杆菌“对应的”TC蛋白质/基因进行概述:
| 光杆状菌 | 光杆状菌W14菌株命名 | 光杆状菌自身同源性 | 类芽孢杆菌1529 |
| TcaA | 毒素C | TccA | ORF3(&1) |
| TcaB | TccB | ORF4(&2) | |
| TcaC | TcdB | ORF5 | |
| TcbA | 毒素B | ||
| TccA | 毒素D | TcdA N末端 | |
| TccB | TcdA C末端 | ||
| TccC | ORF6 | ||
| TcdA | 毒素A | TccA+TccB | |
| TcdB | TcaC |
如以上指出的,TccA与TcdA的N末端有一些水平的同源性,及TccB与TcdA的C末端有一些水平的同源性。此外,TcdA大约280kDa,及如果组合,TccA与TccB一起与TcdA大约同样大小。此外,TcaA与TccA有一些水平的同源性并且同样与TcdA的N末端有一些水平的同源性。又此外,TcaB与TccB有一些水平的同源性及同样与TcdA的N末端有一些水平的同源性。TccA及TcaA,TccB及TcaB有同样大小。
虽然发现一些致病杆菌TC蛋白质“对应”于一些光杆状菌TC蛋白质,“对应”蛋白质相互只有约40%(近似)序列同一性。来自类芽孢杆菌的目标蛋白质与以前TC蛋白质有大约同样程度的序列相关性(~40%同一性)。
如以下更详细的描述,本发明的一种或多种毒素能互相组合和/或与其它毒素组合应用(即光杆状菌Tca复合物已知对烟草天蛾有活性;光杆状菌TC蛋白质的多种“组合”例如可一起应用以增强其它独特光杆状菌毒素的活性;例如,建议应用光杆状菌毒素“与”B.t.毒素用于抗性控制)。此外,本发明的类芽孢杆菌TC蛋白质文中显示用于增强或加强“独特”致病杆菌毒素蛋白质的活性。例如,临时申请号60/441,723(Timothy D.Hey等人),标题为“用于害虫控制的混合及匹配TC蛋白质”涉及TC蛋白质来源于一个属如光杆状菌属生物的TC蛋白质与来源于另一属生物对应的TC蛋白质互换应用的令人惊讶的发现。接着这些在以下列出的其它令人惊讶的数据进一步表明了本发明类芽孢杆菌TC蛋白质的实用性。这些结果的一个原因为令人惊讶的是在“对应”致病杆菌、光杆状菌及目标类芽孢杆菌TC蛋白质之间只有~40%序列同一性。
蛋白质及毒素 本发明提供了易于施用的功能性蛋白质。本发明也提供了用于递送对许多种昆虫,优选对鳞翅目昆虫具有功能活性并为有效杀虫毒素的方法。“功能活性”(或“针对活性”)文中表示蛋白质毒素作为口服活性昆虫控制剂(单独或与其它蛋白质组合)发挥功能,蛋白质有毒性作用(单独或与其它蛋白质组合)或能破坏或阻止昆虫生长和/或摄食,其中所述摄食引起或不可引起昆虫死亡。当昆虫与通过转基因植物表达,被制成蛋白质组合物,可喷雾蛋白质组合物,诱饵基质或其它递送系统递送的有效量的本发明“毒素”接触时,结果一般是昆虫死亡,抑制昆虫的生长和/或增殖,和/或预防昆虫摄食昆虫可获得毒素的来源(优选转基因植物)。本发明的功能性蛋白质也可增强或改进其它毒素蛋白质的活性。因此,文中应用的术语“毒性”“毒力”“毒素活性”及“杀虫活性”如文中定义表示目标“毒素”有“功能活性”。
优选对摄食昆虫有完全致死性,但不需要达到功能活性。如果昆虫避开毒素或停止摄食,在一些应用中此避开是有用的,即使作用是亚致死的或致死性被延迟或非直接的。例如,如果目的是获得抗昆虫的转基因植物,昆虫不愿摄食植物与对昆虫有致死毒性同样是有用的,因为最终目的是避免昆虫引起植物损害。
有其它将毒素混合到昆虫食物的方法。例如,如文中公开的,通过向食物喷洒蛋白质溶液将毒性蛋白质掺入到幼虫食物源是可能的。备选地,可将经纯化蛋白质基因改造入另外的无害细菌中,然后此细菌可在培养物中生长,并且将所述细菌或用于食物源或使其在需要根除昆虫的土壤中定居。并且,可将蛋白质直接基因改造入昆虫食物源中。例如,对许多昆虫幼虫的主要食物源是植物。因此可将编码毒素的基因转移到植物中以使所述植物表达目的毒素。
将功能活性转移到植物或细菌系统中一般需要将编码毒素氨基酸序列的核酸序列整合到适于载体定居的宿主的蛋白质表达载体中。获得编码有功能活性蛋白质的核酸序列的一个途径是如文中公开的,用来自毒素氨基酸序列推导的信息,从产生毒素的细菌种中分离天然遗传物质。可将天然序列进行优化用于在植物中表达,例如,以下进行更详细的讨论。优化的多核苷酸也可在蛋白质序列的基础上进行设计。
本发明提供了具有有益杀虫活性的新类型毒素。对这些类型的毒素及编码它们的多核苷酸进行定性的一个途径是在一系列特定条件下,与示例的核苷酸序列(其互补体和/或探针或来自任意链的探针)杂交能力和/或通过它们用来自示例序列的引物通过PCR进行扩增的能力定义多核苷酸。
有许多获得本发明杀虫毒素的方法。例如,文中公开及权利要求的杀虫毒素的抗体可用于从蛋白质混合物中鉴定并分离其它毒素。特别地,可制备针对更稳定并与其它毒素区别最大的毒素部分的抗体。然后这些抗体可用于特别通过免疫沉淀、酶联免疫吸附测定(ELISA)或Western印迹鉴定有特征活性的相同毒素。文中公开的毒素抗体或相同毒素抗体或这些毒素片段的抗体,用标准方法易于制备。单克隆、多克隆、特异和/或交叉反应抗体可根据本发明进行制备及应用。在检测试剂盒中可包括此类抗体用于检测本发明蛋白质(及其抗原性片段)的存在。
本领域技术人员易于认识到本发明的毒素(及基因)可从多种来源获得。“来自”或“获自”目标DAS1529分离株和/或蜂类芽孢杆菌分离株的毒素表示此毒素(或相似毒素)可获自该分离株或一些其它来源,如另一细菌菌株或转基因植物。例如,本领域技术人员易于认识到,如果公开细菌基因及毒素,可将植物进行工程化以产生毒素。抗体制剂、核酸探针(DNA及RNA)等等可用文中公开的多核苷酸和/或氨基酸序列进行制备并用于从其它(天然)来源筛选及发现其它毒素基因。本发明的毒素可获自多种来源/源微生物。
多核苷酸及探针 本发明进一步提供了编码本发明毒素的核苷酸序列。本发明又提供了鉴定及定性编码杀虫毒素基因的方法。在一个实施方案中,本发明提供了用于作为杂交探针和/或用于PCR技术引物的独特核苷酸序列。产生特征性基因片段的引物可用于鉴定、定性和/或分离特异毒素基因。本发明的核苷酸序列编码与以前描述毒素不同的毒素。
本发明的多核苷酸可用于形成完整“基因”以在目的宿主细胞中编码蛋白质或肽。例如,如本领域技术人员易于识别的,如本领域显然已知的,目标多核苷酸可适当地处于目的宿主中的启动子控制下。
如本领域技术人员已知的,DNA一般以双链形式存在。在此排列中,一条链与另一条链互补,反过来也是如此。由于DNA在植物中复制,产生额外的DNA互补链。本领域中常用的“编码链”是指与反义链结合的链。mRNA从DNA的“反义”链进行转录。“正义”或“编码”链有一系列可作为可读框(ORF)进行阅读以形成目的蛋白质或肽的密码子(密码子为可作为三个残基单位进行阅读以代表一个特定氨基酸的三个核苷酸)。为了在体内表达蛋白质,DNA链一般转录成可用作用于蛋白质模板的mRNA的互补链。因此,本发明包括后附序列表和/或包括互补链的等同物显示的示例多核苷酸的用途。与示例DNA功能性相同的RNA及PNA(肽核酸)包括在本发明中。
在本发明的一个实施方案中,细菌分离株可在致使该微生物高度增殖的条件下进行培养。在处理微生物以提供单链基因组核酸后,DNA可与本发明的引物接触并进行PCR扩增。毒素编码基因的特征性片段可通过程序进行扩增,因此确定毒素编码基因的存在。
本发明的又一方面包括用文中公开的方法及核苷酸序列鉴定的基因及分离株。这样鉴定的基因编码对害虫有活性的毒素。
本发明的毒素及基因可例如通过用寡核苷酸探针进行鉴定并获得。这些探针为可依靠适当标记可检测的或如国际申请号WO93/16094描述的可制成固有荧光的可检测核苷酸序列。探针(及本发明的多核苷酸)可为DNA、RNA或PNA。除腺嘌呤(A),胞嘧啶(C),鸟嘌呤(G),胸腺嘧啶(T)及尿嘧啶(U,用于RNA分子)外,本发明的合成探针(及多核苷酸)也可有次黄嘌呤(能与所有四个碱基配对的中性碱基;在合成探针中,有时用于替代所有四种碱基的混合物)。因此,当文中谈及合成的简并寡核苷酸时,一般应用“n”,“n”可为G,A,T,C或次黄嘌呤。根据标准IUPAC命名委员会,本申请的文中应用含糊密码子(例如,R表示A或G,Y表示C或T等)。
如本领域公知的,如果探针分子与核酸样本杂交,可合理地推定探针与样本大体上有同源性/相似性/同一性。优选地,通过本领域公知的技术,例如,如在Keller,G.H.,M.M.Manak(1987)DNA Probes,Stockton出版社,纽约,NY,第169-170页一书中所述,首先进行多核苷酸的杂交,接着在低、中等或高严格条件下洗涤。例如,如文中阐述的,低严格条件可通过第一次用2×SSC(标准柠檬酸盐)/0.1%SDS(十二烷基硫酸钠)于室温洗涤15分钟实施。一般进行两次洗涤。然后高严格条件可通过降低盐浓度和/或通过升高温度而达到。例如,以上描述的洗涤可接着每次用0.1×SSC/0.1%SDS于室温洗涤15分钟,进行两次,接着继续用0.1×SSC/0.1%SDS于55℃每次洗涤30分钟。这些温度可与其它文中提出的杂交及洗涤方法应用,并是本领域技术人员已知的(例如,SSPE可代替SSC用作盐)。2×SSC/0.1%SDS可通过向445ml水中加入50ml的20×SSC及5ml的10%SDS进行制备。20×SSC可通过组合NaCl(175.3g/0.150M)、柠檬酸钠(88.2g/0.015M)及加水至1升,接着用10NNaOH调整pH至7.0进行制备。10%SDS可通过在50ml经高压水中溶解10g的SDS,稀释至100ml并分装进行制备。
探针的检测提供了以已知的方式用于确定是否杂交在维持着的方法。此种探针分析提供了用于快速鉴定本发明毒素编码基因的方法。根据本发明用作探针的核苷酸节段可用DNA合成仪及标准方法进行合成。这些核苷酸序列可用作PCR引物以扩增本发明的基因。
根据本发明用于应用的探针可来源自多种来源,如文中提及或建议的任何基因。例如,根据本发明可应用以下任何类型的基因(编码和/或非编码或其互补链)的全部或部分:tcaA,tcaB,tcaC,tcbA,tccA,tccB,tccC,tcdA,tcdB,xptA1,xptD1,xptB1,xptC1,xptA2,sepA,sepB及sepC。除了另外特别指出外,例如,提到“tccC”基因包括这个型基因所有特异等位基因(如tccC1及tccC2)。所有其它基因也是同样的(例如,tcdB2,tccC3及表17中提及的等位基因)。
分子的杂交特征可用于定义本发明的多核苷酸。因此本发明包括与文中示例或建议的多核苷酸(或寡核苷酸或引物)杂交的多核苷酸(和/或它们的互补体,优选它们全长互补体)。
如文中应用的杂交的“严格”条件是指可达到通过当前申请人利用的条件同样或大约同样程度的杂交特异性的条件。具体地,通过标准方法(参见,例如,Maniatis,T.,E.F.Fritsch,J.Sambrook [1982] MolecularCloning:A Laboratory Manual,Cold Spring Harbor Laboratory,ColdSpring Harbor,NY)在Southern印迹上固定的DNA用32P-标记的基因特异探针进行杂交。一般而言,杂交及后来的洗涤可在可允许检测靶序列的条件下进行。对于双链DNA基因探针,杂交在低于DNA杂交体解链温度(Tm)20-25℃时在6×SSPE,5×Denhardt′s溶液,0.1%SDS,0.1mg/ml经变性DNA中过夜进行。解链温度通过以下公式进行描述(Beltz,G.A.,K.A.Jacobs,T.H.Eickbush,P.T.Cherbas和F.C.Kafatos[1983]Mcthods of Enzymology,Wu,L.Grossman和K.Moldave编辑,Academic出版社,纽约100:266-285):
Tm=81.5℃+16.6Log[Na+]+0.41(%G+C)-0.61(%甲酰胺)-600/碱基对中双链体长度。
洗涤一般按以下进行:
(1)在1×SSPE,0.1%SDS中于室温洗涤15分钟进行两次(低严格洗涤)。
(2)在0.2×SSPE,0.1%SDS中于室温20℃洗涤15分钟,进行一次(中等严格洗涤)。
对于寡核苷酸探针,杂交于低于杂交体解链温度10-20℃时在6×SSPE,5×Denhardt′s溶液,0.1%SDS,0.1mg/ml经变性DNA中过夜进行。用于寡核苷酸探针的Tm通过以下公式进行确定:
Tm(℃)=2(T/A碱基对数目)+4(G/C碱基对数目)(Suggs,S.V.,T.Miyake,E.H.Kawashime,M.J.Johnson,K.Itakura和R.B.Wallace[1981]ICN-UCLA Symp.Dev.Biol.Using Purified Genes,D.D.Brown编辑,Academic出版社,纽约,23:683-693)
一般按以下进行洗涤:
(1)在1×SSPE,0.1%SDS中于室温洗涤15分钟,进行两次(低严格洗涤)。
(2)在1×SSPE,0.1%SDS中于杂交温度洗涤15分钟,进行一次(中等严格洗涤)。
一般,盐和/或温度可进行改变以改变严格度。用经标记的长度>70个碱基左右的DNA片段,可应用以下条件:
低:1或2×SSPE,室温
低:1或2×SSPE,42℃
中等:0.2×或1×SSPE,65℃
高:0.1×SSPE,65℃
双链体形成及稳定性依赖于两条杂交链间的实质互补性。并且如上提及的,可允许一定程度的误配。因此,本发明的探针序列包括所述序列的突变(单个或多重)、缺失、插入及其组合,其中所述突变、插入或缺失允许形成与靶目的多核苷酸形成稳定杂交体。突变、插入及缺失可以多种方法在给定多核苷酸序列中进行产生,并且这些方法对一般技术人员是已知的。其它方法将来可成为已知的。
PCR技术 聚合酶链反应(PCR)为核苷酸序列的重复性、酶促引发合成过程。该程序是公知的并是本领域技术人员常规应用的(参见Mullis,美国专利号4,683,195,4,683,202和4,800,159;Saiki,Randall K.,StephenScharf,Fred Faloona,Kary B.Mullis,Glenn T.Horn,Henry A.Erlich,Norman Arnheim[1985]“酶扩增β-球蛋白基因组序列及限制位点分析用于诊断镰状细胞贫血,”Science 230:1350-1354)。PCR是建立在酶扩增目的DNA片段基础上的,其中所述目的DNA片段的侧翼为与目的序列的相反链杂交的两个寡核苷酸引物。引物导向互相指向3’末端。模板进行重复循环的热变性,引物与它们的互补序列退火及经退火引物与DNA酶的延伸结果导致PCR引物5’末端定义的节段的扩增。每条引物的延伸产物可作为用于其它引物的模板,因此每次循环一般使在上一次循环中产生的DNA片段数量加倍。这导致特异靶片段的指数增加,在几小时内达到几百万倍。通过应用分离自嗜热细菌嗜热水生菌(Thermus aquaticus)的热稳定DNA聚合酶如Taq聚合酶,扩增过程可完成自动化。可进行应用的其它酶是本领域技术人员已知的。
本发明的DNA序列可用作用于PCR扩增的引物。进行PCR扩增时,引物及模板间可允许一定程度的误配。因此,示例引物的突变、缺失及插入(特别是向5’末端添加核苷酸)是在本发明的范围内。突变、插入及缺失在给定引物中可通过一般技术人员已知的方法进行产生。
基因与毒素的修饰 根据本发明有用的基因与毒素不仅包括特定示例的全长序列,也包括这些序列的部分、节段和/或片段(与全长分子相比包括内部和/或末端缺失)、变体、突变体、嵌合体及其融合体。例如,本发明的毒素可以通过两个或多个毒素/蛋白质部分组合产生的嵌合毒素的形式应用。
本发明的蛋白质可具有经替代氨基酸,只要它们保持文中特定的示例蛋白质的特征性杀虫/功能活性。“变体”基因的核苷酸序列编码相同毒素或与文中示例蛋白质有相同杀虫活性的等同毒素。术语“变体蛋白质”及“等同毒素”是指对靶害虫有相同或基本上相同生物学/功能活性,并与示例毒素有等同序列的毒素。如文中应用的,谈及“等同”序列是指经改进或不对杀虫活性有副作用的其中存在氨基酸替代、缺失、添加或插入的序列。保持杀虫活性的片段也包括在本定义中。片段及保持相同或相似功能的其它等同物或示例毒素对应片段的“毒素活性”在本发明的范围内。可进行变化,如氨基酸替代或添加用于多种目的,如增加(或降低)蛋白质的蛋白酶稳定性(基本上/一般不降低毒素的功能活性)。
用文中提供的教导,等同毒素和/或编码这些等同毒素的基因可获自/来自野生型或重组细菌和/或其它野生型或重组生物体。例如其它芽孢杆菌,类芽孢杆菌,光杆状菌及致病杆菌种,可用作源分离株。
例如,基因的改变通过使用制备点突变的标准技术易于构建。此外,例如,美国专利号5,605,793描述了随机片段化后,通过用DNA重组装用于产生额外分子多样性的方法。可用变体基因产生变体蛋白质;重组宿主可用于产生变体蛋白质。用这些“基因改组”技术,包含文中示例任何序列的任意5、10或20个连续残基(氨基酸或核苷酸)的等同基因及蛋白质可进行构建。如本领域技术人员已知的,可将基因改组技术进行调整以获得具有,例如1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,3132,33,34,35 36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100,101,102,103,104,105,106,107,108,109,110,111,112,113,114,115,116,117,118,119,120,121,122,123,124,125,126,127,128,129,130,131,132,133,134,135,136,137,138,139,140,141,142,143,144,145,146,147,148,149,150,151,152,153,154,155,156,157,158,159,160,161,162,163,164,165,166,167,168,169,170,171,172,173,174,175,176,177,178,179,180,181,182,183,184,185,186,187,188,189,190,191,192,193,194,195,196,197,198,199,200,201,202,203,204,205,206,207,208,209,210,211,212,213,214,215,216,217,218,219,220,221,222,223,224,225,226,227,228,229,230,231,232,233,234,235,236,237,238,239,240,241,242,243,244,245,246,247,248,249,250,251,252,253,254,255,256,257,258,259,260,261,262,263,264,265,266,267,268,269,270,271,272,273,274,275,276,277,278,279,280,281,282,283,284,285,286,287,288,289,290,291,292,293,294,295,296,297,298,299,300,301,302,303,304,305,306,307,308,309,310,311,312,313,314,315,316,317,318,319,320,321,322,323,324,325,326,327,328,329,330,331,332,333,334,335,336,337,338,339,340,341,342,343,344,345,346,347,348,349,350,351,352,353,354,355,356,357,358,359,360,361,362,363,364,365,366,367,368,369,370,371,372,373,374,375,376,377,378,379,380,381,382,383,384,385,386,387,388,389,390,391,392,393,394,395,396,397,398,399,400,401,402,403,404,405,406,407,408,409,410,411,412,413,414,415,416,417,418,419,420,421,422,423,424,425,426,427,428,429,430,431,432,433,434,435,436,437,438,439,440,441,442,443,444,445,446,447,448,449,450,451,452,453,454,455,456,457,458,459,460,461,462,463,464,465,466,467,468,469,470,471,472,473,474,475,476,477,478,479,480,481,482,483,484,485,486,487,488,489,490,491,492,493,494,495,496,497,498,499或500或更多个连续残基(氨基酸或核苷酸),其中所述连续残基对应于任意示例序列(或其互补体(全长互补体))中的节段(相同大小)。类似大小的节段,特别对于保守区的节段,也可用作探针和/或引物。
全长基因片段可根据标准方法用商业上可获得的外切酶或内切酶进行制备。例如,酶如Bal31或定点诱变可用于从这些基因末端系统地切除核苷酸。同样,可用多种限制酶获得编码活性片段的基因。可用蛋白酶直接获得这些毒素的活性片段。
如文中公开的,可将毒素截短并仍保持功能活性,这也在本发明的范围内。“截短毒素”表示可将毒素蛋白质的部分进行切割并在切割后仍显示活性。切割可通过昆虫肠内或肠外的蛋白酶达到。此外,可用分子生物学技术产生有效切割的蛋白质,其中编码所述毒素的DNA碱基通过用限制性内切酶消化或其它本领域技术人员可获得的技术。进行截短后,所述蛋白质可在外源系统如大肠杆菌、杆状病毒、基于植物的病毒系统;酵母等等中进行表达并然后置于文中公开的昆虫测定中以确定活性。本领域熟知可成功产生截短毒素,这样虽然其小于全长的完整序列,但仍保留了功能活性。B.t.毒素可以以截短(核心毒素)形式进行应用是本领域公知的。参见,例如,Adang等人,Gene 36:289-300(1985),“苏云金芽孢杆菌库尔斯塔克HD-73亚种晶体蛋白质的全长及截短质粒克隆的定性及它们对烟草天蛾的毒性”。有保留杀虫活性的截短蛋白质的其它实例,包括昆虫保幼激素酯酶(加利福尼亚大学的美国专利号5,674,485)。如文中应用的,术语“毒素”也表示功能活性截短形式。另一方面,可添加原毒素部分(一般在模式B.t.Cry毒素的C末端部分)以形成有活性的全长蛋白质。参见,例如,美国专利号6,218,188。
文中也特别示例了本发明的某些毒素。由于这些毒素只是本发明毒素的示例,本发明包含与示例毒素有相同或相似杀虫活性的变体或等同毒素(及编码等同毒素的核苷酸序列)是显而易见的。等同毒素与示例毒素有氨基酸相似性(和/或同源性)。氨基酸同一性一般大于60%,优选大于75%,更优选大于80%,甚至更优选大于90%并可大于95%。也可将优选的本发明多核苷酸及蛋白质根据更特定的同一性和/或相似性范围进行定义。例如,与文中示例序列相比,同一性和/或相似性可为49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98或99%。除了另外详细说明外,如文中应用的两个核酸序列同一性和/或相似性的百分数用Karlin和Altschul(1990),Proc.Natl.Acad.Sci.USA 87:2264-2268,如在Karlin和Altschul(1993),Proc.Natl.Acad.Sci.USA 90:5873-5877中经改进的运算法则进行确定。此种运算法则在Altschul等人(1990),J.Mol.Biol.215:402-410的NBLAST和XBLAST程序中进行引用。用NBLAST程序进行BLAST核苷酸搜索,分值=100,字长=12。为获得用于比较的缺口比对,如Altschul等人(1997),Nucl.Acids Res.25:3389-3402描述应用缺口BLAST。当应用BLAST及缺口BLAST程序时,应用了各自程序(NBLAST及XBLAST)的默认系数。参见NCBI/NIH网站。分值可用以上背景部分描述的Crickmore等人的方法及运算法则进行计算。
在说明生物学特性或参与决定最终与生物学活性有关的三维构象的毒素的关键区中,氨基酸同源性/相似性/同一性最高。在这点上,某些氨基酸替代是可接受的并预计是可容忍的。例如,这些替代可在对活性不是关键的蛋白质区进行替代,分析蛋白质的晶体结构及基于软件的蛋白质结构模型可用于确定可进行修饰(用定点诱变、改组等)的蛋白质区以真正改变蛋白质的性质和/或增加蛋白质功能。
也可改变蛋白质的多种性质及靶向3D特征而对蛋白质的活性/功能性没有副面影响。预计可容忍/对分子的三维构象没有副面影响的保守氨基酸替代。氨基酸分为以下类:非极性、不带电荷极性、碱性及酸性。藉此一类氨基酸被另一同型的氨基酸取代,只要替代对化合物的生物学活性无害的氨基酸替代在本发明的范围内。表1提供了属于一类氨基酸的实例表。
| 表1 | |
| 氨基酸类 | 氨基酸实例 |
| 非极性不带电荷极性酸性碱性 | 丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、甲硫氨酸、苯丙氨酸、色氨酸甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺、谷氨酰胺天冬氨酸、谷氨酸赖氨酸、精氨酸、组氨酸 |
在一些情况下,也可进行非保守性替代。关键因素是这些替代必需对毒素的功能性/生物学活性没有明显损害。
如文中应用的,谈及“经分离”多核苷酸和/或“经纯化”毒素是指它们与在自然界发现的其它相关分子不再相关的这些分子。因此,如文中描述的,谈及“经分离”和/或“经纯化”表示有“人工”的参与。例如,置于植物中用于表达的本发明细菌毒素“基因”为“经分离多核苷酸”。同样,如文中示例的,通过植物产生的类芽孢杆菌蛋白质是“经分离蛋白质。”
由于遗传密码的简并性/冗余性,多种不同DNA序列可编码文中公开的氨基酸序列。产生编码相同或基本上相同毒素的备选DNA序列是在本领域熟练技术人员的技术内。这些变体DNA序列在本发明的范围内。
优化用于在植物中表达的序列 为了在植物中获得异源基因的高表达,可优选重新改造所述基因使它们在植物细胞(的细胞质)中有效表达。玉米是在转化前可优选重新设计异源基因以增加其在所述植物中表达水平的此种植物。因此,在设计编码细菌毒素基因设计中的额外步骤是重新改造异源基因用于优化表达。
用于重新改造细菌毒素用于在玉米中表达的一个原因是由于天然基因的非最佳G+C含量。例如,许多天然细菌基因非常低的G+C含量(及随之发生的偏向高A+T含量)导致产生模拟或复制已知为高度富含A+T的植物基因控制序列的序列。导入植物基因的DNA中一些富含A+T序列的存在(例如,一般在基因启动子中发现的TATA盒区)可导致基因的异常转录。另一方面,在经转录mRNA存在的其它调控序列的存在(例如,多腺苷酸化信号序列(AAUAAA)或与参与前mRNA剪接的核内小RNA互补的序列)可导致RNA的不稳定性。因此,设计编码细菌毒素基因用于玉米表达,更优选是指植物优化基因的一个目标是产生有较高G+C含量,并优选地为与编码代谢酶的玉米基因相近的DNA序列。设计编码细菌毒素的植物优化基因的另一个目标是产生其中对序列修饰的不阻碍翻译的DNA序列。
下表(表2)表示了玉米中的G+C含量如何高。对于表2的数据,基因的编码区是从基因库(Release 71)得到的,其碱基组成用MacVector程序(Accelerys,Burlington,MA)进行计算。在计算中忽略了内含子序列。
由于通过遗传密码简并性/冗余性赋予的可塑性(即一些氨基酸由一种以上的密码子表示),不同生物体或生物体不同类的基因组的进化导致冗余密码子的不同选择。此“密码子偏倚性”反映在蛋白质编码区的平均碱基组成中。例如,有相对低G+C含量的生物体利用在简并密码子第三位有A或T的密码子,而有较高G+C含量的生物体利用在第三位有G或C的密码子。认为mRNA中“稀有”密码子的存在可降低mRNA的绝对翻译率,特别是当对应于稀有密码子的相对丰富的带电荷tRNA低时。此现象的延伸是个别稀有密码子翻译率降低可引起至少对多个稀有密码子进行叠加。因此,有相对高含量稀有密码子的mRNA可有对应的低翻译率。此翻译率通过随后低水平的经编码蛋白质反应出来。
在编码用于玉米(或其它植物,如棉花或大豆)表达的细菌毒素的重新改造基因中,确定了植物的密码子偏倚性。对于玉米的密码子偏倚性是统计该植物用于编码它的蛋白质的密码子分布并且优选的密码子选择在表3中进行显示。确定偏倚性后,确定目的基因中密码子的百分率。确定植物优选的第一密码子以及优选的第二及第三密码子的选择。然后,将目的细菌毒素的氨基酸序列进行反向翻译以使核酸序列正好编码天然基因进行异源表达时所产生的相同蛋白质。用密码子偏倚信息对新DNA序列进行设计,以使它对应目的植物的最优选密码子。然后对新序列用于通过修饰可产生的限制性内切酶位点进行分析。鉴定的位点通过用第二或第三选择的优选密码子替代进行进一步修饰。序列中可影响目的基因转录或翻译的其它位点为外显子:内含子连接处(5’或3’),多聚A添加信号或RNA聚合酶终止信号。将序列进一步进行分析及修饰以降低TA或GC双联体的频率。除了双联体外,具有同时多于约四个残基的G或C序列块可影响序列的转录。因此,序列块也可通过用下一选择的优选密码子替代第一或第二选择的密码子等将这些序列块进行修饰。
| 表2 | ||
| 玉米基因蛋白质编码区G+C含量的编译 | ||
| 蛋白质类.sup.a | %G+C范围 | 平均%G+C.sup.b |
| 代谢酶(76)结构蛋白(18)调节蛋白(5)非特征性蛋白质(9)所有蛋白质(108) | 44.4-75.348.6-70.557.2-68.841.5-70.344.4-75.3 | 59.0(.+-.8.0)63.6(.+-.6.7)62.0(.+-.4.9)64.3(.+-.7.2)60.8(.+-.5.2) |
.sup.a括号内给出类型基因数目。
.sup.b括号内给出了标准差。
.sup.c平均计算中忽略的组合组平均值
优选编码包含第一选择密码子约63%,第二选择密码子约22%至约37%之间及第三选择密码子约15%至约0%之间(其中总百分率为100%)的细菌毒素的植物优化基因。最优选包含第一选择密码子约63%,第二选择密码子至少约22%,第三选择密码子约7.5%及第四选择密码子约7.5%(其中总百分率为100%)的植物优化基因。用于玉米表达的改造基因优选的密码子选择在表3中显示。以上描述的方法使本领域技术人员能修饰用于特定植物的外源基因以使基因在植物中最佳表达。此方法在PCT申请WO97/13402中进一步阐明。
为了设计编码细菌毒素的植物优化基因,如表2显示的那样用建立自对特定植物基因序列编译的密码子偏倚表的非冗余遗传密码,将所述蛋白质的氨基酸序列反向翻译成DNA序列。将得到的密码子选择完全均一的DNA序列进一步修饰以建立这样的DNA序列,所述DNA序列除了有较高程度密码子多样性外,也包含战略上放置的限制性酶位点、需要的碱基组成及缺乏可能干扰基因转录或产物mRNA翻译的序列。
| 表3 | |
| 用于在玉米中表达的蛋白质的优选氨基酸密码子 | |
| 氨基酸 | 密码子* |
| 丙氨酸半胱氨酸天冬氨酸谷氨酸苯丙氨酸甘氨酸组氨酸异亮氨酸赖氨酸亮氨酸甲硫氨酸天冬酰胺脯氨酸谷氨酰胺精氨酸丝氨酸苏氨酸缬氨酸色氨酸酪氨酸终止子 | GCC/GCGTGC/TGTGAC/GATGAG/GAATTC/TTTGGC/GGGCAC/CATATC/ATTAAG/AAACTG/CTCATGAAC/AATCCG/CCACAG/CAAAGG/CGCAGC/TCCACC/ACGGTG/GTCTGGTAC/TATTGA/TAG |
*用于玉米的第一及第二优选密码子。
因此,与本发明毒素/基因功能性相等的合成基因可用于转化宿主,包括植物。关于产生合成基因的其它指导可在例如美国专利号5,380,831中找到。
在一些情况下,特别对于在植物中表达,用表达截短蛋白质的截短基因是有益的。例如在以上背景部分讨论的H_fte等人(1989)讨论了B.t.毒素的原毒素及核心毒素节段。优选的截短基因一般编码全长毒素的40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98或99%。
转基因宿主 可将本发明的毒素编码基因导入多种微生物或植物宿主中。在优选的实施方案中,应用转基因植物细胞及植物。优选的植物(及植物细胞)为谷物、玉米及棉花。
在优选的实施方案中,毒素基因的表达直接或间接地导致杀虫蛋白质的细胞内产生(及维持)。以这种方式可造成植物对昆虫有抗性。当害虫摄入转基因/重组/转化/转染的宿主细胞(或其内容物)时,害虫也摄入了毒素。这是引起害虫与毒素接触的优选方式。结果是控制(杀死或使得病)害虫。吸吮害虫也可用相似的方式进行控制。备选地,适当的微生物宿主,例如假单胞菌如荧光假单胞菌(P.fluorescens),可用于存在靶害虫的部位;微生物可在那里增殖,并被靶害虫摄入。带有毒素基因的微生物可在延长毒素活性及稳定细胞的条件下进行处理。然后保持毒素活性的经处理细胞可用于靶害虫的环境中。
如果将靶基因通过适当载体导入到微生物宿主,且所述宿主以存活状态应用于环境时,应该用某些宿主微生物。选择已知占据一种或多种目的作物“植物圈”(叶面,叶圈,根际和/或根面)的微生物宿主。选择这些微生物以便能在特定环境(作物及其它昆虫栖息地)中与野生型微生物进行成功竞争,提供表达多肽杀虫剂的基因稳定维持及表达,并且希望的是,对杀虫剂提供免受环境降解及灭活的经改进保护作用。
已知许多微生物栖息在很多种重要作物的叶面(植物叶的表面)和/或根际(植物根周围土壤)。这些微生物包括细菌、藻类及真菌。特别令人感兴趣的是微生物,如细菌,例如假单胞菌属(Pseudomonas),欧文氏菌属(Erwinia),沙雷氏菌属(Serratia),克雷伯氏菌属(Klebsiella),黄单胞菌属(Xanthomonas),链霉菌属(Streptomyces),根瘤菌属(Rhizobium),红假单胞菌属(Rhodopseudomonas),嗜甲基菌属(Methylophilius),农杆菌属(Agrobacterium),醋杆菌属(Acetobacter),乳杆菌属(Lactobacillus),节杆菌属(Arthrobacter),固氮菌属(Azotobacter),明串珠菌属(Leuconostoc)及产碱杆菌属(Alcaligenes);真菌,特别是酵母,例如,酵母属(Saccharomyces),隐球酵母属(Cryptococcus)、克鲁维酵母属(Kluyveromyces)、掷孢酵母属(Sporobolomyces)、红酵母属(Rhodotorula)及短柄霉属(Aureobasidium)。特别令人感兴趣的是植物圈细菌种如丁香假单胞菌(Pseudomonas syringae),荧光假单胞菌(Pseudomonas fluorescens),褪色沙雷氏菌(Serratia marcescens),木糖醋杆菌(Acetobacter xylinum),根癌农杆菌(Agrobacterium tumefaciens),类球红假单胞菌(Rhodopseudomonas spheroides),野油菜黄单胞菌(Xanthomonascampestris),苜蓿根瘤菌(Rhizobiurn melioti),富氧粪产碱菌(Alcaligenesentrophus)及瓦黑兰德固氮菌(Azotobacter vinlandii);及植物圈酵母种如深红酵母(Rhodotorula rubra),红酵母(R.glutinis),海滨红酵母(R.marina),橙黄红酵母(R.aurantiaca),浅白隐球酵母(Cryptococcusalbidus),流散隐球酵母(C.diffluens),变黄罗伦隐球酵母(C.laurentii),罗斯酵母(Saccharomyces rosei),普地酵母(S.pretoriensis),酿酒酵母(S.cerevisiae),掷孢酵母(Sporobolomyces roseus),香气掷孢酵母(S.odorus),佛地克鲁维酵母(Kluyveromyces veronae)及出芽短梗霉(Aureobasidium pollulans)也是令人感兴趣的色素微生物。
插入基因以形成转基因宿主 本发明的一方面是用表达本发明蛋白质的本发明多核苷酸转化/转染植物、植物细胞和其它宿主细胞。以这种方式转化的植物可对靶害虫的攻击产生抗性。
可获得很多种方法用于在允许基因稳定维持及表达条件下,将编码杀虫蛋白质的基因导入到靶宿主中。这些方法对本领域技术人员是公知的并例如,在美国专利号5,135,867中的描述。
例如,可获得许多包含大肠杆菌中的复制系统及允许选择经转化细胞的标记物的克隆载体用于向高等植物插入外源基因的制备。载体包括,例如pBR322,pUC系列,M13mp系列,pACYC184等。因此,编码毒素的序列可在适当的限制性位点插入到载体中。将获得的质粒转化到大肠杆菌中。将大肠杆菌细胞在适当的培养基中进行培养,然后进行收获并裂解。重新获得质粒。作为分析方法一般进行序列分析,限制性分析,电泳及其它生物化学-分子生物学方法。在每一操作后,应用的DNA序列可进行切割及与下一个DNA序列连接。每个质粒序列可克隆入相同或其它质粒中。根据向植物中插入目的基因的方法,可能需要其它DNA序列。例如,如果Ti或Ri质粒用于转化植物细胞,则Ti或Ri质粒T-DNA的至少右边界,但常常是右边界及左边界与将插入基因的侧翼区进行连接。用于转化植物细胞的T-DNA的应用已进行了深入研究并在EP 120 516;Hoekema(1985)在The Binary Plant Vector System,Offset-durkkerij Kanters B.V.,Alblasserdam,第5章;Fraley等人,Crit.Rev.Plant Sci.4:1-46;和An等人(1985)EMBO J.4:277-287中进行了与描述。
可获得许多用于向植物宿主细胞中插入DNA的技术。这些技术包括使用T-DNA通过根癌农杆菌(Agrobacterium tumefaciens)或发根农杆菌(Agrobacterium rhizogenes)转化、融合、注射、微粒轰击(biolistics)或电穿孔以及其它可能方法进行转化。如果应用农杆菌用于转化,将欲插入的DNA克隆到特定质粒中,即或插入到中间载体或插入到双元载体中。由于具有与T-DNA中序列同源的序列,中间载体可通过同源重组整合到Ti或Ri质粒中。Ti或Ri质粒也包含对T-DNA转移所必需的vir区。中间载体本身不能在农杆菌中复制。中间载体可通过辅助质粒(结合)转移到根癌农杆菌中。双元载体本身可在大肠杆菌及农杆菌中复制。它们包含构建在T-DNA右边界区及左边界区的选择标记基因及接头或多接头。它们可直接转化到农杆菌中(Holstersetal.[1978] Mol.Gen.Genet.163181-187)。用作宿主细胞的农杆菌包含携带vir区的质粒。Vir区是用于向植物细胞中转移T-DNA必需的。可包含额外T-DNA。如此转化的细菌用于转化植物细胞。植物外植体可与根癌农杆菌或发根农杆菌方便地进行培养,用于向植物细胞中转移DNA。然后整株植物在可包含用于筛选的抗生素或杀生物剂的适当培养基中从受感染植物材料(例如,叶片、茎段、根,还有原生质体或经悬浮培养细胞)再生。然后对如此获得的植物是否存在经插入DNA进行检测。关于注射及电穿孔的质粒无特殊需求,用常规质粒如例如pUC衍生物是可能的。
经转化细胞在植物体内以常规方式生长。它们可形成生殖细胞并将经转化特性传递给子代植物。此类植物可以正常方式进行生长并与具有相同的经转化遗传因子或其它遗传因子的植物进行杂交。得到的杂交个体具有相应的表型特征。
在本发明的一些优选实施方案中,编码细菌毒素的基因从插入到植物基因组中的转录单位进行表达。优选地,所述转录单位为能稳定整合到植物基因组中并能选择表达编码所述蛋白质的mRNA的经转化植物品系的重组载体。
一旦经插入的DNA整合到基因组中,则所述经插入DNA在基因组中相对稳定(并不再出来)。它通常包含使经转化植物细胞可抵抗杀生物剂或抗生素,如卡那霉素、G418、博来霉素、潮霉素或氯霉素等的选择标记。因此单独使用的标记允许选择经转化细胞,而不是选择不包含经插入DNA的细胞。目的基因优选通过组成型或可诱型导启动子在植物细胞中表达。mRNA一旦表达,即翻译成蛋白质,由此将目的氨基酸整合到蛋白质中。编码毒素的基因在植物细胞中的表达可在组成型启动子、组织特异型启动子或可诱导型启动子的控制下。
存在几种技术用于向植物细胞导入外源重组载体并用于获得稳定维持并表达所导入基因的植物。此类技术包括将包裹在微粒上的遗传物质直接导入到细胞中(Cornell的美国专利号4,945,050及DowElanco的,现在为Dow AgroSciences,LLC的5,141,131)。此外,植物可用农杆菌技术进行转化,参见Toledo大学的美国专利号5,177,010;Texas A&M的5,104,310;欧洲专利申请0131624B1;Schilperoot的欧洲专利申请120516,159418B1及176,112;Schilperoot的美国专利号5,149,645,5,469,976,5,464,763及4,940,838及Schilperoot的4,693,976;均属于Max Planck的欧洲专利申请116718,290799,320500;日本烟草局的欧洲专利申请604662及627752,及美国专利号5,591,616;均属于Ciba Geigy现在为Novartis的欧洲专利申请0267159及0292435,及美国专利号5,231,019;均属于Calgene的美国专利号5,463,174及4,762,785;及均属于Agracetus的美国专利号5,004,863及5,159,135。其它转化技术包括whiskers技术。参见均属于Zeneca的美国专利号5,302,523及5,464,765。电穿孔技术也用于转化植物。参见Boyce Thompson研究所的WO87/06614;均属于Dekalb的美国专利号5,472,869及5,384,253;及均属于Plant Genetic Systems的WO 92/09696及WO 93/21335。此外,病毒载体也可用于产生表达目的蛋白质的转基因植物。例如,单子叶植物可用属于Mycogen Plant Science和Ciba-Giegy,现在为Novartis的美国专利号5,569,597以及均属于Biosource的美国专利号5,589,367及5,316,931描述的方法用病毒载体进行转化。
如以前阐述的,DNA构建体导入到植物宿主的方式对本发明不是关键性的。可使用提供用于有效转化的任何方法。例如,用于植物细胞转化的多种方法在文中进行描述并包括用Ti或Ri质粒等进行农杆菌介导的转化。在许多情况下,希望将用于转化的构建体的一侧或两侧邻近T-DNA边界,更具体地为右边界。当构建体应用根癌农杆菌或发根农杆菌转化时,这是特别有用的,虽然T-DNA边界可在其它转化方式中找到其它用途。当农杆菌用于植物细胞转化时,可应用可导入到宿主中用于与宿主中存在的T-DNA或Ti或Ri质粒同源重组的载体。导入载体可通过电穿孔、三亲杂交及其它本领域技术人员已知的用于转化革兰氏阴性细菌的其它技术进行。载体导入到农杆菌宿主中的方式对本发明不是关键性的。包含T-DNA的用于重组的Ti或Ri质粒可能或不能引起菌瘿形成,并且只要在所述宿主中存在vir基因,这对所述发明并不是关键性的。
在农杆菌用于转化的一些情况下,如文中引用作为参考的Ditta等人描述的(PNAS USA(1980)77:7347-7351及EPO 0120 515),将在T-DNA边界内的表达构建体插入到广谱载体如pRK2或其衍生物中。表达构建体及T-DNA内包括文中描述的允许选择经转化农杆菌及经转化植物细胞的一个或多个标记。利用的特别标记对本发明不是必需的,优选的标记取决于所用的宿主及构建体。
对于用农杆菌转化植物细胞,可将外植体与经转化农杆菌进行组合并孵育足够时间以使其转化。转化后,通过用适当的抗生素筛选将农杆菌杀死并且植物细胞用适当的选择性培养基进行培养。一旦形成愈伤组织,根据本领域公知的植物组织培养及植物再生的方法,可通过利用适当植物激素促进枝条形成。然而,愈伤组织中间期不一定是必需的。枝条形成后,将所述植物细胞转移到促进根形成的培养基中,因此完成植物再生。然后植物可长大结种并且所述种子可用于建立后代。不管转化技术为何种技术,编码细菌毒素的基因优选整合到适合在植物细胞中表达所述基因的基因转移载体,其中所述载体中包括植物启动子调节元件以及3’非翻译转录终止区如Nos等。
除了用于转化植物的许多技术外,与外源基因接触的组织型也可变化。此类组织包括但不限于胚发生组织,愈伤组织组织I,II和III型,下胚轴,分生组织,根组织,用于在韧皮部表达的组织等。几乎所有植物组织可在去分化期间用文中描述的适当方法进行转化。
如以上阐述的,如果需要,可用多种可选择标记。对特定标记的优选是由技术人员决定的,但以下任何可选择标记可与任何文中没有列出的作为可选择标记发挥作用的其它基因一起应用。此类可选择标记包括但不限于编码抗抗生素卡那霉素、新霉素及G418的转座子Tn5(AphII)的氨基糖苷磷酸转移酶基因以及编码用于抵抗或耐受草甘瞵;潮霉素;氨甲蝶呤;膦丝菌素(双丙氨膦);咪唑啉酮,磺酰脲及三唑并嘧啶除草剂,如氯硫磺;溴草腈,茅草枯等的那些基因。
除可选择标记外,还希望应用报道基因。在一些情况下,报道基因可在有或无可选择标记时应用。报道基因为一般在受体生物体或组织中不存在,并且一般编码的蛋白质导致一些表型变化或具有酶特性的基因。K.Wising等人,Ann.Rev.Genetics,22,421(1988)提供了此类基因的实例。优选的报道基因包括大肠杆菌uidA基因座的β-葡糖苷酸酶(GUS),来自大肠杆菌Tn9的氯霉素乙酰转移酶基因,来自生物发光水母维多利亚水母(Aequorea victoria)的绿色荧光蛋白及来自北美萤火虫(Photinuspyralis)的萤光素酶基因。然后可在所述基因导入到受体细胞后的适当时间检测报道基因表达。优选的此种测定法需要如通过Jefferson等人(1987Biochem.Soc.Trans.15,17-19)描述的应用编码大肠杆菌uidA基因座β-葡糖苷酸酶(GUS)的基因以鉴定经转化细胞。
除植物启动子调节元件外,来自多种来源的启动子调节元件可有效用于在植物细胞中表达外源基因。例如可应用细菌源的启动子调节元件,如章鱼氨酸合酶启动子,胭脂氨酸合酶启动子,甘露氨酸合酶启动子;病毒源启动子,如花椰菜花叶病毒(35S及19S),35T(为重新改造的35S启动子,参见美国专利号6,166,302,特别是实施例7E)等等。植物启动子调节元件包括但不限于核酮糖-1,6-二磷酸(RUBP)羧化酶小亚单位(ssu),β-伴大豆球蛋白启动子,β-云扁豆蛋白启动子,ADH启动子,热休克启动子及组织特异的启动子。可存在其它元件如基质附着区,支架附着区,内含子,增强子,多聚腺苷酸化序列等等并因此可改进转录效率或DNA整合性。此类元件对DNA功能可需要或可不需要,虽然它们可通过影响转录、mRNA稳定性等提供更好的DNA表达或功能。由于希望获得经转录DNA在植物中的最佳性能,此类元件可包括在DNA中。典型的元件包括但不限于Adh-内含子1,Adh-内含子6,苜蓿花叶病毒包膜蛋白前导序列,玉米条纹病毒包膜蛋白前导序列,以及技术人员可获得的其它元件。因此组成型启动子调节元件也可在所有细胞型中于任何时候均指导持续的基因表达(例如,肌动蛋白,遍在蛋白,CaMV 35S等等)。组织特异启动子调节元件负责在特定细胞或组织型如叶或种子中的基因表达(例如玉米醇溶蛋白,油质蛋白,napin,ACP,球蛋白等等)并且也可应用此类启动子。
启动子调节元件也可在植物发育的某阶段有活性以及在植物组织及器官中有活性。此类实例包括但不限于花粉特异、胚特异、玉米穗特异、棉花纤维特异、根特异、种子胚乳特异的启动子调节元件等。在某些情况下,希望应用诱导型启动子调节元件,其负责对特异信号如物理刺激(热休克基因)、光(RUBP羧化酶)、激素(Em)、代谢物、化学物及应激作出反应的基因表达。可应用在植物中发挥作用的其它所需转录及翻译元件。许多植物特异的基因转移载体是本领域公知的。
可用标准分子生物学技术对文中描述的毒素进行克隆及测序。其它信息可在此处引用作为参考的Sambrook,J.,Fritsch,E.F.和Maniais,T.(1989),Molecular Cloning,A Laboratory Manual(Cold Spring Harbor出版社)一书中找到。
抗性控制 随着杀虫蛋白质在转基因植物中商品化应用的增加,一个须考虑的问题是抗性控制。有许多公司在他们的产品中应用苏云金芽孢杆菌毒素,然而一些昆虫会产生B.t.毒素抗性是令人担心的。一个用于昆虫抗性控制的策略是将致病杆菌,光杆状菌等产生的TC毒素等等与毒素如B.t.(晶体毒素,来自芽孢杆菌菌株的可溶性杀虫蛋白质(参见,例如WO98/18932及WO99/57282))或其它昆虫毒素进行组合。组合物可制备为用于可喷雾应用或可为分子组合物。植物可用产生两个或多个不同昆虫毒素的细菌基因进行转化(参见,例如Gould,38 Bioscience 26-33(1988)及美国专利号5,500,365;同样,欧洲专利申请0 400 246 A1及美国专利5,866,784;5,908,970及6,172,281也描述了用两个B.t.晶体毒素转化植物)。另一个产生包含多个昆虫抗性基因的转基因植物的方法是首先产生两种植物,每种植物包含一种昆虫抵抗基因。然后将这些植物用传统植物育种技术进行杂交以产生包含一种以上昆虫抗性基因的植物。因此,如文中应用的“包含多核苷酸”的短语除了另外特别指明外表示至少一个多核苷酸(且可能更多,为连续或不连续的)。
剂型及其它递送系统 制备成包含目标类芽孢杆菌分离株的芽孢和/或晶体的诱饵颗粒或包含获自文中公开分离株基因的重组微生物,可应用于土壤。经制成产物可作为种子包衣应用或在作物周期晚期进行根处理或整个植物处理而应用。植物及土壤处理细胞可通过与多种惰性物质,如无机矿物质(叶硅酸盐、碳酸盐、硫酸盐、磷酸盐等等)或植物材料(粉碎的玉米芯、稻壳、核桃壳等等)混合用作可湿性粉剂、颗粒剂或粉剂。剂型可包括展布-粘着(spreader-sticker)佐剂、稳定剂、其它杀虫添加剂或表面活性剂。液体剂型可为基于水的或非水的并用作泡沫、凝胶、悬液、乳油等等。成分可包括流变剂、表面活性剂、乳化剂、分散剂或聚合物。
如本领域技术人员理解的,杀虫浓度可有很大变化,这取决于特定的剂型特性,特别是其为浓缩物还是直接应用。杀虫剂可占重量的至少1%,并可占重量的100%。干燥剂型可具有约1-95%重量的杀虫剂,而液体剂型一般在液相中具有约1-60%的固体重量。剂型一般具有约从102至约104个细胞/毫克。这些剂型在每公倾上使用约50mg(液体或干燥物)至1kg或更多。
剂型可通过喷雾、撒粉、喷洒等等应用到害虫的环境中,例如土壤或树叶。
另一个递送方式是将毒素的遗传物质整合到杆状病毒载体中。杆状病毒感染特定昆虫宿主,包括希望用毒素靶向的宿主。可将携带毒素表达构建体的感染性杆状病毒导入到昆虫出没地区以毒死经感染的昆虫。
昆虫病毒或杆状病毒已知感染并对某些昆虫有不利作用。病毒对昆虫的作用缓慢,并且病毒不立即停止昆虫的摄食。因此,不认为病毒是最佳的虫害控制剂。然而,将毒素基因组合到杆状病毒载体中可提供传播毒素的有效途径。此外,由于不同杆状病毒对不同昆虫是特异的,用特定毒素选择性靶向特定实施损害的虫害是可能的。用于毒素基因的特别有用的载体是核多角体病毒。已对使用此病毒的转移载体进行了描述并且现在是用于转移外源基因进入昆虫的选择载体。病毒-毒素基因重组体可以经口传播形式进行构建。杆状病毒通常通过中肠肠粘膜感染昆虫。可将插入到强病毒包膜蛋白启动子后的毒素基因进行表达并快速杀死经感染昆虫。
除了用于本发明蛋白质毒素的昆虫病毒或杆状病毒或转基因植物递送体系外,蛋白质可用苏云金芽孢杆菌包囊技术(诸如但不限于文中引用作为参考的美国专利号4,695,455;4,695,462;4,861,595)进行包裹。用于本发明蛋白质毒素的另一递送体系为将蛋白质制入诱饵基质,然后将诱饵基质应用到地上及地下昆虫诱饵站中。此类技术的实例包括但不限于文中引用作为参考的PCT专利申请WO93/23998。
基于植物RNA病毒的系统也用于表达细菌毒素。在如此做时,可将编码毒素的基因插入到感染目的宿主植物的适当植物病毒的包膜启动子区。然后毒素进行表达,由此对来自昆虫损害的植物提供保护。基于植物RNA病毒的系统在Mycogen Plant Sciences,Inc.的美国专利号5,500,360 to及Biosource Genetics公司的美国专利号5,316,931及5,589,367中进行了描述。
除了产生经转化植物外,希望有对细菌基因进行重新改造的其它递送系统。例如,蛋白质毒素可通过与吸引昆虫的分子融合而构建,从而作为带毒素的食物源。在实验室中纯化后可将有“内部”诱饵的此种毒性剂包装进标准昆虫诱捕房中。
突变体 本发明DAS1529及DB482分离株的突变体可通过本领域公知的方法进行制备。例如,不产孢子突变体可通过用甲磺酸乙酯(EMS)诱变分离株而获得。突变体可通过本领域公知的方法用紫外线及亚硝基胍进行制备。
所有文中谈及的或引用的专利、专利申请、临时申请及出版物完整并入本文,使它们与本说明书的明确教导相一致的程度在文中引用作为参考。
以下为说明实行本发明步骤的实施例。这些实施例不作为限制。除非另外注明,所有百分率为重量百分率且所有溶剂混合物比例为体积比例。
实施例1-DAS1529作为类芽孢杆菌种的分离及杀虫活性的发现
发现称为DAS1529的细菌菌株产生对新生鳞翅目昆虫谷实夜蛾(cornearworm;CEW)、烟芽夜蛾(TBW)及烟草天蛾(THW)具有生长抑制的因子。
DAS1529在添加1.25%NaCl的2%蛋白酶蛋白胨3号(PP3)培养基(Difco Laboratories,Detroit,MI)或在添加0.2%葡萄糖的JB培养基中进行培养。细菌培养物于25℃,150转/分钟生长~40小时。
杀虫活性因子最初在5kDa分子量截止滤波器浓缩的发酵培养液中发现。这些因子是不耐热的(通过于85℃加热20分钟进行灭活)。这些数据表明因子为蛋白质性质的。也参见实施例4末尾。
为鉴定细胞沉淀物中的活性因子,将细菌培养物于8000转/分钟在4℃进行离心5分钟,用无菌蒸馏水洗涤一次,并在无菌蒸馏水中重新悬浮至33X原培养体积,并如以下实施例3描述的进行昆虫生物试验。对DAS1529菌株的生物测定数据在表4中进行了总结。数据显示培养培养液及经浓缩DAS1529细菌细胞对CEW(在33X时,有30至50%死亡率)及TBW(在33X时有100%死亡率)有好的活性。DAS1529中的这些毒素因子与靶向研发谷物及棉花中鳞翅目昆虫(例如,CEW及TBW)的商品化转基因产物有重要相关性。
| 表4 | |||
| DAS1529菌株的生物测定 | |||
| 昆虫培养液活性沉淀物活性 | TBW++++++ | CEW+++++ | 蛴螬n.d.- |
*n.d.-没有测定;-,++,+++,分别为无,中等及高活性
实施例2-DAS1529的分类
进行了分子种系发生以确定DAS1529菌株的分类学关系。确定了DAS1529 16SrDNA的核苷酸序列并用于相似性及系统进化分析(用来自ABI的MicroSeq试剂盒)。序列作为SEQ ID NO:16进行提供。BLAST检索结果如下:
核心E
(比特)
值
gi|15395282|emb|AJ320490.1|PTH320490 解硫胺素类芽孢杆菌 2906
0.0
gi|3328014|gb|AF071859.1|AF071859 日本甲虫类芽孢杆菌s... 2834
0.0
gi|3328015|gb|AF071860.1|AF071860 日本甲虫类芽孢杆菌s... 2815
0.0
gi|2769591|emb|Y16129.1|PS16SC168 类芽孢杆菌C-168 1... 2699
0.0
gi|2769590|emb|Y16128.1|PS16ST168 类芽孢杆菌T-168 1... 2509
0.0
gi|2077917|dbj|D78475.1|D78475 解硫胺素类芽孢杆菌
2503
0.0
gi|3328016|gb|AF071861.1|AF071861 缓病类芽孢杆菌 2493
0.0
gi|2895560|gb|AF039408.1| Racillus tipchiralis 16S
核糖体 2493
0.0
gi|2077936|dbj|D88513.1|D88513 解硫胺素类芽孢杆菌
2493
0.0
gi|15395283|emb|AJ320491.1|PAL320491 蜂房类芽孢杆菌pa... 2404
0.0
来自BLAST检索的这些相同高分值序列也用来自GCG 10.2版的缺口程序(Needleman和Wunsch,J.Mol.Biol.48;443-453(1970))进行比较,有以下结果:
%Ident
%Sim
gi|15395282|emb|AJ320490.1|PTH320490 解硫胺素类芽孢杆菌 99.2 99.6
gi|3328014|gb|AF071859.1|AF071859 日本甲虫类芽孢杆菌s... 99.2
99.6
gi|3328015|gb|AF071860.1|AF071860 日本甲虫类芽孢杆菌s... 99.2
99.3
gi|2769591|emb|Y16129.1|PS16SC168 类芽孢杆菌C-168 1... 97.1
97.3
gi|2769590|emb|Y16128.1|PS16ST168 类芽孢杆菌T-168 1... 97.4
97.4
gi|2077917|dbj|D78475.1|D78475 解硫胺素类芽孢杆菌
96.5
98.1
gi|3328016|gb|AF071861.1|AF071861 缓病类芽孢杆菌 98.8
98.9
gi|2895560|gb|AF039408.1| Bacillus tipchiralis 16S
核糖体 96.0
96.9
gi|2077936|dbj|D88513.1|D88513 解硫胺素类芽孢杆菌
96.7
98.7
gi|15395283|emb|AJ320491.1|PAL320491 蜂房类芽孢杆菌pa... 95.2
95.3
[%Ident:明确碱基的配对;%Sim:%Ident加上潜在匹配的不明确碱基]
许多相关序列,包括以上注明的高分值序列,也用序列对比程序CLUSTRAL W(Thompson,J.D.,D.G.Higgins和T.J.Gibson,NucleicAcids Res.22:4673-4680,1994),通过Shida等人的描述(Int.J.Syst.Bacteriol.47:289-298,1997)进行整理及排列。结果清楚地将DAS1529列入Pettersson等人鉴定的类芽孢杆菌属中的日本甲虫类芽孢杆菌/缓病类芽孢杆菌亚群(Int.J.Syst.Bacteriol.49:531-540,1999),并与以上报导的分析一致。此亚群包括昆虫相关种日本甲虫类芽孢杆菌、缓病类芽孢杆菌及解硫胺素类芽孢杆菌(类芽孢杆菌T-168及C-168种),及已知没有昆虫相关性的“Bacillus tipchiralis”(Pettersson等人,1999)。如Wayne等人(Int.J.Syst.Bacteriol.37:463-464,1987)及Vandamme等人(Microbiol.Rev.60:407-438)指出的,大于97%同一性的rDNA序列在没有额外信息时,一般不可用于将细菌菌株归入特定种中。对于DAS1529,对鳞翅目的杀虫活性及硫胺素酶的证据与已知的日本甲虫类芽孢杆菌及缓病类芽孢杆菌不一致,昆虫相关性与已知的解硫胺素类芽孢杆菌(以及其它亚群种)也不一致。
因为其它类芽孢杆菌菌株已知为对日本甲虫(Popillia jalonica)幼虫引起乳白病的病原因子(Harrison等人,2000),将DAS1529对日本甲虫的亲缘物种六月甲虫(June beetles)的活性进行检测。对于在JB与PP3培养基中生长的培养物没有发现活性。显微镜检查这些培养物显示菌体均匀着色,无可见孢子形成或不存在伴孢晶体。我们能显示DAS1529可在定义的培养基及培养条件以及烟草天蛾的血淋巴中形成孢子。已知具有日本甲虫活性的类芽孢杆菌菌株一般与多分孢子及类芽孢体相关(Harrison等人,2000)。
需要额外工作以确定DAS1529是否属于存在种或应归入新种命名。
实施例3-昆虫生物试验方法
应用两种昆虫生物试验方法以获得以下列出的结果。96孔形式及128孔形式用于最初筛选抗鳞翅目昆虫的活性。24孔加入食物的形式用于确定毒素的特异活性(LC50)。
对于96孔形式,人工食物分装到96孔微滴度板中。每孔测量为大约0.32cm2并包含150μl人工食物。样本/毒素以50μl/孔用于发酵培养液、细胞沉淀物及经纯化毒素。包括适当剂量的阳性对照(Cry1Ac)及高剂量的阴性对照(水,空白培养基,不表达靶毒素的细菌宿主菌株)。使样本干燥大约1-3小时以便样本丧失湿度,但食物仍保留湿度。将昆虫卵分散到经样本处理食物的表面上,或每孔种上单一昆虫幼虫。经感染板用铁上(iron-on)聚酯薄膜覆盖或用带孔粘性盖覆盖。在聚酯薄膜上制备小气孔以保证昆虫的空气供应。板于28℃孵育5天并对死亡率及发育障碍进行评分。这在每孔基础上进行,由于每孔中常沉积多个卵,故忽略每孔中幼虫的数目。然后指定每一处理的活性分值:0=无活性,幼虫健康度与水对照孔相同,1=幼虫发育障碍或有一些死亡率的发育障碍,2=所有幼虫死亡。
样本/毒素的特异活性(LC50)在24孔Nutrend板(Nu-TrendTMContainer Corp.,Jacksonville,FL)中通过掺入食物的生物试验进行确定。昆虫人工食物在应用前进行制备并于55℃水浴中保持液体状态。通过将27ml人工食物与不多于3ml样本/毒素混合进行系列稀释(≥5)。将样本与食物混合物总共30ml进行涡旋30秒,然后平均分装到每个板中,装满每孔容积的~50%。在感染前使板冷却至少30分钟。感染每个孔的受试昆虫,将清晰的聚酯薄膜封在每个包含昆虫的板上。用昆虫针在每孔的聚酯薄膜上打上小孔用于空气循环。试验一般于25℃进行6天,但如果需要更快出来结果,一些可于30℃进行4天。对每一试验进行一组阳性及一组阴性对照。试验基于死亡率进行评分,但对发育障碍的数据也进行记录。对受试样本应用统计学方法评估LC50并用ng或μg/ml食物进行表达。
实施例4-来自DAS1529发酵培养液的杀虫毒素-硫胺素酶的生物化学纯
化及表征
DAS1529发酵培养液包含对鳞翅目物种,如烟草蚜虫、谷实夜蛾及烟草天蛾的杀虫活性。通过生物化学纯化及表征对杀虫活性的性质进行了研究。在纯化过程中如实施例3所述进行了谷实夜蛾的生物试验,以了解杀虫活性。
DAS1529发酵培养液用添加1.25%NaCl的2%PP3产生,并如实施例1描述的进行处理。根据制造商推荐,用与Amicon M-12过滤装置连接的Amicon(Beverly,MA)螺旋超滤柱S1Y10(10kDa分子量截止)将四升培养液进行浓缩。将存留物用20mM磷酸钠,pH7.0(缓冲液A)进行渗滤,并以5ml/分钟上样于Q琼脂糖凝胶XL阴离子交换柱(1.6×10cm)。用5倍床体积的缓冲液A将柱进行洗涤以去除未结合的蛋白质。毒素活性通过在缓冲液A中的1.0M NaCl进行洗脱。
包含杀虫活性的级分以20ml等份上样至用缓冲液A平衡的凝胶过滤柱Macro-Prep SE 1000/40(2.6×100cm)上。蛋白质用缓冲液A以3ml/分钟流速进行洗脱。收集对谷实夜蛾有活性的级分并以1ml/分钟流速上样于用20mM Tris-HCl,pH7.0(缓冲液B)平衡的MonoQ(1.0×10cm)柱上。与柱结合的蛋白质用缓冲液B中的0至1M NaCl的线性梯度以2ml/分钟洗脱60分钟。对两毫升级分进行收集并如实施例1描述的对活性进行确定。
向以上活性蛋白质级分中加入固体(NH4)2SO4使终浓度为1.7M。然后以1ml/分钟将蛋白质上样于用在50mM磷酸钾缓冲液,pH7(缓冲液C)中含1.7M(NH4)2SO4平衡的苯基-Superose(1.0×10cm)柱。用10毫升缓冲液C洗柱后,将与柱结合的蛋白质用缓冲液C至5mM磷酸钾,pH7.0的线性梯度以1ml/分钟洗脱120分钟。对通过生物试验确定的最强活性级分合并,并用缓冲液A透析过夜。
经透析样本以1ml/分钟上样于用缓冲液B平衡的Mono Q(0.5×5cm)柱。与柱结合的蛋白质通过在缓冲液B中的0至1M NaCl的线性梯度以1ml/分钟进行洗脱。对活性级分合并,并调整(NH4)2SO4终浓度为1.7M。然后以1ml/分钟将蛋白质上样于用缓冲液C平衡的苯基-Superose(0.5×5cm)柱。与柱结合的蛋白质用缓冲液C至5mM磷酸钾,pH7.0的线性梯度以0.5ml/分钟洗脱40分钟。对经纯化级分合并,并用缓冲液A透析过夜。
最终经纯化毒素的分子量通过凝胶过滤柱Superdex S-200进行检查。毒素显示天然分子量大约为40kDa。经纯化毒素的SDS-PAGE显示大约40kDa的明显条带。这表明天然DAS1529毒素(在此级分中)是大约40kDa的单体。
经纯化毒素在4-20%SDS-PAGE中进行电泳并转印到PVDF膜上。将印迹进行氨基酸分析并进行N末端氨基酸序列测定(SEQ ID NO:17)。使用所述序列查询而搜索蛋白质数据库(NCBI-NR),显示它与来自解硫胺素芽孢杆菌的约42kDa硫胺素酶I有95%同一性(Campobasso等人,1998;基因库登录号2THIA;SEQ ID NO:18)。部分序列比对在图3中显示,它与基因库登录号AAC44156(硫胺素酶I前体;U17168是用于DNA基因库的相应登录号,所述硫胺素酶I前体可进行表达以得到产生并分泌自细菌细胞的硫胺素酶)存在同样比对。对来自DAS1529的经纯化硫胺素酶对谷实夜蛾(CEW)的作用进行了检测,结果在图4中显示。该毒素不能杀死谷实夜蛾(浓度达8μg/cm2)但在浓度低至5ng/cm2时显示95%的生长抑制作用。也发现经纯化硫胺素酶不被蛋白酶K灭活。
实施例5-克隆编码DAS1529产生的杀虫因子基因
为了克隆编码DAS1529产生的杀虫因子的核苷酸序列,用分离自DAS1529的总DNA构建了粘粒文库并对杀虫活性进行了筛选。鉴定了六个产生对谷实夜蛾有杀虫活性的重组粘粒克隆。所述粘粒克隆中有三个产生导致昆虫死亡的不耐热(当加热至85℃持续20分钟)因子。另外三个粘粒克隆产生对昆虫生长抑制的不耐热因子。选择一个产生昆虫死亡的粘粒,命名为粘粒SB12,用于核苷酸序列分析。
A.DAS1529粘粒文库的构建
用DNA纯化试剂盒(Qiagen Inc.,Valencia,CA)从DAS1529分离总DNA。载体及插入DNA的制备、连接及包装,按供应商(Stratagene,La Jolla,CA)的说明进行。将作为Sau3AI DNA片段的DAS1529 DNA插入片段克隆入SuperCos 1粘粒载体的BamHI位点。将经连接产物用Gigapack_III金包装提取物进行包装并转染宿主细胞XL1-Blue MRF’。将转化物在LB-卡那霉素琼脂板上进行筛选。粘粒文库由在200μl LB-卡那霉素(50μg/ml)中的10个96孔微滴度板上生长的960个随机挑选克隆组成,用于昆虫活性筛选及长期保存。
B.
筛选DAS1529粘粒文库的杀虫活性
对于抗鳞翅目昆虫(CEW及TBW)活性的克隆的初步筛选,作为单一菌落的总共960个粘粒克隆在96孔板的2ml培养基中生长。将培养物进行离心,以大约10X浓度重悬于原初培养基中并进行生物试验。包括SuperCos 1载体(SB1)作为阴性对照。从第一轮筛选分离到十六个阳性克隆(SB2至SB17)。进行第二及第三轮筛选以筛选抗TBW及CEW的活性。选择了一个一贯显示最高活性的粘粒克隆(SB12)用于进一步分析。表5总结了SB12粘粒的活性谱(作为经测试的活性谱)。(BAW为甜菜夜蛾(Spodoptera exigua);ECB为欧洲玉米螟(Ostrinia nubilalis);SCRW为南方谷类根虫(Diabrotica undecimzpucata howardi))。SB12大肠杆菌(E.coli)培养培养液均不包含CEW活性;因此,SB12中的活性因子与DAS1529菌株培养培养液中的活性因子不同。
| 表5SB12大肠杆菌克隆的生物试验 | ||||||
| 昆虫培养液活性沉淀物活性 | TBW-+++ | CEW-++ | ECBn.d.*+ | BAWn.d.++ | 蛴螬n.d.- | SCRn.d.- |
*n.d.-未测定;-,++,+++,分别为无,中等,高活性
C.SB12粘粒插入片段的序列测定及tc样和cry样ORF的鉴定
粘粒SB12的核苷酸序列测定显示它包含一个大约34kb的基因组插入片段。这个序列分析令人惊讶地显示存在至少10个推定可读框(ORF)(参见图2)。令人惊讶地发现经鉴定ORF中六个与以前鉴定的来自发光光杆状菌(Waterfield等人,2001)、嗜线虫致病杆菌(Morgan等人,2001)、Serratia entonaophila(Hurst和Glare,2002;Hurst等人,2000)及鼠疫耶尔森氏菌(Yersinia pestis)(Cronin等人,2001)的tcaA,tcaB,tcaC及tccC有一些程度的氨基酸序列同一性(38-48%)。已显示那些来自光杆状菌,致病杆菌及沙雷氏菌的TC蛋白质基因编码杀虫因子。也非常令人感兴趣的是一个DAS1529 ORF与来自苏云金芽孢杆菌的Cry1Ac有~40%的氨基酸序列同一性,其中所述Cry1Ac为另一个以前鉴定为杀虫因子的基因(Schnepf等人,1998;de Maagd等人,2001)。这些发现对理解细菌界中毒素基因分布及研发用于毒素基因搜索及改造的进一步策略有重要意义。
确定了SB12粘粒的核苷酸序列。进一步分析了41,456bp长的经组装DNA。定位了三处缺口:两处位于粘粒载体中,一处位于插入片段中。大约34,000bp的最长毗连序列群的核苷酸序列分析显示存在至少10个推定的可读框(ORF),它们被鉴定为潜在的起始密码子及其后延伸的可读框。已知在与类芽孢杆菌相关的基因组中这个方法对翻译起始位点的错误鉴定率为19%(枯草芽孢杆菌((Bacillus subtilis))及22%(耐盐芽孢杆菌(Bacillus halodurans))(Besemer,J.,Lomsadze,A.,Borodovsky,M.,Nucleic Acids Res.29:2607-2618,2001)。因此,在鉴定天然翻译起始位点时,考虑了与枯草芽孢杆菌16S rRNA 5’末端互补的碱基(在Rocha,E.P.C.,Danchin,A.,Viari,A.,Nucleic Acids Res.27:3567-3576,1999中进行综述)的性质和位置、N末端氨基酸序列及与相关基因的比对。推定的ORF及注释总结在表6中,并在以下进行了更详细的讨论。
| 表6对SB12粘粒序列的序列注释 | ||||
| SEQ ID NO: | 一些ORF类似于: | SB12上的ORF命名 | 评论 | SEQ ID NO:1上的序列位置 |
| 1 | SB12的完整插入片段 | (1-33521) | ||
| 2 | tcaA(在5’截短) | ORF1 | 1-3264 | |
| 3 | 翻译ORF1 | (1-3261) | ||
| 4 | tcaB | ORF2(去除了IS元件) | 3271-4740(5’端)6079-8226(3’端) | |
| 5 | 从最5’端ATG翻译ORF2(无插入片段) | (氨基酸1-490/491-1205) | ||
| 6 | tcaA | ORF3 | 9521-12820 | |
| 7 | 翻译ORF3 | (9521-12817) | ||
| 8 | tcaB | ORF4 | 12827-16453 | |
| 9 | 从最5’端ATG翻译ORF4 | (12827-16450) | ||
| 10 | tcaC | ORF5 | 16516-20850 | |
| 11 | 翻译ORF5 | (16516-20847) | ||
| 12 | tccC | ORF6 | 20867-23659 | |
| 13 | 翻译ORF6(从较好的RBS) | (20867-23656) | ||
| 14 | ORF7(Cry1529) | 24422-26213 | ||
| 15 | 翻译ORF7 | |||
| 19 | tccC | 从最5’端ATG翻译ORF6 | 20798-23656 | |
粘粒SB12中ORF1开始于DAS1529DNA克隆位点的第一个核苷酸,并因此丢失了其天然翻译起始位点。ORF1与ORF3有显著的DNA序列同源性,并且序列比较分析表明ORF1的头18bp被截短,如ORF3中发现的那样,这前六个密码子编码氨基酸甲硫氨酸-缬氨酸-丝氨酸-苏氨酸-苏氨酸。推测ORF1翻译起始与ORF3的翻译起始相似,从SEQ ID NO:1的大约9505碱基到9523碱基处。如以上提及的,基于备选的翻译起始位点,对于ORF2,ORF4及ORF6给出了两个预测的氨基酸序列(SEQ IDNO:19及13)。对于ORF2,以上讨论了SEQ ID NO:5。备选的及优选的起始位点位于ORF1的3295残基处。因此,从这个起始位点得到的蛋白质开始于SEQ ID NO:5的氨基酸残基9(从较好的RBS翻译)。同样,对于ORF4,以上讨论了SEQ ID NO:9。备选的及优选的起始位点位于SEQ ID NO:1的12,852残基处。得到的蛋白质也丢失了SEQ ID NO:9的前八个氨基酸(因此开始于SEQ ID NO:8的氨基酸残基9-从较好的RBS翻译)。
实施例6-“重复”TC的序列分析
将两个ORF2片段(tcaB1)与ORF4(tcaB2)比较确定序列的同一性程度,并将ORF1(tcaA1)与ORF3(tcaA2)比较确定序列的同一性程度这两对ORF观察到相似的序列关系。
因为本身插入(显然是自发产生的)了插入序列样元件并破坏了ORF2,所以通过合并两个片段而构建了该ORF。参见图2。这个插入片段的位置通过将全长SB12 DNA序列(SEQ ID NO:1)与SEQ ID NO:4的序列进行分析/比较而确定,其中所述后一序列不反映(非编码)插入片段。如图7的括号所指明的,SEQ ID NO:4残基490前的5’翻译产物及从残基491始的3’翻译产物的序列,与ORF4(SEQ ID NO:8)排列很好。在明显插入位点处的DNA序列显示为通常在插入元件侧翼发现的9bp直接重复(CACCGAGCA,SEQ ID NO:1的4734-4742及6071-6080碱基)。
实施例7-进一步的序列分析
总而言之,根据Vector NTI clustalW,GCG和/或Blastp分析,六个经鉴定的ORF(ORF1至ORF6)与tcaA、tcaB、tcaC及tccC(以前鉴定的光杆状菌tc基因)具有38-48%氨基酸序列同一性。ORF7编码与来自苏云金芽孢杆菌的Cry1Ac有~40%氨基酸序列同一性的蛋白质,其中所述Cry1Ac为另一个以前鉴定为杀虫因子的基因。通过将ORF7(Cry1529)与许多其它Cry蛋白质序列比较,产生种系图(图8)。这个系统发育树表明Cry1529与其它日本甲虫类芽孢杆菌Cry序列如Cry18s远缘相关(Zhang等人,1997,Zhang等人,1998),其中所述Cry18s与Cry2s是相近的。Cry1529落入这样一组Cry蛋白质组中(虽然与其并不接近,但仍是最接近的),所述组通常含有在鳞翅目中发现的(Cry1,Cry9)毒素、鞘翅目中发现的(Cry3,Cry8,Cry7)毒素及双翅目中发现的(Cry4)毒素,所述Cry蛋白质组与包括线虫毒素Cry5,-12,-13,-14和-21及Cry2,-18比较为不同的组。
在类芽孢杆菌中发现Cry及TC蛋白质基因(在SB12基因组插入片段中)是令人惊讶的并且是新的发现。新Cry及TC蛋白质基因的鉴定与本领域理解的光杆状菌、致病杆菌及苏云金芽孢杆菌相关,并扩展了发现其中存在Cry及TC蛋白质基因的细菌属的范围。文中鉴定的全长Cry1529的大小对应于Cry1s的核心毒素;Cry1529代表了一类新Cry蛋白质,所述蛋白质对于从苏云金芽孢杆菌及类芽孢杆菌分离进一步的cry基因也有意义。
为了证实这些令人惊讶的现象不是由于菌株污染的结果(即为了证实带有TC及Cry ORF的34kb插入片段真正来自DAS 1529的总DNA),通过Southern印迹杂交及PCR进行了分子分析。对于使用PCR的确认,应用ORF6(tccC样)及ORF7(Cry1529)特异引物(实施例8,表8)以从SB12粘粒及DAS1529总DNA扩增ORF6及ORF7。对于ORF6,用以下参数在PE9600热循环仪(Perkin Elmer)上进行PCR扩增:最初于95℃变性2分钟,然后于95℃变性30秒,于60℃退火45秒,于72℃延伸2分钟进行30个循环,最后于72℃延伸2分钟。对于ORF7,除了退火温度为55℃进行30秒及延伸为72℃进行4分钟外,扩增参数与ORF6相同。对ORF6及ORF7均扩增到预计大小单一条带的特异PCR产物。
最初southern印迹杂交建立在部分SB12 DNA序列基础上并根据标准方法(Sambrock等人,1990)进行。DNA样本包括来自两个独立制备的DAS1529总DNA、SB12粘粒DNA及一个来自NC1(光杆状菌)的阴性对照DNA样本。两个DAS1529 DNA样本均为经证实系类芽孢杆菌种来源的16SrDNA序列,并且一个样本最初用作粘粒文库构建;另一个为新制备物。DNA样本用EcoRI消化,印迹到膜上,并用扩增自SB12的经Roche DIG系统(Roche)标记的180bp PCR产物杂交。PCR引物为与载体及经截短ORF1(与全长ORF3相比较)部分退火的5’CCT CAC TAAAGG GAT CAC ACG G 3’,以及与经截短ORF1(tcaA样)及全长ORF3(tcaA样)退火的5’GGC TAA TTG ATG AAT CTC CTT CGC 3’。检测到了与PCR探针杂交的总共三个DNA片段(0.85kb,2.7kb及8.0kb),其中0.85及8.0kb为SB12中的,2.7及8.0kb为DAS1529 DNA中的。阴性对照中没有检测到信号。0.85kb(从第一个EcoRI ORF1内部片段到载体中的第一个EcoRI位点)及8.0kb(从ORF3中第一个5’EcoRI位点到ORF1中第三个EcoRI位点)与来自SB12的靶DNA片段的经计算大小相匹配。2.7kb片段的检测表明在DAS1529 DNA的ORF1第一个EcoRI位点2.7kb紧上游存在EcoRI位点。这些结果显示SB12插入片段来自DAS1529总DNA,并且基于杂交及限制性分析,可说明ORF的所有拷贝。
实施例8-SB12粘粒ORF编码的蛋白质杀虫活性的特征
进行了随机转座子插入诱变(以破坏单个ORF或整个操纵子)及异源表达(表达单个ORF或整个操纵子)以分离在SB12粘粒中赋予杀虫活性的单个ORF或操纵子。
A.SB12粘粒的随机转座子诱变
用GPS-1基因组启动系统(New England BioLabs,Beverly,MA)按试剂盒说明书自DAS1529粘粒SB12产生Tn诱变文库。简而言之,将2μl 10XGPS缓冲液,1μl pGPS2.1供体DNA(0.02μg),1μlSB12粘粒(0.1μg)及18μl无菌H2O加入到0.5ml管中。加入1μl TnsABC转座酶;将混合物涡旋及然后简短离心以收集管底物质。这个反应混合物于37℃孵育10分钟。加入1μl起始溶液并通过吸上吸下几次进行混合。反应于37℃孵育1小时,然后于75℃热灭活10分钟。将1μl反应混合物用无菌H2O稀释10倍;将1μl经稀释反应物电穿孔入100μl ElectroMAXDH5α大肠杆菌(Gibco BRL,Rockville,MD)中。在SOC培养基中于37℃生长1小时后,将10μl或100μl培养物涂布到包含20μg/ml培养物卡那霉素及15μg/ml氯霉素的LB平板上,接着于37℃孵育过夜。
将来自SB12 Tn诱变的单个菌落划线到包含20μg/ml卡那霉素及15μg/ml氯霉素的新鲜LB平板上。通过划线,进一步接种至包含20μg/ml卡那霉素及15μg/ml氯霉素的50ml LB培养物并于28℃,200转/分钟生长48小时。然后通过以3500转/分钟离心20分钟收集细胞。将上清弃去并将沉淀物用2.5ml培养上清重新悬浮进行20X浓缩。然后将经浓缩的细胞沉淀物用于抗谷实夜蛾的活性分析。将40μl 20X浓缩物表面应用于人造食物,在128孔板中每个样本用8孔。加入新孵育的谷实夜蛾幼虫并饲养5天,然后对死亡率及体重进行记录。
检测了总共184个克隆抗谷实夜蛾活性的丧失。结果总结于表7。Tn克隆的生物试验显示在Cry1529基因中Tn的插入导致活性完全丧失。最初的生物试验显示tc基因中携带Tn插入片段的克隆活性是可变的。与SB12比较,在生物试验前将所有培养物校正到同样的细胞密度,对这些克隆的进一步分析显示没有丧失活性。来自Tn分析的结果表明ORF7(Cry1529)是SB12粘粒的主要杀虫活性组分。
| 表7SB12,Cry1529及tctn插入片段大肠杆菌克隆的生物试验 | |||||
| 插入片段 | TBW | CEW | THW | 蛴螬 | SCRW |
| SB12Cry1529中的Tn | +++- | ++- | +++- | -- | n.d.- |
| tcs中的Tn | +++ | ++ | +++ | - | - |
*n.d.-未测定;-,++,+++,分别为无,中等及高活性。
B.SB12 ORF/操纵子的异源表达
将Cry1529(ORF7)及五个tc ORF(参见以下表8)在pET101D_系统进行了表达。参见图5。这个表达载体具有经T7调节的基本pET表达系统的全部属性(Dubendorff和Studier,1991;Studier和Moffatt,1986)并可使钝端PCR产物定向克隆到载体中用于高水平的受调控表达,并简化大肠杆菌中的蛋白质纯化。优化的PCR扩增利用高度热稳定并具有3’至5’外切酶校正活性(以校正核苷酸误掺入错误)的高保真PfuTurboTM DNA聚合酶(Stratagene,La Jolla,CA)。当应用ThermalAceTM聚合酶(Invitrogen)时,将点突变导入到tc ORF中,所述点突变通过基于PfuTurboTM的Quick-ChangeTM XL定点诱变试剂盒(Stratagene)进行校正。由于大肠杆菌BL21starTM(DE3)菌株包含普遍增强mRNA稳定性及重组蛋白质产量的rne131突变,将该菌株用作进行表达的宿主(Lopez等人,1999)。
单个ORF是在定义条件下用ORF特异引物(表8)自SB12粘粒中进行PCR扩增得到的。作为定向克隆化必要条件,设计正向PCR引物在5’端包含序列CACC,以保证PCR产物与pET101.D载体中的突出序列GTGG进行碱基配对。反向引物与正向引物配对时会分别扩增每一ORF。PCR反应在包含50ng SB12粘粒DNA,1X Pfu反应缓冲液(Stratagene),每种dNTP 0.2mM,每条引物0.25mM及2U PfuTurbo DNA聚合酶(Stratagene)的50μl反应混合物中进行。PCR扩增在PE9600热循环仪(Perkin Elmer)上用以下参数进行扩增:最初于95℃持续2分钟,接下来于95℃变性30秒,于55℃退火30秒,每kb ORF于72℃延伸2分钟进行35个循环,最后于72℃延伸10分钟。
| 表8总结用于克隆ORF1-7的PCR引物 | ||
| ORFs | 正向引物(5′至3′) | 反向引物(5′至3′) |
| ORF1(tcaA1)ORF3(tcaA2)ORF4(tcaB2)ORF5(tcaC)ORF6(tccC)ORF7(Cry1529) | CACCATGCTTTATAAGGCCTGGCCACCATGGTGTCAACAACAGACAACACCACCATGACCAAGGAAGGTGATAAGCCACCATGCCACAATCTAGCAATGCCACCATGAAAATGATACCATGGACTCATCCACCATGAACTCAAATGAACCAAATTTATC | TCAGGCCTGCACCGCTCAGGCTTTCGCTGCAGCCTATTTCATAACATATCGAATTGGTCACCGCGCAGGCGGTGAAGCTACTTTCTCTTCATTGAAAACCGGCGGAACTGGAATTAACTTCGATTC |
按照供应商(Invitrogen)的说明书将每个ORF的PCR产物克隆入pET101.D。经克隆ORF作为pET101.D质粒DNA进行纯化并对序列进行确定。由于Tn分析表明ORF7是用于控制受试害虫的SB12的主要组分,生物化学分析及昆虫生物试验集中于经异源表达的ORF7蛋白质。对于ORF7表达克隆,DNA序列分析显示与最初SB12DNA序列有100%匹配。根据试剂盒说明书(Invitrogen),ORF7的表达是通过0.5mM IPTG诱导4小时进行的。
C.用于ORF7及tc操纵子杀虫活性的生物试验
生物试验样本制备为完整大肠杆菌细胞、细胞裂解物及经纯化毒素。ORF7(Cry1529)谱及特异活性在表10中进行了总结。Cry1529对烟草天蛾活性最强,对烟芽夜蛾有高度活性(LC50为10μg/ml食物);观察到对于两种昆虫均为100%死亡率。在较高剂量时,Cry1529对谷实夜蛾、甜菜夜娥及黑切根虫(Agrotis ipsilon)具有一些死亡率(20至60%)及相当程度的生长抑制。对于欧洲玉米螟,Cry1529在较高剂量时有一些生长抑制作用。对于一些其它昆虫种(秋天行军虫(fall armyworm),棉子象鼻虫,南方根虫,蚊子),没有检测到活性。对Cry1A(Cry1Ac)抵抗的小菜蛾(diamondback moth;DBMr)及敏感的小菜蛾(DBMs),Cry1529LC50s分别为>50μg/ml及<1.0μg/ml,表明有潜在的交叉抗性。Cry1529对与日本甲虫有亲缘关系的草地蛴螬,没有可检测到的活性。
为检测DAS1529中其它非Cry1529因子的活性,对敲除了Cry1529 tn的SB12粘粒一个克隆(tn67)进行了抗TBW,CEW,SCRW,ECB,BW,BAW,THW,及蛴螬的作用分析;发现对这些害虫没有活性。为了回答tc ORF在SB12背景中潜在的非表达或低表达,将分别表达的tc ORF进行了单独检测,并与其它来自DAS1529的其它TC组合进行了检测;发现对TBW,CEW及蛴螬没有活性。此外,将四个ORF作为单一操纵子在大肠杆菌细胞中表达到很高水平。在体外检测时,全细胞不包含可检测的抗TBW、CEW及蛴螬活性。虽然缺少抗蛴螬活性有些令人感兴趣,但这些结果并不令人惊讶,因为类芽孢杆菌一般感染范围狭窄的蛴螬宿主。鉴于此,可以知道杀虫毒素活性谱也是相对狭窄的。因此需要涉及较宽范围害虫的筛选(用已知方法)及更多时间以鉴定易感害虫。文中列出的结果使人认识到目标TC蛋白质有与来自致病杆菌,光杆状菌等的其它TC蛋白质同样的作用。
将可溶性蛋白质用25mM磷酸钠pH8.0,100mM氯化钠进行提取,并在4-12%NuPAGE梯度凝胶上用1X MES缓冲液(Invitrogen)进行分析。ORF7蛋白质用标准程序进行纯化,N末端序列测定显示了预计的序列:MNSNEPNLSDV。用表达靶蛋白质的细胞密度经过标准化的整个大肠杆菌细胞进行了生物试验。参见图6。大量经纯化ORF7蛋白质用于通过体外生物试验获得ORF7的LC50。经纯化ORF7的热稳定性分析表明于75℃处理5分钟足可废除其抗TBW的活性。参见表9。
| 表9.经纯化Cry1529(ORF7)的热稳定性 | |
| 样本 | 活性 |
| Cry1529,室温Cry1529,50℃进行5分钟Cry1529,50℃进行10分钟Cry1529,75℃进行5分钟Cry1529,75℃进行10分钟Cry1529,100℃进行5分钟 | +++++++++--- |
-,+++,分别为无活性及完全活性
对于tc基因,ORF3及ORF6的无错误克隆用作中间克隆以产生表达ORF3(tcaA)、ORF4(tcaB)、ORF5(tcaC)及ORF6(tccC)的tc操纵子克隆。为了在pET101.D中构建tc操纵子,将包含部分tcaA、完全tcaB和tcaC以及部分tccC的NsiI/SacI片段自SB12粘粒中切除以替代pET101.D-tcaA中的NsiI/SacI插入片段;其接着插入来自pET101.D-tccC的208bp SacI片段,参见图5。将所有四个ORF通过标准的IPTG诱导进行表达到高水平。对于在tc操纵子中表达的ORF6(tccC),经表达蛋白质的大小比通过载体NTI从最5’ATG(SEQ ID NO:18)预测的ORF6略小并是单独表达的。因此,基于核糖体结合位点共有序列的所注释ORF6(SEQ ID NO:13)可能为在SB12及DAS1529中产生的天然蛋白质。
D.毒素的活性谱
Cry1529(ORF7)的毒素活性谱总结于表10中。
| 表10.大肠杆菌及假单胞菌表达的Cry1529的活性谱 | ||||
| 种 | 活性(+++) | 形式及方法 | 物质产生方法 | LC50 |
| 烟芽夜蛾(TBW) | +++ | 96孔上面上样及饮食掺入(分值,死亡率,抑制率) | FCP,SE,经纯化,IC | 11μg毒素/ml食物与大肠杆菌细胞制备物 |
| 谷实夜蛾(CEW) | + | 96孔上面上样及饮食掺入(分数,死亡率,抑制率) | FCP,SE,经纯化,IC | >100μg毒素/g食物 |
| 甜菜夜蛾(BAW) | + | 96孔上面(分值) | FCP,经纯化, | >78μg/cm2 |
| 草地夜蛾(S.frugiperda)(FAW) | - | 96孔上面(分值) | FCP,经纯化, | >>10μg/cm2 |
| 菱形斑纹蛾(DBM) | +++ | 96孔上面(分值) | FCP,经纯化, | 0.02μg毒素/g食物 |
| Cry1抵抗菱形斑纹蛾(rDBM) | + | 96孔上面(分值) | FCP,经纯化, | 59.7μg毒素/g食物 |
| 黑切根虫(BCW) | + | 96孔上面(分值) | FCP,经纯化, | >43μg/cm2 |
| 欧洲玉米螟(ECB) | + | 128孔上面(分值) | FCP,经纯化, | >43μg/cm2 |
| Culex sp.(蚊子) | - | 1oz杯(死亡率) | FCP,经纯化, | >20μg/mlH2O |
| 南方谷类根虫(SCRW) | - | 96孔上面(分值) | FCP,经纯化, | >>100μg毒素/cm2 |
| Anthonomous grandisgran dis(BW) | - | 128孔上面(重量) | FCP,经纯化, | >>43μg毒素/cm2 |
| 烟草天蛾(THW) | +++ | (高活性) | ||
| Continis mutabilis(甲虫)代表蛴螬 | - | >>100μg毒素/克土壤 | ||
注解:-,+,++,+++分别为(无,低,中,高活性);FCP,经冷冻细胞沉淀物;SE,可溶性提取物;经纯化=柱纯化的Cry1529;IC,P.f.Cry1529包含体
在最初试图确定目标TC/tc ORF活性谱的测定中,只应用了有限范围的害虫。用ORF3-OR6操纵子,获得了以下数据:
| 表11.对于TcORF的活性谱 | |||||
| 种 | 活性(+++) | 形式及方法 | 高剂量 | 物质产生方法 | 评论 |
| 烟芽夜蛾(TBW) | - | 96孔上面(分值) | 10X | FCP | 无作用 |
| 谷实夜蛾(CEW) | - | 96孔上面(分值) | 10X | FCP | 无作用 |
| 甜菜夜蛾(BAW) | - | 96孔上面(分值) | 10X | FCP | 无作用 |
| 草地夜蛾(FAW) | - | 96孔上面(分值) | 10X | FCP | 无作用 |
| 黑切根虫(BCW) | - | 96孔上面(分值) | 10X | FCP | 无作用 |
此外,虽然这个初轮筛选没有显示这些TC对这些害虫的活性,本领域技术人员毫无疑问地认为对应于光杆状菌/致病杆菌蛋白质的这些目标蛋白质是有用的。此外,参见以下实施例10。
实施例9-应用PCR引物鉴定来自其它细菌属、种及菌株的Cry1529同系
物
对于从其它(类芽孢杆菌或其它)菌株中筛选其它的ORF7 cry1529同系物,设计了基因特异的简并PCR引物以扩增1kb的靶ORF7 DNA序列。PCR引物推导自在Cry蛋白质中高度保守的两个非常保守的蛋白质基序(QAANLHL,结构域I,第1区块(block 1)核心用于正向引物;GPGFTGGD,结构域III,第3区块用于反向引物)。这些引物在表12列出并在DAS1529中进行验证。PCR扩增在PE9600热循环仪(PerkinElmer)上用以下参数进行:最初于95℃变性2分钟;接下来于95℃变性30秒,于47℃退火45秒,于72℃延伸2分钟,进行35个循环,最后于72℃延伸10分钟。那些引物对用于通过PCR筛选细菌(非苏云金芽孢杆菌)培养收集物。192个菌株中有5个(3个类芽孢杆菌1个芽孢杆菌及一个未确定菌)产生预计大小的PCR产物。根据初步生物试验筛选也发现这些菌株有CEW活性。然而,用不同引物对获自这些菌株之一中的扩增子进行序列分析显示扩增子不是来自cry基因。
虽然这样,并且由于这些筛选不是穷尽性的,本发明包括对Cry1529样蛋白质及基因筛选类芽孢杆菌亚种、芽孢杆菌亚种(包括苏云金芽孢杆菌及球形芽孢杆菌)等的方法。鉴于在类芽孢杆菌中发现鳞翅目毒性Cry蛋白质的重要特性,本发明也包括总体上用于鳞翅目毒性Cry蛋白质及基因的筛选类芽孢杆菌亚种的方法。多种筛选方法是本领域公知的,包括PCR技术(如以上示例的)、探针及摄食试验(其中将整个细胞摄食靶害虫)。如本领域技术人员易于认识到的,本发明的筛选方法包括在这些筛选中制备及应用克隆文库(如粘粒文库)。
| 表12用于筛选ORF7同系物的PCR引物 | |
| 基因特异的简并引物 | DNA序列(5′至3′) |
| Cry1 529-FCry1 529-RCryPP-FCryPP-RCryPT-FCryPP-F2CryPP-R2CryPT-F2 | CAAGCAGCCAACCTCCACCTAATCCCCTCCTGTAAAGCCTGGCAAGCNGCNAATYTWCATYTTCNCCNCCNGTAAANCCWGGCARGCSGCSAAYYTBCAYYTCAAGCWGCWAATYTWCATYTTCHCCWCCWGTAAAWCCWGGCAGGCSGCSAAYYTGCATYT |
1529=基因特异;PP=日本甲虫类芽孢杆菌密码子偏倚;PT=解硫胺素类芽孢杆菌密码子偏倚
实施例10-致病杆菌XptA2 TC蛋白质毒素与DAS1529 TC蛋白质的互
补作用
这个实施例提供了用单一操纵子(ORF 3-6,tcaA,tcaB,TcaC及tccC;参见实施例8的C部分)表达的DAS1529 TC蛋白质与来自嗜线虫致病杆菌Xwi(参见SEQ ID NO:49)的XptA2毒素互补的实验证据。进行两个独立的实验以单独表达DAS1529 TC操纵子及XptA2,或在同一大肠杆菌细胞中共表达XptA2基因及TC操纵子。对表达不同毒素/毒素组合物的整个细胞抗鳞翅目昆虫:谷实夜蛾(CEW)及烟芽夜蛾(TBW)的活性进行检测。来自两个实验的数据表明DAS1529 TC蛋白质对受检测的两种昆虫均能增强致病杆菌TC蛋白质XptA2活性。
A.DAS 1529 TC及致病杆菌XptA2的共表达
TC操纵子的表达通过携带ColEl复制起点及氨苄青霉素抗性选择标记的pET101.D表达载体(Invitrogen)中的T7启动子/lac操纵基因进行调节。Tc操纵子的克隆与表达的综合性描述可在实施例8的C部分找到。将XptA2基因克隆入带有氯霉素抗性选择标记及与ColEl相容的复制起点的pCot-3表达载体中。pCot-3载体表达系统也通过T7启动子/lac操纵基因进行调节。因此,相容的复制起点及不同的选择标记形成了TC操纵子与XptA2在同一大肠杆菌细胞中共表达的基础。将带有TC操纵子及XptA2的质粒DNA单独或组合转化入大肠杆菌BL21StarTM(DE3)中。在包含50μg/ml羧苄青霉素的LB琼脂平板上用于pET101.D-TC操纵子转化体的筛选,在包含50μg/ml氯霉素的平板上用于pCot-3-XptA2转化体的筛选,并且在包含这两种抗生素的平板上用于pET101.D-TC操纵子/pCot-3-XptA2转化体的筛选。为抑制基础毒素的表达,在琼脂及液体LB培养基中均包括终浓度为50mM的葡萄糖。
对于毒素的产生,用在LB琼脂平板上生长的过夜培养物接种包含抗生素及50mM葡萄糖的5ml及50ml LB培养基。培养物在摇床上以300转/分钟于30℃生长。一旦培养物密度在600nm达到O.D.~0.4,向培养基中加入终浓度为75μM的IPTG以诱导基因表达。24小时后,将大肠杆菌细胞收获,用于通过NuPAGE系统(Invitrogen)进行蛋白质凝胶分析。来自0.5ml 1X培养培养液的细胞沉淀物用100μl 1X NuPAGE LDS样本缓冲液重悬。简要超声处理并煮沸5分钟后,将5μl样本上样到4至12%NuPAGE bis-tris梯度凝胶中用于总蛋白特性分析。当单独表达时或在存在TC操纵子表达时,XptA2表达到可检测水平。基于Personal密度计SI(Molecular Dynamics)凝胶扫描分析,XptA2与TC操纵子共表达时,与XptA2独自表达相比,其表达几乎高达8X。对于5ml诱导实验,XptA2有几乎相等的表达。
B.杀虫活性的生物试验
如实施例8描述的,单独表达或作为操纵子表达时,DAS 1529tc ORF显示对TBW及CEW没有活性。以下生物测定实验集中于确定类芽孢杆菌(DAS1529)TC蛋白质(ORF3-6的TC蛋白质;TcaA-,TcaB-,TcaC-及TccC-样蛋白质)是否能与致病杆菌TC蛋白质毒素活性(XptA2为示例)互补。生物测定样本制备为将完整大肠杆菌细胞在4X细胞浓缩物中用于5ml诱导实验,XptA2及XptA2/TC操纵子细胞均包含非常低但几乎等量的XptA2毒素。表13中的数据显示在受检测的4X细胞浓缩物中,TC蛋白质+致病杆菌XptA2对CEW有活性。这提供了类芽孢杆菌DAS1529 TC蛋白质对致病杆菌XptA2辅助作用的第一个证据。
| 表13 DAS1529 TC辅助致病杆菌XptA2抗谷实夜蛾作用的生物试验 | |
| 昆虫阴性对照TC(DAS1529)致病杆菌XptA2TC蛋白质+致病杆菌XptA2 | CEW |
| ---++ | |
*-,++,+++=分别为无,中等及高活性
对于第二个生物测定实验,将XptA2细胞及XptA2+TC操纵子细胞中XptA2蛋白质的量在光密度计凝胶扫描分析的基础上进行校正。如表14中显示的,XptA2本身在40X时对TBW(烟芽夜蛾)有中等活性,但在20X及低于20X时,活性降到不可检测水平。然而,当与TC共表达时,在存在10X及5X的XptA2时高水平活性非常明显,在1.25X XptA2时仍检测到低活性。这些观察现象表明1529TC蛋白质对致病杆菌XptA2的抗烟芽夜蛾能力有显著的增强作用。在检测的最高剂量中,阴性对照及tc操纵子本身对这个害虫均没有任何活性。
| 表14 DAS1529 TC辅助XptA2抗烟芽夜蛾作用的生物测定 | ||||||
| 经校正的XptA2 | 40X | 20X | 10X | 5X | 2.5X | 1.25X |
| XptA2TCs+XptA2 | +n.d. | -n.d. | -++ | -++ | n.d.+ | n.d.- |
*n.d.-未测定;-,+,++,+++=分别为无,低,中等及高活性
实施例11-Cry1529蛋白质对胰蛋白酶消化的稳定性
本实施例教导了SEQ ID NO:14公开的DNA序列的修饰,所述DNA序列编码Cry1529蛋白质(SEQ ID NO:15公开的)以至新的经编码蛋白质比天然蛋白质对蛋白水解消化更有抗性。蛋白质在昆虫肠中的消化限制了昆虫暴露于蛋白质毒素的时间。因此,降低蛋白质毒素对蛋白酶消化的易感性可用于增加蛋白质的效力。
对于这些检测,将胰蛋白酶(例如,Sigma Chemical#T1426)及胰蛋白酶抑制剂(例如,Sigma Chemical#T9008)在50mM Tris HCl缓冲液,pH8中制备成4mg/mL或10mg/mL的储存液。检测为:用多种浓度的胰蛋白酶及Cry1529蛋白质于37℃孵育1小时,并通过加入等体积的等浓度胰蛋白酶抑制剂进行终止(例如,接受35μl 4mg/mL胰蛋白酶溶液的消化通过加入35μl 4mg/mL胰蛋白酶抑制剂进行终止)。一个典型实验是,Cry1529蛋白质通过适当的改造的大肠杆菌细胞产生并通过以上描述的步骤进行纯化,所述纯化包括通过大小排阻柱与其它蛋白质分开。消化后,蛋白酶产物通过标准的丙烯酰胺凝胶电泳进行分析,接着用制备的抗Cry1529蛋白质的抗体进行免疫印迹分析。此种实验结果在图9中进行显示。
胰蛋白酶消化产生两个主要蛋白质产物,其中较小的分子量大约为50kDa。应当注意这个消化模式与来自Cry1529-His6蛋白质的胰蛋白酶消化产生的消化模式相同,其中所述Cry1529-His6蛋白质除了在羧基末端加入氨基酸KGELNSKLE
GKPIPNPLLGLDSTRTGHHHHHH外,它与SEQ ID NO:15的天然Cry1529蛋白质氨基酸序列相同。Cry1529-His6的编码区通过将天然Cry1529蛋白质的编码区连接到pET101/D-TOPO_载体中(InvitrogenTM,Carlsbad,CA)而产生。制备的这个重组克隆通过结合到商业上可获得的其表位以氨基酸序列GKPIPNPLLGLDSTRTG(在上面序列中以下划线标出)表示的V5抗体,或通过利用六个组氨酸残基(在上面序列中以双下划线标出)的纯化策略有助于重组Cry1529蛋白质的纯化。用于这些操作的步骤根据pET101/D-TOPO_载体提供的说明书进行。
发现用胰蛋白酶消化Cry1529-His6蛋白质导致去除了在昆虫生物试验中其抗鳞翅目昆虫的活性。用MALDI-TOF分析确定包含50kDa肽N末端的氨基酸序列,确定了对应于SEQ ID NO:15氨基酸残基122位(R,精氨酸)及126位(K,赖氨酸)的两个蛋白酶加工位点。用Quick Change_诱变方法(Stratagene,La Jolla,CA)对天然DNA序列(SEQ ID NO:14)进行修饰以去除经编码蛋白质中的第一个胰蛋白酶切割位点。在SEQ ID NO:15的120至123位区域的氨基酸中进行了三个不同类型的突变:RARA至HANA,RARA至RARS及RARA至QANA。用于这些突变的DNA寡核苷酸引物(对每条链以5’至3’方向列出)在以下表15中列出。与天然DNA序列不同的碱基用下划线标出。
| 表15 | ||
| 突变 | 正向(编码链)引物 | 反向(互补链)引物 |
| RARA至HANA(pMYC2865)RARA至QANA(pMYC2866)RARA至RARS(pMYC2867) | AAAATGATTCTAATAATTTA CACGCG AACGCTGTAGTGAAAGACAAAATGATTCTAATAATTTA CAAGCG AACGCTGTAGTGAAAGACAAAATGATTCTAATAATTTAAGAGCGAGATCTGTAGTGAAAGAC | GTCTTTCACTACAGC GTTCGC GTGTAAATTATTAGAATCATTTTGTCTTTCACTACAGC GTTCGC TTGTAAATTATTAGAATCATTTTGTCTTTCACTAC AGATCTCGCTCTTAAATTATTAGAATCATTTT |
野生型及通过这些引物导入的经突变编码区的比较在下表中进行了显示。相关的氨基酸残基以粗体显示。
| 表16 | |
| 野生型:氨基酸:RARA至HANA:氨基酸:RARA至QANA:氨基酸:RARA至RARS:氨基酸: | gAA AAT GAT TCT AAT AAT TTA AGA GCG AGA GCT GTA GTG AAA GAC(E) N D S N N L R A R A V V K D115 120 122 123 125 126gAA AAT GAT TCT AAT AAT TTA CACGCG AAC GCT GTA GTG AAA GAC(E) N D S N N L H A N A V V K DgAA AAT GAT TCT AAT AAT TTA CAAGCG AAC GCT GTA GTG AAA GAC(E) N D S N N L Q A N A V V K DgAA AAT GAT TCT AAT AAT TTA AGA GCG AGA TCTGTA GTG AAA GAC(E) N D S N N L R A R S V V K D |
将单独的经突变编码区单个克隆到pET101/D-TOPO_载体中,这允许可诱导产生Cry1529变体蛋白质。包含所述构建体的大肠杆菌细胞生长,并通过供应商推荐的方法诱导Cry1529变体基因的表达。然后将经收获细胞在胰蛋白酶消化测定中进行检测并如以上进行分析。一般结果在图10中显示。对于这些实验,将10mg完整细胞沉淀物在50mM Tris HCl,pH8.0中进行悬浮,并在终体积为1mL中,用100μL的10mg/mL胰蛋白酶中于37℃消化3小时。在孵育期间,时常混合这些反应物。通过加入100μL的10mg/mL胰蛋白酶抑制剂将消化终止并将管保存在冰上。
这些结果证实天然Cry1529(RARA)及Cry1529-His6(RARA)蛋白质均被胰蛋白酶消化以产生约50kDa的主要产物。当将对应于胰蛋白酶切割位点的RARA序列突变为HANA或QANA时,获得了相当高程度的对胰蛋白酶消化的抗性。不产生50kDa肽,并存在易于检测的明显全长Cry1529-His6蛋白质的量。RARA位点向RARS的突变不消除产生50kDa肽,但相当程度地降低了蛋白酶切割的速率。因此,Cry1529蛋白质中蛋白酶加工位点的突变基本上降低了其对蛋白酶消化的易感性,这使蛋白质在摄入后在昆虫肠中定居较长时间期,导致杀死易感昆虫的效力增强。
实施例12-设计PCR引物,用于检测其它类芽孢杆菌株中IDAS1529 tc
ORF同系物
如以上显示,类芽孢杆菌IDAS1529菌株产生对多种鳞翅目昆虫有毒性的细胞外蛋白质。该菌株的16S核糖体基因的分子种系发生表明它与解硫胺素类芽孢杆菌-缓病类芽孢杆菌-日本甲虫类芽孢杆菌群成员最相关。也显示类芽孢杆菌IDAS1529菌株包含毒素复合体基因(此后称为tc基因)及称为cry1529的新杀虫晶体包含体蛋白质基因这两者。试图确定在类芽孢杆菌属其它成员中是否存在tc同系物,对收集的类芽孢杆菌菌株通过聚合酶链反应(PCR)及杂交分析进行筛选。对于PCR分析,将分离自类芽孢杆菌菌株的总DNA用作模板,并用在类芽孢杆菌IDAS1529菌株、光杆状菌种及致病杆菌种中发现的tc基因特异的寡核苷酸引物进行筛选。将用tc引物组获得的扩增产物进行克隆及确定它们的核苷酸序列,并与获自类芽孢杆菌IDAS1529菌株的tc序列进行比较。以下实施例说明个人怎样设计tc特异寡核苷酸引物并用PCR在类芽孢杆菌分离株的总DNA中寻找与类芽孢杆菌IDAS1529菌株、光致病菌种及致病杆菌种中确定的tc基因同源的DNA序列。通过用PCR分析(如文中描述),可能在与类芽孢杆菌IDAS1529菌株及解硫胺素类芽孢杆菌-缓病类芽孢杆菌-日本甲虫类芽孢杆菌群不同的类芽孢杆菌种中确定tc同系物。
12.A.-从类芽孢杆菌菌株中提取总DNA
类芽孢杆菌菌株在营养琼脂平板(8g/l营养培养液,15g/l细菌用琼脂;Difco Laboratories,Detroit,MI)上于30℃生长3-5天。挑取单菌落并接种到包含100ml无菌营养培养液(8g/l营养培养液;Difco Laboratories,Detroit,MI)的500ml三挡板烧瓶中。在旋转摇床上以150转/分钟于30℃孵育24-72小时后,将培养物分装到无菌500ml聚乙烯瓶中并于4℃,6,500xg离心1小时。离心后,将上清液弃去并保留细菌细胞沉淀物。用QIAGEN Genomic tip系统100/G及相关的基因组DNA缓冲液组(QIAGEN Inc.,Valencia,CA,USA)按正如制造者描述的用于细菌的样本制备及裂解方法从细胞沉淀物中提取总DNA。经提取的总DNA在0.5ml TE缓冲液(10mM Tris-HCl,pH8.0;1mM EDTA,pH8.0)中进行溶解。
12.B.-用于PCR的tc特异寡核苷酸引物的选择
为了选择以前自类芽孢杆菌IDAS1529菌株鉴定的tc基因特异的寡核苷酸引物,将获自类芽孢杆菌IDAS1529菌株,光杆状菌W14菌株及致病杆菌Xwi菌株的tcaA,tcaB,tcdB及tccC的核苷酸序列使用在Vector NTI软件包(Informax,Inc.,Frederick,MD)中的比对程序进行比对。在表17中列出了用于此分析的核苷酸序列。
| 表17.用于tc特异引物选择的核苷酸序列 | |||
| 基因 | 生物来源 | 核苷酸序列来源 | 基因名 |
| tcaA1 | 类芽孢杆菌IDAS1529菌株 | SEQ ID NO:2 | tcaA1-1529 |
| tcaA2 | 类芽孢杆菌IDAS1529菌株 | SEQ ID NO:6 | tcaA2-1529 |
| tcaA | 光杆状菌W14菌株 | 基因库:登录号AF346497 | tcaA-W14 |
| tcaB1 | 类芽孢杆菌IDAS1529菌株 | SEQ ID NO:4 | tcaB1-1529 |
| tcaB2 | 类芽孢杆菌IDAS1529菌株 | SEQ ID NO:8 | tcaB2-1529 |
| tcaB | 光杆状菌W14菌株 | 基因库:登录号A F346497 | tcaB-W14 |
| tcdB1 | 光杆状菌W14菌株 | SEQ ID NO:42 | tcdB1-W14 |
| tcdB2 | 光杆状菌W14菌株 | SEQ ID NO:43 | tcdB2-W14 |
| xptC1 | 致病杆菌Xwi菌株 | SEQ ID NO:20 | xptC1-Xwi |
| tcaC | 类芽孢杆菌IDAS1529菌株 | SEQ ID NO:10 | tcaC-1529 |
| tccC1 | 光杆状菌W14菌株 | SEQ ID NO:44 | tccC1-W14 |
| tccC2 | 光杆状菌W14菌株 | SEQ ID NO:45 | tccC2-W14 |
| tccC3 | 光杆状菌W14菌株 | SEQ ID NO:46 | tccC3-W14 |
| tccC4 | 光杆状菌W14菌株 | SEQ ID NO:47 | tccC4-W14 |
| tccC5 | 光杆状菌W14菌株 | SEQ ID NO:48 | tccC5-W14 |
| xptB1 | 致病杆菌Xwi菌株 | SEQ ID NO:21 | xptBI-Xwi |
| tccC | 类芽孢杆菌IDAS1529菌株 | SEQ ID NO:19 | tccC-1529 |
12.B.i.-tcaA特异引物的选择
tcaA1-1529,tcaA2-1529及tcaA-W14核苷酸序列的对比确定了核苷酸序列同一的具有足够长度的两个区域,用于选择具最小简并性的PCR引物(图10中显示的加框区)。选择这两个区域用于合成tcaA特异引物,将所述引物命名为SB105及SB106(表18及19)。
12.B.ii.-tcaB特异引物的选择
tcaB1-1529,tcaB2-1529及tcaB-W14核苷酸序列的对比确定了核苷酸序列同一的具有足够长度的四个区域,用于选择具最小简并性的PCR引物(图11)。选择这四个区域用于合成tcaB特异引物,将所述引物命名为SB101,SB102,SB103及SB104(表18及19)。
12.B.iii.-tcaC特异引物的选择
tcdB1-W14,tcedB2-W14,xptC1-Xwi及tcaC-1529核苷酸序列的对比确定了核苷酸序列同一的具有足够长度的两个区域,用于选择具最小简并性的PCR引物(图12)。选择这两个区域用于合成tcaC特异引物,将所述引物命名为SB215及SB217(表18及19)。
12.B.iv-tccC特异引物的筛选
tccCl-W14,tccC2-W14,tccC3-W14,tccC4-W14,tccC5-W14,xptB1-Xwi及tccC-1529核苷酸序列的对比确定了核苷酸序列同一的具有足够长度的两个区域,用于选择具最小简并性的PCR引物(图13)。选择这两个区域用于合成tccC特异引物,将所述引物命名为SB212及SB213(表18及19)。
| 表18 tc特异引物 | |||
| 引物名称 | 引物长度 | 引物序列(5’至3’) | SEQ IDNO. |
| SB101 | 32 | GCKATGGCSGACCCGATGCAWTACAAGCTGGC* | 22 |
| SB102 | 32 | AGCGGYTGACCRTCCAGRCTCARATTGTGGCG | 23 |
| SB103 | 28 | TGTATAACTGGATGGCYGGWCGTCTSTC | 24 |
| SB104 | 26 | TCRAAAGGCAGRAAMCGGCTGTCGTT | 25 |
| SB105 | 28 | CTTCYCTKGATATCYTKYTGGATGTGCT | 26 |
| SB106 | 30 | ACGRCTGGYATTGGYAATCAGCCARTCCAA | 27 |
| SB212 | 27 | CGYTATIAATATGAYCCKGTVGGYAAT | 28 |
| SB213 | 25 | CATCBCGYTCTTTRCCIGARTARCG | 29 |
| SB215 | 33 | CGHAGCTCYICCCAGTWYTGGCTGGATGARAAA | 30 |
| SB217 | 32 | GTRTCATTTTCATCTTCRTTBACIRYAAACCA | 31 |
*K=G或T;S=G或C;W=A或T;Y=C或T;R=G或A;M=A或C;V=G或C或A;B=G或T或C;H=A或C或T,I=次黄苷
| 表19.tc引物组合 | |||
| 靶基因 | 正向引物 | 反向引物 | 预计扩增产物的近似大小 |
| tcaAtcaBtcaBtcdBtccC | SB105SB101SB103SB215SB212 | SB106SB102SB104SB217SB213 | 1.4kb0.4 kb0.65kb2.2kb0.9kb |
实施例13-类芽孢杆菌DNA的PCR扩增
对于用tcaA特异引物组及tcaB特异引物组进行PCR扩增,将获自每一类芽孢杆菌菌株的3-5μl总DNA与50pmole的每种引物及1X EppendorfMasterMix(Eppendorf AG;Hamburg,德国)在20μl反应体积中进行混合。扩增条件为于94℃变性3分钟,接着于94℃变性1分钟,于52℃退火1.5分钟,于72℃延伸1.5分钟,进行30个循环,接着于72℃最后延伸5分钟。
对于用tcaC特异引物组及tccC特异引物组的PCR扩增,将获自每一类芽孢杆菌菌株的大约375ng总DNA与50pmole的每种引物及12.5μlEpicentre_ FailSafeTM缓冲液D及2.5U Epicentre_ FailSafeTM聚合酶(Epicentre;Madison,WI)在25μl反应体积中进行混合。扩增条件为于96℃变性4分钟,接着于94℃变性30秒,于64℃退火30秒,于70℃延伸30秒,进行40个循环。对每个循环,退火温度降低0.5℃,且延伸时间增加5秒。
13.A.-PCR扩增产物的凝胶电泳、克隆及核苷酸序列的确定
PCR扩增反应用0.8至1%Seakem LE琼脂糖(BioWhittakerMolecular Applications,Rockland,ME)在1X TAE缓冲液中通过凝胶电泳进行检查。将扩增产物正如厂商描述的那样用TOPOTA_克隆试剂盒(Invitrogen Life Technologies,Carlsbad,CA)克隆到载体pCR2.1-TOPO_中。经克隆扩增产物的核苷酸序列用M13正向、M13反向及如需要用tc序列特异的测序引物进行确定以获得每个经克隆扩增产物的双链序列。用CEQ Dye终止子循环测序快速启动试剂盒(Beckman Coulter,Fullerton,CA,USA)及CEQ 2000XL DNA分析系统(Beckman Coulter)正如制造者所指导的那样进行核苷酸序列的测定。将Sequencher(v.4.1.4)软件包(Gene Codes,Ann Arbor,MI)用于自测序数据中构建毗连序列群并确定用于每个扩增产物的共有序列。
13.B.-PCR扩增产物的核苷酸序列分析
13.B.i.-tcaA
当用获自收集的类芽孢杆菌菌株收集物的总DNA用tcaA-(引物组合SB105及SB106)进行PCR时,观察到获自蜂类芽孢杆菌菌株(NRRLNRS1438;此后称为DB482)的总DNA产生预计大小的扩增产物。将扩增产物进行克隆并测序。
将用SB105及SB106引物组合获得的扩增产物命名为tcaA2-DB482。当tcaA2-DB482的序列(SEQ ID NO:32)与获自类芽孢杆菌IDAS1529菌株及光杆状菌W14菌株的tcaA序列比较时,观察到tcaA2-DB482与tcaA2-1529有最大的核苷酸序列同一性(在1,239个核苷酸中同一性为90.5%)(表20)。由tcaA2-DB482编码的经推导氨基酸序列(命名为TcaA2-DB482;SEQ ID NO:33)与tcaA2-1529的相应经推导氨基酸序列(命名为TcaA2-1529;SEQ ID NO:7)有89.1%的同一性。
| 表20.tcaA2-DB482的核苷酸及氨基酸序列与tcaA1-1529,tcaA2-1529及tcaA-W14对应区的同一性 | ||
| 基因 | 与tcaA2-DB482的核苷酸同一性% | 与tcaA2-DB482的经推导氨基酸序列同一性% |
| tcaA1-1529tcaA2-1529tcaA-W14 | 579050 | 338932 |
13.B.ii-tcaB
将用SB101及SB102引物组合及SB103及SB104引物组合获得的扩增产物分别命名为tcaB2a-DB482及tcaB2b-DB482。当tcaB2a-DB482(SEQID NO:34)及tcaB2b-DB482(SEQ ID NO:35)与获自类芽孢杆状菌IDAS1529菌株及光杆状菌W14菌株的tcaB序列进行比较时,观察到这两个序列均与tcaB1-1529及tcaB2-1529有最大的核苷酸序列同一性(表21)。tcaB2a-DB482及tcaB2b-DB482与tcaB2-1529的核苷酸序列同一性分别为92.6%和89.8%。由tcaB2a-DB482(命名为TcaB2a-DB482;SEQID NO:36)与tcaB2b-DB482(命名为TcaB2b-DB482;SEQ ID NO:37)编码的经推导氨基酸序列与tcaB2-1529对应的经推导氨基酸序列(命名为TcaB2-1529;SEQ ID NO:9)同一性分别为91.2%和91.1%。
| 表21.tcaB2a-DB482及tcaB2b-DB482与tcaB1-1529,tcaB2-1529及tcaB-W14对应区的核苷酸及推导氨基酸序列的同一性 | ||||
| 基因 | 与tcaB2a-DB482的核苷酸同一性% | 与tcaB2b-DB482的核苷酸同一性% | 与TcaB2a-DB482的经推导氨基酸序列同一性% | 与TcaB2b-DB48的经推导氨基酸序列同一性% |
| tcaB1-1529tcaB2-1529tcaB-W14 | 939363 | 939057 | 949159 | 929257 |
13.B.iii-tcdB
用tcaC特异引物组合(SB215及SB217)对获自DB482的总DNA进行PCR时,产生预计大小的扩增产物。将扩增产物进行克隆并测序。
将用SB215及SB217引物组合获得的扩增产物命名为tcaC-DB482。当tcaC-DB482序列(SEQ ID NO:38)与获自类芽孢杆菌IDAS1529菌株、致病杆菌Xwi菌株及光杆状菌W14菌株的tcaC序列进行比较时,观察到tcaC-DB482与tcaC-1529有最大的核苷酸序列同一性(在2,091个核苷酸中同一性为93.5%)(表22)。由tcaC-DB482编码的经推导氨基酸序列(命名为TcaC-DB482;SEQ ID NO:39)与tcaC-1529对应的经推导氨基酸序列(命名为TcaC-1529;SEQ ID NO:11)同一性为91.1%。
| 表22.tcaC-DB482与xptC1-Xwi、tcdB1-W14、tcdB2-W14及tcaC-1529对应区的核苷酸及推导氨基酸序列的同一性 | ||
| 基因 | 与tcaC-DB482的核苷酸序列同一性% | 与TcaC-DB482的经推倒氨基酸序列同一性% |
| tcaC-1529xptC1-XwitcdB1-W14tcdB2-W14 | 93505050 | 91353636 |
13.B.iv.-tccC
当用tccC特异引物组合(SB212及SB213)将获自收集的类芽孢杆菌菌株的总DNA进行PCR时,观察到来自DB482的总DNA产生预计大小的扩增产物。将扩增产物进行克隆并测序。
将用SB212及SB213引物组合获得的扩增产物命名为tccC-DB482。当tccC-DB482序列(SEQ ID NO:40)与获自类芽孢杆菌IDAS1529菌株、致病杆菌Xwi菌株及光杆状菌W14菌株的tccC序列进行比较时,观察到tccC-DB482与tccC-1529有最大的核苷酸序列同一性(在858个核苷酸中同一性为93.7%)(表23)。由tccC-DB482编码的经推导氨基酸序列(命名为TccC-DB482;SEQ ID NO:41)与tccC-1529对应的经推导氨基酸序列(命名为TccC-1529;SEQ ID NO:13)同一性为95.5%。
| 表23.tccC-DB482与xptB1-Xwi、tc-W14、tccC-1529及来自光杆状菌W14菌株tcc基因对应区的核苷酸及推导氨基酸序列的同一性 | ||
| 基因 | 与tccC-DB482的核苷酸序列同一性% | 与TccC-DB482的经推倒氨基酸序列同一性% |
| tccC-1529xptB1-XwitccC1-W14tccC2-W14tccC3-W14tccC4-W14tccC5-W14 | 94545456565654 | 96454845464644 |
13.C.-PCR分析总结
本实施例(及文中其它实施例)阐述了基于三个细菌属的tc基因设计寡核苷酸引物的方法及这些引物的用途,用于PCR筛选类芽孢杆菌菌株,由此可鉴定在那些菌株中存在的tc同系物。显示分离自蜜蜂幼虫的蜂类芽孢杆菌(作为NRRLB-30670保藏)的分离株DB482包含tcaA、tcaB、tcaC及tccC的同系物。这些tc同系物的发现证实类芽孢杆菌IDAS1529菌株在类芽孢杆菌属中不是唯一存在tc基因的菌株。因此,本领域技术人员可用这些及其它方法以确定在其它类芽孢杆菌种如软骨素类芽孢杆菌(P.chondroitinus),解藻酸类芽孢杆菌(P.alginolyticus),幼虫类芽孢杆菌(P.larvae),强壮类芽孢杆菌(P.validus),戈氏类芽孢杆菌(P.gordonae),蜂房类芽孢杆菌(P.alvei),缓病类芽孢杆菌,日本甲虫类芽孢杆菌,解硫胺素类芽孢杆菌,解菌多糖类芽孢杆菌(P.curdlanaolyticus),神户类芽孢杆菌(P.kobensis),解糖类芽孢杆菌(P.glucaizolyticus),灿烂类芽孢杆菌(P.lautus),千叶类芽孢杆菌(P.chibensis),马阔里类芽孢杆菌(P.macquariensis),固氮类芽孢杆菌(P.azotofxans),皮奥利亚类芽孢杆菌(P.peoriae),多粘类芽孢杆菌(P.polymyxa),依利诺斯类芽孢杆菌(P.illinoisensis),解淀粉类芽孢杆菌(P.amylolyticus),饲料类芽孢杆菌(P.pabuli)及浸麻类芽孢杆菌(P.macerans)中的其它tc同系物。
实施例14-通过Southern杂交在其它类芽孢杆菌菌株中检测IDAS1529
tcORF同系物
本实施例阐述了如何应用放射标记的DNA片段作为探针在类芽孢杆菌分离株基因组DNA中寻找DNA序列(优选与第一次在IDAS1529中检测到的已知tcORF有一些同源性)。结果证明在蜂类芽孢杆菌分离株DB482中检测到与两个tcORF同源的序列。
如以上在实施例12中描述的,制备来自多种类芽孢杆菌菌株(或来自作为阴性对照的大肠杆菌)的基因组DNA,并用限制酶进行消化以产生多个片段。一般消化通过在EcoRI酶的制造商(New England Biolabs,Beverly,MA)提供的400μl反应缓冲液的总体积中包含8μg DNA。将包含200单位酶的反应物于37℃孵育过夜,然后置于冰上。将经消化DNA进一步进行纯化并通过加入30μl 3M乙酸钠(pH5.2)及750μL冰冷的100%乙醇进行浓缩,接着进行离心。将DNA沉淀物用70%乙醇洗两次,真空下干燥并在50μl TE缓冲液[10mM Tris HCI,pH8.0;1mM乙二胺四乙酸(EDTA)]重新悬浮。通过凝胶电泳进行分析用于限制性消化的视觉确证。以类似方式将IDAS1529粘粒SB12的DNA用EcoRI消化,并用作杂交实验的阳性对照。
将用于Southern印迹分析的经EcoRI消化的基因组DNA片段在TEA缓冲液(40mM Tris-乙酸,2mM EDTA,pH8.0)(1μgDNA/孔)中通过0.7%或1.2%琼脂糖凝胶电泳分离。在每块凝胶上,用包含1kb DNA分子量梯度(Invitrogen,Carlsbad,CA)的泳道提供分子量大小标准。在这个梯度中大于500bp的15个片段大小(用千碱基表示)为:12.2,11.2,10.1,9.2,8.1,7.1,6.1,5.1,4.1,3.1,2.0,1.6,1.0,0.52及0.50。凝胶中的DNA用50μg/mL溴化乙锭染色,将凝胶照相,然后将凝胶中的DNA脱嘌呤(0.2M HCl中5分钟),变性(0.5M NaOH,1.5M NaCl中15分钟),中和(0.2M HCl中5分钟)并在2XSSC(20XSSC包含3M NaCl,0.3M柠檬酸钠,pH7.0)中转移到MAGNA 0.45微米尼龙转移膜(Osmonics,Westborough,MA)。DNA通过紫外线(Stratalinker_;Stratagene;La Jolla;CA)与膜进行交联并准备用于在“最低杂交”溶液[包含10%w/v聚乙二醇(分子量大约8000),7%w/v十二烷基硫酸钠;0.6XSSC,5mM EDTA,100μg/ml经变性鲑鱼精DNA及10mM磷酸钠缓冲液(来自包含95g/L NaH2PO4·1H2O及84.5g/L Na2HPO4·7H2O的1M储存液)]中于60℃或65℃杂交1至3小时。
用作杂交探针的tcORF DNA片段首先通过用SB12粘粒DNA作为模板(参见以前实施例)的聚合酶链反应(PCR)进行制备。用于这些扩增的正向及反向引物在以下(大写字母的碱基对应于蛋白质编码区)表24中列出(每条DNA链的5’至3’方向)。设计的引物组1从SB12粘粒DNA扩增包含所有tcORF5的DNA片段,所述DNA片段在SEQ ID NO:10公开并与光杆状菌tcaC基因有一些相似性(表6)。设计的引物组2用于从粘粒SB12扩增编码如SEQ ID NO:19公开的蛋白质DNA片段。这个DNA片段及编码的蛋白质比如SEQ ID NO:1 2公开的tc ORF6 DNA序列及所编码的如SEQ ID NO:13的蛋白质稍长。作为SEQ ID NO:13及SEQ ID NO:19公开的蛋白质与光杆状菌tccC基因(表6)编码的蛋白质均有一些相似性。将扩增的PCR产物克隆入pCR_2.1-TOPO_克隆载体(Invitrogen,Carlsbad,CA)中,并将包含tcORF的片段通过限制酶消化(在以下表中列出)从产生的克隆中切下,接着通过用Gen EluteTM琼脂糖离心柱(Sigma Chemical Co,St Louis,MO)从琼脂糖凝胶中纯化。回收的片段通过用Quick-PrecipTM Plus溶液按照供应商的说明书(EdgeBioSystems,Gaithersburg,MD)进行沉淀而浓缩。
| 表24. |
| PCR引物组1 |
| SB12 tcORF5(SEQ ID NO:10) |
| 正向引物SB126*gtacgtcatctagaaaggagatataccATGCCACAATCTAGCAATGCCGATATCAAGCTATTGTC反向引物SB127*tgacatcggtcgacattattaCCGCGCAGGCGGTGAAGCAAATAATGATGAGTCCATGGTA用SaII+XbaI+PvuI从pCR_2.1-topO_克隆切下并纯化4,368bp片段 |
| PCR引物组2 |
| 编码SEQ ID NO:19的SB12 tcORF;其包括tcORF6(SEQ ID NO:12) |
| 正向引物SB128*,**gtacgtcaactagtaaggagatataccATGAAAATGATACCgTGGACTCAcCATTATTTGCTTCACC反向引物SB129*tgacatcgctcgagattattaCTTTCTCTTCATTGAAAACCGGCGGAAAAAGTTCCCA用EcoRI+SphI/+PvuI从pCR_2.1-topO_克隆切下并纯化2,925bp片段 |
*在这个表中,引物5’端的小写碱基不与粘粒SB12 DNA序列互补。它们用于提供扩增产物末端上的限制性酶识别序列以有助于以后的克隆操作。
**将来自天然序列的那些碱基改变为小写粗体碱基以去除可能干扰以后克隆的功能性分析的潜在发夹结构。
放射性标记的DNA片段用高效引发放射性标记的试剂盒(RocheDiagnostics,Mannheim,德国)按照供应者的说明书进行制备。未掺入的核苷酸过通QIAquick_PCR纯化柱(Qiagen,Inc.Valencia,CA)按照制造者的说明书进行去除。通过这些方法标记的大约100ng DNA片段产生大约0.1μCi/ng的特异活性。经标记DNA片段通过煮沸5分钟进行变性,然后加入至最低杂交溶液中的杂交印迹中并于60℃或65℃孵育过夜。通过在2XSSC中于室温漂洗去除不牢固放射性,然后通过在0.3XSSC+0.1%十二烷基硫酸钠中于60℃或65℃洗涤印迹至少1小时去除较紧密结合的放射性。至少进行两次此种洗涤。将印迹于-80℃置于有两层增感屏的X射线胶片上,并在1至3天曝光后,将曝光胶片进行显影。通过在0.3XSSC+0.1%SDS中煮沸10分钟,将经杂交DNA片段从印迹中去除,并在以后的杂交中重新应用一次或两次。
在获自蜂类芽孢杆菌DB482菌株的基因组DNA中观察到与来自引物组1及引物组2的探针杂交的不同片段。检测与IDAS1529 tcORF5序列同源的衍生自引物组1(引物SB126及SB127)的探针与预计大小(以千碱基表示)为20、10.2及8.4的片段杂交。在这个分子大小的范围内,DNA片段的迁移只可提供对分子真实大小的估计。对估计为20kb及8.4kb片段的信号强度比对估计为10.2kb片段的信号强度更强。由于这些片段中的每一片段至少为探针片段(约4.4kb)大小的两倍,这些结果的一个解释为:与来自IDAS 1529 tcORF5的探针类似并因此与光杆状菌tcaC基因类似的基因的多重拷贝在蜂类芽孢杆菌DB482菌株中存在。然而,对这个结果的其它解释是可能的。
来自引物组2(引物SB128及SB129)的探针,其检测与IDAS 1529tcORF6及其侧翼5’端序列同源的序列,所述探针与估计大小(以千碱基表示)为7.8及4.5的片段杂交。估计为7.8kb片段的信号强度比估计为4.5kb片段见到的信号强度强的多。这个结果的一个解释为蜂类芽孢杆菌DB482菌株有与IDAS 1529 tcORF6及其5’侧翼序列相似的单一基因,并因此与光杆状菌tccC基因相似,并且EcoRI将该基因切割成该基因所包含的两个不等部分DNA序列的片段。然而,对这个结果的其它解释是可能的,包括与探针有不同量绝对同源性的多重基因的存在。
这些结果(通过PCR扩增接着通过DNA序列分析检测)证实了在蜂类芽孢杆菌DB482菌株中存在光杆状菌tcaC及tccC基因的相关物。
实施例15-DB482的杀虫活性
显示类芽孢杆菌DAS1529菌株产生对鳞翅目昆虫有毒性的细胞外蛋白质并且也显示此菌株包含名为Cry1529的cry基因。由于此菌株产生细胞外杀虫活性蛋白质及细胞内杀虫活性蛋白质,本发明包括筛选类芽孢杆菌其它菌株的细胞外(释放到培养基上清液)和/或细胞内(细胞相关)杀虫活性因子。该实施例阐述了如何产生类芽孢杆菌菌株的发酵培养液,如何处理这些培养液及如何检验来自这些培养液样本的杀虫活性。
15.A.类芽孢杆菌发酵培养液的产生及处理
类芽孢杆菌菌株在营养琼脂平板(8g/l营养培养液,15g/l细菌用琼脂;Difco Laboratories,Detroit,MI)于30℃生长3-5天。挑取单个菌落并接种到包含100ml无菌的改良胰胨豆胨培养液(胰蛋白胨10-g/l,蛋白胨7g/l,豆胨3g/l,KCl 5g/l,K2PO4 2.5g/l;Difco Laboratories,Detroit,MI)的500ml三挡板烧瓶中。于28℃在旋转摇床上以150转/分钟孵育72小时后,将培养物分装到无菌500ml聚乙烯瓶中并于4℃,以4,000xg离心45分钟。离心后,弃去上清液并通过0.22μm膜滤器(MilliporeCorporation,Bedford,MA)。然后将培养滤液用Centricon Plus-20离心过滤装置用5,000分子量截止膜通过4,000xg离心浓缩20X。细菌细胞沉淀物在10mM磷酸钾缓冲液(pH=8)中进行重悬。然后这些样本在昆虫生物试验中对经处理上清及细胞沉淀样本中包含的杀虫活性进行检验。
15.B.经处理上清及细胞沉淀物的昆虫生物试验
在这些测定中包括的昆虫种为南方谷类根虫(Southern cornrootworm,SCR),谷实夜蛾(CEW)及烟芽夜蛾(TBW)。用于喂养的人工食物及生物测定SCR在以前进行了描述(Rose,R.L.及McCabe,J.M.1973.J.Econ.Entomol.66,398-400)。标准人工鳞翅目食物(StonevilleYellow食物)用于喂养及ECB、CEW及TBW的生物测定。将40μl份经浓缩上清或细胞沉淀物样本直接应用于包含人工食物的孔(~1.5cm2)表面。使经处理的食物孔在无菌通风橱中空气干燥,并且将每孔感染孵育自表面无菌卵的单个新生昆虫。然后将测定板进行密封,置于湿度生长箱,并于28℃维持3-5天。然后对死亡率及确定的幼虫重量进行评分。每个处理应用八个昆虫。
15.C.DB482的杀虫活性
来自DB482菌株的经浓缩上清及细胞沉淀物对SCR、TBW及CEW相对于对照处理有杀虫活性(表25)。这可能是因为来自DB482的经浓缩上清及细胞沉淀物的杀虫活性是两个不同杀虫因子的结果,一个杀虫因子为细胞相关(即Cry样)而另一个是来自细胞释放(即TC样)。然而,也可能来自DB482的经浓缩上清及细胞沉淀物的杀虫活性为存在于这两种细胞级分中的同一杀虫因子的结果。
表25.DB482的杀虫活性
| 受试昆虫 | 经浓缩上清活性 | 细胞沉淀物活性 |
| SCR | +++* | +++ |
| TBW | ++ | ++ |
| CEW | +++ | ++ |
| 培养基对照 | - | - |
*-,++,+++;分别为无,中等及高活性
15.D.杀虫活性筛选的总结
这个实施例阐述了用于筛选来自类芽孢杆菌菌株的经浓缩培养上清及细胞沉淀物以确定对鞘翅目及鳞翅目昆虫具有杀虫活性菌株的方法。文中显示的蜂类芽孢杆菌分离株DB482包含tcaA,tcaB,tcaC及tccC的同系物。在DB482中发现的杀虫活性证实类芽孢杆菌DAS1529菌株在类芽孢杆菌属中不是唯一产生对鳞翅目昆虫杀虫活性的菌株。因此,本发明包括用于鉴定在其它类芽孢杆菌种如软骨素类芽孢杆菌,解藻酸类芽孢杆菌,幼虫类芽孢杆菌,强壮类芽孢杆菌,戈氏类芽孢杆菌,蜂房类芽孢杆菌,缓病类芽孢杆菌,缓病类芽孢杆菌,日本甲虫类芽孢杆菌,解硫胺素类芽孢杆菌,解菌多糖类芽孢杆菌,神户类芽孢杆菌,解糖类芽孢杆菌,灿烂类芽孢杆菌,千叶类芽孢杆菌,马阔里类芽孢杆菌,固氮类芽孢杆菌,皮奥利亚类芽孢杆菌,多粘类芽孢杆菌,依利诺斯类芽孢杆菌,解淀粉类芽孢杆菌,饲料类芽孢杆菌及浸麻类芽孢杆菌中对鳞翅目昆虫有杀虫活性的其它类芽孢杆菌菌株的方法。
序列表
<110>美国陶氏益农公司
<120>可获自类芽孢杆菌种的杀虫活性蛋白质及多核苷酸
<130>DAS-101XC2
<150>US 60/392,633
<151>2002-06-28
<150>US 60/441,647
<151>2003-01-21
<160>49
<170>PatentIn版本3.2
<210>1
<211>33521
<212>DNA
<213>人工序列
<220>
<223>SB12全部插入片段的核酸序列
<400>1
gatcacacgg ccggcgtatt ccggctcgga accgaagaat taacagaagc gcttcagcag 60
tccggttatc ggacagtctt tgatattgca tctgaaaatc ttgcggaatt tcagaaaagc 120
aatccggaga ttccctcttc cgacgcgaag gagattcatc aattagccgt ccagaggaca 180
gaaaacttat gcatgcttta taaggcctgg caactgcaca atgatccggt cgtccagagc 240
cttcccaaat tatccgcgga taccggcctg cgaggcatgc gtgccgcgtt ggagcggagt 300
cttggagggg gagccgattt tggagacttg ttcccggagc gatcgccaga gggctatgcg 360
gaagcctcct ctatacagtc gcttttttcg ccgggacgtt accttacggt gctgtataaa 420
attgcgcagg atctccacga cccaaaagac aaactgcata ttgacaaccg ccgtccagat 480
ttgaagtcgc tgatcctcaa taatgacaat atgaaccgtg aggtgtcttc cctggatatc 540
ctgctggatg tgctgcagtc cgaaggctcc ggcacactga catccctgaa ggatacctac 600
tatccgatga cccttccc tatgatgacgac cttgcgcaaa tcaatgccgt ggcggaggcg 660
cgctcatcca atttgctggg gatctgggat accctgctgg acacgcagcg gacttccatc 720
ctgcaggatt ccgccgctgt ccaccggata agcaagccgc ggcactcggc atacgtcaat 780
cagagagtct ccgatgatga accggtattg atcgcgggag aggaattcta cttggagacc 840
ggcggtgttg ccgacacgac cccgtctccg ccaacgaggg aagcgctttc cttgacgcca 900
aacagcttcc gtctgctggt caaccccgag ccgacagcag acgacatcgc caatcactac 960
aacgttaaga ctcaagatcc tgccgctctg gccgccgtct taaatgtggt cgatgacttt 1020
tgcctgaaaa ccggtttgag ctttaatgag ttgctggact taacgatgca gaaggatgat 1080
gaatcgatcg gcagcgagta caaaagccgg tttgtaaaat ttggcggcga ggccaatgtt 1140
ccggtttcaa cctatggagc tgtatttctg acaggaacgg aagaaactcc gttgtgggta 1200
ggaaaaggag ctgtgataag ccctgcagcg gacgcctatg ttcgtaatgg gacatatgca 1260
aacacgaatt atggatcaga cactagtctt gttgtgaagc aggatgggtc tagtggatac 1320
agtagggaag catatatcag gtttgatttg acaggtcttt ccggagttgt ggaggaagct 1380
aaaatttctc taacaactag agcgaaacaa ttgtctagct taagacacca agctcatttg 1440
gtcagtgaca acagttggga tgaattgaaa atcacatgga ataacaaacc tgcaggagga 1500
gcgatcatcg caagctggga tgttcccgaa gttggtgaga atgtaaaggt tgatgtgacc 1560
cggcaagtaa atgatgcgct cgcaaacggt caagataaac tatcaattgt tattcgttct 1620
agtgcaaatt atggcagtct gggcgatgtc tcttatgcct ctagagaaca ccctgaaaaa 1680
gcctcacgac cttctatgga aatcaaggcg ataacgggtg ctggtttaaa ttttacggcg 1740
gataatgttg tagctctggc aggaagggcg gaaaagcttg tccggctggc gcgcagcacg 1800
ggactttcct ttgagcagtt ggattggctg attaccaata ccagccgtgc cgtaatcgaa 1860
catggtggag aactgattct ggataagccg gtactggagt ctgtggccga attcacaagg 1920
ctccataagc gttatggcat cacagcggat atgttcgccg cgtttatcgg cgaagtcaat 1980
acgtatgctg aagcaggtaa agagagcttt tatcagacga ttttcagcac ggccgaccat 2040
tcggctgcct tacctttagg cgcaactttg caatttgagg tgagcaaaca ggatcgatat 2100
gaagcgattt gctgcggggc catgggggtg accgccgatg agttctctcg tatcggcaaa 2160
tactgctttg gcgacaacgc gcagcaagtt accgccaatg aaacaaccgt tgcgcagctt 2220
tatcgtttag gccgaattcc tcacatgctt ggattgcgtt ttaccgaggc ggagctgttg 2280
tggaaattga tggctggcgg cgaggatacc ttgctccgca cgattggcgc gaagcctcgc 2340
agtttacaag ccttagagat tattcgccgt actgaggtcc ttttggactg gatggatgct 2400
catcagcttg atgttgtctc cctgcaagcc atggttacca atcggtacag cggcacagcc 2460
acgccggagc tgtacaactt tttggcacag gtgcaccaat ccacaagcag tgccgcgaac 2520
gtgtccaaag cggatgctca ggataccctg cccgcggaca agctgttccg ggccttggcg 2580
gtaggcttca acctgaaggc caacgtgatg gcgcaggtca ttgactggtt ggacaaaacc 2640
gacggagcgt ttacgctgcg ggctttctgg gacaagcttc aagcgtattt cagcgccgat 2700
catgaagaag aactgacggc cttggaagga gaagccgact tgctgcagtg gtgccaacag 2760
atcagccagt atgcgctcat tgtccgctgg tgcgggttaa gcgatcagga tctggcgctg 2820
ctgaccgggc atcccgggca gcttctgtcc ggacaacata cggtgccggt accctcgctg 2880
catctcctgc tggtgctgac ccgcctgaag gaatggcagc agcgcgtcca ggtttccagc 2940
gaggaggcca tgcgctattt tgcccaggcc gatgcgccaa ccgtcacacg cgatgctgcg 3000
gtcaagctgc ttgcccgtat ccatggctgg aatgaacagg ataccgcctc gatgaatgac 3060
tacctgctgg gagagaacga atatcctaag aactttgagc agatctttac tttggaaagc 3120
tgggtcaacc tgggccgtca actgaatgtt ggcagccgaa cgttgggaga gctggttgac 3180
atgtcagaag aggatgatac cgcggaaaac acggatttga ttatctcggt cgcccaaagc 3240
ctgatggctg cggtgcaggc ctgaaccaac atgaccaagg aaggtggtaa gaatatgtct 3300
acttcaaccc tgttgcaatt gattaaggaa tcccgccggg atgcgttggt caaccattat 3360
atcgccaaca atgtcccgag agagcttacg gataagatta cagacgcaga cagcctgtat 3420
gagtatttgc tgctggatac caagatcagt gaactcgtaa aaacatcgcc gatagctgag 3480
gccattagca gcgttcagtt atacatgaac cgatgcgtgg aaggctatga aggcaagctg 3540
actccggaag gcaacagcca tttcgggccg ggaaaattcc tgaataattg ggatacctat 3600
aacaagcgtt attccacttg ggccggcaag gaacgtctga aatattatgc aggcagttat 3660
attgacccgt ccttgcgcta taacaaaacg gatccgttcc tgaacctgga acagaatatc 3720
agccagggaa gaatcaccga tgacaccgta aagaacgcgc tgcaacacta cctgactgaa 3780
tatgaagtgt tggcggattt ggaatatatc agcgtaaata aaggcgccga tgaaagtgta 3840
ttattcttcg taggccgcac caaaacaatg ccatacgaat attactggcg ccgattaacg 3900
ttgaaaaagg acaataacaa taaactggtg cctgccatct ggtctcaatg gaaaaaaata 3960
actgccaata tcggcgaagc agttaataat tatgtggtgc ttcactggca taataaccgc 4020
ttacatgtac aatggggttc tacagagaaa acacaaaatg atgacggaga acccattgag 4080
aaacgatatt tgaatgactg gttcatggat aagtccagtg tctggtcttc attccgaaag 4140
gtttcatata tagaaaatag ttttacttat actgagggca tcattgattc aagaaatatt 4200
actatagctg gaaatcaact gttctgtgat gattcaaata cttttaaggc aacaataacg 4260
gcacttccat ttgaccaaat acgtgtttac ttagaaaaga tttacggtac aggcggcagc 4320
atcacggtta ctggagaaaa taaaggctat attattaagg tgggggagcc aagagaagtc 4380
agtttctctc ctaatacgtt actagatgta ttcataggta gtaatgcaag ccctcgagac 4440
ccatatttca aagctacatt taatagagaa gctctccaaa attcatacgg ctcaattaaa 4500
ataaatcaat acacccctcc ttctggaagc aatatcaaag gtcctatcga ccttaccctg 4560
aaaaataaca tcgacctgtc ggcgttgttg gaagagagcc ttgacgtact gttcgactat 4620
accattcagg ggaataacca attgggcggc ttagaggcct ttaacgggcc ttacggactt 4680
tatttgtggg aaatcttcct ccatgttcca tttttaatgg cggttcgctt ccacaccgag 4740
cactgagaga tcccctcata atttccccaa agcgtaacca tgtgtgaata aattttgagc 4800
tagtagggtt gcagccacga gtaagtcttc ccttgttatt gtgtagccag aatgccgcaa 4860
aacttccatg cctaagcgaa ctgttgagag tacgtttcga tttctgactg tgttagcctg 4920
gaagtgcttg tcccaacctt gtttctgagc atgaacgccc gcaagccaac atgttagttg 4980
aagcatcagg gcgattagca gcatgatatc aaaacgctct gagctgctcg ttcggctatg 5040
gcgtaggcct agtccgtagg caggactttt caagtctcgg aaggtttctt caatctgcat 5100
tcgcttcgaa tagatattaa caagttgttt gggtgttcga atttcaacag gtaagttagt 5160
tgctagaatc catggctcct ttgccgacgc tgagtagatt ttaggtgacg ggtggtgaca 5220
atgagtccgt gtcgagcgct gattttttcg gcctttagag cgagatttat acaatagaat 5280
ttggcatgag attggattgc ttttagtcag cctcttatag cctaaagtct ttgagtgact 5340
agatgacata tcatgtaagt tgctgatagg tttccagttt tccgctccta ggtctgcata 5400
ttgtactttt cctcttactc gacttaacca gtaccaaccc agcttctcaa cggatttata 5460
ccatggcact ttaaagccag catcactgac aatgagcggt gtggtgttac tcggtagaat 5520
gctcgcaagg tcggctagaa attggtcatg agctttcttt gaacattgct ctgaaagcgg 5580
gaacgctttc tcataaagag taacagaacg accgtgtagt gcgactgaag ctcgcaatac 5640
cataagccgt ttttgctcac ggatatcaga ccagtcaaca agtacaatggg catcgtatt 5700
gcccgaacag ataaagctag catgccaacg gtatacagcg agtcgctc tttgtggaggtg 5760
acgattacct aacaatcggt cgattcgttt gatgttatgt tttgttctcg ctttggttgg 5820
caggttacgg ccaagttcgg taagagtgag agttttacag tcaagtaagg cgtggcaagc 5880
caacgttaag ctgttgagtc gttttaagtg taattcgggg cagaattggt aaagagagtc 5940
gtgtaaaata tcgagttcgc acattttgtt gtctgattat tgatttttgg cgaaaccatt 6000
tgatcatatg acaagatgtg tatctacctt aacttaatga ttttgataaa aatcattagg 6060
ggattcatca gcaccgagca gcggtatgag ttggcggaac gatggtttaa attcattttc 6120
aacagcgcag gttaccgtga tggctacggc aatctgctga cggatgacaa aggcaacgtg 6180
cgctactgga acgtcgtgcc tctgcaggag gatacggagt gggatgacac gttgtccctg 6240
gcaacgaccg acccggacga gattgcgatg gccgacccga tgcaatacaa gctggctatc 6300
tttattcaca ccttggactt cttgatcagc cgcggcgaca gcttgtaccg gatgctggag 6360
cgggatacct tgaccgaagc gaagatgtat tacattcagg ccagccaact gcttgggcct 6420
cgtcccgaga tccggatcaa tcacagctgg cctgatccga ccctgcaaag cgaagcggac 6480
gcggtaaccg ccgtgccgac gcgaagcgat tcgccggcag cgccaattct cgccttgcga 6540
gcgcttctga atgcggaaaa cgggcatttc ctgccgcctt ataatgatga actattagct 6600
ttctgggata aaatcgacct gcgtctctac aatttacgcc acaatctgag cctggacggt 6660
cagccgcttc atttgccgct ctttaccgaa ccggtcaatc ctcgtgagct gcaggttcag 6720
catggggcag gcgatggatt agggggaagc gccggttccg tccaaagccg tcaaagtgtc 6780
tatcgttttc ctctggtcat cgataaggcg cgcaatgccg cgagtagtgt tatccaattc 6840
gggaatgccc tggaaaacgc gctgacaaag caggacagcg aggccatgac tatgctgttg 6900
caatcccagc agcagattgt cctgcagcaa acccgcgata ttcaggagaa gaacctggcc 6960
tcgctgcaag caagtctgga agcaacgatg acagccaaag cgggcgcgaa atcccgaaag 7020
acccattttg ccggcctggc ggataactgg atgtcgcata atgaaaccgc ctcacttgca 7080
ctgcgtacca ctgcgggaat tatcaataca agctcgaccg tgccaatcgc tatcactggc 7140
ggcttggata tggctccgaa catttttggt ttcgcagttg gaggttcccg ctggggagca 7200
gccagcgcgg ctgtagccca aggattgcaa atcgccgccg gcgtaatgga acagacggcc 7260
aatatcatcg atatcagcga aagctaccgc cggcgccggg aggattggct gctgcagcgg 7320
gatgttgccg agaatgaagc ggcgcagttg gattcgcaga ttgcggccct gcgggaacag 7380
atggatatgg cgcgaaaaca acttgcgctg gcggagacgg aacaggcaca cgcgcaagcg 7440
gtctacgagc tgctaagcac ccgttttacg aatcaagctt tgtataactg gatggccgga 7500
cgtctgtcgt ctctatacta tcaaatgtat gacgccgcat tgccgctctg cttgatggcc 7560
aaacaggctt tagagaaaga aatcggcaat gataaaacgg ttggaatctt caccctcccg 7620
gcctggaatg atttgtatca gggattgcta gcgggcgagg cgctgctgct cgagcttcag 7680
aagctggaga atctgtggct ggaggaggac aagcgcggaa tggaagctgt aagaacggta 7740
tctttagata cccttctccg caaagaaaag ccagaatccg gttttgcaga tttcgtcaag 7800
gaagttctgg acggaaagac gcctgaccct gtaagcggag ttagcgtaca gctgcaaaac 7860
aatattttca gtgcaaccct tgacctgtcc acccttggcc tggatcgctt ttacaaccaa 7920
gcggaaaagg cccacaggat caaaaacctg tcggttacct tacccgcgct attgggacct 7980
tatcaggata ttgcggcaac cttatcgcta ggtggcgaga ccgttgcgct ttcccatggc 8040
gtggatgaca gcggcttgtt tatcacggat ctcaacgaca gccgtttcct gcctttcgag 8100
ggtatggatc ctttatccgg cacactcgtt ctgtcgatac tccatgccgg gcaagacggt 8160
gaccagcgcc tcctgctgga aagcctgaac gacgtcatct tccacattcg atatgtcatg 8220
aaatagaaga caaactcccg cgaaatagtt caaccgcggg agttctttat tttccaccca 8280
aatcattgac ataaatatac tttaataata tgttggagga agaagaggag gttgttattg 8340
gtgagaataa agaaaatgtt tgaagtagcg atgatgttat cattggcgtg tttgtttttt 8400
gttacatcag ctgcttcagc aaaaacaact aatttaactt cttccccgaa acttatgaac 8460
tgctttgatg tagctggtaa cgtaacctac aaaaccgctc ctgatggttc aattacgaaa 8520
ataatcgaag tacaagatgt tagtaaattc agtgaacaaa ccaatctcag gttggctcca 8580
gattctaaag ttaccattta tattcctgac tccagtgaca ataaccagcc caattactcc 8640
aataataatt ccaatgacta tagtgaacaa aattacctca atactaaccc caacgttgaa 8700
ccatttgttg aaccatttgt tgaacttata aagtatattg cgaacgtaag tgatccatat 8760
gaagcgtgtg gatcaaaatc gattagagat tctgattatg atcctcccgg cggaaaaatg 8820
ataataaaac aagggataca ggctacacac tcaaccacgg tttctatcga tgccaaaatc 8880
gtttcaactg ccttaaaata tgatgtaaca acgagttatt ccattgaaga ggagcaaaat 8940
attaaagtac cagacaataa aagaggaaga attattgctt atccaaagta tgatgtcaac 9000
cc tttgaaa tatgggaagc tggtctaata tataataaaa agattggaga cggtacggct 9060
ttctatccta aaggagtatg ttttgttaca attattaatt aactttcaaa taagagaagc 9120
tgtttcttaa gaataaagaa gcagcttctt gcatttttta ttatgatatt acactctatc 9180
ttctgtcaga tgctccctct caacttccat tcccaatccc ctcttcttaa aaggccataa 9240
aagttacact tatcatttcc gtcattgcta atctaccttg cagttaacct aaaatatacc 9300
ttccgggatt cctgaaggat gaaacatatt ttcacccatc agtgaaacta tctatgcttt 9360
tttgattgaa gcgagaggta tgcttgggtt gtaaatgaaa ggggggacct gttcatggga 9420
aactacctaa aacggtaacg gatagcttct atggttttga tgtctgcagt cattttgtct 9480
tggggagtac tcatcattca gaacacaaga ggaggagttc atggtgtcaa caacagacaa 9540
cacggccggc gtattccggc tcggaaccga agaattaaca gaagcgctta agcagtccgg 9600
ttatcggacc gtctttga tattgtatctga caatcttgcg gaatttcaga aaaacaatcc 9660
ggagattccc tcttctgacg cgaaggaga ttcatcaatta gccgtccaga ggacagaaaa 9720
cttatgcatg ctttataagg cctggcagct gcacaatgat ccggttgtcc agagccttcc 9780
caaattatcc gcggataccg gcctgcaagg catgcgtgcc gcgttggagc ggagtcttgg 9840
aggcggagcc gattttggag acttgttccc ggagcgatcg ccagagggct atgcggaagc 9900
ctcctctata cagtcgcttt tctcgccggg acgttacctg acggtgctgt ataaaattgc 9960
gcgggatctc cacgacccaa aagataaact gcatattgac aaccgccgtc cagatttgaa 10020
gtcgctgatc ctcaataatg acaatatgaa ccgagaggta tcttctctgg atatccttct 10080
ggatgtgctg cagcccgaag gctctgacac gctgacatcc ttgaaggata cctaccatcc 10140
gatgaccctt ccctatgatg acgaccttgc gcaaatcaat gccgtggcgg aggcgcgttc 10200
atctaatttg ctggggattt gggataccct gctggacacg cagcggactt ccatcctgca 10260
gaattccgcc gctgcccgcc ggataagcaa ggcgcggcac tcggcatacg ccaatcagaa 10320
agcctccaat gatgagccgg tattcatcac gggagaggaa atctacctgg aaaccggagg 10380
taaacggctt tttctggcgc ataaactcga gataggttca actattagcg ctaaaatcaa 10440
cattggaccg ccgcaagcgg ccgatatcgc gccggcaaag ttgcaactcg tatattacgg 10500
cagaggcggc agagggaact acttcctgcg cgtggcagac gatgtgtccc tcggtggaaa 10560
gctgctgacc aattgttatc tgaccagcga tgacggacag agcaacaata ttagcgggcc 10620
atactgccta atgatcaacc gaggcaccgg cagcatgcct agcgggactc accttccagt 10680
tcagattgaa agagtgaccg atacatccat ccgcattttt gtgccggatc acggctattt 10740
ggggctaggc gaaagccttg ccagcaactg gaatgaaccg ttggcgctga atctgggctt 10800
ggatgaagcg ttgaccttta ccttgagaaa gaaggagacg ggaaatgaca ccatttccat 10860
aatcgacatg ctgccgccgg tagcgaacac gactccgtct ccgccgacga gggaaacgct 10920
ttccttgacg ccaaacagct tccgtctgct ggtcaaccct gagccgacag cggaggacat 10980
cgccaagcac tacaacgtca cgacggtaac ccgggctcct gccgatctgg cctccgcctt 11040
aaatgttgtc gatgatttct gcttgaaaac cggtttgagc tttaacgaat tgctggattt 11100
aaccatgcag aaggattatc agtcaaaaag cagtgagtac aaaagccgat ttgtaaaatt 11160
cggcggcggg gagaatgttc cggtatcaag ctatggcgca gcctttctga caggagcgga 11220
agatactcct ttgtgggtga aacagtataa cagcgtgggg actgcaacaa gcacccctgt 11280
tttaaacttt acgccagata atgttgtggc tttggcagga agggcggaaa agcttgtccg 11340
gctgatgcgc agcacgggtc tttcctttga gcagttggat tggctgattg ccaatgccag 11400
ccgtgccgtt atcgaacacg gtggagagct ttttctggat aagccggtac tggaagctgt 11460
ggccgaattc acaaggctca ataagcgtta tggcgtcaca tcggatatgt tcgccgcgtt 11520
tatcggcgaa gtcaatacgt atacagaagc gggcaaggac agcttttatc aggcgagttt 11580
cagcacggcc gaccattcgg ctaccttacc tttgggcgct tctttgcaac ttgaggtgag 11640
caagcaggat cgatatgaag cgatttgctg cggggctatg ggggtgaccg ccgatgagtt 11700
ctcccgtatc ggcaaatact gctttgggga taaagcacag caaatcacgg ccaatgaaac 11760
aaccgttgcc cagctttatc gtttaggccg aattcctcat atgctaggct tgcgttttac 11820
cgaggcagag ctgttgtgga aattgatggc tgggggcgag gataccttgc tccgcacgat 11880
tggcgcgaac cctcgcagtt tagaagcgtt agagattatt cgccggacgg aggtcctttt 11940
ggactggatg gatgcccatc agctggatgt tgtctccctg caagccatgg ttaccaatcg 12000
gtacagcggc acagccacgc cggagctgta caattttttg gcacaggtgc atcaatccgc 12060
aagcagtgcc gcgaacgtgg ccagagcgga tggtcaggat acgttgcctg cggacaagct 12120
gctccgggca ttggcggcgg gcttcaaact gaaagccaac gtgatggcgc gagtaatcga 12180
ctggatggac aaaaccaata aagcgtttac gctgcgggct ttctgggaca agcttcaagc 12240
gtatttcagc gccgatcatg aagaagaact gaccgccctg gaaggagaag ccgcaatgct 12300
gcagtggtgc cagcagatca gccagtatgc gctcattgtc cgctggtgcg ggttaagcga 12360
gcaggatctg gcgctgctga ccgggaatcc ggagcagctt ctggacggac aacatacggt 12420
gcccgtaccc tcgctgcatc tcctgctggt gctgacccgc ctgaaggaat ggcagcagcg 12480
cgtccaggtt tccagcgagg aggctatgcg ctattttgcc caggccgatt cgccaaccgt 12540
cacgcgcgac gatgcggtta atctgcttgc ccgtatccat ggctggaatg aagcggatac 12600
cgtctcgatg aatgactacc tgctgggaga gaacgaatat cctaagaact ttgatcagat 12660
ctttgcactg gaaagctggg tcaacctggg ccgtcaactg aacgtgggca gcagaacgct 12720
gggagagctg gttgacatgg ctgaagagga taaaaccgcg gaaaacatgg atctgattac 12780
ttcggtggcc catagcctga tggctgcagc gaaagcctga accaacatga ccaaggaagg 12840
tgataagcat atgtctactt caaccctgtt gcaatcgatt aaagaagccc gccgggatgc 12900
gctggtcaac cattatattg ctaatcaggt tccgacagcg cttgcggaca agattacgga 12960
cgcggacagc ctgtatgagt acttgctgct ggataccaag atcagtgaac tcgtaaaaac 13020
atcgccgata gcggaggcca tcagcagcgt gcagttatac atgaaccgct gcgtcgaagg 13080
ctatgaaggc aagttgactc cggaaagtaa tactcatttt ggcccaggta aatttctata 13140
taactgggat acgtacaaca aacgtttttc cacctgggca ggaaaagaac gcttgaaata 13200
ttatgcaggc agctatattg agccgtcctt gcgctacaac aaaaccgatc cattcctgaa 13260
cctggaacag agcatcagcc agggaagaat tactgatgat accgtaaaga acgcgctgca 13320
acactacctg actgaatatg aagtgttggc ggatctggat tatatcagcg ttaataaagg 13380
cggcgacgaa agtgttttac tctttgttgg acgcaccaaa accgtaccgt atgaatacta 13440
ctggcgccgt ttgcttttaa aaagggacaa taataataag ctagtaccag cagtctggtc 13500
tcagtggaaa aaaatcagtg ccaatatcgg tgaagcggtt gatagttatg tggtgcctcg 13560
gtggcataaa aaccggctac atgtgcaatg gtgttctata gagaaaagtg aaaatgatgc 13620
cggtgaaccc attgagaaac gatatttgaa tgactggttc atggatagtt ccggagtctg 13680
gtcttcattt cgaaagattc cggttgtgga aaagagtttc gaatatttgg acggaagcct 13740
cgatccccga tttgtcgctc ttgttagaaa tcaaatatta attgatgagc cagaaatatt 13800
cagaattaca gtatcagccc ctaatccgat agatgcaaat ggaagagtag aggtacattt 13860
tgaagaaaac tatgcaaaca gatataatat taccattaaa tatgggacaa cgagtcttgc 13920
tattcctgca gggcaggtag ggcatccaaa tatctctatt aatgaaacat taagggttga 13980
attcggcacc aggccggatt ggtattatac tttcagatat ttaggaaata caatccaaaa 14040
ctcatacggt tcaattgtca ataatcaatt ttcacctcca tcaggaagca atattaaagg 14100
tcctatcgac cttaccctga aaaataacat cgacctgtcg gccttgttgg atgagagcct 14160
tgacgcactg ttcgactata ccattcaggg cgataaccaa ttgggcggct tagctgcctt 14220
taacgggcct tacggacttt acttgtggga aatcttcttc catgttcctt ttttaatggc 14280
ggttcgcttc cacaccgagc agcggtatga gttggcggaa cgttggttta aattcatctt 14340
caacagcgca ggataccgtg atgattacgg cagtctgctg acggatgaca aaggcaacgt 14400
gcgttactgg aacgtgatac cgctgcaaga ggacacggag tgggatgaca cgttgtccct 14460
ggcaacgacc gacccggacg agattgcgat ggccgacccg atgcaataca agctggctat 14520
atttattcac accatggact tcctgatcag ccgcggcgat agcttgtacc ggatgctgga 14580
gcgggatacc ctggccgaag ccaagatgta ttacattcag gccagccaac tgcttgggcc 14640
ccgccccgac atccggctca atcacagttg gcctaatccg accttgcaaa gcgaagcgga 14700
cgcggtaacc gccgtgccga cgcgaagcga ttcgccggca gcgccaattt tggccttgcg 14760
agcgcttctg acaggcgaaa acggtcattt cctgccgcct tataatgatg aactgttcgc 14820
tttctgggac aaaatcgatc tgcgtttata caatttgcgc cacaatttga gtctggacgg 14880
tcagccgctt catttgccgc tctttgccga accggtcaat ccgcgtgaat tgcaggttca 14940
gcatggcccg ggcgatggct tggggggaag cgcgggttcc gcccaaagcc gtcagagtgt 15000
ctatcgtttt cctctggtca tcgataaggc gcgcaatgcg gccaacagtg tcatccaatt 15060
cggcaatgcc ctggaaaacg cactgaccaa gcaagacagc gaagcaatga ccatgctgtt 15120
gcagtcccag cagcagattg tcctgcagca aacccgcgat attcaggaga agaacctggc 15180
cgcgctgcaa gcaagtctgg aagcaacgat gacagcgaaa gcgggggcgg agtcccggaa 15240
gacccatttt gccggcttgg cggacaactg gatgtcggac aatgaaaccg cctcactcgc 15300
actgcgtacc accgcgggaa tcatcaatac cagctcaacc gtgccgatcg ccatcaccgg 15360
cggcttggat atggctccga acatttttgg tttcgcagtt ggaggttccc gctggggagc 15420
agccagcgcg gctgtagccc aaggattgca aatcgccgcc ggcgtaatgg aacagacggc 15480
caatattatc gatattagcg aaagctaccg ccggcgccgg gaggattggc tgctgcagcg 15540
ggatgttgcc gaaaatgaag cggcgcagtt ggattcgcag attgcggccc tgcgggaaca 15600
gatggatatg gcgcgcaagc aacttgcgct ggcggagacg gaacaggcgc acgcgcaagc 15660
ggtctacgag ctgcaaagca cccgctttac gaatcaagct ttgtataact ggatggctgg 15720
acgtctgtcg tctctatact atcaaatgta tgacgccgca ttgccgctct gcttgatggc 15780
gaagcaggct ttagagaaag aaatcggttc ggataaaacg gtcggagtct tgtccctccc 15840
ggcctggaat gatctatatc agggattatt ggcgggcgag gcgctgctgc tcgagcttca 15900
gaagctggag aatctgtggc tggaggaaga caagcgcgga atggaagccg taaaaacagt 15960
ctctctggat actcttctcc gcaaaacaaa tccgaactcc gggtttgcgg atctcgtcaa 16020
ggaggcactg gacgaaaacg gaaagacgcc tgacccggtg agcggagtcg gcgtacagct 16080
gcaaaacaat attttcagcg caacccttga cctctccgtt cttggcctgg atcgctctta 16140
caatcaggcg gaaaagtccc gcaggatcaa aaatatgtcg gttaccttac ctgcgctatt 16200
ggggccttac caggatatag aggcaacctt atcgctaggc ggcgagaccg ttgcgctgtc 16260
ccatggcgtg gatgacagcg gcttgttcat cactgatctc aacgacagcc ggttcctgcc 16320
tttcgagggc atggatccgt tatccggcac actcgtcctg tcgatattcc atgccgggca 16380
agacggcgac cagcgcctcc tgctggaaag tctcaatgac gtcatcttcc acattcgata 16440
tgttatgaaa tagctttaca gtcagatata ttccggggct tgtattcaca agcccctcca 16500
aggaggaatt gggttatgcc acaatctagc aatgccgata tcaagctatt gtcgccatcg 16560
ctgccaaagg gcggcggttc catgaaggga atcgaagaaa acatcgcggc tcccggctcc 16620
gacggcatgg cacgttgtaa tgtgccgctg ccggtaacct ccggccgcta tattactcct 16680
gatataagcc tgtcctatgc gagcggccac ggcaacggcg cttatggaat gggctggacg 16740
atgggagtga tgagcattag ccggagaaca agccgaggga cccccagtta tacatccgaa 16800
gaccagttcc ttggtccgga tggggaggtg cttgttccgg aaagcaacga acaaggggag 16860
atcattaccc gccacaccga tacggcccaa gggataccgt taggcgagac gtttacggtt 16920
acacgctatt ttccccggat cgagagcgct tttcatttgc tggaatactg ggaagcgcaa 16980
gcaggaagcg caacagcgtc gttttggctt attcactctg ccgatggagt gctgcactgt 17040
ctgggtaaaa ctgctcaggc gaggatagcc gcccctgacg attccgccaa gatcgcagaa 17100
tggctagtgg aggagtccgt ctcccccttc ggagagcata tttattacca atacaaagaa 17160
gaagacaatc aaggcgtgaa tctggaggaa gacaatcatc aatatggggc gaaccgctat 17220
ctgaaatcga ttcgctatgg aaataaggtt gcctctcctt ctctctatgt ctggaagggg 17280
gaaattccgg cagacggcca atggctgtat tccgttatcc tggattatgg cgagaacgat 17340
acctcagcgg atgttcctcc cctatacacg ccccaagggg agtggctggt gcgcccggac 17400
cgtttttccc gctatgacta cggatttgag gtccggactt gccgcttgtg ccgccaggtc 17460
ttgatgttcc acgtctttaa ggagcttggc ggggagccgg cgctggtgtg gcggatgcag 17520
ttggaatacg acgagaaccc ggcggcgtcc atgctgagcg cggtccggca attggcttat 17580
gaagcagatg gggccattcg aagcttgccg ccgctggaat tcgattatac tccatttggc 17640
atcgagacaa cggccgattg gcagcctttt ctgcctgtgc ctgaatgggc ggatgaagaa 7700
cattatcagt tggtcgattt gtacggagaa ggcataccgg gcttattata tcagaacaat 17760
gaccactggc attatcgttc gcccgcccgg ggcgacacac cggacgggat cgcctataac 17820
agctggcggc cgcttcctca tatccccgtg aactcccgga acgggatgct gatggatctg 17880
aatggagacg ggtatctgga atggttgctt gcggaacccg gggttgcggg gcgctatagc 17940
atgaacccgg ataagagctg gtccggtttt gtgccgctcc aggcactgcc aacggaattc 18000
ttccatccgc aggcacagct tgccaatgtt accggatcgg gtttaaccga cttggttatg 18060
atcggtccga agagcgtccg gttttatgcc ggagaagaag cgggcttcaa gcgcgcatgt 18120
gaagtgtggc agcaagtggg cattactttg cctgtggaac gcgtggataa aaaggaactg l8180
gtggcattca gcgatatgct gggatcgggt cagtctcatc tggtgcgcat ccggcatgat 18240
ggcgttacat gctggcctaa tctggggaac ggcgtgttcg gggcgccgtt ggcccttcac 18300
gggtttacgg catcggagcg ggaattcaat ccggaacgtg tatatcttgt ggaccttgat 18360
ggatccggcg cttccgatat catttatgct tctcgtgacg ctctactcat ttaccgaaat 18420
ctttccggca atggctttgc tgatccggtg cgggttccgc tgcctgacgg cgtgcggttt 18480
gataatctgt gccggctgct gcctgccgat atccgcgggt taggtgtggc cagtctggtg 18540
ctgcatgtac cttacatggc cccccgcagt tggaaattag atttctttgc ggcgaagccg 18600
tatttattgc aaacggtcag caacaatctt ggagcttcca gctcgttttg gtaccgaagc 18660
tccacccagt attggctgga tgagaaacag gcggcctcat cggctgtctc cgctttgccc 18720
ttcccgataa acgtggtatc ggatatgcac acggtggacg aaatcagcgg ccgcaccagg 18780
actcagaagt atacttaccg ccatggcgtg tatgaccgga ccgaaaagga atttgccgga 18840
ttcggccgca ttgacacatg ggaagaggag cgggattccg aaggaaccct gagcgtcagc 18900
actccgcccg tgctgacgcg gacctggtat cataccgggc aaaagcagga tgaggagcgt 18960
gccgtgcagc aatattggca aggcgaccct gcggcttttc aggttaaacc cgtccggctt 19020
actcgattcg atgcggcagc ggcccaggat ctgccgctag attctaataa tgggcagcaa 19080
atactggctg tgtaccgatc attacaaggg atgccgctgc ggactgagat ttttgcggga 19140
gatgttggcg ggtcgcctcc ttatcaggta gagagcttcc gttatcaagt gcgcttggtg 19200
cagagcatcg attcggaatg tgttgccttg cccatgcagt tggagcagct tacgtacaac 19260
tatgagcaaa tcgcctctga tccgcagtgt tcacagcaga tacagcaatg gttcgacgaa 19320
tacggcgtgg cggcacagag tgtaacaatc caatatccgc gccgggcaca gccggaggac 19380
aatccgtacc ctcgcacgct gccggatacc agctggagca gcagttatga ttcgcagcaa 19440
atgctgctgc ggttgaccag gcaaaggcaa aaagcgtacc accttgcaga tcctgaaggc 19500
tggcgcttga atattcccca tcagacacgc ctggatgcct tcatttattc tgctgacagc 19560
gtgcccgccg aaggaataag cgccgagctg ctggaggtgg acggcacgtt acgatcttcg 19620
gcgctggaac aggcttatgg cggccagtca gagatcatct atgcgggcgg gggcgaaccg 19680
gatttgcgag ccctggtcca ttacaccaga agcgcggttc ttgatgaaga ctgtttacaa 19740
gcctatgaag gcgtactgag cgatagccaa ttgaactcgc ttcttgcctc ttccggctat 19800
caacgaagcg caagaatatt gggttcgggc gatgaagtgg atatttttgt cgcggaacaa 19860
ggatttaccc gttatgcgga tgaaccgaat tttttccgta ttctggggca acaatcctct 19920
ctcttgtccg gggaacaagt attaacatgg gatgataatt tctgtgcggt tacatccatc 19980
gaagacgcgc ttggcaatca aattcagatt gcatatgatt accgctttgt ggaggccatc 20040
cagattaccg atacgaataa taatgtgaat caggtcgccc tggatgctct cggccgggtc 20100
gtatacagcc ggacctgggg cacggaggaa gggataaaga ccggcttccg cccggaggtg 20160
gaattcgcga cgcccgagac aatggagcag gcgcttgccc tggcatctcc cttgccggtt 20220
gcatcctgct gtgtatatga tgcgcatagc tggatgggaa cgataactct tgcacaactg 20280
tcagagcttg ttccagatag tgaaaagcaa tggtcgttct tgatagacaa tcgcttgatt 20340
atgccggacg gcagaatcag atcccgcggt cgggatccat ggtcgcttca ccggctattg 20400
ccgcctgctg tgggcgaatt gctgagcgag gcggaccgta aaccgccgca tacggtaatt 20460
ttggcagcag atcgttaccc ggatgaccca tcccagcaaa ttcaggcgag catcgtgttt 20520
agcgatggct ttgggcgtac gatacaaact gctaaaagag aagatacccg atgggcgatt 20580
gcggaacggg tggactatga cggaaccgga gccgtaatcc gcagctttca gcctttttat 20640
cttgacgact ggaattatgt gggcgaagag gctgtcagca gctctatgta cgcaacgatc 20700
tattattatg atgctctggc acgacaatta aggatggtca acgctaaagg atatgagagg 20760
agaactgctt tttacccatg gtttacagta aacgaagatg aaaatgatac catggactca 20820
tcattatttg cttcaccgcc tgcgcggtga gatggaggtt aaacctatga acacaacgtc 20880
catatatagg ggcacgccta cgatttcagt tgtggataac cggaacttgg agattcgcat 20940
tcttcagtat aaccgtatcg cggctgaaga tccggcagat gagtgtatcc tgcggaacac 21000
gtatacgccg ttaagctatc ttggcagcag catggatccc cgtttgttct cgcaatatca 21060
ggatgatcgc ggaacaccgc cgaatatacg aaccatggct tccctgagag gcgaagcgct 21120
gtgttcggaa agtgtggatg ccggccgcaa ggcggagctt tttgatatcg aggggcggcc 21180
cgtctggctt atcgatgcca acggcacaga gacgactctc gaatatgatg tcttaggcag 21240
gccaacagcc gtattcgagc aacaggaagg tacggactcc ccccagtgca gggagcggtt 21300
tatttatggt gagaaggagg cggatgccca ggccaacaat ttgcgcggac aactggttcg 21360
ccactacgat accgcgggcc ggatacagac cgacagcatc tccttggctg gactgccgtt 21420
gcgccaaagc cgtcaactgc tgaaaaattg ggatgaacct ggcgactgga gtatggatga 21480
ggaaagcgcc tgggcctcgt tgctggctgc cgaagcttat gatacgagct ggcggtatga 21540
cgcgcaggac agggtgctcg cccaaaccga cgccaaaggg aatctccagc aactgactta 21600
caatgacgcc ggccagccgc aggcggtcag cctcaagctg caaggccaag cggagcaacg 21660
gatttggaac cggatcgagt acaacgcggc gggtcaagtg gatctcgccg aagccgggaa 21720
tggaatcgta acggaatata cttacgagga aagcacgcag cggttaatcc gaaaaaaaga 21780
ttcccgcgga ctgtcctccg gggaaagaga agtgctgcag gattatcgtt atgaatatga 21840
tccggtaggc aatatccttt ctatttacaa tgaagcggag ccggttcgtt atttccgcaa 21900
tcaggccgtt gctccgaaaa ggcaatatgc ctacgatgcc ttgtatcagc ttgtatctag 21960
ttcggggcgg gaatccgacg cgcttcggca gcagacgtcg cttcctccct tgatcacgcc 22020
tatccctctg gacgatagcc aatacgtcaa ttacgctgaa aaatacagct atgatcaggc 22080
gggcaattta atcaagctta gccataacgg ggcaagtcaa tatacaacga atgtgtatgt 22140
ggacaaaagc tcaaaccggg ggatttggcg gcaaggggaa gacatcccgg atatcgcggc 22200
ttcctttgac agagcaggca atcaacaagc tttattcccg gggagaccgt tggaatggga 22260
tacacgcaat caattaagcc gtgtccatat ggtcgtgcgc gaaggcggag acaacgactg 22320
ggaaggctat ctctatgaca gctcgggaat gcgtatcgta aaacgatcta cccgcaaaac 22380
acagacaacg acgcaaacgg atacgaccct ctatttgccg ggcctggagc tgcgaatccg 22440
ccagaccggg gaccgggtca cggaagcatt gcaggtcatt accgtggatg agggagcggg 22500
acaagtgagg gtgctgcact gggaggatgg aaccgagccg ggcggcatcg ccaatgatca 22560
gtaccggtac agcctgaacg atcatcttac ctcctcttta ttggaagttg acgggcaagg 22620
tcagatcatt agtaaggaag aattttatcc ctatggcggc acagccctgt ggacagcccg 22680
gtcagaggta gaggcaagct acaagaccat ccgctattca ggcaaagagc gggatgccac 22740
aggcctgtat tattacggac accgctacta tatgccatgg ttgggtcgct ggctgaatcc 22800
ggacccggcc ggaatggtag atggactaaa cctgtaccgt atggtcagga acaatcctat 22860
aggactgatg gatccgaatg ggaatgcgcc aatcaacgtg gcggattata gcttcgtgca 22920
tggtgattta gtttatggtc ttagtaagga aagaggaaga tatctaaagc tatttaatcc 22980
aaactttaat atggaaaaat cagactctcc tgctatggtt atagatcaat ataataataa 23040
tgttgcattg agtataacta accaatataa agtagaagaa ttgatgaaat ttcaaaaaga 23100
cccacaaaaa gccgcacgga aaataaaggt tccagaaggg aatcgtttat cgaggaacga 23160
aaattatcct ttgtggcacg attatattaa cattggagaa gctaaagctg catttaaggc 23220
ctctcatatt ttccaagaag tgaaggggaa ttatgggaaa gattattatc ataaattatt 23280
attagacaga atgatagaat cgccgttgct gtggaaacga ggcagcaaac tcgggctaga 23340
aatcgccgct accaatcaga gaacaaaaat acactttgtt cttgacaatt taaatatcga 23400
gcaggtggtt acgaaagagg gtagcggcgg tcagtcaatc acagcttcgg agctccgtta 23460
tatttatcga aatcgcgaaa gattgaacgg gcgtgtcatt ttctatagaa ataatgaaag 23520
gctagatcag gctccatggc aagaaaatcc ggacttatgg agcaaatatc aaccgggtct 23580
tagacaaagc agcagttcaa gagtcaaaga acgagggatt gggaactttt tccgccggtt 23640
ttcaatgaag agaaagtagc atgtaactaa aattgctccc cattggttgt gtaaactaat 23700
ggggagttgt gattcactcc tgttcaacgc cattcatgta gaattgtttt gggaggttaa 23760
accgattgga tgccggcccc aaggcggagc tttttgatac cgaggggctt cgagtgtggc 23820
ttatcgatat caacggcaca cagacgactc tcgaatatga tgtattaggc aggcctgcag 23880
ccgtattcga gcatcaggaa ggcaaggaat ttcctaagtg ccgggatcgg tttagaatga 23940
gtctgatgcc aagccaacaa tttgcgaggg cagttgatgc gccactacga tacaatcccg 24000
ttacattcct tgataataag gggcttaaaa tcgtaattac cctaagtctc gtcgaggttg 24060
ctatagaatt gtatcgtctt catggtggcg ttcttttgct tcataatagt acgtgctgct 24120
agaattgtgc aggacgtcgc acattgctga tgtaaatgta tgtctttttc ttggaatagt 24180
agatccgctc cttgttctga tgtgttcatt ctactagccc ttattttttc tggccaacta 24240
agtcctatat ataattataa aaaaagcata gatatcttca tctataggtg aggatatcta 24300
tgcttttcat tttttgatta gagatatact tgtagtgcaa ggaaaagtag ataggagggt 24360
gaatttaaca gaagttacaa actgttgttt acttaaaaaa ttaatatgga gggaaataaa 24420
tatgaactca aatgaaccaa atttatctga tgttgttaat tgtttaagtg accccaatag 24480
tgacttggag aagtctggcg gtggagtagc gctagatgtt ggaatgtcat tgatatccga 24540
acttcttggt acggttccag ttgctggatc aattcttcaa tttgtattcg ataaattgtg 24600
gtttattttt ggcccttctg agtgggactc acttatggaa catgttgaag cattaattga 24660
tagtaaaata caagagcagg taaaaagaag tgcacaagat gaactaaatg caattacaaa 24720
taacttatct acgtatttga aatttctaga tgcatgggaa aatgattcta ataatttaag 24780
agcgagagct gtagtgaaag accaatttgt aggccttgaa cagactcttg aaagaaaaat 24840
ggttagtgtt tttggaagta cgggtcatga agtgcatctt ttgccaattt tcgctcaagc 24900
agccaacctc cacctaattc tattaagaga tgctgagaaa tatggaaaga gatggggttg 24960
ggcagataga gaaattcaag tatattatga taaccagatt cgttatatcc atgaatatac 25020
ggaccattgt attaaatatt ataatcaagg attaagtaaa ctgaaaggtt ctacctatca 25080
agattgggat aagtataatc gttttagaag agaaatgacc ctaactgttc ttgatttgat 25140
ttcaattttc ccatcgtatg atactagaac ttacccaatt gatacaatag gtcaattgac 25200
aagggaagtt tattcggatt tacttattgc taacccgtct gggatgcaga ctttcactaa 25260
tgtagatttc gacaatattc ttattagaaa acctcattta atggatttct taagaactct 25320
tgagattttt accgatcgac ataacgcaag cagacacaac gtatattggg gcggacatcg 25380
agtgcattct tcttacacag gaggtaattt tgaaaatttt gaatctccct tatatggcag 25440
tgaagcaaat gtagaacccc gaacatggtt gagttttgga gaatctcaag tctataatat 25500
acgttcgaag cctgagtggg atagaggaag tactgcaatt agtggctcct atgaatttcg 25560
aggagtgaca ggatgttctt tttatcgaat gggaaatttt gctggcaccg tagccctaac 25620
ttaccgacag tttggtaacg aaggttctca aatcccattg cacaggctat gtcatgttac 25680
ttattttaga agatctcaag ctgtgggggc gacttcgaga cagacgttaa caagtggtcc 25740
gctattttcc tggacacata gtagtgctac ggaaacgaat atcattcacc cgacaaaaat 25800
tacacaaata ccaatggtga aggctagttc ccttggatca ggtacttctg ttgtccaagg 25860
accaggcttt acaggagggg atgtacttcg aagaaatagc cccggtagca caggaacttt 25920
aagagttaac gtcaattcac cattatcaca gagatatcgt ataagaattc gttacgcttc 25980
tactacggat ttagattttt ttgtcattcg cggaaatacg acagttaata attttagatt 26040
tgggaacact atgcgtaaag gagaccctat aacctctcga tcatttagat ttgcggcttt 26100
tagtacacca tttacttttg ctagctcaca ggatgaactt agaataaatg tacaaaattt 26160
caataatggt gaagaagttt atatagatag aatcgaagtt attccagttt gatactacag 26220
atgtttatgt tgatacccta ggtaatacac ctactgagac gttgggaaga agtgtaaaaa 26280
actcatctca aaatcgaaag taaaagagcc cttcttaaaa ttttaagagg ggctcagctc 26340
attgttgcac agttactcca gggtctgtca aggattttgc ttaaattgat ttatatgaac 26400
ctaccccgag ggggagacga gcctcaaggc aaaatgctgg ccgatgcgtt ctggaaagaa 26460
tacggagaac tgcagcagca ttttcggaca gcaggcggaa atagcctgag agaagacgat 26520
gaggttgtcg acccaggtga tcaggatgtc ctggactccc cgattcttaa gatcgttcag 26580
aatgctgagc cagaacttcg tggactcgtt ttccccgatc cacatgctca gtacgacctt 26640
attgccgtcc aaatcgatgc cgtacacatt ctggagatga tcttcaatct cccgtgtact 26700
tacgtcctct tggcgtagag ggcgaatatc agtcctcgat gccggttacg ctcgtttgat 26760
tcttcttcac aacgatgggc tcgaacttga ttaggcggtc tcgggaacgg aaatcgcctg 26820
tacgccgtac tcacctggtg atcgtcttct tgctcttacc attgcggcta tttgccgtct 26880
gctggttctg cacatcatac ctctcataac ccagatgcgt gtcctccccc aacctttcta 26940
gtcctttcat tgttagtgga tttgattgag tttacacgaa gtatttacga ctcttggaac 27000
ccgggtgttt tttgcaagtg aaaaatgctg agttttgctg caaaaagtgc caggctccct 27060
tgccagccaa aacattactg cggaatgcgt tccattgcct gcttgaggcg gaaactctcg 27120
cctgtgaacg agagaatatg cgcgtggtgc acgagacggt cgaccaaggc tgaggtgagc 27180
ttagtatccc caaatatgga ggtccattgg ccaaactcca ggtactgggc tgtgggtttt 27240
gcgcttgcga agggcggcgt tccagtcgct ctggtcggca tagcgtttgg ccgttcgcca 27300
gtgaatgccc acctaccttg cgatttcgct cactgagcag ccttctgttt cgcgtaaaaa 27360
agttgttgag gcattttcag catccttccc gtctccttcg tcaagttctc ggcaaaccta 27420
acgataggag gattttaagg ggctgacaag tgcctttttt gcatctgact tcagcatttt 27480
tacgctgcaa ttctaggcat ttttagtatg caataaacac ccgggtctcc atctctgaca 27540
tgagcctgcc gggcactcat ataatataaa aagcatcaga gctgaatgag tcggctgctg 27600
atgcttattt attggaccga acgatatctc tgcaagtaca agtacgaatg gagcccggta 27660
ttgttgatac ccccgttttt ataaggatag actaagcagt tctttaatag actttaaatc 27720
tttcaggatg agtttatctg gtatccaaat gacaggaatt tgagttttat tgattttgta 27780
attggttata atgaaatcga atttgaccgt attgcttggt tcggtttgaa ggtttagaac 27840
gttacccaat tcattattta atttgtgata gatgaatttt ttccaattgg ttggtccgga 27900
taaaagcaat aaaacctttt ttttataatt tgacaggaga atagataaaa tatgaaacgt 27960
gatgtggtag ctctcatctt cagataatct attttcattt atttctttat tccatgcgac 28020
aataagaggg tgaatgatgt tgtagccctc tattaattca ttaggaatcg tcttaaatct 28080
accccaatag tattctaacg gtaaattgag atttttaaat atatagatct tgtggaaaga 28140
aaaatggatg ttatgtctta tttcttctat tactttggca ttcatattta cttcacttga 28200
aatcatgtca attaaagcaa ggtgcttatc gtaaagttgt ttatatgatc cacgatagta 28260
attcttgatt ttactttttt cattatcatc cccctcggag atgaggaaaa aaaatagtgt 28320
aaaaaactta agttcatttt gctggaagct gaccttatag aaattttcaa tggcagagac 28380
aatggcatag gtgcaatcta acttttgaga gctaaatatg tagtccatat taaaactttt 28440
ggaaataaaa tgcttgtata tatttctatt tacagacaca ttgatgagta tggttaatag 28500
attataatcg atctccattt tatagaaacg aatatagttc tcaatttttt gttgcaagtc 28560
taggtccggt ttaaagattt ctttatactt ttgcacgtga aaaaaaagaa ccatatagaa 28620
gtatctaata ttcagttcct ttccaattat ttggatcgtt gttctgaaat taaaatcaag 28680
gttaaaatgt ctaagtattt ttctgaaatt atttaatttt ttcttcaatg ttaatttatc 28740
taagtacaat atttgagacc atttttccaa gctataatac ttctgattga atattcccat 28800
taaaatgatg taaagttcac tgtttattat ataagtagct ataatagtgg aaaggtgatc 28860
taaaggatct ttttttagaa cgtaaccttt ggaattaatg cttattatat cccaattatc 28920
tggaagatcc tgttttaatt gagaaatgtc acttataatc gttctgcttg tacattgcag 28980
cttacgggct aaagaactgg aagacacgat accttcgctg tcaattaagg attctaatat 29040
ttggattttt cgaataattg aatgattttg aattaagtga gcggtgaatt catccattta 29100
gtctccccct cgaaaagcga taactggtta aagtgcagat gtactatcct ttgttcgaag 29160
ttgctagtaa tcaattctgc ggatctcttc aaagtgctcc aggtgctatg gatttacgaa 29220
tttcccctaa acatatcttt ctaatgtttg tcttcttaat gaaaatcttt attatttttc 29280
tccttttcac aatttaaatt tcaattagaa agtaacgtaa ttttggaatg aaaaacgata 29340
cataatttca ttaatagatg aaaatatgta tggtttttaa aatgtttgta aaggtcagct 29400
taatgcggtt aatagaaggt taagagattt tattgtgcaa ggggggacga agaaggatat 29460
aagatagaac atatccgaaa gggaggaggc taacgaaatt tgaaattatt tgttgggtag 29520
tgtttgcaaa actcgaatta tatggtaatc tatagatggt caattatttg caatgccaaa 29580
ggaaggtgag gctgtgagta ccgttgctgc gaagccacag aggttggggg agctaataca 29640
gtactatcgg cagaagaagg aattgagtct gtcgaagctg caagaagcgg tcggcattga 29700
taaaggcagc ctgtcgagaa ttgaaaacag cgaggtcaaa cgccctgatt ttcgatccat 29760
cttgtcgatc gccgcggtat tggacattcc ccatgacgcc atcgtagaac agtacatcga 29820
gatcggacat aaatcggaag tcatatacac tattttacag aacgaattga caaccctcga 29880
gcatccatcg ctcataccga aaattgccgc aaagtttctt gaagcgccca atgaagacag 29940
tctggatgca gtagagaagt tgtaccgaac gataggctcc gtgaatcatc cttccactca 30000
gttatcttta tacaccctca tcgtagacta ctcacgcgcc catggaatca tgccttacat 30060
tgccaaagga ttatttcgga agtacatgat tgaacgaaat gatttcagca ggttgaagga 30120
aacgtatcag gttggaaaaa atgtgctgga ctatgctaat tttttgagcg agaaagagcg 30180
gatacttcta tactatggct tgagtgttca cgcttatagt cttatgtttt atcatgatgc 30240
cataaaattc ggtaattatg ttgtggaaaa tggggaagaa gaaccgctag caaatgcaac 30300
tcataatgtt tgcaatgcct attaccattt ggggaattat gacgattgca atacctatct 30360
cgaaaagtat agtcatttcc catatccttt cgtcaaagag aatgttaaat taatgactgc 30420
ctttcttaac gggaagaaag ggaatattga gtccgccatt actcagttta ataactgttt 30480
agataccctg tcctcatata atttgattca tgccgtaact gaattaatgg aactatatct 30540
ccataaaaac gatcttgttg cagcagatca actccttatg tatgaagaac aaataattga 30600
gagcatcacc caaccacgaa ctacgccata taaaaggtca agattagcgc actactttcg 30660
catcaaagga caattgttaa ctcgtaaaca acatgaaaaa gacgctgttg atagtttctt 30720
gaaaagtaca ttagagtacg taaaaattgg tcgttttacg gaagcttttg aatcattgtc 30780
gtttgtgacg cattcaatga tacataatca gtcaatcatt aatagtgaaa taattaaaaa 30840
ggttgataat attttacaaa taattgctgc aaaataatta aggaggaata tggtgccatg 30900
agaaaacgta aacttctttt cattgcctct cttctagttt ttggagcaat cagcatggag 30960
catattgttt catacatcga tgccccgtgg ataactaact tctaatgaat ataacatctc 31020
ataacgctag tcatggcccc gccattcgtt ggtggggtaa catccttcga aagcccgatt 31080
cttttactgg caatgttgct gcaattgtaa ggggcctcac tcactccaag tgctgtctct 31140
gcagatcctc tttggtttat gccatcggtc tatagcagca gtaactcgat cgacagataa 31200
aaatttgaaa attctcttcg aaaggagatt gacgcattaa gacgccttta tgggcgtttt 31260
tttgtttttt atgtataaag ttgttgcata ataatccaga atcaagtcat atttaccaac 31320
ttcatctata atcaggtcaa ataatacagt ttatggatga ggtgtggaaa tgagccatca 31380
accggtatac aaaggtgact taatcccttt tacttatagc tatgagaaag ctggctgttt 31440
aattgaaatc attgagagca ctcgacagga gcttatagta gcggccacgg aaaaaaagtg 31500
tcttaccgac gaaactgttg taagattaag ccaaaagtta gatacatacc tattggaatt 31560
tcaaagaagg agctgcggct agaagaatag gatgtgataa tccggattat taggggaagg 31620
tgaggctgtg agtatcggtt ctgtgaagcc taaaagcttg ggggagttaa tcaagtatta 31680
tcgaaaaatg aatagcgaaa tcgcagatca gacattgaga ttgagcaaaa acctaaagtc 31740
attttctcaa tcttgcagaa cgaattggaa acactcgagc atccagcatt aatacccgaa 31800
atagccgcca aatttcttga cttatcaaat ggtatggagg gggtaaaaga gctttacaga 31860
gtaattgact cggtagaaga tacctccatt caattagctg tgtacaacct tattattgat 31920
tactctcgcg ctcatggaat gatgccctat attgctaagg gattataccg aaaatacatg 31980
atcgaacgaa atgatttcag caaattgaaa gaaacctatc aactaggtaa gtgtgtattg 32040
gactatatac agtttctggg cgacgaagaa cgaattgtat tttattattc aataggagtt 32100
cacgctgaca gcttaatgaa ctatgatgac tctgtaccct atatgaaata tgtggtggag 32160
aacgataact cagaaaatgg tgcctataga gcgaatgctt atcttagtct atgcaattct 32220
tcctataata ctggtgatta caaagcaagc caggaatatt tagatgagta cagtaagtac 32280
tctttttcat atgtagccga taatgtgcat tttatgtcgg cttgtataga gggcaagatg 32340
gggaacgtgg atagttcgat ttcaaagtta cgttcttatt tacaaagttc atgggaagta 32400
tcccgttgaa aagggaacct aaatatattc aaacgccttg tggtgtctca gattgttgaa 32460
aaaccctgtc cttttctaaa ggtacagggt ttctcacatg aaaaggactc acgaaacgaa 32520
ccttccgatg aacccggcca cggttttttc gtacgtttcc cgatccatcc ggtatgcttc 32580
tccatgtccg gctttcggaa cgatgtatag ctctttctcg gcggggcaat tttcgtaaac 32640
tttatgcacc atctccgtcg gcacaaaagt atcgttggcc ccatgaatga agagagtcgg 32700
ggttttcgac tttttcacct gctccagtgc ggaggcttct ccgaaaaagt accctgcccg 32760
tagcctggtc agcaggctgg tggtatccac gatcgggaat gccggaagat gatacatgcg 32820
ccgcagctgg aaggaaagct gatccttcac agaggtataa ccacagtctt cgacgatggc 32880
tttcacgttc ggcggcaaat tctcgccgct ggtcatcatc acggttgccc ctcccatcga 32940
cacgccgtgg agaacgattt gtgaattcgt cccattcgtg tccaaaaccc gctgaatcca 33000
tttcaaataa tccttacgct cgggccagcc gaaaccgata taatggcctt cgctttcccc 33060
atgtccccga gcatcgggga gcaggatgtt gtagccccat ttctcgtggt acattctggc 33120
gtaaccgctc atttgcgttg cgttcccgga atatccgtgc gcgatgatga ccgttttgtc 33180
cgacggcttg gatgccggca aataatacgc cttcagatga atgccgtcat ccgagtccat 33240
ctcccagcgc tcaaagcttt ggttgttcca ccattccttg tccgccagcg tggtttgctt 33300
tgattcctcc acctcaggac tggttttcag gtcgggattg tcgctcaaaa agtctttcga 33360
agcgcgcgca atcgccactt gataaaagta aaagctcccg gcggtaagga taataatgac 33420
aaatacaatc aaggaaataa agcctgtcac catttttttc ttcaattctg ttctctccta 33480
gtaaactctc atgttagtta ttttaatata tcataatgat c 33521
<210>2
<211>3264
<212>DNA
<213>类芽孢杆菌IDAS 1529菌株
<400>2
gatcacacgg ccggcgtatt ccggctcgga accgaagaat taacagaagc gcttcagcag 60
tccggttatc ggacagtctt tgatattgca tctgaaaatc ttgcggaatt tcagaaaagc 120
gaaaacttat gcatgcttta taaggcctgg caactgcaca atgatccggt cgtccagagc 240
cttcccaaat tatccgcgga taccggcctg cgaggcatgc gtgccgcgtt ggagcggagt 300
cttggagggg gagccgattt tggagacttg ttcccggagc gatcgccaga gggctatgcg 360
gaagcctcct ctatacagtc gcttttttcg ccgggacgtt accttacggt gctgtataaa 420
attgcgcagg atctccacga cccaaaagac aaactgcata ttgacaaccg ccgtccagat 480
ttgaagtcgc tgatcctcaa taatgacaat atgaaccgtg aggtgtcttc cctggatatc 540
ctgctggatg tgctgcagtc cgaaggctcc ggcacactga catccctgaa ggatacctac 600
tatccgatga cccttcccta tgatgacgac cttgcgcaaa tcaatgccgt ggcggaggcg 660
cgctcatcca atttgctggg gatctgggat accctgctgg acacgcagcg gacttccatc 720
ctgcaggatt ccgccgctgt ccaccggata agcaagccgc ggcactcggc atacgtcaat 780
cagagagtct ccgatgatga accggtattg atcgcgggag aggaattcta cttggagacc 840
ggcggtgttg ccgacacgac cccgtctccg ccaacgaggg aagcgctttc cttgacgcca 900
aacagcttcc gtctgctggt caaccccgag ccgacagcag acgacatcgc caatcactac 960
aacgttaaga ctcaagatcc tgccgctctg gccgccgtct taaatgtggt cgatgacttt 1020
tgcctgaaaa ccggtttgag ctttaatgag ttgctggact taacgatgca gaaggatgat 1080
gaatcgatcg gcagcgagta caaaagccgg tttgtaaaat ttggcggcga ggccaatgtt 1140
ccggtttcaa cctatggagc tgtatttctg acaggaacgg aagaaactcc gttgtgggta 1200
ggaaaaggag ctgtgataag ccctgcagcg gacgcctatg ttcgtaatgg gacatatgca 1260
aacacgaatt atggatcaga cactagtctt gttgtgaagc aggatgggtc tagtggatac 1320
agtagggaag catatatcag gtttgatttg acaggtcttt ccggagttgt ggaggaagct 1380
aaaatttctc taacaactag agcgaaacaa ttgtctagct taagacacca agctcatttg 1440
gtcagtgaca acagttggga tgaattgaaa atcacatgga ataacaaacc tgcaggagga 1500
gcgatcatcg caagctggga tgttcccgaa gttggtgaga atgtaaaggt tgatgtgacc 1560
cggcaagtaa atgatgcgct cgcaaacggt caagataaac tatcaattgt tattcgttct 1620
agtgcaaatt atggcagtct gggcgatgtc tcttatgcct ctagagaaca ccctgaaaaa 1680
gcctcacgac cttctatgga aatcaaggcg ataacgggtg ctggtttaaa ttttacggcg 1740
gataatgttg tagctctggc aggaagggcg gaaaagcttg tccggctggc gcgcagcacg 1800
ggactttcct ttgagcagtt ggattggctg attaccaata ccagccgtgc cgtaatcgaa l860
catggtggag aactgattct ggataagccg gtactggagt ctgtggccga attcacaagg 1920
ctccataagc gttatggcat cacagcggat atgttcgccg cgtttatcgg cgaagtcaat 1980
acgtatgctg aagcaggtaa agagagcttt tatcagacga ttttcagcac ggccgaccat 2040
tcggctgcct tacctttagg cgcaactttg caatttgagg tgagcaaaca ggatcgatat 2100
gaagcgattt gctgcggggc catgggggtg accgccgatg agttctctcg tatcggcaaa 2160
tactgctttg gcgacaacgc gcagcaagtt accgccaatg aaacaaccgt tgcgcagctt 2220
tatcgtttag gccgaattcc tcacatgctt ggattgcgtt ttaccgaggc ggagctgttg 2280
tggaaattga tggctggcgg cgaggatacc ttgctccgca cgattggcgc gaagcctcgc 2340
agtttacaag ccttagagat tattcgccgt actgaggtcc ttttggactg gatggatgct 2400
catcagcttg atgttgtctc cctgcaagcc atggttacca atcggtacag cggcacagcc 2460
acgccggagc tgtacaactt tttggcacag gtgcaccaat ccacaagcag tgccgcgaac 2520
gtgtccaaag cggatgctca ggataccctg cccgcggaca agctgttccg ggccttggcg 2580
gtaggcttca acctgaaggc caacgtgatg gcgcaggtca ttgactggtt ggacaaaacc 2640
gacggagcgt ttacgctgcg ggctttctgg gacaagcttc aagcgtattt cagcgccgat 2700
catgaagaag aactgacggc cttggaagga gaagccgact tgctgcagtg gtgccaacag 2760
atcagccagt atgcgctcat tgtccgctgg tgcgggttaa gcgatcagga tctggcgctg 2820
ctgaccgggc atcccgggca gcttctgtcc ggacaacata cggtgccggt accctcgctg 2880
catctcctgc tggtgctgac ccgcctgaag gaatggcagc agcgcgtcca ggtttccagc 2940
gaggaggcca tgcgctattt tgcccaggcc gatgcgccaa ccgtcacacg cgatgctgcg 3000
gtcaagctgc ttgcccgtat ccatggctgg aatgaacagg ataccgcctc gatgaatgac 3060
tacctgctgg gagagaacga atatcctaag aactttgagc agatctttac tttggaaagc 3120
tgggtcaacc tgggccgtca actgaatgtt ggcagccgaa cgttgggaga gctggttgac 3180
atgtcagaag aggatgatac cgcggaaaac acggatttga ttatctcggt cgcccaaagc 3240
ctgatggctg cggtgcaggc ctga 3264
<210>3
<211>1087
<212>PRT
<213>类芽孢杆菌IDAS 1529菌株
<400>3
Asp His Thr Ala Gly Val Phe Arg Leu Gly Thr Glu GIU Leu Thr Glu
1 5 10 15
Ala Leu Gln Ser Gly Tyr Arg Thr Val Phe Asp Ile Ala Ser Glu
20 25 30
Asn Leu Ala Glu Phe Gln Lys Ser Asn Pro Glu Ile Pro Ser Ser Asp
35 40 45
Ala Lys Glu Ile His Gln Leu Ala Val Gln Arg Thr Glu Asn Leu Cys
50 55 60
Met Leu Tyr Lys Ala Trp Gln Leu His Asn Asp Pro Val Val Gln Ser
65 70 75 80
Leu Pro Lys Leu Ser Ala Asp Thr Gly Leu Arg Gly Met Arg Ala Ala
85 90 95
Leu Glu Arg Ser Leu Gly Gly Gly Ala Asp Phe Gly Asp Leu Phe Pro
100 105 110
Glu Arg Ser Pro Glu Gly Tyr Ala Glu Ala Ser Ser Ile Gln Ser Leu
115 120 125
Phe Ser Pro Gly Arg Tyr Leu Thr Val Leu Tyr Lys Ile Ala Gln Asp
130 135 140
Leu His Asp Pro Lys Asp Lys Leu His Ile Asp Asn Arg Arg Pro Asp
145 150 155 160
Leu Lys Ser Leu Ile Leu Asn Asn Asp Asn Met Asn Arg Glu Val Ser
165 170 175
Ser Leu Asp Ile Leu Leu Asp Val Leu Gln Ser Glu Gly Ser Gly Thr
180 185 190
Leu Thr Ser Leu Lys Asp Thr Tyr Tyr Pro Met Thr Leu Pro Tyr Asp
195 200 205
Asp Asp Leu Ala Gln Ile Asn Ala Val Ala Glu Ala Arg Ser Ser Asn
210 215 220
Leu Leu Gly Ile Trp Asp Thr Leu Leu Asp Thr Gln Arg Thr Ser Ile
225 230 235 240
Leu Gln Asp Ser Ala Ala Val His Arg Ile Ser Lys Pro Arg His Ser
245 250 255
Ala Tyr Val Asn Gln Arg Val Ser Asp Asp Glu Pro Val Leu Ile Ala
260 265 270
Gly Glu Glu Phe Tyr Leu Glu Thr Gly Gly Val Ala Asp Thr Thr Pro
275 280 285
Ser Pro Pro Thr Arg Glu Ala Leu Ser Leu Thr Pro Asn Ser Phe Arg
290 295 300
Leu Leu Val Asn Pro Glu Pro Thr Ala Asp Asp Ile Ala Asn His Tyr
305 310 315 320
Asn Val Lys Thr GIn Asp Pro Ala Ala Leu Ala Ala Val Leu Asn Val
325 330 335
Val Asp Asp Phe Cys Leu Lys Thr Gly Leu Ser Phe Asn Glu Leu Leu
340 345 350
Asp Leu Thr Met Gln Lys Asp Asp Glu Ser Ile Gly Ser Glu Tyr Lys
355 360 365
Ser Arg Phe Val Lys Phe Gly Gly Glu Ala Asn Val Pro Val Ser Thr
370 375 380
Tyr Gly Ala Val Phe Leu Thr Gly Thr Glu Glu Thr Pro Leu Trp Val
385 390 395 400
Gly Lys Gly Ala Val Ile Ser Pro Ala Ala Asp Ala Tyr Val Arg Asn
405 410 415
Gly Thr Tyr Ala Asn Thr Asn Tyr Gly Ser Asp Thr Ser Leu Val Val
420 425 430
Lys Gln Asp Gly Ser Ser Gly Tyr Ser Arg Glu Ala Tyr Ile Arg Phe
435 440 445
Asp Leu Thr Gly Leu Ser Gly Val Val Glu Glu Ala Lys Ile Ser Leu
450 455 460
Thr Thr Arg Ala Lys Gln Leu Ser Ser Leu Arg His Gln Ala His Leu
465 470 475 480
Val Ser Asp Asn Ser Trp Asp Glu Leu Lys Ile Thr Trp Asn Asn Lys
485 490 495
Pro Ala Gly Gly Ala Ile Ile Ala Ser Trp Asp Val Pro Glu Val Gly
500 505 510
Glu Asn Val Lys Val Asp Val Thr Arg Gln Val Asn Asp Ala Leu Ala
515 520 525
Asn Gly Gln Asp Lys Leu Ser Ile Val Ile Arg Ser Ser Ala Asn Tyr
530 535 540
Gly Ser Leu Gly Asp Val Ser Tyr Ala Ser Arg Glu His Pro Glu Lys
545 550 555 560
Ala Ser Arg Pro Ser Met Glu Ile Lys Ala Ile Thr Gly Ala Gly Leu
565 570 575
Asn Phe Thr Ala Asp Asn Val Val Ala Leu Ala Gly Arg Ala Glu Lys
580 585 590
Leu Val Arg Leu Ala Arg Ser Thr Gly Leu Ser Phe Glu Gln Leu Asp
595 600 605
Trp Leu Ile Thr Asn Thr Ser Arg Ala Val Ile Glu His Gly Gly Glu
610 6l5 620
Leu Ile Leu Asp Lys Pro Val Leu Glu Ser Val Ala Glu Phe Thr Arg
625 630 635 640
Leu His Lys Arg Tyr Gly Tle Thr Ala Asp Met Phe Ala Ala Phe Ile
645 650 655
Gly Glu Val Asn Thr Tyr Ala Glu Ala Gly Lys Glu Ser Phe Tyr Gln
660 665 670
Thr Ile Phe Ser Thr Ala Asp His Ser Ala Ala Leu Pro Leu Gly Ala
675 680 685
Thr Leu Gln Phe Glu Val Ser Lys Gln Asp Arg Tyr Glu Ala Ile Cys
690 695 700
Cys Gly Ala Met Gly Val Thr Ala Asp Glu Phe Ser Arg Ile Gly Lys
705 710 715 720
Tyr Cys Phe Gly Asp Asn Ala Gln Gln Val Thr Ala Asn Glu Thr Thr
725 730 735
Val Ala Gln Leu Tyr Arg Leu Gly Arg Ile Pro His Met Leu Gly Leu
740 745 750
Arg Phe Thr Glu Ala Glu Leu Leu Trp Lys Leu Met Ala Gly Gly Glu
755 760 765
Asp Thr Leu Leu Arg Thr Ile Gly Ala Lys Pro Arg Ser Leu Gln Ala
770 775 780
Leu Glu Ile Ile Arg Arg Thr Glu Val Leu Leu Asp Trp Met Asp Ala
785 790 795 800
His Gln Leu Asp Val Val Ser Leu Gln Ala Met Val Thr Asn Arg Tyr
805 810 815Ser Gly Thr Ala Thr Pro Glu Leu Tyr Asn Phe Leu Ala Gln Val His
820 825 830
Gln Ser Thr Ser Ser Ala Ala Asn Val Ser Lys Ala Asp Ala Gln Asp
835 840 845
Thr Leu Pro Ala Asp Lys Leu Phe Arg Ala Leu Ala Val Gly Phe Asn
850 855 860
Leu Lys Ala Asn Val Met Ala Gln Val Ile Asp Trp Leu Asp Lys Thr
865 870 875 880
Asp Gly Ala Phe Thr Leu Arg Ala Phe Trp Asp Lys Leu Gln Ala Tyr
885 890 895
Phe Ser Ala Asp His Glu Glu Glu Leu Thr Ala Leu Glu Gly Glu Ala
900 905 910
Asp Leu Leu Gln Trp Cys Gln Gln Ile Ser Gln Tyr Ala Leu Ile Val
915 920 925
Arg Trp Cys Gly Leu Ser Asp Gln Asp Leu Ala Leu Leu Thr Gly His
930 935 940
Pro Gly Gln Leu Leu Ser Gly Gln His Thr Val Pro Val Pro Ser Leu
945 950 955 960
His Leu Leu Leu Val Leu Thr Arg Leu Lys Glu Trp Gln Gln Arg Val
965 970 975
GIn Val Ser Ser Glu Glu Ala Met Arg Tyr Phe Ala Gln Ala Asp Ala
980 985 990
Pro Thr Val Thr Arg Asp Ala Ala Val Lys Leu Leu Ala Arg Ile His
995 1000 1005
Gly Trp Asn Glu Gln Asp Thr Ala Ser Met Asn Asp Tyr Leu Leu
1010 1015 1020
Gly Glu Asn Glu Tyr Pro Lys Asn Phe Glu Gln Ile Phe Thr Leu
1025 1030 1035
Glu Ser Trp Val Asn Leu Gly Arg Gln Leu Asn Val Gly Ser Arg
1040 1045 1050
Thr Leu Gly Glu Leu Val Asp Met Ser Glu Glu Asp Asp Thr Ala
1055 1060 1065
Glu Asn Thr Asp Leu Ile Ile Ser Val Ala Gln Ser Leu Met Ala
1070 1075 1080
Ala Val Gln Ala
1085
<210>4
<211>3618
<212>DNA
<213>类芽孢杆菌IDAS 1529菌株
<400>4
atgaccaagg aaggtggtaa gaatatgtct acttcaaccc tgttgcaatt gattaaggaa 60
tcccgccggg atgcgttggt caaccattat atcgccaaca atgtcccgag agagcttacg 120
gaactcgtaa aaacatcgcc gatagctgag gccattagca gcgttcagtt atacatgaac 240
cgatgcgtgg aaggctatga aggcaagctg actccggaag gcaacagcca tttcgggccg 300
ggaaaattcc tgaataattg ggatacctat aacaagcgtt attccacttg ggccggcaag 360
gaacgtctga aatattatgc aggcagttat attgacccgt ccttgcgcta taacaaaacg 420
gatccgttcc tgaacctgga acagaatatc agccagggaa gaatcaccga tgacaccgta 480
aagaacgcgc tgcaacacta cctgactgaa tatgaagtgt tggcggattt ggaatatatc 540
agcgtaaata aaggcgccga tgaaagtgta ttattcttcg taggccgcac caaaacaatg 600
ccatacgaat attactggcg ccgattaacg ttgaaaaagg acaataacaa taaactggtg 660
cctgccatct ggtctcaatg gaaaaaaata actgccaata tcggcgaagc agttaataat 720
tatgtggtgc ttcactggca taataaccgc ttacatgtac aatggggttc tacagagaaa 780
acacaaaatg atgacggaga acccattgag aaacgatatt tgaatgactg gttcatggat 840
aagtccagtg tctggtcttc attccgaaag gtttcatata tagaaaatag ttttacttat 900
actgagggca tcattgattc aagaaatatt actatagctg gaaatcaact gttctgtgat 960
gattcaaata cttttaaggc aacaataacg gcacttccat ttgaccaaat acgtgtttac 1020
ttagaaaaga tttacggtac aggcggcagc atcacggtta ctggagaaaa taaaggctat 1080
attattaagg tgggggagcc aagagaagtc agtttctctc ctaatacgtt actagatgta 1140
ttcataggta gtaatgcaag ccctcgagac ccatatttca aagctacatt taatagagaa 1200
gctctccaaa attcatacgg ctcaattaaa ataaatcaat acacccctcc ttctggaagc 1260
aatatcaaag gtcctatcga ccttaccctg aaaaataaca tcgacctgtc ggcgttgttg 1320
gaagagagcc ttgacgtact gttcgactat accattcagg ggaataacca attgggcggc 1380
ttagaggcct ttaacgggcc ttacggactt tatttgtggg aaatcttcct ccatgttcca 1440
tttttaatgg cggttcgctt ccacaccgag cagcggtatg agttggcgga acgatggttt 1500
aaattcattt tcaacagcgc aggttaccgt gatggctacg gcaatctgct gacggatgac 1560
aaaggcaacg tgcgctactg gaacgtcgtg cctctgcagg aggatacgga gtgggatgac 1620
acgttgtccc tggcaacgac cgacccggac gagattgcga tggccgaccc gatgcaatac 1680
aagctggcta tctttattca caccttggac ttcttgatca gccgcggcga cagcttgtac 1740
cggatgctgg agcgggatac cttgaccgaa gcgaagatgt attacattca ggccagccaa 1800
ctgcttgggc ctcgtcccga gatccggatc aatcacagct ggcctgatcc gaccctgcaa 1860
agcgaagcgg acgcggtaac cgccgtgccg acgcgaagcg attcgccggc agcgccaatt 1920
ctcgccttgc gagcgcttct gaatgcggaa aacgggcatt tcctgccgcc ttataatgat 1980
gaactattag ctttctggga taaaatcgac ctgcgtctct acaatttacg ccacaatctg 2040
agcctggacg gtcagccgct tcatttgccg ctctttaccg aaccggtcaa tcctcgtgag 2100
ctgcaggttc agcatggggc aggcgatgga ttagggggaa gcgccggttc cgtccaaagc 2160
cgtcaaagtg tctatcgttt tcctctggtc atcgataagg cgcgcaatgc cgcgagtagt 2220
gttatccaat tcgggaatgc cctggaaaac gcgctgacaa agcaggacag cgaggccatg 2280
actatgctgt tgcaatccca gcagcagatt gtcctgcagc aaacccgcga tattcaggag 2340
aagaacctgg cctcgctgca agcaagtctg gaagcaacga tgacagccaa agcgggcgcg 2400
aaatcccgaa agacccattt tgccggcctg gcggataact ggatgtcgca taatgaaacc 2460
gcctcacttg cactgcgtac cactgcggga attatcaata caagctcgac cgtgccaatc 2520
gctatcactg gcggcttgga tatggctccg aacatttttg gtttcgcagt tggaggttcc 2580
cgctggggag cagccagcgc ggctgtagcc caaggattgc aaatcgccgc cggcgtaatg 2640
gaacagacgg ccaatatcat cgatatcagc gaaagctacc gccggcgccg ggaggattgg 2700
ctgctgcagc gggatgttgc cgagaatgaa gcggcgcagt tggattcgca gattgcggcc 2760
ctgcgggaac agatggatat ggcgcgaaaa caacttgcgc tggcggagac ggaacaggca 2820
cacgcgcaag cggtctacga gctgctaagc acccgtttta cgaatcaagc tttgtataac 2880
tggatggccg gacgtctgtc gtctctatac tatcaaatgt atgacgccgc attgccgctc 2940
tgcttgatgg ccaaacaggc tttagagaaa gaaatcggca atgataaaac ggttggaatc 3000
ttcaccctcc cggcctggaa tgatttgtat cagggattgc tagcgggcga ggcgctgctg 3060
ctcgagcttc agaagctgga gaatctgtgg ctggaggagg acaagcgcgg aatggaagct 3120
gtaagaacgg tatctttaga tacccttctc cgcaaagaaa agccagaatc cggttttgca 3180
gatttcgtca aggaagttct ggacggaaag acgcctgacc ctgtaagcgg agttagcgta 3240
cagctgcaaa acaatatttt cagtgcaacc cttgacctgt ccacccttgg cctggatcgc 3300
ttttacaacc aagcggaaaa ggcccacagg atcaaaaacc tgtcggttac cttacccgcg 3360
ctattgggac cttatcagga tattgcggca accttatcgc taggtggcga gaccgttgcg 3420
ctttcccatg gcgtggatga cagcggcttg tttatcacgg atctcaacga cagccgtttc 3480
ctgcctttcg agggtatgga tcctttatcc ggcacactcg ttctgtcgat actccatgcc 3540
gggcaagacg gtgaccagcg cctcctgctg gaaagcctga acgacgtcat cttccacatt 3600
cgatatgtca tgaaatag 3618
<210>5
<211>1205
<212>PRT
<213>类芽孢杆菌IDAS 1529菌株
<400>5
Met Thr Lys Glu Gly Gly Lys Asn Met Ser Thr Ser Thr Leu Leu Gln
1 5 10 15
Leu Ile Lys Glu Ser Arg Arg Asp Ala Leu Val Asn His Tyr Ile Ala
20 25 30
Asn Asn Val Pro Arg Glu Leu Thr Asp Lys Ile Thr Asp Ala Asp Ser
35 40 45
Leu Tyr Glu Tyr Leu Leu Leu Asp Thr Lys I le Ser Glu Leu Val Lys
50 55 60
Thr Ser Pro Ile Ala Glu Ala Ile Ser Ser Val Gln Leu Tyr Met Asn
65 70 75 80
Arg Cys Val Glu Gly Tyr Glu Gly Lys Leu Thr Pro Glu Gly Asn Ser
85 90 95
His Phe Gly Pro Gly Lys Phe Leu Asn Asn Trp Asp Thr Tyr Asn Lys
100 105 110
Arg Tyr Ser Thr Trp Ala Gly Lys Glu Arg Leu Lys Tyr Tyr Ala Gly
115 120 125
Ser Tyr Ile Asp Pro Ser Leu Arg Tyr Asn Lys Thr Asp Pro Phe Leu
130 135 140
Asn Leu Glu Gln Asn Ile Ser Gln Gly Arg Ile Thr Asp Asp Thr Val
145 150 155 160
Lys Asn Ala Leu Gln His Tyr Leu Thr Glu Tyr Glu Val Leu Ala Asp
165 170 175
Leu Glu Tyr Ile Ser Val Asn Lys Gly Ala Asp Glu Ser Val Leu Phe
180 185 190
Phe Val Gly Arg Thr Lys Thr Met Pro Tyr Glu Tyr Tyr Trp Arg Arg
195 200 205
Leu Thr Leu Lys Lys Asp Asn Asn Asn Lys Leu Val Pro Ala Ile Trp
210 215 220
Ser Gln Trp Lys Lys Ile Thr Ala Asn Ile Gly Glu Ala Val Asn Asn
225 230 235 240
Tyr Val Val Leu His Trp His Asn Asn Arg Leu His Val Gln Trp Gly
245 250 255
Ser Thr Glu Lys Thr Gln Asn Asp Asp Gly Glu Pro Ile Glu Lys Arg
260 265 270
Tyr Leu Asn Asp Trp Phe Met Asp Lys Ser Ser Val Trp Ser Ser Phe
275 280 285
Arg Lys Val Ser Tyr Ile Glu Asn Ser Phe Thr Tyr Thr Glu Gly Ile
290 295 300
Ile Asp Ser Arg Asn Ile Thr Ile Ala Gly Asn Gln Leu Phe Cys Asp
305 310 315 320
Asp Ser Asn Thr Phe Lys Ala Thr Ile Thr Ala Leu Pro Phe Asp Gln
325 330 335
Ile Arg Val Tyr Leu Glu Lys Ile Tyr Gly Thr Gly Gly Ser Ile Thr
340 345 350
Val Thr Gly Glu Asn Lys Gly Tyr Ile Ile Lys Val Gly Glu Pro Arg
355 360 365
Glu Val Ser Phe Ser Pro Asn Thr Leu Leu Asp Val Phe Ile Gly Ser
370 375 380
Asn Ala Ser Pro Arg Asp Pro Tyr Phe Lys Ala Thr Phe Asn Arg Glu
385 390 395 400
Ala Leu Gln Asn Ser Tyr Gly Ser Ile Lys Ile Asn Gln Tyr Thr Pro
405 410 415
Pro Ser Gly Ser Asn Ile Lys Gly Pro Ile Asp Leu Thr Leu Lys Asn
420 425 430
Asn Ile Asp Leu Ser Ala Leu Leu Glu Glu Ser Leu Asp Val Leu Phe
435 440 445
Asp Tyr Thr Ile Gln Gly Asn Asn Gln Leu Gly Gly Leu Glu Ala Phe
450 455 460
Asn Gly Pro Tyr Gly Leu Tyr Leu Trp Glu Ile Phe Leu His Val Pro
465 470 475 480
Phe Leu Met Ala Val Arg Phe His Thr Glu Gln Arg Tyr Glu Leu Ala
485 490 495
Glu Arg Trp Phe Lys Phe Ile Phe Asn Ser Ala Gly Tyr Arg Asp Gly
500 505 510
Tyr Gly Asn Leu Leu Thr Asp Asp Lys Gly Asn Val Arg Tyr Trp Asn
515 520 525
Val Val Pro Leu Gln Glu Asp Thr Glu Trp Asp Asp Thr Leu Ser Leu
530 535 540
Ala Thr Thr Asp Pro Asp Glu Ile Ala Met Ala Asp Pro Met Gln Tyr
545 550 555 560
Lys Leu Ala Ile Phe Ile His Thr Leu Asp Phe Leu Ile Ser Arg Gly
565 570 575
Asp Ser Leu Tyr Arg Met Leu Glu Arg Asp Thr Leu Thr Glu Ala Lys
580 585 590
Met Tyr Tyr Ile Gln Ala Ser Gln Leu Leu Gly Pro Arg Pro Glu Ile
595 600 605
Arg Ile Asn His Ser Trp Pro Asp Pro Thr Leu Gln Ser Glu Ala Asp
610 615 620
Ala Val Thr Ala Val Pro Thr Arg Ser Asp Ser Pro Ala Ala Pro Ile
625 630 635 640
Leu Ala Leu Arg Ala Leu Leu Asn Ala Glu Asn Gly His Phe Leu Pro
645 650 655
Pro Tyr Asn Asp Glu Leu Leu Ala Phe Trp Asp Lys Ile Asp Leu Arg
660 665 670
Leu Tyr Asn Leu Arg His Asn Leu Ser Leu Asp Gly Gln Pro Leu His
675 680 685
Leu Pro Leu Phe Thr Glu Pro Val Asn Pro Arg Glu Leu Gln Val Gln
690 695 700
His Gly Ala Gly Asp Gly Leu Gly Gly Ser Ala Gly Ser Val Gln Ser
705 710 715 720
Arg Gln Ser Val Tyr Arg Phe Pro Leu Val Ile Asp Lys Ala Arg Asn
725 730 735
Ala Ala Ser Ser Val Ile Gln Phe Gly Asn Ala Leu Glu Asn Ala Leu
740 745 750
Thr Lys Gln Asp Ser Glu Ala Met Thr Met Leu Leu Gln Ser Gln Gln
755 760 765
Gln Ile Va1 Leu Gln Gln Thr Arg Asp Ile Gln Glu Lys Asn Leu Ala
770 775 780
Ser Leu Gln Ala Ser Leu Glu Ala Thr Met Thr Ala Lys Ala Gly Ala
785 790 795 800
Lys Ser Arg Lys Thr His Phe Ala Gly Leu Ala Asp Asn Trp Met Ser
805 810 815
His Asn Glu Thr Ala Ser Leu Ala Leu Arg Thr Thr Ala Gly Ile Ile
820 825 830
Asn Thr Ser Ser Thr Val Pro Ile Ala Ile Thr Gly Gly Leu Asp Met
835 840 845
Ala Pro Asn Ile Phe Gly Phe Ala Val Gly Gly Ser Arg Trp Gly Ala
850 855 860
Ala Ser Ala Ala Val Ala Gln Gly Leu Gln Ile Ala Ala Gly Val Met
865 870 875 880
Glu Gln Thr Ala Asn Ile Ile Asp Ile Ser Glu Ser Tyr Arg Arg Arg
885 890 895
Arg Glu Asp Trp Leu Leu Gln Arg Asp Val Ala Glu Asn Glu Ala Ala
900 905 910
Gln Leu Asp Ser Gln Ile Ala Ala Leu Arg Glu Gln Met Asp Met Ala
915 920 925
Arg Lys Gln Leu Ala Leu Ala Glu Thr Glu Gln Ala His Ala Gln Ala
930 935 940
Val Tyr Glu Leu Leu Ser Thr Arg Phe Thr Asn Gln Ala Leu Tyr Asn
945 950 955 960
Trp Met Ala Gly Arg Leu Ser Ser Leu Tyr Tyr Gln Met Tyr Asp Ala
963 970 975
Ala Leu Pro Leu Cys Leu Met Ala Lys Gln Ala Leu Glu Lys Glu Ile
980 985 990
Gly Asn Asp Lys Thr Val Gly Ile Phe Thr Leu Pro Ala Trp Asn Asp
995 1000 1005
Leu Tyr Gln Gly Leu Leu Ala Gly Glu Ala Leu Leu Leu Glu Leu
1010 10l5 1020
Gln Lys Leu Glu Asn Leu Trp Leu Glu Glu Asp Lys Arg Gly Met
1025 1030 1035
Glu Ala Val Arg Thr Val Ser Leu Asp Thr Leu Leu Arg Lys Glu
1040 1045 1050
Lys Pro Glu Ser Gly Phe Ala Asp Phe Val Lys Glu Val Leu Asp
1055 1060 1065
Gly Lys Thr Pro Asp Pro Val Ser Gly Val Ser Val Gln Leu Gln
1070 1075 1080
Asn Asn Ile Phe Ser Ala Thr Leu Asp Leu Ser Thr Leu Gly Leu
1085 1090 1095
Asp Arg Phe Tyr Asn Gln Ala Glu Lys Ala His Arg Ile Lys Asn
1100 1105 1110
Leu Ser Val Thr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp Ile
1115 1120 1125
Ala Ala Thr Leu Ser Leu Gly Gly Glu Thr Val Ala Leu Ser His
1130 1135 1140
Gly Val Asp Asp Ser Gly Leu Phe Ile Thr Asp Leu Asn Asp Ser
1145 1150 1155
Arg Phe Leu Pro Phe Glu Gly Met Asp Pro Leu Ser Gly Thr Leu
1160 1165 1170
Val Leu Ser Ile Leu His Ala Gly Gln Asp Gly Asp Gln Arg Leu
1175 1180 1185
Leu Leu Glu Ser Leu Asn Asp Val Ile Phe His Ile Arg Tyr Val
1190 1195 1200
Met Lys
1205
<210>6
<211>3300
<212>DNA
<213>类芽孢杆菌IDAS 1529菌株
<400>6
atggtgtcaa caacagacaa cacggccggc gtattccggc tcggaaccga agaattaaca 60
gaagcgctta agcagtccgg ttatcggacc gtctttgata ttgtatctga caatcttgcg 120
gccgtccaga ggacagaaaa cttatgcatg ctttataagg cctggcagct gcacaatgat 240
ccggttgtcc agagccttcc caaattatcc gcggataccg gcctgcaagg catgcgtgcc 300
gcgttggagc ggagtcttgg aggcggagcc gattttggag acttgttccc ggagcgatcg 360
ccagagggct atgcggaagc ctcctctata cagtcgcttt tctcgccggg acgttacctg 420
acggtgctgt ataaaattgc gcgggatctc cacgacccaa aagataaact gcatattgac 480
aaccgccgtc cagatttgaa gtcgctgatc ctcaataatg acaatatgaa ccgagaggta 540
tcttctctgg atatccttct ggatgtgctg cagcccgaag gctctgacac gctgacatcc 600
ttgaaggata cctaccatcc gatgaccctt ccctatgatg acgaccttgc gcaaatcaat 660
gccgtggcgg aggcgcgttc atctaatttg ctggggattt gggataccct gctggacacg 720
cagcggactt ccatcctgca gaattccgcc gctgcccgcc ggataagcaa ggcgcggcac 780
tcggcatacg ccaatcagaa agcctccaat gatgagccgg tattcatcac gggagaggaa 840
atctacctgg aaaccggagg taaacggctt tttctggcgc ataaactcga gataggttca 900
actattagcg ctaaaatcaa cattggaccg ccgcaagcgg ccgatatcgc gccggcaaag 960
ttgcaactcg tatattacgg cagaggcggc agagggaact acttcctgcg cgtggcagac 1020
gatgtgtccc tcggtggaaa gctgctgacc aattgttatc tgaccagcga tgacggacag 1080
agcaacaata ttagcgggcc atactgccta atgatcaacc gaggcaccgg cagcatgcct 1140
agcgggactc accttccagt tcagattgaa agagtgaccg atacatccat ccgcattttt 1200
gtgccggatc acggctattt ggggctaggc gaaagccttg ccagcaactg gaatgaaccg 1260
ttggcgctga atctgggctt ggatgaagcg ttgaccttta ccttgagaaa gaaggagacg 1320
ggaaatgaca ccatttccat aatcgacatg ctgccgccgg tagcgaacac gactccgtct 1380
ccgccgacga gggaaacgct ttccttgacg ccaaacagct tccgtctgct ggtcaaccct 1440
gagccgacag cggaggacat cgccaagcac tacaacgtca cgacggtaac ccgggctcct 1500
gccgatctgg cctccgcctt aaatgttgtc gatgatttct gcttgaaaac cggtttgagc 1560
tttaacgaat tgctggattt aaccatgcag aaggattatc agtcaaaaag cagtgagtac 1620
aaaagccgat ttgtaaaatt cggcggcggg gagaatgttc cggtatcaag ctatggcgca 1680
gcctttctga caggagcgga agatactcct ttgtgggtga aacagtataa cagcgtgggg 1740
actgcaacaa gcacccctgt tttaaacttt acgccagata atgttgtggc tttggcagga 1800
agggcggaaa agcttgtccg gctgatgcgc agcacgggtc tttcctttga gcagttggat l860
tggctgattg ccaatgccag ccgtgccgtt atcgaacacg gtggagagct ttttctggat 1920
aagccggtac tggaagctgt ggccgaattc acaaggctca ataagcgtta tggcgtcaca 1980
tcggatatgt tcgccgcgtt tatcggcgaa gtcaatacgt atacagaagc gggcaaggac 2040
agcttttatc aggcgagttt cagcacggcc gaccattcgg ctaccttacc tttgggcgct 2100
tctttgcaac ttgaggtgag caagcaggat cgatatgaag cgatttgctg cggggctatg 2160
ggggtgaccg ccgatgagtt ctcccgtatc ggcaaatact gctttgggga taaagcacag 2220
caaatcacgg ccaatgaaac aaccgttgcc cagctttatc gtttaggccg aattcctcat 2280
atgctaggct tgcgttttac cgaggcagag ctgttgtgga aattgatggc tgggggcgag 2340
gataccttgc tccgcacgat tggcgcgaac cctcgcagtt tagaagcgtt agagattatt 2400
cgccggacgg aggtcctttt ggactggatg gatgcccatc agctggatgt tgtctccctg 2460
caagccatgg ttaccaatcg gtacagcggc acagccacgc cggagctgta caattttttg 2520
gcacaggtgc atcaatccgc aagcagtgcc gcgaacgtgg ccagagcgga tggtcaggat 2580
acgttgcctg cggacaagct gctccgggca ttggcggcgg gettcaaact gaaagccaac 2640
gtgatggcgc gagtaatcga ctggatggac aaaaccaata aagcgtttac gctgcgggct 2700
ttctgggaca agcttcaagc gtatttcagc gccgatcatg aagaagaact gaccgccctg 2760
gaaggagaag ccgcaatgct gcagtggtgc cagcagatca gccagtatgc gctcattgtc 2820
cgctggtgcg ggttaagcga gcaggatctg gcgctgctga ccgggaatcc ggagcagctt 2880
ctggacggac aacatacggt gcccgtaccc tcgctgcatc tcctgctggt gctgacccgc 2940
ctgaaggaat ggcagcagcg cgtccaggtt tccagcgagg aggctatgcg ctattttgcc 3000
caggccgatt cgccaaccgt cacgcgcgac gatgcggtta atctgcttgc ccgtatccat 3060
ggctggaatg aagcggatac cgtctcgatg aatgactacc tgctgggaga gaacgaatat 3120
cctaagaact ttgatcagat ctttgcactg gaaagctggg tcaacctggg ccgtcaactg 3180
aacgtgggca gcagaacgct gggagagctg gttgacatgg ctgaagagga taaaaccgcg 3240
gaaaacatgg atctgattac ttcggtggcc catagcctga tggctgcagc gaaagcctga 3300
<210>7
<211>1099
<212>PRT
<213>类芽孢杆菌IDAS 1529菌株
<400>7
Met Val Ser Thr Thr Asp Asn Thr Ala Gly Val Phe Arg Leu Gly Thr
1 5 10 15
Glu Glu Leu Thr Glu Ala Leu Lys Gln Ser Gly Tyr Arg Thr Val Phe
20 25 30
Asp Ile Val Ser Asp Asn Leu Ala Glu Phe Gln Lys Asn Asn Pro Glu
35 40 45
Ile Pro Ser Ser Asp Ala Lys Glu Ile His Gln Leu Ala Val Gln Arg
50 55 60
Thr Glu Asn Leu Cys Met Leu Tyr Lys Ala Trp Gln Leu His Asn Asp
65 70 75 80
Pro Val Val Gln Ser Leu Pro Lys Leu Ser Ala Asp Thr Gly Leu Gln
85 90 95
Gly Met Arg Ala Ala Leu Glu Arg Ser Leu Gly Gly Gly Ala Asp Phe
100 105 110
Gly Asp Leu Phe Pro Glu Arg Ser Pro Glu Gly Tyr Ala Glu Ala Ser
115 120 125
Ser Ile Gln Ser Leu Phe Ser Pro Gly Arg Tyr Leu Thr Val Leu Tyr
130 135 140
Lys Ile Ala Arg Asp Leu His Asp Pro Lys Asp Lys Leu His Ile Asp
145 150 155 160
Asn Arg Arg Pro Asp Leu Lys Ser Leu Ile Leu Asn Asn Asp Asn Met
165 170 175
Asn Arg Glu Val Ser Ser Leu Asp Ile Leu Leu Asp Val Leu Gln Pro
180 185 190
Glu Gly Ser Asp Thr Leu Thr Ser Leu Lys Asp Thr Tyr His Pro Met
195 200 205
Thr Leu Pro Tyr Asp Asp Asp Leu Ala Gln Ile Asn Ala Val Ala Glu
210 215 220
Ala Arg Ser Ser Asn Leu Leu Gly Ile Trp Asp Thr Leu Leu Asp Thr
225 230 235 240
Gln Arg Thr Ser Ile Leu Gln Asn Ser Ala Ala Ala Arg Arg Ile Ser
245 250 255
Lys Ala Arg His Ser Ala Tyr Ala Asn Gln Lys Ala Ser Asn Asp Glu
260 265 270
Pro Val Phe Ile Thr Gly Glu Glu Ile Tyr Leu Glu Thr Gly Gly Lys
275 280 285
Arg Leu Phe Leu Ala His Lys Leu Glu Ile Gly Ser Thr Ile Ser Ala
290 295 300
Lys Ile Asn Ile Gly Pro Pro Gln Ala Ala Asp Ile Ala Pro Ala Lys
305 310 315 320
Leu Gln Leu Val Tyr Tyr Gly Arg Gly Gly Arg Gly Asn Tyr Phe Leu
325 330 335
Arg Val Ala Asp Asp Val Ser Leu Gly Gly Lys Leu Leu Thr Asn Cys
340 345 350
Tyr Leu Thr Ser Asp Asp Gly Gln Ser Asn Asn Ile Ser Gly Pro Tyr
355 360 365
Cys Leu Met Ile Asn Arg Gly Thr Gly Ser Met Pro Ser Gly Thr His
370 375 380
Leu Pro Val Gln Ile Glu Arg Val Thr Asp Thr Ser Ile Arg Ile Phe
385 390 395 400
Val Pro Asp His Gly Tyr Leu Gly Leu Gly Glu Ser Leu Ala Ser Asn
405 410 415
Trp Asn Glu Pro Leu Ala Leu Asn Leu Gly Leu Asp Glu Ala Leu Thr
420 425 430
Phe Thr Leu Arg Lys Lys Glu Thr Gly Asn Asp Thr Ile Ser Ile Ile
435 440 445
Asp Met Leu Pro Pro Val Ala Asn Thr Thr Pro Ser Pro Pro Thr Arg
450 455 460
Glu Thr Leu Ser Leu Thr Pro Asn Ser Phe Arg Leu Leu Val Asn Pro
465 470 475 480
Glu Pro Thr Ala Glu Asp Ile Ala Lys His Tyr Asn Val Thr Thr Val
485 490 495
Thr Arg Ala Pro Ala Asp Leu Ala Ser Ala Leu Asn Val Val Asp Asp
500 505 510
Phe Cys Leu Lys Thr Gly Leu Ser Phe Asn Glu Leu Leu Asp Leu Thr
515 520 525
Met Gln Lys Asp Tyr Gln Ser Lys Ser Ser Glu Tyr Lys Ser Arg Phe
530 535 540
Val Lys Phe Gly Gly Gly Glu Asn Val Pro Val Ser Ser Tyr Gly Ala
545 550 555 560
Ala Phe Leu Thr Gly Ala Glu Asp Thr Pro Leu Trp Val Lys Gln Tyr
565 570 575
Asn Ser Val Gly Thr Ala Thr Ser Thr Pro Va1 Leu Asn Phe Thr Pro
580 585 590
Asp Asn Val Val Ala Leu Ala Gly Arg Ala Glu Lys Leu Val Arg Leu
595 600 605
Met Arg Ser Thr Gly Leu Ser Phe Glu Gln Leu Asp Trp Leu Ile Ala
610 615 620
Asn Ala Ser Arg Ala Val Ile Glu His Gly Gly Glu Leu Phe Leu Asp
625 630 635 640
Lys Pro Val Leu Glu Ala Val Ala Glu Phe Thr Arg Leu Asn Lys Arg
645 650 655
Tyr Gly Val Thr Ser Asp Met Phe Ala Ala Phe Ile Gly Glu Val Asn
660 665 670
Thr Tyr Thr Glu Ala G1y Lys Asp Ser Phe Tyr Gln Ala Ser Phe Ser
675 680 685
Thr Ala Asp His Ser Ala Thr Leu Pro Leu Gly Ala Ser Leu Gln Leu
690 695 700
Glu Val Ser Lys Gln Asp Arg Tyr Glu Ala Ile Cys Cys Gly Ala Met
705 710 715 720
Gly Val Thr Ala Asp Glu Phe Ser Arg Ile Gly Lys Tyr Cys Phe Gly
725 730 735
Asp Lys Ala Gln Gln Ile Thr Ala Asn Glu Thr Thr Val Ala Gln Leu
740 745 750
Tyr Arg Leu Gly Arg Ile Pro His Met Leu Gly Leu Arg Phe Thr Glu
755 760 765
Ala Glu Leu Leu Trp Lys Leu Met Ala Gly Gly Glu Asp Thr Leu Leu
770 775 780
Arg Thr Ile Gly Ala Asn Pro Arg Ser Leu Glu Ala Leu Glu Ile Ile
785 790 795 800
Arg Arg Thr Glu Val Leu Leu Asp Trp Met Asp Ala His Gln Leu Asp
805 810 815
Val Val Ser Leu Gln Ala Met Val Thr Asn Arg Tyr Ser Gly Thr Ala
820 825 830
Thr Pro Glu Leu Tyr Asn Phe Leu Ala Gln Val His Gln Ser Ala Ser
835 840 845
Ser Ala Ala Asn Val Ala Arg Ala Asp Gly Gln Asp Thr Leu Pro Ala
850 855 860
Asp Lys Leu Leu Arg Ala Leu Ala Ala Gly Phe Lys Leu Lys Ala Asn
865 870 875 880
Val Met Ala Arg Val Ile Asp Trp Met Asp Lys Thr Asn Lys Ala Phe
885 890 895
Thr Leu Arg Ala Phe Trp Asp Lys Leu Gln Ala Tyr Phe Ser Ala Asp
900 905 910
His Glu Glu Glu Leu Thr Ala Leu Glu Gly Glu Ala Ala Met Leu Gln
915 920 925
Trp Cys Gln Gln Ile Ser Gln Tyr Ala Leu Ile Val Arg Trp Cys Gly
930 935 940
Leu Ser Glu Gln Asp Leu Ala Leu Leu Thr Gly Asn Pro Glu Gln Leu
945 950 955 960
Leu Asp Gly Gln His Thr Val Pro Val Pro Ser Leu His Leu Leu Leu
965 970 975
Val Leu Thr Arg Leu Lys Glu Trp Gln Gln Arg Val Gln Val Ser Ser
980 985 990
Glu Glu Ala Met Arg Tyr Phe Ala Gln Ala Asp Ser Pro Thr Val Thr
995 1000 1005
Arg Asp Asp Ala Val Asn Leu Leu Ala Arg Ile His Gly Trp Asn
1010 1015 1020
Glu Ala Asp Thr Val Ser Met Asn Asp Tyr Leu Leu Gly Glu Asn
1025 1030 1035
Glu Tyr Pro Lys Asn Phe Asp Gln Ile Phe Ala Leu Glu Ser Trp
1040 1045 1050
Val Asn Leu Gly Arg Gln Leu Asn Val Gly Ser Arg Thr Leu Gly
1055 1060 1065
Glu Leu Val Asp Met Ala Glu Glu Asp Lys Thr Ala Glu Asn Met
1070 1075 1080
Asp Leu Ile Thr Ser Val Ala His Ser Leu Met Ala Ala Ala Lys
1085 1090 1095
Ala
<210>8
<211>3627
<212>DNA
<213>类芽孢杆菌IDAS 1529菌株
<400>8
atgaccaagg aaggtgataa gcatatgtct acttcaaccc tgttgcaatc gattaaagaa 60
gcccgccggg atgcgctggt caaccattat attgctaatc aggttccgac agcgcttgcg 120
gaactcgtaa aaacatcgcc gatagcggag gccatcagca gcgtgcagtt atacatgaac 240
cgctgcgtcg aaggctatga aggcaagttg actccggaaa gtaatactca ttttggccca 300
ggtaaatttc tatataactg ggatacgtac aacaaacgtt tttccacctg ggcaggaaaa 360
gaacgcttga aatattatgc aggcagctat attgagccgt ccttgcgcta caacaaaacc 420
gatccattcc tgaacctgga acagagcatc agccagggaa gaattactga tgataccgta 480
aagaacgcgc tgcaacacta cctgactgaa tatgaagtgt tggcggatct ggattatatc 540
agcgttaata aaggcggcga cgaaagtgtt ttactctttg ttggacgcac caaaaccgta 600
ccgtatgaat actactggcg ccgtttgctt ttaaaaaggg acaataataa taagctagta 660
ccagcagtct ggtctcagtg gaaaaaaatc agtgccaata tcggtgaagc ggttgatagt 720
tatgtggtgc ctcggtggca taaaaaccgg ctacatgtgc aatggtgttc tatagagaaa 780
agtgaaaatg atgccggtga acccattgag aaacgatatt tgaatgactg gttcatggat 840
agttccggag tctggtcttc atttcgaaag attccggttg tggaaaagag tttcgaatat 900
ttggacggaa gcctcgatcc ccgatttgtc gctcttgtta gaaatcaaat attaattgat 960
gagccagaaa tattcagaat tacagtatca gcccctaatc cgatagatgc aaatggaaga 1020
gtagaggtac attttgaaga aaactatgca aacagatata atattaccat taaatatggg 1080
acaacgagtc ttgctattcc tgcagggcag gtagggcatc caaatatctc tattaatgaa 1140
acattaaggg ttgaattcgg caccaggccg gattggtatt atactttcag atatttagga 1200
aatacaatcc aaaactcata cggttcaatt gtcaataatc aattttcacc tccatcagga 1260
agcaatatta aaggtcctat cgaccttacc ctgaaaaata acatcgacct gtcggccttg 1320
ttggatgaga gccttgacgc actgttcgac tataccattc agggcgataa ccaattgggc 1380
ggcttagctg cctttaacgg gccttacgga ctttacttgt gggaaatctt cttccatgtt 1440
ccttttttaa tggcggttcg cttccacacc gagcagcggt atgagttggc ggaacgttgg 1500
tttaaattca tcttcaacag cgcaggatac cgtgatgatt acggcagtct gctgacggat 1560
gacaaaggca acgtgcgtta ctggaacgtg ataccgctgc aagaggacac ggagtgggat 1620
gacacgttgt ccctggcaac gaccgacccg gacgagattg cgatggccga cccgatgcaa 1680
tacaagctgg ctatatttat tcacaccatg gacttcctga tcagccgcgg cgatagcttg 1740
taccggatgc tggagcggga taccctggcc gaagccaaga tgtattacat tcaggccagc 1800
caactgcttg ggccccgccc cgacatccgg ctcaatcaca gttggcctaa tccgaccttg 1860
caaagcgaag cggacgcggt aaccgccgtg ccgacgcgaa gcgattcgcc ggcagcgcca 1920
attttggcct tgcgagcgct tctgacaggc gaaaacggtc atttcctgcc gccttataat 1980
gatgaactgt tcgctttctg ggacaaaatc gatctgcgtt tatacaattt gcgccacaat 2040
ttgagtctgg acggtcagcc gcttcatttg ccgctctttg ccgaaccggt caatccgcgt 2100
gaattgcagg ttcagcatgg cccgggcgat ggcttggggg gaagcgcggg ttccgcccaa 2160
agccgtcaga gtgtctatcg ttttcctctg gtcatcgata aggcgcgcaa tgcggccaac 2220
agtgtcatcc aattcggcaa tgccctggaa aacgcactga ccaagcaaga cagcgaagca 2280
atgaccatgc tgttgcagtc ccagcagcag attgtcctgc agcaaacccg cgatattcag 2340
gagaagaacc tggccgcgct gcaagcaagt ctggaagcaa cgatgacagc gaaagcgggg 2400
gcggagtccc ggaagaccca ttttgccggc ttggcggaca actggatgtc ggacaatgaa 2460
accgcctcac tcgcactgcg taccaccgcg ggaatcatca ataccagctc aaccgtgccg 2520
atcgccatca ccggcggctt ggatatggct ccgaacattt ttggtttcgc agttggaggt 2580
tcccgctggg gagcagccag cgcggctgta gcccaaggat tgcaaatcgc cgccggcgta 2640
atggaacaga cggccaatat tatcgatatt agcgaaagct accgccggcg ccgggaggat 2700
tggctgctgc agcgggatgt tgccgaaaat gaagcggcgc agttggattc gcagattgcg 2760
gccctgcggg aacagatgga tatggcgcgc aagcaacttg cgctggcgga gacggaacag 2820
gcgcacgcgc aagcggtcta cgagctgcaa agcacccgct ttacgaatca agctttgtat 2880
aactggatgg ctggacgtct gtcgtctcta tactatcaaa tgtatgacgc cgcattgccg 2940
ctctgcttga tggcgaagca ggctttagag aaagaaatcg gttcggataa aacggtcgga 3000
gtcttgtccc tcccggcctg gaatgatcta tatcagggat tattggcggg cgaggcgctg 3060
ctgctcgagc ttcagaagct ggagaatctg tggctggagg aagacaagcg cggaatggaa 3120
gccgtaaaaa cagtctctct ggatactctt ctccgcaaaa caaatccgaa ctccgggttt 3180
gcggatctcg tcaaggaggc actggacgaa aacggaaaga cgcctgaccc ggtgagcgga 3240
gtcggcgtac agctgcaaaa caatattttc agcgcaaccc ttgacctctc cgttcttggc 3300
ctggatcgct cttacaatca ggcggaaaag tcccgcagga tcaaaaatat gtcggttacc 3360
ttacctgcgc tattggggcc ttaccaggat atagaggcaa ccttatcgct aggcggcgag 3420
accgttgcgc tgtcccatgg cgtggatgac agcggcttgt tcatcactga tctcaacgac 3480
agccggttcc tgcctttcga gggcatggat ccgttatccg gcacactcgt cctgtcgata 3540
ttccatgccg ggcaagacgg cgaccagcgc ctcctgctgg aaagtctcaa tgacgtcatc 3600
ttccacattc gatatgttat gaaatag 3627
<210>9
<211>1208
<212>PRT
<213>类芽孢杆菌IDAS 1529菌株
<400>9
Met Thr Lys Glu Gly Asp Lys His Met Ser Thr Ser Thr Leu Leu Gln
1 5 10 15
Ser Ile Lys Glu Ala Arg Arg Asp Ala Leu Val Asn His Tyr Ile Ala
20 25 30
Asn Gln Val Pro Thr Ala Leu Ala Asp Lys Ile Thr Asp Ala Asp Ser
35 40 45
Leu Tyr Glu Tyr Leu Leu Leu Asp Thr Lys Ile Ser Glu Leu Val Lys
50 55 60
Thr Ser Pro Ile Ala Glu Ala Ile Ser Ser Val Gln Leu Tyr Met Asn
65 70 75 80
Arg Cys Val Glu Gly Tyr Glu Gly Lys Leu Thr Pro Glu Ser Asn Thr
85 90 95
His Phe Gly Pro Gly Lys Phe Leu Tyr Asn Trp Asp Thr Tyr Asn Lys
100 105 110
Arg Phe Ser Thr Trp Ala Gly Lys Glu Arg Leu Lys Tyr Tyr Ala Gly
115 120 125
Ser Tyr Ile Glu Pro Ser Leu Arg Tyr Asn Lys Thr Asp Pro Phe Leu
130 135 140
Asn Leu Glu Gln Ser Ile Ser Gln Gly Arg Ile Thr Asp Asp Thr Val
145 150 155 160
Lys Asn Ala Leu Gln His Tyr Leu Thr Glu Tyr Glu Va1 Leu Ala Asp
165 170 175
Leu Asp Tyr Ile Ser Val Asn Lys Gly Gly Asp Glu Ser Val Leu Leu
180 185 190
Phe Val Gly Arg Thr Lys Thr Val Pro Tyr Glu Tyr Tyr Trp Arg Arg
195 200 205
Leu Leu Leu Lys Arg Asp Asn Asn Asn Lys Leu Val Pro Ala Val Trp
210 215 220
Ser Gln Trp Lys Lys Ile Ser Ala Asn Ile Gly Glu Ala Val Asp Ser
225 230 235 240
Tyr Val Val Pro Arg Trp His Lys Asn Arg Leu His Val Gln Trp Cys
245 250 255
Ser Ile Glu Lys Ser Glu Asn Asp Ala Gly Glu Pro Ile Glu Lys Arg
260 265 270
Tyr Leu Asn Asp Trp Phe Met Asp Ser Ser Gly Val Trp Ser Ser Phe
275 280 285
Arg Lys Ile Pro Val Val Glu Lys Ser Phe Glu Tyr Leu Asp Gly Ser
290 295 300
Leu Asp Pro Arg Phe Val Ala Leu Val Arg Asn Gln Ile Leu Ile Asp
305 310 315 320
Glu Pro Glu Ile Phe Arg Ile Thr Val Ser Ala Pro Asn Pro Ile Asp
325 330 335
Ala Asn Gly Arg Val Glu Val His Phe Glu Glu Asn Tyr Ala Asn Arg
340 345 350
Tyr Asn Ile Thr Ile Lys Tyr Gly Thr Thr Ser Leu Ala Ile Pro Ala
355 360 365
Gly Gln Val Gly His Pro Asn Ile Ser Ile Asn Glu Thr Leu Arg Val
370 375 380
Glu Phe Gly Thr Arg Pro Asp Trp Tyr Tyr Thr Phe Arg Tyr Leu Gly
385 390 395 400
Asn Thr Ile Gln Asn Ser Tyr Gly Ser Ile Val Asn Asn Gln Phe Ser
405 410 415
Pro Pro Ser Gly Ser Asn Ile Lys Gly Pro Ile Asp Leu Thr Leu Lys
420 425 430
Asn Asn Ile Asp Leu Ser Ala Leu Leu Asp Glu Ser Leu Asp Ala Leu
435 440 445
Phe Asp Tyr Thr Ile Gln Gly Asp Asn Gln Leu Gly Gly Leu Ala Ala
450 455 460
Phe Asn Gly Pro Tyr Gly Leu Tyr Leu Trp Glu Ile Phe Phe His Val
465 470 475 480
Pro Phe Leu Met Ala Val Arg Phe His Thr Glu Gln Arg Tyr Glu Leu
485 490 495
Ala Glu Arg Trp Phe Lys Phe Ile Phe Asn Ser Ala Gly Tyr Arg Asp
500 505 510
Asp Tyr Gly Ser Leu Leu Thr Asp Asp Lys Gly Asn Val Arg Tyr Trp
515 520 525
Asn Val Ile Pro Leu Gln Glu Asp Thr Glu Trp Asp Asp Thr Leu Ser
530 535 540
Leu Ala Thr Thr Asp Pro Asp Glu Ile Ala Met Ala Asp Pro Met Gln
545 550 555 560
Tyr Lys Leu Ala Ile Phe Ile His Thr Met Asp Phe Leu Ile Ser Arg
565 570 575
Gly Asp Ser Leu Tyr Arg Met Leu Glu Arg Asp Thr Leu Ala Glu Ala
580 585 590
Lys Met Tyr Tyr Ile Gln Ala Ser Gln Leu Leu Gly Pro Arg Pro Asp
595 600 605
Ile Arg Leu Asn His Ser Trp Pro Asn Pro Thr Leu Gln Ser Glu Ala
610 615 620
Asp Ala Val Thr Ala Val Pro Thr Arg Ser Asp Ser Pro Ala Ala Pro
625 630 635 640
Ile Leu Ala Leu Arg Ala Leu Leu Thr Gly Glu Asn Gly His Phe Leu
645 650 655
Pro Pro Tyr Asn Asp Glu Leu Phe Ala Phe Trp Asp Lys Ile Asp Leu
660 665 670
Arg Leu Tyr Asn Leu Arg His Asn Leu Ser Leu Asp Gly Gln Pro Leu
675 680 685
His Leu Pro Leu Phe Ala Glu Pro Val Asn Pro Arg Glu Leu Gln Val
690 695 700
Gln His Gly Pro Gly Asp Gly Leu Gly Gly Ser Ala Gly Ser Ala Gln
705 710 715 720
Ser Arg Gln Ser Val Tyr Arg Phe Pro Leu Val Ile Asp Lys Ala Arg
725 730 735
Asn Ala Ala Asn Ser Val Ile Gln Phe Gly Asn Ala Leu Glu Asn Ala
740 745 750
Leu Thr Lys Gln Asp Ser Glu Ala Met Thr Met Leu Leu Gln Ser Gln
755 760 765
Gln Gln Ile Val Leu Gln Gln Thr Arg Asp Ile Gln Glu Lys Asn Leu
770 775 780
Ala Ala Leu Gln Ala Ser Leu Glu Ala Thr Met Thr Ala Lys Ala Gly
785 790 795 800
Ala Glu Ser Arg Lys Thr His Phe Ala Gly Leu Ala Asp Asn Trp Met
805 810 815
Ser Asp Asn Glu Thr Ala Ser Leu Ala Leu Arg Thr Thr Ala Gly Ile
820 825 830
Ile Asn Thr Ser Ser Thr Val Pro Ile Ala Ile Thr Gly Gly Leu Asp
835 840 845
Met Ala Pro Asn Ile Phe Gly Phe Ala Val Gly Gly Ser Arg Trp Gly
850 855 860
Ala Ala Ser Ala Ala Val Ala Gln Gly Leu Gln Ile Ala Ala Gly Val
865 870 875 880
Met Glu Gln Thr Ala Asn Ile Ile Asp Ile Ser Glu Ser Tyr Arg Arg
885 890 895
Arg Arg Glu Asp Trp Leu Leu Gln Arg Asp Val Ala Glu Asn Glu Ala
900 905 910
Ala Gln Leu Asp Ser Gln Ile Ala Ala Leu Arg Glu Gln Met Asp Met
915 920 925
Ala Arg Lys Gln Leu Ala Leu Ala Glu Thr Glu Gln Ala His Ala Gln
930 935 940
Ala Val Tyr Glu Leu Gln Ser Thr Arg Phe Thr Asn Gln Ala Leu Tyr
945 950 955 960
Asn Trp Met Ala Gly Arg Leu Ser Ser Leu Tyr Tyr Gln Met Tyr Asp
965 970 975
Ala Ala Leu Pro Leu Cys Leu Met Ala Lys Gln Ala Leu Glu Lys Glu
980 985 990
Ile Gly Ser Asp Lys Thr Val Gly Val Leu Ser Leu Pro Ala Trp Asn
995 1000 1005
Asp Leu Tyr Gln Gly Leu Leu Ala Gly Glu Ala Leu Leu Leu Glu
1010 1015 1020
Leu Gln Lys Leu Glu Asn Leu Trp Leu Glu Glu Asp Lys Arg Gly
1025 1030 1035
Met Glu Ala Val Lys Thr Val Ser Leu Asp Thr Leu Leu Arg Lys
1040 1045 1050
Thr Asn Pro Asn Ser Gly Phe Ala Asp Leu Val Lys Glu Ala Leu
1055 1060 1065
Asp Glu Asn Gly Lys Thr Pro Asp Pro Val Ser Gly Val Gly Val
1070 1075 1080
Gln Leu Gln Asn Asn Ile Phe Ser Ala Thr Leu Asp Leu Ser Val
1085 1090 1095
Leu Gly Leu Asp Arg Ser Tyr Asn Gln Ala Glu Lys Ser Arg Arg
1100 1105 1110
Ile Lys Asn Met Ser Val Thr Leu Pro Ala Leu Leu Gly Pro Tyr
1115 1120 1125
Gln Asp Ile Glu Ala Thr Leu Ser Leu Gly Gly Glu Thr Val Ala
1130 1135 1140
Leu Ser His Gly Val Asp Asp Ser Gly Leu Phe Ile Thr Asp Leu
1145 1150 1155
Asn Asp Ser Arg Phe Leu Pro Phe Glu Gly Met Asp Pro Leu Ser
1160 1165 1170
Gly Thr Leu Val Leu Ser Ile Phe His Ala Gly Gln Asp Gly Asp
1175 1180 1185
Gln Arg Leu Leu Leu Glu Ser Leu Asn Asp Val Ile Phe His Ile
1190 1195 1200
Arg Tyr Val Met Lys
1205
<210>10
<211>4335
<212>DNA
<213>类芽孢杆菌IDAS 1529菌株
<400>10
atgccacaat ctagcaatgc cgatatcaag ctattgtcgc catcgctgcc aaagggcggc 60
ggttccatga agggaatcga agaaaacatc gcggctcccg gctccgacgg catggcacgt 120
tgtaatgtgc cgctgccggt aacctccggc cgctatatta ctcctgatat aagcctgtcc 180
tatgcgagcg gccacggcaa cggcgcttat ggaatgggct ggacgatggg agtgatgagc 240
attagccgga gaacaagccg agggaccccc agttatacat ccgaagacca gttccttggt 300
ccggatgggg aggtgcttgt tccggaaagc aacgaacaag gggagatcat tacccgccac 360
accgatacgg cccaagggat accgttaggc gagacgttta cggttacacg ctattttccc 420
cggatcgaga gcgcttttca tttgctggaa tactgggaag cgcaagcagg aagcgcaaca 480
gcgtcgtttt ggcttattca ctctgccgat ggagtgctgc actgtctggg taaaactgct 540
caggcgagga tagccgcccc tgacgattcc gccaagatcg cagaatggct agtggaggag 600
tccgtctccc ccttcggaga gcatatttat taccaataca aagaagaaga caatcaaggc 660
gtgaatctgg aggaagacaa tcatcaatat ggggcgaacc gctatctgaa atcgattcgc 720
tatggaaata aggttgcctc tccttctctc tatgtctgga agggggaaat tccggcagac 780
ggccaatggc tgtattccgt tatcctggat tatggcgaga acgatacctc agcggatgtt 840
cctcccctat acacgcccca aggggagtgg ctggtgcgcc cggaccgttt ttcccgctat 900
gactacggat ttgaggtccg gacttgccgc ttgtgccgcc aggtcttgat gttccacgtc 960
tttaaggagc ttggcgggga gccggcgctg gtgtggcgga tgcagttgga atacgacgag 1020
aacccggcgg cgtccatgct gagcgcggtc cggcaattgg cttatgaagc agatggggcc 1080
attcgaagct tgccgccgct ggaattcgat tatactccat ttggcatcga gacaacggcc 1140
gattggcagc cttttctgcc tgtgcctgaa tgggcggatg aagaacatta tcagttggtc 1200
gatttgtacg gagaaggcat accgggctta ttatatcaga acaatgacca ctggcattat 1260
cgttcgcccg cccggggcga cacaccggac gggatcgcct ataacagctg gcggccgctt 1320
cctcatatcc ccgtgaactc ccggaacggg atgctgatgg atctgaatgg agacgggtat 1380
ctggaatggt tgcttgcgga acccggggtt gcggggcgct atagcatgaa cccggataag 1440
agctggtccg gttttgtgcc gctccaggca ctgccaacgg aattcttcca tccgcaggca 1500
cagcttgcca atgttaccgg atcgggttta accgacttgg ttatgatcgg tccgaagagc 1560
gtccggtttt atgccggaga agaagcgggc ttcaagcgcg catgtgaagt gtggcagcaa 1620
gtgggcatta ctttgcctgt ggaacgcgtg gataaaaagg aactggtggc attcagcgat 1680
atgctgggat cgggtcagtc tcatctggtg cgcatccggc atgatggcgt tacatgctgg 1740
cctaatctgg ggaacggcgt gttcggggcg ccgttggccc ttcacgggtt tacggcatcg 1800
gagcgggaat tcaatccgga acgtgtatat cttgtggacc ttgatggatc cggcgcttcc 1860
gatatcattt atgcttctcg tgacgctcta ctcatttacc gaaatctttc cggcaatggc 1920
tttgctgatc cggtgcgggt tccgctgcct gacggcgtgc ggtttgataa tctgtgccgg 1980
ctgctgcctg ccgatatccg cgggttaggt gtggccagtc tggtgctgca tgtaccttac 2040
atggcccccc gcagttggaa attagatttc tttgcggcga agccgtattt attgcaaacg 2100
gtcagcaaca atcttggagc ttccagctcg ttttggtacc gaagctccac ccagtattgg 2160
ctggatgaga aacaggcggc ctcatcggct gtctccgctt tgcccttccc gataaacgtg 2220
gtatcggata tgcacacggt ggacgaaatc agcggccgca ccaggactca gaagtatact 2280
taccgccatg gcgtgtatga ccggaccgaa aaggaatttg ccggattcgg ccgcattgac 2340
acatgggaag aggagcggga ttccgaagga accctgagcg tcagcactcc gcccgtgctg 2400
acgcggacct ggtatcatac cgggcaaaag caggatgagg agcgtgccgt gcagcaatat 2460
tggcaaggcg accctgcggc ttttcaggtt aaacccgtcc ggcttactcg attcgatgcg 2520
gcagcggccc aggatctgcc gctagattct aataatgggc agcaagaata ctggctgtac 2580
cgatcattac aagggatgcc gctgcggact gagatttttg cgggagatgt tggcgggtcg 2640
cctccttatc aggtagagag cttccgttat caagtgcgct tggtgcagag catcgattcg 2700
gaatgtgttg ccttgcccat gcagttggag cagcttacgt acaactatga gcaaatcgcc 2760
tctgatccgc agtgttcaca gcagatacag caatggttcg acgaatacgg cgtggcggca 2820
cagagtgtaa caatccaata tccgcgccgg gcacagccgg aggacaatcc gtaccctcgc 2880
acgctgccgg ataccagctg gagcagcagt tatgattcgc agcaaatgct gctgcggttg 2940
accaggcaaa ggcaaaaagc gtaccacctt gcagatcctg aaggctggcg cttgaatatt 3000
ccccatcaga cacgcctgga tgccttcatt tattctgctg acagcgtgcc cgccgaagga 3060
ataagcgccg agctgctgga ggtggacggc acgttacgat cttcggcgct ggaacaggct 3120
tatggcggcc agtcagagat catctatgcg ggcgggggcg aaccggattt gcgagccctg 3180
gtccattaca ccagaagcgc ggttcttgat gaagactgtt tacaagccta tgaaggcgta 3240
ctgagcgata gccaattgaa ctcgcttctt gcctcttccg gctatcaacg aagcgcaaga 3300
atattgggtt cgggcgatga agtggatatt tttgtcgcgg aacaaggatt tacccgttat 3360
gcggatgaac cgaatttttt ccgtattctg gggcaacaat cctctctctt gtccggggaa 3420
caagtattaa catgggatga taatttctgt gcggttacat ccatcgaaga cgcgcttggc 3480
aatcaaattc agattgcata tgattaccgc tttgtggagg ccatccagat taccgatacg 3540
aataataatg tgaatcaggt cgccctggat gctctcggcc gggtcgtata cagccggacc 3600
tggggcacgg aggaagggat aaagaccggc ttccgcccgg aggtggaatt cgcgacgccc 3660
gagacaatgg agcaggcgct tgccctggca tctcccttgc cggttgcatc ctgctgtgta 3720
tatgatgcgc atagctggat gggaacgata actcttgcac aactgtcaga gcttgttcca 3780
gatagtgaaa agcaatggtc gttcttgata gacaatcgct tgattatgcc ggacggcaga 3840
atcagatccc gcggtcggga tccatggtcg cttcaccggc tattgccgcc tgctgtgggc 3900
gaattgctga gcgaggcgga ccgtaaaccg ccgcatacgg taattttggc agcagatcgt 3960
tacccggatg acccatccca gcaaattcag gcgagcatcg tgtttagcga tggctttggg 4020
cgtacgatac aaactgctaa aagagaagat acccgatggg cgattgcgga acgggtggac 4080
tatgacggaa ccggagccgt aatccgcagc tttcagcctt tttatcttga cgactggaat 4140
tatgtgggcg aagaggctgt cagcagctct atgtacgcaa cgatctatta ttatgatgct 4200
ctggcacgac aattaaggat ggtcaacgct aaaggatatg agaggagaac tgctttttac 4260
ccatggttta cagtaaacga agatgaaaat gataccatgg actcatcatt atttgcttca 4320
ccgcctgcgc ggtga 4335
<210>11
<211>1444
<212>PRT
<213>类芽孢杆菌IDAS 1529菌株
<400>11
Met Pro Gln Ser Ser Asn Ala Asp Ile Lys Leu Leu Ser Pro Ser Leu
1 5 10 15
Pro Lys Gly Gly Gly Ser Met Lys Gly Ile Glu Glu Asn Ile Ala Ala
20 25 30
Pro Gly Ser Asp Gly MeT Ala Arg Cys Asn Val Pro Leu Pro Val Thr
35 40 45
Ser Gly Arg Tyr Ile Thr Pro Asp Ile Ser Leu Ser Tyr Ala Ser Gly
50 55 60
His Gly Asn Gly Ala Tyr Gly Met Gly Trp Thr Met Gly Val Met Ser
65 70 75 80
Ile Ser Arg Arg Thr Ser Arg Gly Thr Pro Ser Tyr Thr Ser Glu Asp
85 90 95
Gln Phe Leu Gly Pro Asp Gly Glu Val Leu Val Pro Glu Ser Asn Glu
100 105 110
Gln Gly Glu Ile Ile Thr Arg His Thr Asp Thr Ala Gln Gly Ile Pro
115 120 125
Leu Gly Glu Thr Phe Thr Val Thr Arg Tyr Phe Pro Arg Ile Glu Ser
130 135 140
Ala Phe His Leu Leu Glu Tyr Trp Glu Ala Gln Ala Gly Ser Ala Thr
145 150 155 160
Ala Ser Phe Trp Leu Ile His Ser Ala Asp Gly Val Leu His Cys Leu
165 170 175
Gly Lys Thr Ala Gln Ala Arg Ile Ala Ala Pro Asp Asp Ser Ala Lys
180 185 190
Ile Ala Glu Trp Leu Val Glu Glu Ser Val Ser Pro Phe Gly Glu His
195 200 205
Ile Tyr Tyr Gln Tyr Lys Glu Glu Asp Asn Gln Gly Val Asn Leu Glu
210 215 220
Glu Asp Asn His Gln Tyr Gly Ala Asn Arg Tyr Leu Lys Ser Ile Arg
225 230 235 240
Tyr Gly Asn Lys Val Ala Ser Pro Ser Leu Tyr Val Trp Lys Gly Glu
245 250 255
Ile Pro Ala Asp Gly Gln Trp Leu Tyr Ser Val Ile Leu Asp Tyr Gly
260 265 270
Glu Asn Asp Thr Ser Ala Asp Val Pro Pro Leu Tyr Thr Pro Gln Gly
275 280 285
Glu Trp Leu Val Arg Pro Asp Arg Phe Ser Arg Tyr Asp Tyr Gly Phe
290 295 300
Glu Val Arg Thr Cys Arg Leu Cys Arg Gln Val Leu Met Phe His Val
305 310 315 320
Phe Lys Glu Leu Gly Gly Glu Pro Ala Leu Val Trp Arg Met Gln Leu
325 330 335
Glu Tyr Asp Glu Asn Pro Ala Ala Ser Met Leu Ser Ala Val Arg Gln
340 345 350
Leu Ala Tyr Glu Ala Asp Gly Ala Ile Arg Ser Leu Pro Pro Leu Glu
355 360 365
Phe Asp Tyr Thr Pro Phe Gly Ile Glu Thr Thr Ala Asp Trp Gln Pro
370 375 380
Phe Leu Pro Val Pro Glu Trp Ala Asp Glu Glu His Tyr Gln Leu Val
385 390 395 400
Asp Leu Tyr Gly Glu Gly Ile Pro Gly Leu Leu Tyr Gln Asn Asn Asp
405 410 415
His Trp His Tyr Arg Ser Pro Ala Arg Gly Asp Thr Pro Asp Gly Ile
420 425 430
Ala Tyr Asn Ser Trp Arg Pro Leu Pro His Ile Pro Val Asn Ser Arg
435 440 445
Asn Gly Met Leu Met Asp Leu Asn Gly Asp Gly Tyr Leu Glu Trp Leu
450 455 460
Leu Ala Glu Pro Gly Val Ala Gly Arg Tyr Ser Met Asn Pro Asp Lys
465 470 475 480
Ser Trp Ser Gly Phe Val Pro Leu Gln Ala Leu Pro Thr Glu Phe Phe
485 490 495
His Pro Gln Ala Gln Leu Ala Asn Val Thr Gly Ser Gly Leu Thr Asp
500 505 510
Leu Val Met Ile Gly Pro Lys Ser Val Arg Phe Tyr Ala Gly Glu Glu
515 520 525
Ala Gly Phe Lys Arg Ala Cys Glu Val Trp Gln Gln Val Gly Ile Thr
530 535 540
Leu Pro Val Glu Arg Val Asp Lys Lys Glu Leu Val Ala Phe Ser Asp
545 550 555 560
Met Leu Gly Ser Gly Gln Ser His Leu Val Arg Ile Arg His Asp Gly
565 570 575
Val Thr Cys Trp Pro Asn Leu Gly Asn Gly Val Phe Gly Ala Pro Leu
580 585 590
Ala Leu His Gly Phe Thr Ala Ser Glu Arg Glu Phe Asn Pro Glu Arg
595 600 605
Val Tyr Leu Val Asp Leu Asp Gly Ser Gly Ala Ser Asp Ile Ile Tyr
610 615 620
Ala Ser Arg Asp Ala Leu Leu Ile Tyr Arg Asn Leu Ser Gly Asn Gly
625 630 635 640
Phe Ala Asp Pro Val Arg Val Pro Leu Pro Asp Gly Val Arg Phe Asp
645 650 655
Asn Leu Cys Arg Leu Leu Pro Ala Asp Ile Arg Gly Leu Gly Val Ala
660 665 670
Ser Leu Val Leu His Val Pro Tyr Met Ala Pro Arg Ser Trp Lys Leu
675 680 685
Asp Phe Phe Ala Ala Lys Pro Tyr Leu Leu Gln Thr Val Ser Asn Asn
690 695 700
Leu Gly Ala Ser Ser Ser Phe Trp Tyr Arg Ser Ser Thr Gln Tyr Trp
705 710 715 720
Leu Asp Glu Lys Gln Ala Ala Ser Ser Ala Val Ser Ala Leu Pro Phe
725 730 735
Pro Ile Asn Val Val Ser Asp Met His Thr Val Asp Glu Ile Ser Gly
740 745 750
Arg Thr Arg Thr Gln Lys Tyr Thr Tyr Arg His Gly Val Tyr Asp Arg
755 760 765
Thr Glu Lys Glu Phe Ala Gly Phe Gly Arg Ile Asp Thr Trp Glu Glu
770 775 780
Glu Arg Asp Ser Glu Gly Thr Leu Ser Val Ser Thr Pro Pro Val Leu
785 790 795 800
Thr Arg Thr Trp Tyr His Thr Gly Gln Lys Gln Asp Glu Glu Arg Ala
805 810 815
Val Gln Gln Tyr Trp Gln Gly Asp Pro Ala Ala Phe Gln Val Lys Pro
820 825 830
Val Arg Leu Thr Arg Phe Asp Ala Ala Ala Ala Gln Asp Leu Pro Leu
835 840 845
Asp Ser Asn Asn Gly Gln Gln Glu Tyr Trp Leu Tyr Arg Ser Leu Gln
850 855 860
Gly Met Pro Leu Arg Thr Glu Ile Phe Ala Gly Asp Val Gly Gly Ser
865 870 875 880
Pro Pro Tyr Gln Val Glu Ser Phe Arg Tyr Gln Val Arg Leu Val Gln
885 890 895
Ser Ile Asp Ser Glu Cys Val Ala Leu Pro Met Gln Leu Glu Gln Leu
900 905 910
Thr Tyr Asn Tyr Glu Gln Ile Ala Ser Asp Pro Gln Cys Ser Gln Gln
915 920 925
Ile Gln Gln Trp Phe Asp Glu Tyr Gly Val Ala Ala Gln Ser Val Thr
930 935 940
Ile Gln Tyr Pro Arg Arg Ala Gln Pro Glu Asp Asn Pro Tyr Pro Arg
945 950 955 960
Thr Leu Pro Asp Thr Ser Trp Ser Ser Ser Tyr Asp Ser Gln Gln Met
965 970 975
Leu Leu Arg Leu Thr Arg Gln Arg Gln Lys Ala Tyr His Leu Ala Asp
980 985 990
Pro Glu Gly Trp Arg Leu Asn Ile Pro His Gln Thr Arg Leu Asp Ala
995 1000 1005
Phe Ile Tyr Ser Ala Asp Ser Val Pro Ala Glu Gly Ile Ser Ala
1010 1015 1020
Glu Leu Leu Glu Val Asp Gly Thr Leu Arg Ser Ser Ala Leu Glu
1025 1030 1035
Gln Ala Tyr Gly Gly Gln Ser Glu Ile Ile Tyr Ala Gly Gly Gly
1040 1045 1050
Glu Pro Asp Leu Arg Ala Leu Val His Tyr Thr Arg Ser Ala Val
1055 1060 1065
Leu Asp Glu Asp Cys Leu Gln Ala Tyr Glu Gly Val Leu Ser Asp
1070 1075 1080
Ser Gln Leu Asn Ser Leu Leu Ala Ser Ser Gly Tyr Gln Arg Ser
1085 1090 1095
Ala Arg Ile Leu Gly Ser Gly Asp Glu Val Asp Ile Phe Val Ala
1100 1105 1110
Glu Gln Gly Phe Thr Arg Tyr Ala Asp Glu Pro Asn Phe Phe Arg
1115 1120 1125
Ile Leu Gly Gln Gln Ser Ser Leu Leu Ser Gly Glu Gln Val Leu
1130 1135 1140
Thr Trp Asp Asp Asn Phe Cys Ala Val Thr Ser Ile Glu Asp Ala
1145 1150 1155
Leu Gly Asn Gln Ile Gln Ile Ala Tyr Asp Tyr Arg Phe Val Glu
1160 1165 1170
Ala Ile Gln Ile Thr Asp Thr Asn Asn Asn Val Asn Gln Val Ala
1175 1180 1185
Leu Asp Ala Leu Gly Arg Val Val Tyr Ser Arg Thr Trp Gly Thr
1190 1195 1200
Glu Glu Gly Ile Lys Thr Gly Phe Arg Pro Glu Val Glu Phe Ala
1205 1210 1215
Thr Pro Glu Thr Met Glu Gln Ala Leu Ala Leu Ala Ser Pro Leu
1220 1225 1230
Pro Val Ala Ser Cys Cys Val Tyr Asp Ala His Ser Trp Met Gly
1235 1240 1245
Thr Ile Thr Leu Ala Gln Leu Ser Glu Leu Val Pro Asp Ser Glu
1250 1255 1260
Lys Gln Trp Ser Phe Leu Ile Asp Asn Arg Leu Ile Met Pro Asp
` 1265 1270 1275
Gly Arg Ile Arg Ser Arg Gly Arg Asp Pro Trp Ser Leu His Arg
1280 1285 1290
Leu Leu Pro Pro Ala Val Gly Glu Leu Leu Ser Glu Ala Asp Arg
1295 1300 1305
Lys Pro Pro His Thr Val Ile Leu Ala Ala Asp Arg Tyr Pro Asp
1310 1315 1320
Asp Pro Ser Gln Gln Ile Gln Ala Ser Ile Val Phe Ser Asp Gly
1325 1330 1335
Phe Gly Arg Thr Ile Gln Thr Ala Lys Arg Glu Asp Thr Arg Trp
1340 1345 1350
Ala Ile Ala Glu Arg Val Asp Tyr Asp Gly Thr Gly Ala Val Ile
1355 1360 1365
Arg Ser Phe Gln Pro Phe Tyr Leu Asp Asp Trp Asn Tyr Val Gly
1370 1375 1380
Glu Glu Ala Val Ser Ser Ser Met Tyr Ala Thr Ile Tyr Tyr Tyr
1385 1390 1395
Asp Ala Leu Ala Arg Gln Leu Arg Met Val Asn Ala Lys Gly Tyr
1400 1405 1410
Glu Arg Arg Thr Ala Phe Tyr Pro Trp Phe Thr Val Asn Glu Asp
1415 1420 1425
Glu Asn Asp Thr Met Asp Ser Ser Leu Phe Ala Ser Pro Pro Ala
1430 1435 1440
Arg
<210>12
<211>2793
<212>DNA
<213>类芽孢杆菌IDAS 1529菌株
<400>12
atgaacacaa cgtccatata taggggcacg cctacgattt cagttgtgga taaccggaac 60
ttggagattc gcattcttca gtataaccgt atcgcggctg aagatccggc agatgagtgt 120
atcctgcgga acacgtatac gccgttaagc tatcttggca gcagcatgga tccccgtttg 180
ttctcgcaat atcaggatga tcgcggaaca ccgccgaata tacgaaccat ggcttccctg 240
agaggcgaag cgctgtgttc ggaaagtgtg gatgccggcc gcaaggcgga gctttttgat 300
atcgaggggc ggcccgtctg gcttatcgat gccaacggca cagagacgac tctcgaatat 360
gatgtcttag gcaggccaac agccgtattc gagcaacagg aaggtacgga ctccccccag 420
tgcagggagc ggtttattta tggtgagaag gaggcggatg cccaggccaa caatttgcgc 480
ggacaactgg ttcgccacta cgataccgcg ggccggatac agaccgacag catctccttg 540
gctggactgc cgttgcgcca aagccgtcaa ctgctgaaaa attgggatga acctggcgac 600
tggagtatgg atgaggaaag cgcctgggcc tcgttgctgg ctgccgaagc ttatgatacg 660
agctggcggt atgacgcgca ggacagggtg ctcgcccaaa ccgacgccaa agggaatctc 720
cagcaactga cttacaatga cgccggccag ccgcaggcgg tcagcctcaa gctgcaaggc 780
caagcggagc aacggatttg gaaccggatc gagtacaacg cggcgggtca agtggatctc 840
gccgaagccg ggaatggaat cgtaacggaa tatacttacg aggaaagcac gcagcggtta 900
atccgaaaaa aagattcccg cggactgtcc tccggggaaa gagaagtgct gcaggattat 960
cgttatgaat atgatccggt aggcaatatc ctttctattt acaatgaagc ggagccggtt 1020
cgttatttcc gcaatcaggc cgttgctccg aaaaggcaat atgcctacga tgccttgtat 1080
cagcttgtat ctagttcggg gcgggaatcc gacgcgcttc ggcagcagac gtcgcttcct 1140
cccttgatca cgcctatccc tctggacgat agccaatacg tcaattacgc tgaaaaatac 1200
agctatgatc aggcgggcaa tttaatcaag cttagccata acggggcaag tcaatataca 1260
acgaatgtgt atgtggacaa aagctcaaac cgggggattt ggcggcaagg ggaagacatc 1320
ccggatatcg cggcttcctt tgacagagca ggcaatcaac aagctttatt cccggggaga 1380
ccgttggaat gggatacacg caatcaatta agccgtgtcc atatggtcgt gcgcgaaggc 1440
ggagacaacg actgggaagg ctatctctat gacagctcgg gaatgcgtat cgtaaaacga 1500
tctacccgca aaacacagac aacgacgcaa acggatacga ccctctattt gccgggcctg 1560
gagctgcgaa tccgccagac cggggaccgg gtcacggaag cattgcaggt cattaccgtg 1620
gatgagggag cgggacaagt gagggtgctg cactgggagg atggaaccga gccgggcggc 1680
atcgccaatg atcagtaccg gtacagcctg aacgatcatc ttacctcctc tttattggaa 1740
gttgacgggc aaggtcagat cattagtaag gaagaatttt atccctatgg cggcacagcc 1800
ctgtggacag cccggtcaga ggtagaggca agctacaaga ccatccgcta ttcaggcaaa 1860
gagcgggatg ccacaggcct gtattattac ggacaccgct actatatgcc atggttgggt 1920
cgctggctga atccggaccc ggccggaatg gtagatggac taaacctgta ccgtatggtc 1980
aggaacaatc ctataggact gatggatccg aatgggaatg cgccaatcaa cgtggcggat 2040
tatagcttcg tgcatggtga tttagtttat ggtcttagta aggaaagagg aagatatcta 2100
aagctattta atccaaactt taatatggaa aaatcagact ctcctgctat ggttatagat 2160
caatataata ataatgttgc attgagtata actaaccaat ataaagtaga agaattgatg 2220
aaatttcaaa aagacccaca aaaagccgca cggaaaataa aggttccaga agggaatcgt 2280
ttatcgagga acgaaaatta tcctttgtgg cacgattata ttaacattgg agaagctaaa 2340
gctgcattta aggcctctca tattttccaa gaagtgaagg ggaattatgg gaaagattat 2400
tatcataaat tattattaga cagaatgata gaatcgccgt tgctgtggaa acgaggcagc 2460
aaactcgggc tagaaatcgc cgctaccaat cagagaacaa aaatacactt tgttcttgac 2520
aatttaaata tcgagcaggt ggttacgaaa gagggtagcg gcggtcagtc aatcacagct 2580
tcggagctcc gttatattta tcgaaatcgc gaaagattga acgggcgtgt cattttctat 2640
agaaataatg aaaggctaga tcaggctcca tggcaagaaa atccggactt atggagcaaa 2700
tatcaaccgg gtcttagaca aagcagcagt tcaagagtca aagaacgagg gattgggaac 2760
tttttccgcc ggttttcaat gaagagaaag tag 2793
<210>13
<211>930
<212>PRT
<213>类芽孢杆菌IDAS 1529菌株
<400>13
Met Asn Thr Thr Ser Ile Tyr Arg Gly Thr Pro Thr Ile Ser Val Val
1 5 10 15
Asp Asn Arg Asn Leu Glu Ile Arg Ile Leu Gln Tyr Asn Arg Ile Ala
20 25 30
Ala Glu Asp Pro Ala Asp Glu Cys Ile Leu Arg Asn Thr Tyr Thr Pro
35 40 45
Leu Ser Tyr Leu Gly Ser Ser Met Asp Pro Arg Leu Phe Ser Gln Tyr
50 55 60
Gln Asp Asp Arg Gly Thr Pro Pro Asn Ile Arg Thr Met Ala Ser Leu
65 70 75 80
Arg Gly Glu Ala Leu Cys Ser Glu Ser Val Asp Ala Gly Arg Lys Ala
85 90 95
Glu Leu Phe Asp lle Glu Gly Arg Pro Val Trp Leu Ile Asp Ala Asn
100 105 110
Gly Thr Glu Thr Thr Leu Glu Tyr Asp Val Leu Gly Arg Pro Thr Ala
115 120 125
Val Phe Glu Gln Gln Glu Gly Thr Asp Ser Pro Gln Cys Arg Glu Arg
130 135 140
Phe Ile Tyr Gly Glu Lys Glu Ala Asp Ala Gln Ala Asn Asn Leu Arg
145 150 155 160
Gly Gln Leu Val Arg His Tyr Asp Thr Ala Gly Arg Ile Gln Thr Asp
165 170 175
Ser Ile Ser Leu Ala Gly Leu Pro Leu Arg Gln Ser Arg Gln Leu Leu
180 185 190
Lys Asn Trp Asp Glu Pro Gly Asp Trp Ser Met Asp Glu Glu Ser Ala
195 200 205
Trp Ala Ser Leu Leu Ala Ala Glu Ala Tyr Asp Thr Ser Trp Arg Tyr
210 215 220
Asp Ala Gln Asp Arg Val Leu Ala Gln Thr Asp Ala Lys Gly Asn Leu
225 230 235 240
Gln Gln Leu Thr Tyr Asn Asp Ala Gly Gln Pro Gln Ala Val Ser Leu
245 250 255
Lys Leu Gln Gly Gln Ala Glu Gln Arg Ile Trp Asn Arg Ile Glu Tyr
260 265 270
Asn Ala Ala Gly Gln Val Asp Leu Ala Glu Ala Gly Asn Gly Ile Val
275 280 285
Thr Glu Tyr Thr Tyr Glu Glu Ser Thr Gln Arg Leu Ile Arg Lys Lys
290 295 300
Asp Ser Arg Gly Leu Ser Ser Gly Glu Arg Glu Val Leu Gln Asp Tyr
305 310 315 320
Arg Tyr Glu Tyr Asp Pro Val Gly Asn Ile Leu Ser Ile Tyr Asn Glu
325 330 335
Ala Glu Pro Val Arg Tyr Phe Arg Asn Gln Ala Val Ala Pro Lys Arg
340 345 350
Gln Tyr Ala Tyr Asp Ala Leu Tyr Gln Leu Val Ser Ser Ser Gly Arg
355 360 365
Glu Ser Asp Ala Leu Arg Gln Gln Thr Ser Leu Pro Pro Leu Ile Thr
370 375 380
Pro Ile Pro Leu Asp Asp Ser Gln Tyr Val Asn Tyr Ala Glu Lys Tyr
385 390 395 400
Ser Tyr Asp Gln Ala Gly Asn Leu Ile Lys Leu Ser His Asn Gly Ala
405 410 415
Ser Gln Tyr Thr Thr Asn Val Tyr Val Asp Lys Ser Ser Asn Arg Gly
420 425 430
Ile Trp Arg Gln Gly Glu Asp Ile Pro Asp Ile Ala Ala Ser Phe Asp
435 440 445
Arg Ala Gly Asn Gln Gln Ala Leu Phe Pro Gly Arg Pro Leu Glu Trp
450 455 460
Asp Thr Arg Asn Gln Leu Ser Arg Val His Met Val Val Arg Glu Gly
465 470 475 480
Gly Asp Asn Asp Trp Glu Gly Tyr Leu Tyr Asp Ser Ser Gly Met Arg
485 490 495
Ile Val Lys Arg Ser Thr Arg Lys Thr Gln Thr Thr Thr Gln Thr Asp
500 505 510
Thr Thr Leu Tyr Leu Pro Gly Leu Glu Leu Arg Ile Arg Gln Thr Gly
515 520 525
Asp Arg Val Thr Glu Ala Leu Gln Val Ile Thr Val Asp Glu Gly Ala
530 535 540
Gly Gln Val Arg Val Leu His Trp Glu Asp Gly Thr Glu Pro Gly Gly
545 550 555 560
Ile Ala Asn Asp Gln Tyr Arg Tyr Ser Leu Asn Asp His Leu Thr Ser
565 570 575
Ser Leu Leu Glu Val Asp Gly Gln Gly Gln Ile Ile Ser Lys Glu Glu
580 585 590
Phe Tyr Pro Tyr Gly Gly Thr Ala Leu Trp Thr Ala Arg Ser Glu Val
595 600 605
Glu Ala Ser Tyr Lys Thr Ile Arg Tyr Ser Gly Lys Glu Arg Asp Ala
610 615 620
Thr Gly Leu Tyr Tyr Tyr Gly His Arg Tyr Tyr Met Pro Trp Leu Gly
625 630 635 640
Arg Trp Leu Asn Pro Asp Pro Ala Gly Met Val Asp Gly Leu Asn Leu
645 650 655
Tyr Arg Met Val Arg Asn Asn Pro Ile Gly Leu Met Asp Pro Asn Gly
660 665 670
Asn Ala Pro Ile Asn Val Ala Asp Tyr Ser Phe Val His Gly Asp Leu
675 680 685
Val Tyr Gly Leu Ser Lys Glu Arg Gly Arg Tyr Leu Lys Leu Phe Asn
690 695 700
Pro Asn Phe Asn Met Glu Lys Ser Asp Ser Pro Ala Met Val Ile Asp
705 710 715 720
Gln Tyr Asn Asn Asn Val Ala Leu Ser Ile Thr Asn Gln Tyr Lys Val
725 730 735
Glu Glu Leu Met Lys Phe Gln Lys Asp Pro Gln Lys Ala Ala Arg Lys
740 745 750
Ile Lys Val Pro Glu Gly Asn Arg Leu Ser Arg Asn Glu Asn Tyr Pro
755 760 765
Leu Trp His Asp Tyr Ile Asn Ile Gly Glu Ala Lys Ala Ala Phe Lys
770 775 780
Ala Ser His Ile Phe Gln Glu Val Lys Gly Asn Tyr Gly Lys Asp Tyr
785 790 795 800
Tyr His Lys Leu Leu Leu Asp Arg Met Ile Glu Ser Pro Leu Leu Trp
805 810 815
Lys Arg Gly Ser Lys Leu Gly Leu Glu Ile Ala Ala Thr Asn Gln Arg
820 825 830
Thr Lys Ile His Phe Val Leu Asp Asn Leu Asn Ile Glu Gln Val Val
835 840 845
Thr Lys Glu Gly Ser Gly Gly Gln Ser Ile Thr Ala Ser Glu Leu Arg
850 855 860
Tyr Ile Tyr Arg Asn Arg Glu Arg Leu Asn Gly Arg Val Ile Phe Tyr
865 870 875 880
Arg Asn Asn Glu Arg Leu Asp Gln Ala Pro Trp Gln Glu Asn Pro Asp
885 890 895
Leu Trp Ser Lys Tyr Gln Pro Gly Leu Arg Gln Ser Ser Ser Ser Arg
900 905 910
Val Lys Glu Arg Gly Ile Gly Asn Phe Phe Arg Arg Phe Ser Met Lys
915 920 925
Arg Lys
930
<210>14
<211>1791
<212>DNA
<213>人工序列
<220>
<223>ORF7的核酸序列,其编码cry-样蛋白
<400>14
atgaactcaa atgaaccaaa tttatctgat gttgttaatt gtttaagtga ccccaatagt 60
gacttggaga agtctggcgg tggagtagcg ctagatgttg gaatgtcatt gatatccgaa 120
cttcttggta cggttccagt tgctggatca attcttcaat ttgtattcga taaattgtgg 180
tttatttttg gcccttctga gtgggactca cttatggaac atgttgaagc attaattgat 240
agtaaaatac aagagcaggt aaaaagaagt gcacaagatg aactaaatgc aattacaaat 300
aacttatcta cgtatttgaa atttctagat gcatgggaaa atgattctaa taatttaaga 360
gcgagagctg tagtgaaaga ccaatttgta ggccttgaac agactcttga aagaaaaatg 420
gttagtgttt ttggaagtac gggtcatgaa gtgcatcttt tgccaatttt cgctcaagca 480
gccaacctcc acctaattct attaagagat gctgagaaat atggaaagag atggggttgg 540
gcagatagag aaattcaagt atattatgat aaccagattc gttatatcca tgaatatacg 600
gaccattgta ttaaatatta taatcaagga ttaagtaaac tgaaaggttc tacctatcaa 660
gattgggata agtataatcg ttttagaaga gaaatgaccc taactgttct tgatttgatt 720
tcaattttcc catcgtatga tactagaact tacccaattg atacaatagg tcaattgaca 780
agggaagttt attcggattt acttattgct aacccgtctg ggatgcagac tttcactaat 840
gtagatttcg acaatattct tattagaaaa cctcatttaa tggatttctt aagaactctt 900
gagattttta ccgatcgaca taacgcaagc agacacaacg tatattgggg cggacatcga 960
gtgcattctt cttacacagg aggtaatttt gaaaattttg aatctccctt atatggcagt 1020
gaagcaaatg tagaaccccg aacatggttg agttttggag aatctcaagt ctataatata 1080
cgttcgaagc ctgagtggga tagaggaagt actgcaatta gtggctccta tgaatttcga 1140
ggagtgacag gatgttcttt ttatcgaatg ggaaattttg ctggcaccgt agccctaact 1200
taccgacagt ttggtaacga aggttctcaa atcccattgc acaggctatg tcatgttact 1260
tattttagaa gatctcaagc tgtgggggcg acttcgagac agacgttaac aagtggtccg 1320
ctattttcct ggacacatag tagtgctacg gaaacgaata tcattcaccc gacaaaaatt 1380
acacaaatac caatggtgaa ggctagttcc cttggatcag gtacttctgt tgtccaagga 1440
ccaggcttta caggagggga tgtacttcga agaaatagcc ccggtagcac aggaacttta 1500
agagttaacg tcaattcacc attatcacag agatatcgta taagaattcg ttacgcttct l560
actacggatt tagatttttt tgtcattcgc ggaaatacga cagttaataa ttttagattt 1620
gggaacacta tgcgtaaagg agaccctata acctctcgat catttagatt tgcggctttt 1680
agtacaccat ttacttttgc tagctcacag gatgaactta gaataaatgt acaaaatttc 1740
aataatggtg aagaagttta tatagataga atcgaagtta ttccagtttg a 1791
<210>15
<211>596
<212>PRT
<213>人工序列
<220>
<223>ORF7编码的氨基酸序列
<400>15
Met Asn Ser Asn Glu Pro Asn Leu Ser Asp Val Val Asn Cys Leu Ser
1 5 10 15
Asp Pro Asn Ser Asp Leu Glu Lys Ser Gly Gly Gly Val Ala Leu Asp
20 25 30
Val Gly Met Ser Leu Ile Ser Glu Leu Leu Gly Thr Val Pro Val Ala
35 40 45
Gly Ser Ile Leu Gln Phe Val Phe Asp Lys Leu Trp Phe Ile Phe Gly
50 55 60
Pro Ser Glu Trp Asp Ser Leu Met Glu His Val Glu Ala Leu Ile Asp
65 70 75 80
Ser Lys Ile Gln Glu Gln Val Lys Arg Ser Ala Gln Asp Glu Leu Asn
85 90 95
Ala Ile Thr Asn Asn Leu Ser Thr Tyr Leu Lys Phe Leu Asp Ala Trp
100 105 110
Glu Asn Asp Ser Asn Asn Leu Arg Ala Arg Ala Val Val Lys Asp Gln
115 120 125
Phe Val Gly Leu Glu Gln Thr Leu Glu Arg Lys Met Val Ser Val Phe
130 135 140
Gly Ser Thr Gly His Glu Val His Leu Leu Pro Ile Phe Ala Gln Ala
145 150 155 160
Ala Asn Leu His Leu Ile Leu Leu Arg Asp Ala Glu Lys Tyr Gly Lys
165 170 175
Arg Trp Gly Trp Ala Asp Arg Glu Ile Gln Val Tyr Tyr Asp Asn Gln
180 185 190
Ile Arg Tyr Ile His Glu Tyr Thr Asp His Cys Ile Lys Tyr Tyr Asn
195 200 205
Gln Gly Leu Ser Lys Leu Lys Gly Ser Thr Tyr Gln Asp Trp Asp Lys
210 210 220
Tyr Asn Arg Phe Arg Arg Glu Met Thr Leu Thr Val Leu Asp Leu Ile
225 230 235 240
Ser Ile Phe Pro Ser Tyr Asp Thr Arg Thr Tyr Pro Ile Asp Thr Ile
245 250 255
Gly Gln Leu Thr Arg Glu Val Tyr Ser Asp Leu Leu Ile Ala Asn Pro
260 265 270
Ser Gly Met Gln Thr Phe Thr Asn Val Asp Phe Asp Asn Ile Leu Ile
275 280 285
Arg Lys Pro His Leu Met Asp Phe Leu Arg Thr Leu Glu Ile Phe Thr
290 295 300
Asp Arg His Asn Ala Ser Arg His Asn Val Tyr Trp Gly Gly His Arg
305 310 315 320
Val His Ser Ser Tyr Thr Gly Gly Asn Phe Glu Asn Phe Glu Ser Pro
325 330 335
Leu Tyr Gly Ser Glu Ala Asn Val Glu Pro Arg Thr Trp Leu Ser Phe
340 345 350
Gly Glu Ser Gln Val Tyr Asn Ile Arg Ser Lys Pro Glu Trp Asp Arg
355 360 365
Gly Ser Thr Ala Ile Ser Gly Ser Tyr Glu Phe Arg Gly Val Thr Gly
370 375 380
Cys Ser Phe Tyr Arg Met Gly Asn Phe Ala Gly Thr Val Ala Leu Thr
385 390 395 400
Tyr Arg Gln Phe Gly Asn Glu Gly Ser Gln Ile Pro Leu His Arg Leu
405 410 415
Cys His Val Thr Tyr Phe Arg Arg Ser Gln Ala Va1 Gly Ala Thr Ser
420 425 430
Arg Gln Thr Leu Thr Ser Gly Pro Leu Phe Ser Trp Thr His Ser Ser
435 440 445
Ala Thr Glu Thr Asn Ile Ile His Pro Thr Lys Ile Thr Gln Ile Pro
450 455 460
Met Val Lys Ala Ser Ser Leu Gly Ser Gly Thr Ser Val Val Gln Gly
465 470 475 480
Pro Gly Phe Thr Gly Gly Asp Val Leu Arg Arg Asn Ser Pro Gly Ser
485 490 495
Thr Gly Thr Leu Arg Val Asn Val Asn Ser Pro Leu Ser Gln Arg Tyr
500 505 510
Arg Ile Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Asp Phe Phe Val
515 520 525
Ile Arg Gly Ash Thr Thr Val Asn Asn Phe Arg Phe Gly Asn Thr Met
530 535 540
Arg Lys Gly Asp Pro Ile Thr Ser Arg Ser Phe Arg Phe Ala Ala Phe
545 550 555 560
Ser Thr Pro Phe Thr Phe Ala Ser Ser Gln Asp Glu Leu Arg Ile Asn
565 570 575
Val Gln Asn Phe Asn Asn Gly Glu Glh Val Tyr Ile Asp Arg Ile Glu
580 585 590
Val Ile Pro Val
595
<210>16
<211>1547
<212>DNA
<213>人工序列
<220>
<223>IDAS1529 16S rDNA的核酸序列
<400>16
tggagagttt gatcctggct caggacgaac gctggcggcg tgcctaatac atgcaagtcg 60
agcggakcaa cggtttcctt cgggaaaccr ttagcttagc ggcggacggg tgagtaatac 120
gtaggtaacc tgcccttaag accgggataa ctcacggaaa cgtgggctaa taccggatag 180
gcgatttcct cgcatgaggg aatcgggaaa ggcggagcaa tctgccactt atggatggac 240
ctacggcgca ttagctagtt ggtggggtaa cggctcacca aggcgacgat gcgtagccga 300
cctgagaggg tgatcggcca cactgggact gagacacggc ccagactcct acgggaggca 360
gcagtaggga atcttccgca atggacgcaa gtctgacgga gcaacgccgc gtgagtgatg 420
aaggttttcg gatcgtaaag ctctgttgcc agggaagaac gctatggaga gtaactgttc 480
cataggtgac ggtacctgag aagaaagccc cggctaacta cgtgccagca gccgcggtaa 540
tacgtagggg gcaagcgttg tccggaatta ttgggcgtaa agcgcgcgca ggcggtcatg 600
taagtctggt gtttaaaccc ggggctcaac tccgggtcgc atcggaaact gtgtgacttg 660
agtgcagaag aggaaagtgg aattccacgt gtagcggtga aatgcgtaga gatgtggagg 720
aacaccagtg gcgaaggcga ctttctgggc tgtaactgac gctgaggcgc gaaagcgtgg 780
ggagcaaaca ggattagata ccctggtagt ccacgccgta aacgatgaat gctaggtgtt 840
aggggtttcg atacccttgg tgccgaagtt aacacattaa gcattccgcc tggggagtac 900
ggtcgcaaga ctgaaactca aaggaattga cggggacccg cacaagcagt ggagtatgtg 960
gtttaattcg aagcaacgcg aagaacctta ccaggtcttg acatccctct gaccgtccta 1020
gagatagggc ttcccttcgg ggcagaggag acaggtggtg catggttgtc gtcagctcgt 1080
gtcgtgagat gttgggttaa gtcccgcaac gagcgcaacc cttaacttta gttgccagca 1140
ttaagttggg cactctagag tgactgccgg tgacaaaccg gaggaaggtg gggatgacgt 1200
caaatcatca tgccccttat gacctgggct acacacgtac tacaatggct ggtacaacgg 1260
gaagcgaagc cgcgaggtgg agcgaatcct aaaaagccag tctcagttcg gattgcaggc 1320
tgcaactcgc ctgcatgaag tcggaattgc tagtaatcgc ggatcagcat gccgcggtga 1380
atacgttccc gggtcttgta cacaccgccc gtcacaccac gagagtttac aacacccgaa 1440
gtcggtgggg taaccgcaag gagccagccg ccgaaggtgg ggtagatgat tggggtgaag 1500
tcgtaacaag gtagccgtat cggaaggtgc ggytggatca cctcctt 1547
<210>17
<211>20
<212>PRT
<213>人工序列
<220>
<223>来自IDAS1529培养液级分的经纯化毒素的N-末端氨基酸序列
<400>17
Asp Ile Thr Leu Lys Val Ala Ile Tyr Pro Tyr Val Pro Asp Pro Ser
1 5 10 15
Arg Phe Gln Ala
20
<210>18
<211>379
<212>PRT
<213>人工序列
<220>
<223>来自解硫胺素芽孢杆菌(Bacillus thiaminolyticus)的硫胺素酶I的氨基酸序列
<400>18
Ala His Ser Asp Ala Ser Ser Asp Ile Thr Leu Lys Val Ala Ile Tyr
1 5 10 15
Pro Tyr Val Pro Asp Pro Ala Arg Phe Gln Ala Ala Val Leu Asp Gln
20 25 30
Trp Gln Arg Gln Glu Pro Gly Val Lys Leu Glu Phe Thr Asp Trp Asp
35 40 45
Ser Tyr Ser Ala Asp Pro Pro Asp Asp Leu Asp Val Phe Val Leu Asp
50 55 60
Ser Ile Phe Leu Ser His Phe Val Asp Ala Gly Tyr Leu Leu Pro Phe
65 70 75 80
Gly Ser Gln Asp Ile Asp Gln Ala Glu Asp Val Leu Pro Phe Ala Leu
85 90 95
Gln Gly Ala Lys Arg Asn Gly Glu Val Tyr Gly Leu Pro Gln Ile Leu
100 105 110
Cys Thr Asn Leu Leu Phe Tyr Arg Lys Gly Asp Leu Lys Ile Gly Gln
115 120 125
Val Asp Asn Ile Tyr Glu Leu Tyr Lys Lys Ile Gly Thr Ser His Ser
130 135 140
Glu Gln Ile Pro Pro Pro Gln Asn Lys Gly Leu Leu Ile Asn Met Ala
145 150 155 160
Gly Gly Thr Thr Lys Ala Ser Me tTyr Leu Glu Ala Leu Ile Asp Val
l65 170 175
Thr Gly Gln Tyr Thr Glu Tyr Asp Leu Leu Pro Pro Leu Asp Pro Leu
180 185 190
Asn Asp Lys Val Ile Arg Gly Leu Arg Leu Leu Ile Asn Met Ala Gly
195 200 205
Glu Lys Pro Ser Gln Tyr Val Pro Glu Asp Gly Asp Ala Tyr Val Arg
210 215 220
Ala Ser Trp Phe Ala Gln Gly Ser Gly Arg Ala Phe Ile Gly Tyr Ser
225 230 235 240
Glu Ser Met Met Arg Met Gly Asp Tyr Ala Glu Gln Val Arg Phe Lys
245 250 255
Pro Ile Ser Ser Ser Ala Gly Gln Asp Ile Pro Leu Phe Tyr Ser Asp
260 265 270
Val Val Ser Val Asn Ser Lys Thr Ala His Pro Glu Leu Ala Lys Lys
275 280 285
Leu Ala Asn Val Met Ala Ser Ala Asp Thr Val Glu Gln Ala Leu Arg
290 295 300
Pro Gln Ala Asp Gly Gln Tyr Pro Gln Tyr Leu Leu Pro Ala Arg His
305 310 315 320
Gln Val Tyr Glu Ala Leu Met Gln Asp Tyr Pro Ile Tyr Ser Glu Leu
325 330 335
Ala Gln Ile Val Asn Lys Pro Ser Asn Arg Val Phe Arg Leu Gly Pro
340 345 350
Glu Val Arg Thr Trp Leu Lys Asp Ala Lys Gln Val Leu Pro Glu Ala
355 360 365
Leu Gly Leu Thr Asp Val Ser Ser Leu Ala Ser
370 375
<210>19
<211>953
<212>PRT
<213>类芽孢杆菌IDAS 1529菌株
<400>19
Met Lys Met Ile Pro Trp Thr His His Tyr Leu Leu His Arg Leu Arg
1 5 10 15
Gly Glu Met Glu Val Lys Pro Met Asn Thr Thr Ser Ile Tyr Arg Gly
20 25 30
Thr Pro Thr Ile Ser Val Val Asp Asn Arg Asn Leu Glu Ile Arg Ile
35 40 45
Leu Gln Tyr Asn Arg Ile Ala Ala Glu Asp Pro Ala Asp Glu Cys Ile
50 55 60
Leu Arg Asn Thr Tyr Thr Pro Leu Ser Tyr Leu Gly Ser Ser Met Asp
65 70 75 80
Pro Arg Leu Phe Ser Gln Tyr Gln Asp Asp Arg Gly Thr Pro Pro Asn
85 90 95
Ile Arg Thr Met Ala Ser Leu Arg Gly Glu Ala Leu Cys Ser Glu Ser
100 105 110
Val Asp Ala Gly Arg Lys Ala Glu Leu Phe Asp Ile Glu Gly Arg Pro
115 120 125
Val Trp Leu Ile Asp Ala Asn Gly Thr Glu Thr Thr Leu Glu Tyr Asp
130 135 140
Val Leu Gly Arg Pro Thr Ala Val Phe Glu Gln Gln Glu Gly Thr Asp
145 150 155 160
Ser Pro Gln Cys Arg Glu Arg Phe Ile Tyr Gly Glu Lys Glu Ala Asp
165 170 175
Ala Gln Ala Asn Asn Leu Arg Gly Gln Leu Val Arg His Tyr Asp Thr
180 185 190
Ala Gly Arg Ile Gln Thr Asp Ser Ile Ser Leu Ala Gly Leu Pro Leu
195 200 205
Arg Gln Ser Arg Gln Leu Leu Lys Asn Trp Asp Glu Pro Gly Asp Trp
210 215 220
Ser Met Asp Glu Glu Ser Ala Trp Ala Ser Leu Leu Ala Ala Glu Ala
225 230 235 240
Tyr Asp Thr Ser Trp Arg Tyr Asp Ala Gln Asp Arg Val Leu Ala Gln
245 250 255
Thr Asp Ala Lys Gly Asn Leu Gln Gln Leu Thr Tyr Asn Asp Ala Gly
260 265 270
Gln Pro Gln Ala Val Ser Leu Lys Leu Gln Gly Gln Ala Glu Gln Arg
275 280 285
Ile Trp Asn Arg Ile Glu Tyr Asn Ala Ala Gly Gln Val Asp Leu Ala
290 295 300
Glu Ala Gly Asn Gly Ile Val Thr Glu Tyr Thr Tyr Glu Glu Ser Thr
305 310 315 320
Gln Arg Leu Ile Arg Lys Lys Asp Ser Arg Gly Leu Ser Ser Gly Glu
325 330 335
Arg Glu Va1 Leu Gln Asp Tyr Arg Tyr Glu Tyr Asp Pro Val Gly Asn
340 345 350
Ile Leu Ser Ile Tyr Asn Glu Ala Glu Pro Val Arg Tyr Phe Arg Asn
355 360 365
Gln Ala Val Ala Pro Lys Arg Gln Tyr Ala Tyr Asp Ala Leu Tyr Gln
370 375 380
Leu Val Ser Ser Ser Gly Arg Glu Ser Asp Ala Leu Arg Gln Gln Thr
385 390 395 400
Ser Leu Pro Pro Leu Ile Thr Pro Ile Pro Leu Asp Asp Ser Gln Tyr
405 410 415
Val Asn Tyr Ala Glu Lys Tyr Ser Tyr Asp Gln Ala Gly Asn Leu Ile
420 425 430
Lys Leu Ser His Asn Gly Ala Ser Gln Tyr Thr Thr Asn Val Tyr Val
435 440 445
Asp Lys Ser Ser Asn Arg Gly Ile Trp Arg Gln Gly Glu Asp Ile Pro
450 455 460
Asp Ile Ala Ala Ser Phe Asp Arg Ala Gly Asn Gln Gln Ala Leu Phe
465 470 475 480
Pro Gly Arg Pro Leu Glu Trp Asp Thr Arg Asn Gln Leu Ser Arg Val
485 490 495
His Met Val Val Arg Glu Gly Gly Asp Asn Asp Trp Glu Gly Tyr Leu
500 505 510
Tyr Asp Ser Ser Gly Met Arg Ile Val Lys Arg Ser Thr Arg Lys Thr
515 520 525
Gln Thr Thr Thr Gln Thr Asp Thr Thr Leu Tyr Leu Pro Gly Leu Glu
530 535 540
Leu Arg Ile Arg Gln Thr Gly Asp Arg Val Thr Glu Ala Leu Gln Val
545 550 555 560
Ile Thr Val Asp Glu Gly Ala Gly Gln Val Arg Val Leu His Trp Glu
565 570 575
Asp Gly Thr Glu Pro Gly Gly Ile Ala Asn Asp Gln Tyr Arg Tyr Ser
580 585 590
Leu Asn Asp His Leu Thr Ser Ser Leu Leu Glu Val Asp Gly Gln Gly
595 600 605
Gln Ile Ile Ser Lys Glu Glu Phe Tyr Pro Tyr Gly Gly Thr Ala Leu
610 615 620
Trp Thr Ala Arg Ser Glu Val Glu Ala Ser Tyr Lys Thr Ile Arg Tyr
625 630 635 640
Ser Gly Lys Glu Arg Asp Ala Thr Gly Leu Tyr Tyr Tyr Gly His Arg
645 650 655
Tyr Tyr Met Pro Trp Leu Gly Arg Trp Leu Asn Pro Asp Pro Ala Gly
660 665 670
Met Val Asp Gly Leu Asn Leu Tyr Arg Met Val Arg Asn Asn Pro Ile
675 680 685
Gly Leu Met Asp Pro Asn Gly Asn Ala Pro Ile Asn Val Ala Asp Tyr
690 695 700
Ser Phe Val His Gly Asp Leu Val Tyr Gly Leu Ser Lys Glu Arg Gly
705 710 715 720
Arg Tyr Leu Lys Leu Phe Asn Pro Asn Phe Asn Met Glu Lys Ser Asp
725 730 735
Ser Pro Ala Met Val Ile Asp Gln Tyr Asn Asn Asn Val Ala Leu Ser
740 745 750
Ile Thr Asn Gln Tyr Lys Val Glu Glu Leu Met Lys Phe Gln Lys Asp
755 760 765
Pro Gln Lys Ala Ala Arg Lys Ile Lys Val Pro Glu Gly Asn Arg Leu
770 775 780
Ser Arg Asn Glu Asn Tyr Pro Leu Trp His Asp Tyr Ile Asn Ile Gly
785 790 795 800
Glu Ala Lys Ala Ala Phe Lys Ala Ser His Ile Phe Gln Glu Val Lys
805 810 815
Gly Asn Tyr Gly Lys Asp Tyr Tyr His Lys Leu Leu Leu Asp Arg Met
820 825 830
Ile Glu Ser Pro Leu Leu Trp Lys Arg Gly Ser Lys Leu Gly Leu Glu
835 840 845
Ile Ala Ala Thr Asn Gln Arg Thr Lys Ile His Phe Val Leu Asp Asn
850 855 860
Leu Asn Ile Glu Gln Val Val Thr Lys Glu Gly Ser Gly Gly Gln Ser
865 870 875 880
Ile Thr Ala Ser Glu Leu Arg Tyr Ile Tyr Arg Asn Arg Glu Arg Leu
885 890 895
Asn Gly Arg Val Ile Phe Tyr Arg Asn Asn Glh Arg Leu Asp Gln Ala
900 905 910
Pro Trp Gln Glu Asn Pro Asp Leu Trp Ser Lys Tyr Gln Pro Gly Leu
915 920 925
Arg Gln Ser Ser Ser Ser Arg Val Lys Glu Arg Gly Ile Gly Asn Phe
930 935 940
Phe Arg Arg Phe Ser Met Lys Arg Lys
945 950
<210>20
<211>4482
<212>DNA
<213>致病杆菌(Xenorhabdus)Xwi菌株
<400>20
atgcagggtt caacaccttt gaaacttgaa ataccgtcat tgccctctgg gggcggatca 60
ctaaaaggaa tgggagaagc actcaatgcc gtcggagcgg aagggggagc gtcattttca 120
ctgcccttgc cgatctctgt cgggcgtggt ctggtgccgg tgctatcact gaattacagc 180
agtactgccg gcaatgggtc attcgggatg gggtggcaat gtggggttgg ttttatcagc 240
ctgcgtaccg ccaagggcgt tccgcactat acgggacaag atgagtatct cgggccggat 300
ggggaagtgt tgagtattgt gccggacagc caagggcaac cagagcaacg caccgcaacc 360
tcactgttgg ggacggttct gacacagccg catactgtta cccgctatca gtcccgcgtg 420
gcagaaaaaa tcgttcgttt agaacactgg cagccacagc agagacgtga ggaagagacg 480
tctttttggg tactttttac tgcggatggt ttagtgcacc tattcggtaa gcatcaccat 540
gcacgtattg ctgacccgca ggatgaaacc agaattgccc gctggctgat ggaggaaacc 600
gtcacgcata ccggggaaca tatttactat cactatcggg cagaagacga tcttgactgt 660
gatgagcatg aacttgctca gcattcaggt gttacggccc agcgttatct ggcaaaagtc 720
agctatggca atactcagcc ggaaaccgct tttttcgcgg taaaatcagg tattcctgct 780
gataatgact ggctgtttca tctggtattt gattacggtg agcgctcatc ttcgctgaac 840
tctgtacccg aattcaatgt gtcagaaaac aatgtgtctg aaaacaatgt gcctgaaaaa 900
tggcgttgtc gtccggacag tttctcccgc tatgaatatg ggtttgaaat tcgaacccgt 960
cgcttgtgtc gccaagttct gatgtttcat cagctgaaag cgctggcagg ggaaaaggtt 1020
gcagaagaaa caccggcgct ggtttcccgt cttattctgg attatgacct gaacaacaag l080
gtttccttgc tgcaaacggc ccgcagactg gcccatgaaa cggacggtac gccagtgatg 1140
atgtccccgc tggaaatgga ttatcaacgt gttaatcatg gcgtgaatct gaactggcag 1200
tccatgccgc agttagaaaa aatgaacacg ttgcagccat accaattggt tgatttatat 1260
ggagaaggaa tttccggcgt actttatcag gatactcaga aagcctggtg gtaccgtgct 1320
ccggtacggg atatcactgc cgaaggaacg aatgcggtta cctatgagga ggccaaacca 1380
ctgccacata ttccggcaca acaggaaagc gcgatgttgt tggacatcaa tggtgacggg 1440
cgtctggatt gggtgattac ggcatcaggg ttacggggct accacaccat gtcaccggaa 1500
ggtgaatgga caccctttat tccattatcc gctgtgccaa tggaatattt ccatccgcag 1560
gcaaaactgg ctgatattga tggggctggg ctgcctgact tagcgcttat cgggccaaat 1620
agtgtacgtg tctggtcaaa taatcgggca ggatgggatc gcgctcagga tgtgattcat 1680
ttgtcagata tgccactgcc ggttcccggc agaaatgagc gtcatcttgt cgcattcagt 1740
gatatgacag gctccgggca atcacatctg gtggaagtaa cggcagatag cgtgcgctac 1800
tggccgaacc tggggcatgg aaaatttggt gagcctctga tgatgacagg cttccagatt 1860
agcggggaaa cgtttaaccc cgacagactg tatatggtag acatagatgg ctcaggcacc 1920
accgatttta tttatgcccg caatacttac cttgaactct atgccaatga aagcggcaat 1980
cattttgctg aacctcagcg tattgatctg ccggatgggg tacgttttga tgatacttgt 2040
cggttacaaa tagcggatac acaaggatta gggactgcca gcattatttt gacgatcccc 2100
catatgaagg tgcagcactg gcgattggat atgaccatat tcaagccttg gctgctgaat 2160
gccgtcaata acaatatggg aacagaaacc acgctgtatt atcgcagctc tgcccagttc 2220
tggctggatg agaaattaca ggcttctgaa tccgggatga cggtggtcag ctacttaccg 2280
ttcccggtgc atgtgttgtg gcgcacggaa gtgctggatg aaatttccgg taaccgattg 2340
accagccatt atcattactc acatggtgcc tgggatggtc tggaacggga gtttcgtggt 2400
tttgggcggg tgacacaaac tgatattgat tcacgggcga gtgcgacaca ggggacacat 2460
gctgaaccac cggcaccttc gcgcacggtt aattggtacg gcactggcgt acgggaagtc 2520
gatattcttc tgcccacgga atattggcag ggggatcaac aggcatttcc ccattttacc 2580
ccacgcttta cccgttatga cgaaaaatcc ggtggtgata tgacggtcac gccgagcgaa 2640
caggaagaat actggttaca tcgagcctta aaaggacaac gtttacgcag tgagctgtat 2700
ggggatgatg attctatact ggccggtacg ccttattcag tggatgaatc ccgcacccaa 2760
gtacgtttgt taccggtgat ggtatcggac gtgcctgcgg tactggtttc ggtggccgaa 2820
tcccgccaat accgatatga acgggttgct accgatccac agtgcagcca aaagatcgtc 2880
cttaaatctg atgcgttagg atttccgcag gacaatcttg agattgccta ttcgagacgt 2940
ccacagcctg agttctcgcc ttatccggat accctgcccg aaacactttt caccagcagt 3000
ttcgacgaac agcagatgtt ccttcgtctg acacgccagc gttcttctta tcatcatctg 3060
aatcatgatg ataatacgtg gatcacaggg cttatggata cctcacgcag tgacgcacgt 3120
atttatcaag ccgataaagt gccggacggt ggattttccc ttgaatggtt ttctgccaca 3180
ggtgcaggag cattgttgt tgcctgatgcc gcagccgatt atctgggaca tcagcgtgta 3240
gcatataccg gtccagaaga acaacccgct attcctccgc tggtggcata cattgaaacc 3300
gcagagtttg atgaacgatc gttggcggct tttgaggagg tgatggatga gcaggagctg 3360
acaaaacagc tgaatgatgc gggctggaat acggcaaaag tgccgttcag tgaaaagaca 3420
gatttccatg tctgggtggg acaaaaggaa tttacagaat atgccggtgc agacggattc 3480
tatcggccat tggtgcaacg ggaaaccaag cttacaggta aaacgacagt cacgtgggat 3540
agccattact gtgttatcac cgcaacagag gatgcggctg gcctgcgtat gcaagcgcat 3600
tacgattatc gatttatggt tgcggataac accacagatg tcaatgataa ctatcacacc 3660
gtgacgtttg atgcactggg gagggtaacc agcttccgtt tctgggggac tgaaaacggt 3720
gaaaaacaag gatatacccc tgcggaaaat gaaactgtcc cctttattgt ccccacaacg 3780
gtggatgatg ctctggcatt gaaacccggt atacctgttg cagggctgat ggtttatgcc 3840
cctctgagct ggatggttca ggccagcttt tctaatgatg gggagcttta tggagagctg 3900
aaaccggctg ggatcatcac tgaagatggt tatctcctgt cgcttgcttt tcgccgctgg 3960
caacaaaata accctgccgc tgccatgcca aagcaagtca attcacagaa cccaccccat 4020
gtactgagtg tgatcaccga ccgctatgat gccgatccgg aacaacaatt acgtcaaacg 4080
tttacgttta gtgatggttt tgggcgaacc ttacaaacag ccgtacgcca tgaaagtggt 4140
gaagcctggg tacgtgatga gtatggagcc attgtggctg aaaatcatgg cgcgcctgaa 4200
acggcgatga cagatttccg ttgggcagtt tccggacgta cagaatatga cggaaaaggc 4260
caagccctgc gtaagtatca accgtatttc ctgaatagtt ggcagtacgt cagtgatgac 4320
agtgcccggc aggatatata tgccgatacc cattactatg atccgttggg gcgtgaatat 4380
caggttatca cggccaaagg cgggtttcgt cgatccttat tcactccctg gtttgtggtg 4440
aatgaagatg aaaatgacac tgccggtgaa atgacagcat aa 4482
<210>21
<211>3051
<212>DNA
<213>致病杆菌Xwi菌株
<400>21
atgaagaatt tcgttcacag caatacgcca tccgtcaccg tactggacaa ccgtggtcag 60
acagtacgcg aaatagcctg gtatcggcac cccgatacac ctcaggtaac cgatgaacgc 120
atcaccggtt atcaatatga tgctcaagga tctctgactc agagtattga tccgcgattt 180
tatgaacgcc agcagacagc gagtgacaag aacgccatta cacccaatct tattctcttg 240
tcatcactca gtaagaaggc attgcgtacg caaagtgtgg atgccggaac ccgtgtcgcc 300
ctgcatgatg ttgccgggcg tcccgtttta gctgtcagcg ccaatggcgt tagccgaacg 360
tttcagtatg aaagtgataa ccttccggga cgattgctaa cgattaccga gcaggtaaaa 420
ggagagaacg cctgtatcac ggagcgattg atctggtcag gaaatacgcc ggcagaaaaa 480
ggcaataatc tggccggcca gtgcgtggtc cattatgatc ccaccggaat gaatcaaacc 540
aacagcatat cgttaaccag catacccttg tccatcacac agcaattact gaaagatgac 600
agcgaagccg attggcacgg tatggatgaa tctggctgga aaaacgcgct ggcgccggaa 660
agcttcactt ctgtcagcac aacggatgct accggcacgg tattaacgag tacagatgct 720
gccggaaaca agcaacgtat cgcctatgat gtggccggtc tgcttcaagg cagttggttg 780
gcgctgaagg ggaaacaaga acaagttatc gtgaaatccc tgacctattc ggctgccagc 840
cagaagctac gggaggaaca tggtaacggg atagtgacta catataccta tgaacccgag 900
acgcaacgag ttattggcat aaaaacagaa cgtccttccg gtcatgccgc tggggagaaa 960
attttacaaa acctgcgtta tgaatatgat cctgtcggaa atgtgctgaa atcaactaat 1020
gatgctgaaa ttacccgctt ttggcgcaac cagaaaattg taccggaaaa tacttacacc 1080
tatgacagcc tgtaccagct ggtttccgtc actgggcgtg aaatggcgaa tattggccga 1140
caaaaaaacc agttacccat ccccgctctg attgataaca atacttatac gaattactct 1200
cgcacttacg actatgatcg tgggggaaat ctgaccagaa ttcgccataa ttcaccgatc 1260
accggtaata actatacaac gaacatgacc gtttcagatc acagcaaccg ggctgtactg 1320
gaagagctgg cgcaagatcc cactcaggtg gatatgttgt tcacccccgg cgggcatcag 1380
acccggcttg ttcccggtca ggatcttttc tggacacccc gtgacgaatt gcaacaagtg 1440
atattggtca atagggaaaa tacgacgcct gatcaggaat tctaccgtta tgatgcagac 1500
agtcagcgtg tcattaagac tcatattcag aagacaggta acagtgagca aatacagcga 1560
acattatatt tgccagagct ggaatggcgc acgacatata gcggcaatac attaaaagag 1620
tttttgcagg tcatcactgt cggtgaatcg ggtcaggcac aagtgcgggt gctgcattgg 1680
gaaacaggca aaccggcgga tatcagcaat gatcagctgc gctacagtta tggcaacctg 1740
attggcagta gcgggctgga attggacagt gacgggcaga tcattagtca ggaagaatat 1800
tacccctatg ggggaaccgc cgtgtgggca gcccgaagtc agtcagaagc tgattacaaa 1860
accgtgcgtt attctggcaa agagcgggat gcaacagggt tgtattacta cggttatcgt 1920
tattatcaat cgtggacagg gcgatggttg agtgtagatc ctgccggtga ggtcgatggt 1980
ctcaatttgt tccgaatgtg caggaataac cccatcgttt tttctgattc tgatggtcgt 2040
ttccccggtc agggtgtcct tgcctggata gggaaaaaag cgtatcgaaa ggcagtcaac 2100
atcacgacag aacacctgct tgaacaaggc gcttcctttg atacgttctt gaaattaaac 2160
cgaggattgc gaacgtttgt tttgggtgtg ggggtagcaa gtctgggggt gaaggcggcc 2220
acgattgcag gagcgtcgcc ttgggggatt gtcggggctg ccattggtgg ttttgtctcc 2280
ggggcggtga tggggttttt cgcgaacaac atctcagaaa aaattgggga agttttaagt 2340
tatctgacgc gtaaacgttc tgttcctgtt caggttggcg cttttgttgt cacatcgctt 2400
gtgacgtctg cactatttaa cagctcttcg acaggtaccg ccatttccgc agcaacagcg 2460
gtcaccgttg gaggattaat ggctttagcc ggagagcata acacgggcat ggctatcagt 2520
attgccacac ccgccggaca aggtacgctg gatacgctca ggcccggtaa tgtcagcgcg 2580
ccagagcggt taggggcact atcaggcgca attattggcg gcatattact tggccgccat 2640
cagggaagtt ctgagctggg tgaacgggca gcgattggtg ctatgtatgg tgctcgatgg 2700
ggaaggatca ttggtaatct atgggatggc ccttatcggt ttatcggcag gttactgctc 2760
agaagaggca ttagctctgc catttcccac gctgtcagtt ccaggagctg gtttggccga 2820
atgataggag aaagtgtcgg gagaaatatt tctgaagtat tattacctta tagccgtaca 2880
cccggtgaat gggttggtgc agccattggc gggacagccg cggccgctca tcatgccgtt 2940
ggaggggaag ttgccaatgc cgctagccgg gttacctgga gcggctttaa gcgggctttt 3000
aataacttct tctttaacgc ctctgcacgt cataatgaat ccgaagcata a 3051
<210>22
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物SB101
<400>22
gckatggcsg acccgatgca wtacaagctg gc 32
<210>23
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物SB102
<400>23
agcggytgac crtccagrct carattgtgg cg 32
<210>24
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物SB103
<400>24
tgtataactg gatggcyggw cgtctstc 28
<210>25
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物SB104
<400>25
tcraaaggca graamcggct gtcgtt 26
<210>26
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物SB105
<400>26
cttcyctkga tatcytkytg gatgtgct 28
<210>27
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物SB106
<400>27
acgrctggya ttggyaatca gccartccaa 30
<210>28
<211>27
<212>DNA
<213>人工序列
<220>
<223>引物SB212
<220>
<221>misc_feature
<222>(7)..(7)
<223>n=i(次黄苷)
<400>28
cgytatnaat atgaycckgt vggyaat 27
<210>29
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物SB213
<220>
<221>misc_feature
<222>(17)..(17)
<223>n=i(次黄苷)
<400>29
catcbcgytc tttrccngar tarcg 25
<210>30
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物SB215
<220>
<221>misc_feature
<222>(10)..(10)
<223>n=i(次黄苷)
<400>30
cghagctcyn cccagtwytg gctggatgar aaa 33
<210>31
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物SB217
<220>
<221>misc_feature
<222>(24)..(24)
<223>n=i(次黄苷)
<400>31
gtrtcatttt catcttcrtt bacnryaaac ca 32
<210>32
<211>1293
<212>DNA
<213>蜂类芽孢杆菌(蜂类芽孢杆菌)DB482菌株
<400>32
gcagcccgaa ggctccggca cgctggcatc cttgaaggat acctaccatc cgatgaccct 60
tccctatgat gacgaccttg cgcaaatcaa tgccgtggcg gaggcgcact catctaattt 120
gctggggatt tgggataccc tgctggacac gcagcggact tccatcctgc agaattccgc l80
cgctgcctgc cggataagca aggcgcggca atcggcatcc ccggatcaga gagcctccga 240
tgatgagccg gtattgatta caggagaaga attctacctg gagacgggcg gcaaacggct 300
ttttctggcg cataaactcg agataggctc cacgataagc gccaaaatca acattggacc 360
gccgcaagcg gccgatatcg cgccagcaaa gttgcaactc gtttattacg gcagaggcgg 420
cagaggggac tacttccttc gtgtggcaga cgatgtgtcc ctcggtggaa aattgctgaa 480
caattgttat ctgaccagcg acgacggaca gagcaacaat attaacggac cattctgcct 540
aatgattaat cgaggcaccg gcagcatgcc cagcgggact cacctgccag ttcagattga 600
cagagtgaca gatacatccc tacgcatttt tgtgccgcaa cacggttact tgggactagg 660
agaaagcctt gccagcaact ggaatgaacc gttggcgctg aatctggact tggatcaagc 720
gttgaccttt accctaagaa agaatgagtc cggacaagat accatttcca taatcgatat 780
gatgccgcct gttgccgaca cgaccccgtc cccgccgacg agggaaacgc tttccttgac 840
gccaaacagc ttccgtctgc tggttaaccc cgagccgaca gaagaagaca tcgccaagca 900
ctacaacgtt aagactgcca taacccgagc tcctgccgat ctggccgccg ccttaaatgt 960
tgtcgatgat ttctgcatga agaccggctt gagctttgat gaattgctga acttaacgat 1020
gcagaaggat tatcagtcaa aaagcagtga gtacaaaagc cgatttgtaa aatttggcgg 1080
cggggagcat gttccggttt caacctatgg agctgtgttt ttgacaggta cggaagaaac 1140
tccgttgtgg gcaaaacagt ataacagcgc aggcgctgca acagacaccc ctgttttgaa 1200
ctttacggcg gataatgttg cagctttggc aggaagagcg gaaaagcttg tgcggctggc 1260
gcgaagcacg ggtctttcct ttgagcagtt gga 1293
<210>33
<211>430
<212>PRT
<213>蜂类芽孢杆菌DB482菌株
<400>33
Gln Pro Glu Gly Ser Gly Thr Leu Ala Ser Leu Lys Asp Thr Tyr His
1 5 10 15
Pro Met Thr Leu Pro Tyr Asp Asp Asp Leu Ala Gln Ile Asn Ala Val
20 25 30
Ala Glu Ala His Scr Ser Asn Leu Leu Gly Ile Trp Asp Thr Leu Leu
35 40 45
Asp Thr Gln Arg Thr Ser Ile Leu Gln Asn Ser Ala Ala Ala Cys Arg
50 55 60
Ile Ser Lys Ala Arg Gln Ser Ala Ser Pro Asp Gln Arg Ala Ser Asp
65 70 75 80
Asp Glu Pro Val Leu Ile Thr Gly Glu Glu Phe Tyr Leu Glu Thr Gly
85 90 95
Gly Lys Arg Leu Phe Leu Ala His Lys Leu Glu Ile Gly Ser Thr Ile
100 105 110
Ser Ala Lys Ile Asn Ile Gly Pro Pro Gln Ala Ala Asp Ile Ala Pro
115 120 125
Ala Lys Leu Gln Leu Val Tyr Tyr Gly Arg Gly Gly Arg Gly Asp Tyr
130 135 140
Phe Leu Arg Val Ala Asp Asp Val Ser Leu Gly Gly Lys Leu Leu Asn
145 150 155 160
Asn Cys Tyr Leu Thr SerA sp Asp Gly Gln Ser Asn Asn Ile Asn Gly
165 170 175
Pro Phe Cys Leu Met Ile Asn Arg Gly Thr Gly Ser Met Pro Ser Gly
180 185 190
Thr His Leu Pro Val Gln Ile Asp Arg Val Thr Asp Thr Ser Leu Arg
195 200 205
Ile Phe Val Pro Gln His Gly Tyr Leu Gly Leu Gly Glu Ser Leu Ala
210 215 220
Ser Asn Trp Asn Glu Pro Leu Ala Leu Asn Leu Asp Leu Asp Gln Ala
225 230 235 240
Leu Thr Phe Thr Leu Arg Lys Asn Glu Ser Gly Gln Asp Thr Ile Ser
245 250 255
Ile Ile Asp Met Met Pro Pro Val Ala Asp Thr Thr Pro Ser Pro Pro
260 265 270
Thr Arg Glu Thr Leu Ser Leu Thr Pro Asn Ser Phe Arg Leu Leu Val
275 280 285
Asn Pro Glu Pro Thr Glu Glu Asp Ile Ala Lys His Tyr Asn Val Lys
290 295 300
Thr Ala Ile Thr Arg Ala Pro Ala Asp Leu Ala Ala Ala Leu Asn Val
305 310 315 320
Val Asp Asp Phe Cys Met Lys Thr Gly Leu Ser Phe Asp Glu Leu Leu
325 330 335
Asn Leu Thr Met Gln Lys Asp Tyr Gln Ser Lys Ser Ser Glu Tyr Lys
340 345 350
Ser Arg Phe Val Lys Phe Gly Gly Gly Glu his Val Pro Val Ser Thr
355 360 365
Tyr Gly Ala Val Phe Leu Thr Gly Thr Glu Glu Thr Pro Leu Trp Ala
370 375 380
Lys Gln Tyr Asn Ser Ala Gly Ala Ala Thr Asp Thr Pro Val Leu Asn
385 390 395 400
Phe Thr Ala Asp Asn Val Ala Ala Leu Ala Gly Arg Ala Glu Lys Leu
405 410 415
Val Arg Leu Ala Arg Ser Thr Gly Leu Ser Phe Glu Gln Leu
420 425 430
<210>34
<211>340
<212>DNA
<213>蜂类芽孢杆菌DB482菌株
<400>34
tatatttatt cacaccttgg acttcctgat caaccgcggc gacagcttgt accggctgct 60
ggagcgggat actctgaccg aagccaagat gtattacatc caggccagcc aactgcttgg 120
tccccgcccc gatatccgga tcaatcacag ttggcctaat ccgaccctgc aaagcgaagc 180
ggacgcggtg accgccgtac cgacgcgaag cgattcgcgg gcaacgccaa tcctcgcctt 240
gcgagcgctt ctgaaagcgg aaaacgggca tttcctgccg ccttataatg atgaactgtt 300
agctttctgg gataaaatcg atctgcgttt atacaattta 340
<210>35
<211>565
<212>DNA
<213>蜂类芽孢杆菌DB482菌株
<400>35
gtctctatac tatcaaatgt atgacgccgc attgccgctc tgcttgatgg ccaaacaggc 60
tttagagaaa gaaatcggca ctgataaaac gggtggagtt ttcaccctcc cggcctggaa 120
tgatctgtat cagggattac tggcggggga ggcgctgctg ctcgagcttc agaagctgga 180
gaatctgtgg ctggaggaag acaagcgcgg aatggaagcc gtaaaaacgg tatctttaga 240
tacccttctc cgcaaagaaa cgccagagtc tagcttcgta gagctagtca aggaagttct 300
ggacggaaag acgcctgacc ctgtaggcgg agtcggcgta cagctgcaaa acaatatttt 360
cagcgcaacc cttgacctgt ccgttcttgg cttggatcgc tcttacaacc aagcggaaaa 420
gacccgcagg atcaaaaatc tgtcggttac cttacccgcg cttttgggac cttaccagga 480
tatagaagca accttatcgc taggcggcga gaccgttgcg ctttcccatg gcgtggatga 540
cagcggcttg ttcatcacgg atctt 565
<210>36
<211>113
<212>PRT
<213>蜂类芽孢杆菌DB482菌株
<400>36
Ile Phe Ile His Thr Leu Asp Phe Leu Ile Asn Arg Gly Asp Ser Leu
1 5 10 15
Tyr Arg Leu Leu Glu Arg Asp Thr Leu Thr Glu Ala Lys Met Tyr Tyr
20 25 30
Tle Gln Ala Ser Gln Leu Leu Gly Pro Arg Pro Asp Ile Arg Ile Asn
35 40 45
His Ser Trp Pro Asn Pro Thr Leu Gln Ser Glu Ala Asp Ala Val Thr
50 55 60
Ala Val Pro Thr Arg Ser Asp Ser Arg Ala Thr Pro Ile Leu Ala Leu
65 70 75 80
Arg Ala Leu Leu Lys Ala Glu Asn Gly His Phe Leu Pro Pro Tyr Asn
85 90 95
Asp Glu Leu Leu Ala Phe Trp Asp Lys Ile Asp Leu Arg Leu Tyr Asn
100 105 110
Leu
<210>37
<211>188
<212>PRT
<213>蜂类芽孢杆菌DB482菌株
<400>37
Ser Leu Tyr Tyr Gln Met Tyr Asp Ala Ala Leu Pro Leu Cys Leu Met
1 5 10 15
Ala Lys Gln Ala Leu Glu Lys Glu Ile Gly Thr Asp Lys Thr Gly Gly
20 25 30
Val Phe Thr Leu Pro Ala Trp Asn Asp Leu Tyr Gln Gly Leu Leu Ala
35 40 45
Gly Glu Ala Leu Leu Leu Glu Leu Gln Lys Leu Glu Asn Leu Trp Leu
50 55 60
Glu Glu Asp Lys Arg Gly Met Glu Ala Val Lys Thr Val Ser Leu Asp
65 70 75 80
Thr Leu Leu Arg Lys Glu Thr Pro Glu Ser Ser Phe Val Glu Leu Val
85 90 95
Lys Glu Val Leu Asp Gly Lys Thr Pro Asp Pro Val Gly Gly Val Gly
100 105 110
Val Gln Leu Gln Asn Asn Ile Phe Ser Ala Thr Leu Asp Leu Ser Val
115 120 125
Leu Gly Leu Asp Arg Ser Tyr Asn Gln Ala Glu Lys Thr Arg Arg Ile
130 135 140
Lys Asn Leu Ser Val Thr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp
145 150 155 160
Ile Glu Ala Thr Leu Ser Leu Gly Gly Glu Thr Val Ala Leu Ser His
165 170 175
Gly Val Asp Asp Ser Gly Leu Phe Ile Thr Asp Leu
180 185
<210>38
<211>2091
<212>DNA
<213>蜂类芽孢杆菌DB482菌株
<400>38
caggcaacct catcggctgt ctgtggtgtg ccattcccga tcaacgtggt atcggacata 60
cacacggtgg acgaaatcag cggcagcgcc aggattcaga agtatactta ccgcaatggc 120
gtgtatgacc ggaccgataa ggaatttgcc gggttcggcc acattgacac atgggaagag 180
gagcgggatt ccgagggaac ccttagcatc agcactcccc ccgtgctgac acggacctgg 240
tatcataccg ggcaaaagca ggatgaggag cgtgccgtgc agcaatattg gcaaggcgac 300
cctgccgctt ttcaggttaa acccgtccgg cttactcgat tcgatgcggc aacggcccag 360
gatgtcccgc tagactctcc caataggcgg gaagagtatt ggctgtatcg ctcgttgcga 420
gggatgccgc tgcgtaatga aatttttgct ggagatgttg tggggttgcc tccttatcag 480
gtggagagct tacgttatca agtgcgcttg atgcagagca ccgattcgga atgtgttaca 540
ttgcccatgc agttggagca gcttacgtac aactatgagc aaatcgcctc tgatccgcag 600
tgttcacagc agatacagca atggttcgac gaatacggcg tggcggcaca gagtataacg 660
atccaatatc cgcgccgggc acagccggag gacaatccgt accctcacac gctgccggat 720
accagctgga gcagcagtta tgattcgcag caaatgctgc tgcggttaac aaggcaaagg 780
caaaaagcgt accaccttgc agaccctgaa ggctggcgct tgaatatccc ccatcagaca 840
cgcctggatt ctttcatcta ttctgctgac agcgtgcctg ccgaaggaat aagcgcagag 900
ctgctggggg gtgacggcac gttacgatct ccggcgctgg aacaggctta tggcggccag 960
tcagagatca tctatgcggg cgggggggaa ccggattcgc gagctctggt ccattacacc 1020
agaagcgcga ttctcgatga agcctgtttg caagcctatg aaggcgtact gagcgatagc 1080
caattgaact cgcttcttgc atcttccggc tatcaacgaa gcgcaagaat attgggttcc 1140
ggcgatgaag cggatatttt tgttgcggaa caaggattta cccgttatgc ggatgaacag 1200
aattttttcc gtattctggg acaacaatcc tctctcttga ccggggaaca agtattaaca 1260
tgggatgata atttctgtgc ggtaacatcc atagaagacg cgcttggcaa tcaaattcag 1320
attgcatatg attaccgctt tgtggaggct atccagatta ccgatgcgaa taacaatgtg 1380
aatcaggtct ccctggatgc tctcggccgg gtcgtataca gccggacctg gggcacagag 1440
gaagggatag agacgggctt ccgcccggag gcggaattct cgccgcccga gacaatggag 1500
caggcgcttg ccctggcgtc tcccttgccg gttgcatcct gctgtgttta tgatgcgcat 1560
agctggatgg gaacgataac tcttgggcag ctgtcagcgc ttgttccaga tagtgaaaag 1620
caatggtcgt tcttgatagc caatcgcttg attatgccgg acggcaggat aagagcccgc 1680
ggccgggccc catggtggct tcaacggcta ttgccgcctg ccgtggccaa gctgctgagc 1740
gaggcggacc gtaagccgcc gcatacggta gttttggcag cagatcgcta cccggatgac 1800
ccatcccagc aaattcaggc cagcgtcgtg tttagcgatg gctttgggcg tacgatacaa 1860
accgctaaaa gagcagatac ccgatgggcg attacggaac ggattgacta tgacgaaacc 1920
ggagccgtaa tccgaagctt tcagcctttt tatattgatg actggaatta tgtgggcaaa 1980
gaggctgtca gcggctctat gtatgcaacg atctattact atgatgctct ggcacgccaa 2040
ctaaggatgg tcaacgccaa aggatatgag aggagaactg ctttttaccc a 2091
<210>39
<211>697
<212>PRT
<213>蜂类芽孢杆菌DB482菌株
<400>39
Gln Ala Thr Ser Ser Ala Val Cys Gly Val Pro Phe Pro Ile Asn Val
1 5 10 15
Val Ser Asp Ile His Thr Val Asp Glu Ile Ser Gly Ser Ala Arg Ile
20 25 30
Gln Lys Tyr Thr Tyr Arg Asn Gly Val Tyr Asp Arg Thr Asp Lys Glu
35 40 45
Phe Ala Gly Phe Gly his Ile Asp Thr Trp Glu Glu Glu Arg Asp Ser
50 55 60
Glu Gly Thr Leu Ser Ile Ser Thr Pro Pro Val Leu Thr Arg Thr Trp
65 70 75 80
Tyr His Thr Gly Gln Lys Gln Asp Glu Glu Arg Ala Val Gln Gln Tyr
85 90 95
Trp Gln Gly Asp Pro Ala Ala Phe Gln Val Lys Pro Val Arg Leu Thr
100 105 110
Arg Phe Asp Ala Ala Thr Ala Gln Asp Val Pro Leu Asp Ser Pro Asn
115 120 125
Arg Arg Glu Glu Tyr Trp Leu Tyr Arg Ser Leu Arg Gly Met Pro Leu
130 135 140
Arg Asn Glu Ile Phe Ala Gly Asp Val Val Gly Leu Pro Pro Tyr Gln
145 150 155 160
Val Glu Ser Leu Arg Tyr Gln Va1 Arg Leu Met Gln Ser Thr Asp Ser
165 170 175
Glu Cys Val Thr Leu Pro Met Gln Leu Glu Gln Leu Thr Tyr Asn Tyr
180 185 190
Glu Gln Ile Ala Ser Asp Pro Gln Cys Ser Gln Gln Ile Gln Gln Trp
195 200 205
Phe Asp Glu Tyr Gly Val Ala Ala Gln Ser Ile Thr Ile Gln Tyr Pro
210 215 220
Arg Arg Ala Gln Pro Glu Asp Asn Pro Tyr Pro His Thr Leu Pro Asp
225 230 235 240
Thr Ser Trp Ser Ser Ser Tyr Asp Ser Gln Gln Met Leu Leu Arg Leu
245 250 255
Thr Arg Gln Arg Gln Lys Ala Tyr His Leu Ala Asp Pro Glu Gly Trp
260 265 270
Arg Leu Asn Ile Pro His Gln Thr Arg Leu Asp Ser Phe Ile Tyr Ser
275 280 285
Ala Asp Ser Val Pro Ala Glu Gly Ile Ser Ala Glu Leu Leu Gly Gly
290 295 300
Asp Gly Thr Leu Arg Ser Pro Ala Leu Glu Gln Ala Tyr Gly Gly Gln
305 310 315 320
Ser Glu Ile Ile Tyr Ala Gly Gly Gly Glu Pro Asp Ser Arg Ala Leu
325 330 335
Val His Tyr Thr Arg Ser Ala Ile Leu Asp Glu Ala Cys Leu Gln Ala
340 345 350
Tyr Glu Gly Val Leu Ser Asp Ser Gln Leu Asn Ser Leu Leu Ala Ser
355 360 365
Ser Gly Tyr Gln Arg Ser Ala Arg Ile Leu Gly Ser Gly Asp Glu Ala
370 375 380
Asp Ile Phe Val Ala Glu Gln Gly Phe Thr Arg Tyr Ala Asp Glu Gln
385 390 395 400
Asn Phe Phe Arg Ile Leu Gl y Gln Gln Ser Ser Leu Leu Thr Gly Glu
405 410 415
Gln Val Leu Thr Trp Asp Asp Asn Phe Cys Ala Val Thr Ser Ile Glu
420 425 430
Asp Ala Leu Gly Asn Gln Ile Gln Ile Ala Tyr Asp Tyr Arg Phe Val
435 440 445
Glu Ala Ile Gln Ile Thr Asp Ala Asn Asn Asn Val Asn Gln Val Ser
450 455 460
Leu Asp Ala Leu Gly Arg Val Val Tyr Ser Arg Thr Trp Gly Thr Glu
465 470 475 480
Glu Gly Ile Glu Thr Gly Phe Arg Pro Glu Ala Glu Phe Ser Pro Pro
485 490 495
Glu Thr Met Glu Gln Ala Leu Ala Leu Ala Ser Pro Leu Pro Val Ala
500 505 510
Ser Cys Cys Val Tyr Asp Ala His Ser Trp Met Gly Thr Ile Thr Leu
515 520 525
Gly Gln Leu Ser Ala Leu Val Pro Asp Ser Glu Lys Gln Trp Ser Phe
530 535 540
Leu Ile Ala Asn Arg Leu Ile Met Pro Asp Gly Arg Ile Arg Ala Arg
545 550 555 560
Gly Arg Ala Pro Trp Trp Leu Gln Arg Leu Leu Pro Pro Ala Val Ala
565 570 575
Lys Leu Leu Ser Glu Ala Asp Arg Lys Pro Pro His Thr Val Val Leu
580 585 590
Ala Ala Asp Arg Tyr Pro Asp Asp Pro Ser Gln Gln Ile Gln Ala Ser
595 600 605
Val Val Phe Ser Asp Gly Phe Gly Arg Thr Ile Gln Thr Ala Lys Arg
610 615 620
Ala Asp Thr Arg Trp Ala Ile Thr Glu Arg Ile Asp Tyr Asp Glu Thr
625 630 635 640
Gly Ala Val Ile Arg Ser Phe Gln Pro Phe Tyr Ile Asp Asp Trp Asn
645 650 655
Tyr Val Gly Lys Glu Ala Val Ser Gly Ser Met Tyr Ala Thr Ile Tyr
660 665 670
Tyr Tyr Asp Ala Leu Ala Arg Gln Leu Arg Met Val Asn Ala Lys Gly
675 680 685
Tyr Glu Arg Arg Thr Ala Phe Tyr Pro
690 695
<210>40
<211>858
<212>DNA
<213>蜂类芽孢杆菌DB482菌株
<400>40
atcctgtcta tctgcaatga agcggagccg gtccgttatt tccgcaatca ggccgtcgct 60
ccgaaaaggc agtatgctta cgatgccctg tatcagcttg tatccagctc ggggcgggaa 120
tccgacgcgc ttcgtcagca gacgtcgctt cctcccttga tcacgcctat tcctctcgac 180
gatagccaat acgtcaatta tgctgagaga tacagctatg atcgggcggg caatctaatc 240
aagcttagcc atcatggggc aagtcaatat acaacgaatg tgcatgtgga caaaagttca 300
aaccggggga tttggcggca aggggaagac atcccggata tcgcggcttc ctttgacaga 360
gcaggcaatc aacaagattt attcccgggg agacggttgg aatgggatac acgcaatcag 420
ttatgccgtg tccatatggt cgtgcgcgaa ggcggcgata acgactggga gggctatctc 480
tatgacagct caggaatgcg catcgtaaaa cattctaccc gcaagacaca gacgacaacg 540
caaacggata cgacgatcta tttgccgggc ctggagcttc gcatccgcca aaccggggac 600
agggtcacgg aagcattgca ggtcattacc gtggatgagg gagcgggaca agtgagggtg 660
ctgcactggg aggatggaac cgagccgggc ggcatagcca atgatcagta tcggtacagc 720
ctaaacgatc atcttggctc ctctttattg gaagttgacg ggcaaagtca gatcattagc 780
aaggaagaat tttatcccta tggcggcaca gcattgtgga cagcccggtc agaggtggag 840
gcaagctaca agaccacg 858
<210>41
<211>286
<212>PRT
<213>蜂类芽孢杆菌DB482菌株
<400>41
Ile Leu Ser Ile Cys Asn Glu Ala Glu Pro Val Arg Tyr Phe Arg Ash
1 5 10 15
Gln Ala Val Ala Pro Lys Arg Gln Tyr Ala Tyr Asp Ala Leu Tyr Gln
20 25 30
Leu Val Ser Ser Ser Gly Arg Glu Ser Asp Ala Leu Arg Gln Gln Thr
35 40 45
Ser Leu Pro Pro Leu Ile Thr Pro Ile Pro Leu Asp Asp Ser Gln Tyr
50 55 60
Val Asn Tyr Ala Glu Arg Tyr Ser Tyr Asp Arg Ala Gly Asn Leu Ile
65 70 75 80
Lys Leu Ser His His Gly Ala Ser Gln Tyr Thr Thr Asn Val His Val
85 90 95
Asp Lys Ser Ser Asn Arg Gly Ile Trp Arg Gln Gly Glu Asp Ile Pro
100 105 110
Asp Ile Ala Ala Ser Phe Asp Arg Ala Gly Asn Gln Gln Asp Leu Phe
115 120 125
Pro Gly Arg Arg Leu Glu Trp Asp Thr Arg Asn Gln Leu Cys Arg Val
130 135 140
His Met Val Val Arg Glu Gly Gly Asp Asn Asp Trp Glu Gly Tyr Leu
145 L50 155 160
Tyr Asp Ser Ser Gly Met Arg Ile Val Lys His Ser Thr Arg Lys Thr
165 170 175
Gln Thr Thr Thr Gln Thr Asp Thr Thr Ile Tyr Leu Pro Gly Leu Glu
180 185 190
Leu Arg Ile Arg Gln Thr Gly Asp Arg Val Thr Glu Ala Leu Gln Val
195 200 205
Ile Thr Val Asp Glu Gly Ala Gly Gln Val Arg Val Leu His Trp Glu
210 215 220
Asp Gly Thr Glu Pro Gly Gly Ile Ala Asn Asp Gln Tyr Arg Tyr Ser
225 230 235 240
Leu Asn Asp His Leu Gly Ser Ser Leu Leu Glu Val Asp Gly Gln Ser
245 250 255
Gln Ile Ile Ser Lys Glu Glu Phe Tyr Pro Tyr Gly Gly Thr Ala Leu
260 265 270
Trp Thr Ala Arg Ser Glu Val Glu Ala Ser Tyr Lys Thr Thr
275 280 285
<210>42
<211>4434
<212>DNA
<213>光杆状菌(Photorhabdus)W14菌株
<400>42
atgatgcaga attcacaaac attcagtgtt accgagctgt cattacccaa aggcggcggc 60
gctattaccg gtatgggtga agcattaaca ccagccgggc cggatggtat ggccgcctta 120
tccctgccat tacccatttc cgccgggcgt ggttacgcac cctcgctcac tctgaattac 180
aacagtggaa ccggtaacag cccatttggt ctcggttggg actgcggcgt catggcaatt 240
cgtcgtcgca ccagtaccgg cgtaccgaat tacgatgaaa ccgatacttt tctggggccg 300
gaaggtgaag tgttggtcgt agcattaaat gaggcaggtc aagctgatat ccgcagtgaa 360
tcctcattgc agggcatcaa tttgggtgcg accttcaccg ttacctgtta tcgctcccgc 420
ctagaaagcc actttaaccg gttggaatac tggcaacccc aaacaaccgg cgcaaccgat 480
ttctggctga tatacagccc cgacggacag gtccatttac tgggcaaaaa tcctcaggca 540
cgtatcagca atccactcaa tgttaaccaa acagcgcaat ggctgttgga agcctcgata 600
tcatcccaca gcgaacagat ttattatcaa tatcgcgctg aagatgaagc aggttgtgaa 660
accgacgagc tagcagccca ccccagcgca accgttcagc gctacctgca aacagtacat 720
tacgggaacc tgaccgccag cgacgttttt cctacactaa acggagatga cccacttaaa 780
tctggctgga tgttctgttt agtatttgac tacggtgagc gcaaaaacag cttatctgaa 840
atgccgctgt ttaaagccac aggcaattgg ctttgccgaa aagaccgttt ttcccgttat 900
gagtacggtt ttgaattgcg tactcgccgc ttatgccgcc aaatactgat gtttcaccgt 960
ctacaaaccc tatctggtca ggcaaagggg gatgatgaac ctgcgctagt gtcgcgtctg 1020
atactggatt atgacgaaaa cgcgatggtc agtacgctcg tttctgtccg ccgggtaggc 1080
catgaggaca acaacacggt taccgcgctg ccaccactgg aactggccta tcagcctttt 1140
gagccagaac aaaccgcact ctggcaatca atggatgtac tggcaaattt caacaccatt 1200
cagcgctggc aactgcttga cctgaaagga gaaggcgtgc ccggcattct ctatcaggat 1260
agaaatggct ggtggtatcg atctgcccaa cgtcaggccg gggaagagat gaatgcggtc 1320
acctggggga aaatgcaact ccttcccatc acaccagctg tgcaggataa cgcctcactg 1380
atggatatta acggtgacgg gcaactggac tgggtgatta ccgggccggg gctaaggggc 1440
tatcacagcc aacacccgga tggcagttgg acgcgtttta cgccattaca tgccctgccg 1500
atagaatatt ctcatcctcg cgctcaactt gccgatttaa tgggagccgg gctgtccgat 1560
ttagtgctaa ttggtcccaa aagtgtgcgc ttatatgtca ataaccgtga tggttttacc 1620
gaagggcggg atgtggtgca atccggtgat atcaccctgc cgctaccggg cgccgatgcc 1680
cgtaagttag tggcatttag tgacgtactg ggttcaggcc aagcacatct ggttgaagtt 1740
agtgcaactc aagtcacctg ctggccgaat ctggggcatg gccgttttgg tcagccaatc 1800
gtattgccgg gattcagcca atctgccgcc agttttaatc ctgatcgagt tcatctggcc 1860
gatttggatg ggagcggccc tgccgatttg atttatgttc atgctgaccg tctggatatt 1920
ttcagcaatg aaagtggcaa cggttttgca aaaccattca cactctcttt tcctgacggc 1980
ctgcgttttg atgatacctg ccagttgcaa gtagccgatg tacaagggtt aggcgttgtc 2040
agcctgatcc taagcgtacc gcatatggcg ccacatcatt ggcgctgcga tctgaccaac 2100
gcgaaaccgt ggttactcag tgaaacgaac aacaatatgg gggccaatca caccttgcat 2160
taccgtagct ctgtccagtt ctggctggat gaaaaagctg cggcattggc taccggacaa 2220
acaccggtct gttacctgcc cttcccggtc catacccttt ggcaaacaga aaccgaggat 2280
gaaatcagcg gcaataagtt agtgaccacg ttacgttatg ctcacggcgc ttgggatgga 2340
cgtgaacggg aatttcgtgg ctttggttat gttgagcaga cagacagcca tcaactcgct 2400
caaggcaatg cgccggaacg tacaccaccg gcactcacca aaagctggta tgccaccgga 2460
ttacctgcgg tagataatgc gttatccgcc gggtattggc gtggcgataa gcaagctttc 2520
gccggtttta cgccacgttt tactctctgg aaagagggca aagatgttcc actgacaccg 2580
gaagatgacc ataatctata ctggttaaac cgggcgctaa aaggtcagcc actgcgtagt 2640
gaactctacg ggctggatgg cagcgcacag caacagatcc cctatacagt gactgaatcc 2700
cgtccacagg tgcgccaatt acaagatggc gccaccgttt ccccggtgct ctgggcctca 2760
gtcgtggaaa gccgtagtta tcactacgaa cgtattatca gtgatcccca gtgcaatcag 2820
gatatcacgt tgtccagtga cctattcggg caaccactga aacaggtttc cgtacaatat 2880
ccccgccgca acaaaccaac aaccaatccg tatcccgata ccctaccgga tacgctgttt 2940
gccagcagtt atgacgatca acaacagcta ttgcgattaa cctgccgaca atccagttgg 3000
caccatctta ttggtaatga gctaagagtg ttgggattac cggatggcac acgcagtgat 3060
gcctttactt acgatgccaa acaggtacct gtcgatggct taaatctgga aaccctgtgt 3120
gctgaaaata gcctgattgc cgatgataaa cctcgcgaat acctcaatca gcaacgaacg 3180
ttctataccg acgggaaaaa ccaaacaccg ctgaaaacac cgacacgaca agcgttaatc 3240
gcctttaccg aaacggcggt attaacggaa tctctgttat ccgcgtttga tggcggtatt 3300
acgccagacg aattaccggg aatactgaca caggccggat accaacaaga gccttatctg 3360
tttccacgca ccggcgaaaa caaagtttgg gtagcgcgtc aaggctatac cgattacggg 3420
acggaagcac aattttggcg tcctgtcgca caacgtaaca gcctgttaac cgggaaaatg 3480
acgttaaaat gggatactca ctattgtgtc atcacccaaa cccaagatgc tgccggcctc 3540
accgtctcag ccaattatga ctggcgtttt ctcacaccaa cgcaactgac tgacatcaac 3600
gataatgtgc atctcatcac cttggatgct ctgggacgcc ctgtcacgca acgtttctgg 3660
gggatcgaaa gcggtgtggc aacaggttac tcttcatcag aagaaaaacc attctctcca 3720
ccaaacgata tcgataccgc tattaatcta accggaccac tccctgtcgc acagtgtctg 3780
gtctatgcac cggacagttg gatgccacta ttcagtcaag aaaccttcaa cacattaacg 3840
caggaagagc aggagacgct gcgtgattca cgtattatca cggaagattg gcgtatttgc 3900
gcactgactc gccgccgttg gctacaaagt caaaagatca gtacaccatt agttaaactg 3960
ttaaccaaca gcattggttt acctccccat aaccttacgc tgaccacaga ccgttatgac 4020
cgcgactctg agcagcaaat tcgccaacaa gtcgcattta gtgatggttt tggccgtctg 4080
ctacaagcgt ctgtacgaca tgaggcaggc gaagcctggc aacgtaacca agacggttct 4140
ctggtgacaa aagtggagaa taccaaaacg cgttgggcgg tcacgggacg caccgaatat 4200
gataataaag ggcaaacgat acgcacttat cagccctatt tcctcaacga ctggcgatat 4260
gtcagtgatg acagcgccag aaaagaagcc tatgcggata ctcatattta tgatccaatt 4320
gggcgagaaa tccgggttat tactgcaaaa ggctggctgc gccaaagcca atatttcccg 4380
tggtttaccg tgagtgagga tgagaatgat acggccgctg atgcgctggt gtaa 4434
<210>43
<211>4425
<212>DNA
<213>光杆状菌W14菌株
<400>43
atgcaaaatt cacaagattt tagtattacg gaactgtcac tgcccaaagg ggggggcgct 60
atcacgggaa tgggtgaagc attaaccccc actggaccgg atggtatggc cgcgctatct 120
ctaccattgc ctatttctgc cgggcgcggt tatgctcccg cattcactct gaattacaac 180
agcggcgccg gtaacagtcc atttggtctg ggttgggatt gcaacgttat gactatccgc 240
cgccgcaccc attttggcgt cccccattat gacgaaaccg ataccttttt ggggccagaa 300
ggcgaagtgc tggtggtagc ggatcaacct cgcgacgaat ccacattaca gggtatcaat 360
ttaggcgcca cctttaccgt taccggctac cgttcccgtc tggaaagcca tttcagccga 420
ttggaatatt ggcaacccaa aacaacaggt aaaacagatt tttggttgat atatagccca 480
gatgggcagg tgcatctact gggtaaatca ccgcaagcgc ggatcagcaa cccatcccaa 540
acgacacaaa cagcacaatg gctgctggaa gcctctgtat catcacgtgg cgaacaaatt 600
tattatcaat atcgcgccga agatgacaca ggttgcgaag cagatgaaat tacgcaccat 660
ttacaggcta cagcgcaacg ttatttacac atcgtgtatt acggcaaccg tacagccagc 720
gaaacattac ccggtctgga tggcagcgcc ccatcacaag cagactggtt gttctatctg 780
gtatttgatt acggcgaacg cagtaacaac ctgaaaacgc caccagcatt ttcgactaca 840
ggtagctggc tttgccgtca ggaccgtttt tcccgttatg aatatggctt tgagattcgt 900
acccgccgct tatgccgtca ggtattgatg taccatcacc tgcaagcact ggatagtaag 960
ataacagaac acaacggacc aacgctggtt tcacgcctga tactcaatta cgacgaaagc 1020
gcgatagcca gcacgctagt attcgttcgc cgagtgggac acgagcaaga tggtaatgtc 1080
gtcaccctgc cgccattaga attggcatat caggattttt caccgcgaca tcacgctcac 1140
tggcaaccaa tggatgtact ggcaaacttc aatgccattc agcgctggca gctagtcgat 1200
ctaaaaggcg aaggattacc cggcctgtta tatcaggata aaggcgcttg gtggtaccgc 1260
tccgcacagc gtctgggcga aattggctca gatgccgtca cttgggaaaa gatgcaacct 1320
ttatcggtta ttccttcttt gcaaagtaat gcctcgttgg tggatatcaa tggagacggc 1380
caacttgact gggttatcac cggaccggga ttacggggat atcatagtca acgcccggat 1440
ggcagttgga cacgttttac cccactcaac gctctgccgg tggaatacac ccatccacgc 1500
gcgcaactcg cagatttaat gggagccggg ctatccgatt tggtgctgat cggccctaag 1560
agcgtgcgtt tatatgccaa tacccgcgac ggctttgcca aaggaaaaga tgtggtgcaa 1620
tccggtgata tcacactgcc ggtgccgggc gccgatccac gtaagttggt ggcgtttagt 1680
gatgtattgg gttcaggtca agcccatctg gttgaagtaa gcgcgactaa agtcacctgc 1740
tggcctaatc tggggcgcgg acgttttggt caacccatta ccttaccggg attcagccag 1800
ccagcaaccg agtttaaccc ggctcaagtt tatctggccg atctggatgg cagcggtcca 186
acggatctga tttatgttca tacaaaccgt ctggatatct tcctgaacaa aagtggcaat 1920
ggctttgctg aaccagtgac attacgcttc ccggaaggtc tgcgttttga tcatacctgt 1980
cagttacaaa tggccgatgt acaaggatta ggcgtcgcca gcctgatact gagcgtgccg 2040
catatgtctc cccatcactg gcgctgcgat ctgaccaaca tgaagccgtg gttactcaat 2100
gaaatgaaca acaatatggg ggtccatcac accttgcgtt accgcagttc ctcccaattc 2160
tggctggatg aaaaagccgc ggcgctgact accggacaaa caccggtttg ctatctcccc 2220
ttcccgatcc acaccctatg gcaaacggaa acagaagatg aaatcagcgg caacaaatta 2280
gtcacaacac ttcgttatgc tcgtggcgca tgggacggac gcgagcggga atttcgcgga 2340
tttggttatg tagagcagac agacagccat caactggctc aaggcaacgc gccagaacgt 2400
acgccaccgg cgctgaccaa aaactggtat gccaccggac tgccggtgat agataacgca 2460
ttatcaaccg agtattggcg tgatgatcag gcttttgccg gtttctcacc gcgctttacg 2520
acttggcaag ataacaaaga tgtcccgtta acaccggaag atgataacag tcgttactgg 2580
ttcaaccgcg cgttgaaagg tcaactgcta cgtagtgaac tgtacggatt ggacgatagt 2640
acaaataaac acgttcccta tactgtcact gaatttcgt tcacaggtacg tcgattacag 2700
cataccgaca gccgataccc tgtactttgg tcatctgtag ttgaaagccg caactatcac 2760
tacgaacgta tcgccagcga cccgcaatgc agtcaaaata ttacgctatc cagtgatcga 2820
tttggtcagc cgctaaaaca gctttcggta cagtacccgc gccgccagca gccagcaatc 2880
aatctgtatc ctgatacatt gcctgataag ttgttagcca acagctatga tgaccaacaa 2940
cgccaattac ggctcaccta tcaacaatcc agttggcatc acctgaccaa caataccgtt 3000
cgagtattgg gattaccgga tagtacccgc agtgatatct ttacttatgg cgctgaaaat 3060
gtgcctgctg gtggtttaaa tctggaactt ctgagtgata aaaatagcct gatcgcggac 3120
gataaaccac gtgaatacct cggtcagcaa aaaaccgctt ataccgatgg acaaaataca 3180
acgccgttgc aaacaccaac acggcaagcc ctgattgcct ttaccgaaac aacggtattc 3240
aaccagtcca cattatcagc gtttaacgga agcatcccgt ccgataaatt atcaacgacg 3300
ctggagcaag ctggatatca gcaaacaaat tatctattcc ctcgcactgg agaagataaa 3360
gtttgggtag cccatcacgg ctataccgat tatggtacag cggcacagtt ctggcgcccg 3420
caaaaacaga gcaacaccca actcaccggt aaaatcaccc tcatctggga tgcaaactat 3480
tgcgttgtgg tacaaacccg ggatgctgct ggactgacaa cctcagccaa atatgactgg 3540
cgttttctga ccccggtgca actcaccgat atcaatgaca atcagcacct tatcacactg 3600
gatgcattgg gccgaccaat cacattgcgc ttttggggaa ctgaaaacgg caagatgaca 3660
ggttattcct caccggaaaa agcatcattt tctccaccat ccgatgttaa tgccgctatt 3720
gagttaaaaa aaccgctccc tgtagcacag tgtcaggtct acgcaccaga aagctggatg 3780
ccagtattaa gtcagaaaac cttcaatcga ctggcagaac aagattggca aaagttatat 3840
aacgcccgaa tcatcaccga agatggacgt atctgcacac tggcttatcg ccgctgggta 3900
caaagccaaa aggcaatccc tcaactcatt agcctgttaa acaacggacc ccgtttacct 3960
cctcacagcc tgacattgac gacggatcgt tatgatcacg atcctgagca acagatccgt 4020
caacaggtgg tattcagtga tggctttggc cgcttgctgc aagccgctgc ccgacatgag 4080
gcaggcatgg cccggcaacg caatgaagac ggctctttga ttataaatgt ccagcatact 4140
gagaaccgtt gggcagtgac tggacgaacg gaatatgaca ataaggggca accgatacgt 4200
acctatcagc cctatttcct caatgactgg cgatacgtca gcaatgatag tgcccggcag 4260
gaaaaagaag cttatgcaga tacccatgtc tatgatccca taggtcgaga aatcaaggtt 4320
atcaccgcaa aaggttggtt ccgtcgaacc ttgttcactc cctggtttac tgtcaatgaa 4380
gatgaaaatg acacagccgc tgaggtgaag aaggtaaaga tgtaa 4425
<210>44
<211>3132
<212>DNA
<213>光杆状菌W14菌株
<400>44
atgagcccgt ctgagactac tctttatact caaaccccaa cagtcagcgt gttagataat 60
cgcggtctgt ccattcgtga tattggtttt caccgtattg taatcggggg ggatactgac 120
acccgcgtca cccgtcacca gtatgatgcc cgtggacacc tgaactacag tattgaccca 180
cgcttgtatg atgcaaagca ggctgataac tcagtaaagc ctaattttgt ctggcagcat 240
gatctggccg gtcatgccct gcggacagag agtgtcgatg ctggtcgtac tgttgcattg 300
aatgatattg aaggtcgttc ggtaatgaca atgaatgcga ccggtgttcg tcagacccgt 360
cgctatgaag gcaacacctt gcccggtcgc ttgttatctg tgagcgagca agttttcaac 420
caagagagtg ctaaagtgac agagcgcttt atctgggctg ggaatacaac ctcggagaaa 480
gagtataacc tctccggtct gtgtatacgc cactacgaca cagcgggagt gacccggttg 540
atgagtcagt cactggcggg cgccatgcta tcccaatctc accaattgct ggcggaaggg 600
caggaggcta actggagcgg tgacgacgaa actgtctggc agggaatgct ggcaagtgag 660
gtctatacga cacaaagtac cactaatgcc atcggggctt tactgaccca aaccgatgcg 720
aaaggcaata ttcagcgtct ggcttatgac attgccggtc agttaaaagg gagttggttg 780
acggtgaaag gccagagtga acaggtgatt gttaagtccc tgagctggtc agccgcaggt 840
cataaattgc gtgaagagca cggtaacggc gtggttacgg agtacagtta tgagccggaa 900
actcaacgtc tgataggtat caccacccgg cgtgccgaag ggagtcaatc aggagccaga 960
gtattgcagg atctacgcta taagtatgat ccggtgggga atgttatcag tatccataat 1020
gatgccgaag ctacccgctt ttggcgtaat cagaaagtgg agccggagaa tcgctatgtt 1080
tatgattctc tgtatcagct tatgagtgcg acagggcgtg aaatggctaa tatcggtcag 1140
caaagcaacc aacttccctc acccgttata cctgttccta ctgacgacag cacttatacc 1200
aattaccttc gtacctatac ttatgaccgt ggcggtaatt tggttcaaat ccgacacagt 1260
tcacccgcga ctcaaaatag ttacaccaca gatatcaccg tttcaagccg cagtaaccgg 1320
gcggtattga gtacattaac gacagatcca acccgagtgg atgcgctatt tgattccggc 1380
ggtcatcaga agatgttaat accggggcaa aatctggatt ggaatattcg gggtgaattg 1440
caacgagtca caccggtgag ccgtgaaaat agcagtgaca gtgaatggta tcgctatagc 1500
agtgatggca tgcggctgct aaaagtgagt gaacagcaga cgggcaacag tactcaagta 1560
caacgggtga cttatctgcc gggattagag ctacggacaa ctggggttgc agataaaaca 1620
accgaagatt tgcaggtgat tacggtaggt gaagcgggtc gcgcacaggt aagggtattg 1680
cactgggaaa gtggtaagcc gacagatatt gacaacaatc aggtgcgcta cagctacgat 1740
aatctgcttg gctccagcca gcttgaactg gatagcgaag ggcagattct cagtcaggaa 1800
gagtattatc cgtatggcgg tacggcgata tgggcggcga gaaatcagac agaagccagc 1860
tacaaattta ttcgttactc cggtaaagag cgggatgcca ctggattgta ttattacggc 1920
taccgttatt atcaaccttg ggtgggtcga tggttgagtg ctgatccggc gggaaccgtg 1980
gatgggctga atttgtaccg aatggtgagg aataacccca tcacattgac tgaccatgac 2040
ggattagcac cgtctccaaa tagaaatcga aatacatttt ggtttgcttc atttttgttt 2100
cgtaaacctg atgagggaat gtccgcgtca atgagacggg gacaaaaaat tggcagagcc 2160
attgccggcg ggattgcgat tggcggtctt gcggctacca ttgccgctac ggctggcgcg 2220
gctatccccg tcattctggg ggttgcggcc gtaggcgcgg ggattggcgc gttgatggga 2280
tataacgtcg gtagcctgct ggaaaaaggc ggggcattac ttgctcgact cgtacagggg 2340
aaatcgacgt tagtacagtc ggcggctggc gcggctgccg gagcgagttc agccgcggct 2400
tatggcgcac gggcacaagg tgtcggtgtt gcatcagccg ccggggcggt aacaggggct 2460
gtgggatcat ggataaataa tgctgatcgg gggattggcg gcgctattgg ggccgggagt 2520
gcggtaggca ccattgatac tatgttaggg actgcctcta cccttaccca tgaagtcggg 2580
gcagcggcgg gtggggcggc gggtgggatg atcaccggta cgcaagggag tactcgggca 2640
ggtatccatg ccggtattgg cacctattat ggctcctgga ttggttttgg tttagatgtc 2700
gctagtaacc ccgccggaca tttagcgaat tacgcagtgg gttatgccgc tggtttgggt 2760
gctgaaatgg ctgtcaacag aataatgggt ggtggatttt tgagtaggct cttaggccgg 2820
gttgtcagcc catatgccgc cggtttagcc agacaattag tacatttcag tgtcgccaga 2880
cctgtctttg agccgatatt tagtgttctc ggcgggcttg tcggtggtat tggaactggc 2940
ctgcacagag tgatgggaag agagagttgg atttccagag cgttaagtgc tgccggtagt 3000
ggtatagatc atgtcgctgg catgattggt aatcagatca gaggcagggt cttgaccaca 3060
accgggatcg ctaatgcgat agactatggc accagtgctg tgggagccgc acgacgagtt 3120
ttttctttgt aa 3132
<210>45
<211>2748
<212>DNA
<2l3>光杆状菌W14菌株
<400>45
atgagcagtt acaattctgc aattgaccaa aagaccccct cgattaaggt attagataac 60
aggaaattaa atgtacgtac tttagaatat ctacgcactc aagctgacga aaacagtgat 120
gaattaatta cgttctatga gttcaatatt ccgggatttc aggtaaaaag caccgatcct 180
cgtaaaaata aaaaccagag cggcccaaat ttcattcgtg tctttaatct tgccggtcaa 240
gttttacgtg aagaaagtgt tgatgccggt cggactatta ccctcaatga tattgaaagt 300
cgcccggtgt tgatcatcaa tgcaaccggt gtccgccaaa accatcgtta tgaagataac 360
acccttcccg gtcgtctgct cgctatcacc gaacaagtac aggcaggaga gaaaacgacc 420
gaacgtctta tctgggccgg caatacgccg caagaaaaag attacaacct cgccggtcag 480
tgtgtccgcc attacgatac cgcgggactt actcaactca atagcctttc tctggctggc 540
gtcgtgctat cacaatctca gcaactactc gtcgatgata aaaatgctga ctggacaggt 600
gaagaccaaa gcctctggca gcaaaaactg agcagtgatg tctataccac ccaaaataaa 660
gccgatgcca ccggggcttt attgacccag accgatgcca aaggcaacat ccagcgtctg 720
gcctacgacg tagccgggca gctaaaaggc tgttggttga cactcaaagg tcaggccgag 780
caagtgatta tcaaatcgct gacctactcc gccgccggac aaaaattacg cgaagagcac 840
ggtaacgggg ttatcactga atacagctat gaaccagaaa cccaacggct tatcggtatt 900
gccacccgcc gtccgtcaga cgccaaagtg ttgcaagact tacgctatca atatgacccg 960
gtaggcaatg tgatcaatat ccgtaatgat gcggaagcca cccgcttttg gcgcaatcag 1020
aaagtggtcc cggagaatag ctatacctac gactccctgt atcagcttat cagtgccacc 1080
gggcgggaaa tggctaatat aggtcagcaa aataaccaac tgccctcccc tgcgctacct 1140
tctgacaaca atacctacac taactatact cgcagctaca gctatgatca cagtggtaat 1200
ctgacgcaaa ttcggcacag ctcgccagct acccagaaca actacaccgt ggctatcacc 1260
ctctcaaacc gcagcaatcg gggtgttctc agtacgctaa ccaccgatcc aaatcaagtg 1320
gatacgttgt ttgatgccgg tggtcaccaa accagtttat tacccggaca gacacttatc 1380
tggacaccac gaggagagtt aaagcaggtt aataatggcc cgggaaatga gtggtaccgc 1440
tacgacagca acggcatgag acaactgaaa gtgagtgaac agccaaccca gaatactacg 1500
cagcaacaac gggtaatcta tttgccggga ctggagctac gcacaaccca gagcaacgcc 1560
acaacaacgg aagagttaca cgttatcaca ctcggtgaag ccggtcgcgc acaggtacgg 1620
gtgttgcact gggagagcgg taagccagaa gatgtcaaca ataatcaact acgttacagc 1680
tacgataatc tgatcggctc cagccagctt gaactggaca accaaggaca aattatcagc 1740
gaggaagagt attatccatt tggcgggaca gcgctgtggg cagcaaacag ccaaacagaa 1800
gccagctata aaacgattcg ctattccggc aaagaacgag atgccaccgg gttgtattat 1860
tacggttatc gttattacca accgtgggcg ggcagatggt taagcgcgga cccggcagga 1920
accattgatg ggctgaatct ataccgaatg gtaagaaata atcctgtgag tttacaagat 1980
gaaaatggat tagcgccaga aaaagggaaa tataccaaag aggtaaattt ctttgatgaa 2040
ttaaaattca aattggcagc caaaagttca catgttgtca aatggaacga gaaagagagc 2100
agttatacaa aaaataaatc attgaaagtg gttcgtgtcg gtgattccga tccgtcgggt 2160
tatttgctaa gccacgaaga gttactaaaa ggtatagaaa aaagtcaaat catatatagc 2220
cgacttgaag aaaacagctc cctttcagaa aaatcaaaaa cgaatctttc tttaggatct 2280
gaaatatccg gttatatggc aagaaccata caagatacga tatcagaata tgccgaagag 2340
cataaatata gaagtaatca ccctgatttt tattcagaaa ccgatttctt tgcgttaatg 2400
gataaaagtg aaaaaaatga ttattccggt gaaagaaaaa tttatgcggc aatggaggtt 2460
aaggtttatc atgatttaaa aaataaacaa tcagaattac atgtcaacta tgcattggcc 2520
catccctata cgcaattgag taatgaagaa agagcgctgt tgcaagaaac agaacccgct 2580
attgcaatag atagagaata taatttcaaa ggtgttggca aattcctgac aatgaaagca 2640
attaaaaaat cattgaaagg acataaaatt aataggatat caacagaggc tattaatatt 2700
cgctctgcgg ctatcgctga gaatttagga atgcggagaa cttcataa 2748
<210>46
<211>2883
<212>DNA
<213>光杆状菌W14菌株
<400>46
atgaaaaaca ttgatcccaa actttatcaa aaaaccccta ctgtcagcgt ttacgataac 60
cgtggtctga taatccgtaa catcgatttt catcgtacta ccgcaaatgg tgatcccgat 120
acccgtatta cccgccatca atacgatatt cacggacacc taaatcaaag catcgatccg 180
cgcctatatg aagccaagca aaccaacaat acgatcaaac ccaattttct ttggcagtat 240
gatttgaccg gtaatcccct atgtacagag agcattgatg caggtcgcac tgtcaccttg 300
aatgatattg aaggccgtcc gctactaacg gtgactgcaa caggggttat acaaactcga 360
caatatgaaa cttcttccct gcccggtcgt ctgttatctg ttgccgaaca aacacccgag 420
gaaaaaacat cccgtatcac cgaacgcctg atttgggctg gcaataccga agcagagaaa 480
gaccataacc ttgccggcca gtgcgtgcgt cactatgaca cggcgggagt tacccggtta 540
gagagtttat cactgaccgg tactgtttta tctcaatcca gccaactatt gatcgacact 600
caagaggcaa actggacagg tgataacgaa accgtctggc aaaacatgct ggctgatgac 660
atctacacaa ccctgagcac cttcgatgcc accggtgctt tactgactca gaccgatgcg 720
aaagggaaca ttcagagact ggcttatgat gtggccgggc agctaaacgg gagctggcta 780
acactcaaag gccagacgga acaagtgatt atcaaatccc tgacctactc cgccgccgga 840
caaaaattac gtgaggaaca cggcaatgat gttatcaccg aatacagtta tgaaccggaa 900
acccaacggc tgatcggtat caaaacccgc cgtccgtcag acactaaagt gctacaagac 960
ctgcgctatg aatatgaccc ggtaggcaat gtcatcagca tccgtaatga cgcggaagcc 1020
acccgctttt ggcacaatca gaaagtgatg ccggaaaaca cttataccta cgattccctg 1080
tatcagctta tcagcgccac cgggcgcgaa atggcgaata taggtcaaca aagtcaccaa 1140
tttccctcac ccgctctacc ttctgataac aacacctata ccaactatac ccgtacttat 1200
acttatgacc gtggcggcaa tctgaccaaa atccagcaca gttcaccggc gacgcaaaac 1260
aactacacca ccaatatcac ggtttcaaat cgcagcaacc gcgcagtact cagcacattg 1320
accgaagatc cggcgcaagt agatgctttg tttgatgcag gcggacatca gaacaccttg 1380
atatcaggac aaaacctgaa ctggaatact cgtggtgaac tgcaacaagt aacactggtt l440
aaacgggaca agggcgccaa tgatgatcgg gaatggtatc gttatagcgg tgacggaaga 1500
aggatgttaa aaatcaatga acagcaggcc agcaacaacg ctcaaacaca acgtgtgact 1560
tatttgccga acttagaact tcgtctaaca caaaacagca cggccacaac cgaagatttg 1620
caagttatca ccgtaggcga agcgggccgg gcacaggtac gagtattaca ttgggagagc 1680
ggtaaaccgg aagatatcga caataatcag ttgcgttata gttacgataa tcttatcggt 1740
tccagtcaac ttgaattaga tagcgaagga caaattatca gtgaagaaga atattatccc 1800
tatggtggaa cagcattatg ggccgccagg aatcagacag aagccagtta taaaactatc 1860
cgttattcag gcaaagagcg ggatgccacc gggctatatt actacggcta tcggtattac 1920
caaccgtgga taggacggtg gttaagctcc gatccggcag gaacaatcga tgggctgaat 1980
ttatatcgga tggtgaggaa taatccagtt accctccttg atcctgatgg attaatgcca 2040
acaattgcag aacgcatagc agcactaaaa aaaaataaag taacagactc agcgccttcg 2100
ccagcaaatg ccacaaacgt agcgataaac atccgcccgc ctgtagcacc aaaacctagc 2160
ttaccgaaag catcaacgag tagccaacca accacacacc ctatcggagc tgcaaacata 2220
aaaccaacga cgtctgggtc atctattgtt gctccattga gtccagtagg aaataaatct 2280
acttctgaaa tctctctgcc agaaagcgct caaagcagtt cttcaagcac tacctcgaca 2340
aatctacaga aaaaatcatt tactttatat agagcagata acagatcctt tgaagaaatg 2400
caaagtaaat tccctgaagg atttaaagcc tggactcctc tagacactaa gatggcaagg 2460
caatttgcta gtatctttat tggtcagaaa gatacatcta atttacctaa agaaacagtc 2520
aagaacataa gcacatgggg agcaaagcca aaactaaaag atctctcaaa ttacataaaa 2580
tataccaagg acaaatctac agtatgggtt tctactgcaa ttaatactga agcaggtgga 2640
caaagctcag gggctccact ccataaaatt gatatggatc tctacgagtt tgccattgat 2700
ggacaaaaac taaatccact accggagggt agaactaaaa acatggtacc ttccctttta 2760
ctcgacaccc cacaaataga gacatcatcc atcattgcac ttaatcatgg accggtaaat 2820
gatgcagaaa tttcatttct gacaacaatt ccgcttaaaa atgtaaaacc tcataagaga 2880
taa 2883
<210>47
<211>2850
<212>DNA
<213>光杆状菌W14菌株
<400>47
atgaaaaaca ttgacccaaa actttatcaa catacgccca ccgttaacgt ctacgataac 60
cgtggcctga ccattcgtaa catcgacttt caccgtgacg tcgcgggagg cgatacagat 120
actcgtatta cccgccacca atatgatacc cgaggacact tgagccaaag cattgatcca 180
cggctgtatg acgccaaaca aaccaataac tcgacaaacc ccaacttcct ctggcaatac 240
aatctcaccg gcgacacttt gcggacagaa agtgtcgatg ccggccgtac cgtagccctc 300
aatgatattg aaggccgtca agtgttgatt gtaaccgcaa ccggcgccat tcagacccga 360
caatatgaag ccaataccct gcccggtcgt ctattatccg taagtgaaca agcccccgga 420
gaacagactc cccgcgttac tgagcatttt atttgggctg gtaatacaca ggcggagaaa 480
gatcataatc ttgccggcca gtatgtgcgc cactacgaca cagcaggagt gacgcaactg 540
gaaagcctgt cattgacaga aaacatctta tctcaatccc gtcagttatt agccgacggt 600
caggaagcag actggacagg taacgatgaa accctctggc agaccaaact caatagcgaa 660
acttacacga cacaaagcac ctttgatgct accggcgctt tgctgaccca aaccgatgca 720
aaaggcaaca tgcaacgtct ggcttacaac gtggcaggac aattacaagg tagctggctg 780
acattgaaaa accaaagtga gcaagtcatt gtcaaatccc tgacctattc cgccgcaggc 840
cagaaattgc gtgaagaaca cggtaatggc gttatcactg aatacagcta tgaaccggaa 900
actctacgat tgatcggtac cactactcgc cgtcaatcag atagcaaggt gttacaagat 960
ctacgctatg aacatgatcc tgtagggaat attattagtg tccgtaatga tgcagaagcc 1020
acccgcttct ggcgcaatca gaaaatagtc cctgaaaata cctacaccta cgattccctg 1080
tatcagctta tcagtgcaac aggacgtgag atggctaaca tcggccagca aagcaaccaa 1140
cttccttcgc caatcatccc tcttcctact gatgaaaact catataccaa ctatactcgc 1200
agctataatt acgatcgcgg cggcaatttg gttcaaatcc ggcacagttc ccccgccgcc 1260
caaaataact acaccacaga tatcaccgtt tcgaatcgca gtaaccgggc agtgctgagt 1320
tcgctaacct cagacccaac acaggtggag gcactgtttg atgccggcgg acatcaaaca 1380
aaattgttac cggggcaaga gctgagttgg aatacacgag gtgaactaaa acaggtaacg 1440
ccagtcagtc gcgagagcgc cagcgatcgg gaatggtatc gttacggcaa cgacggcatg 1500
cgacggttaa aagtcagtga gcaacagact ggcaacagca cgcagcagca acgagtaact 1560
tatcttcccg atctggagct acgtacaaca caaaatggga ctactacatc agaagacctg 1620
catgctatta ccgtgggagc agcaggccac gcacaagtgc gagttctaca ctgggaaact 1680
acgccaccag ccggtatcaa taacaatcag cttcgctata gctatgataa tttgattggt 1740
tccagtcaac ttgaactgga taacgcagga caaattatca gtcaggaaga gtattatcca 1800
tttggcggca cagcattatg ggcagcaaga aaccaaatag aagccagcta caaaatcctc 1860
cgttactcag gtaaagaacg cgatgctacc gggctctatt attacggcta ccgctattat 1920
cagccgtggg ttggtaggtg gttaagcgcc gatccggctg gaacaatcga tggactgaat 1980
ctataccgga tggtgagaaa taatccgtca acactggttg atatttctgg gcttgcacct 2040
acgaaataca atattcccgg atttgacttt gatgtagaaa tagatgagca aaaaagatct 2100
aaattaaaac caacgttgat aagaatcaaa gatgaatttt tacattatgg tcctgtagat 2160
aagctgttag aagaaaaaaa acccggcctc aatgtaccag aggagctatt tgatagaggt 2220
ccatccgaga atggagtgtc aacattaact ttcaaaaaag acctaccgat aagttgtatt 2280
agcaacacag aatataccct tgatatctta tacaacaaac atgagactaa accattccct 2340
tacgaaaacg aagcaacagt tggcgcagat ctgggagtaa taatgtccgt ggagtttgga 2400
aataaatcaa taggtaatgc ctctgacgaa gatttaaaag aagaacatct cccattagga 2460
aaatccacaa tggataaaac agacctgcca gatttaaaac aagggctaat gatcgcggag 2520
aagataaaaa gtggaaaagg ggcatatcct tttcattttg gtgctgcaat agctgttgta 2580
tatggtgagg ataaaaaagt agccgcttca attctgacag atttatctga acctaaaaga 2640
gacgaaggcg agtatttgca aagtacgaga aaggtaagcg caatgtttat cacaaacgtc 2700
aatgaatttc gcggccatga ttacccaaaa agtaaatata gtatcggatt agttacagct 2760
gaaaaacgtc agccagtaat aagcaaaaaa cgtgcaaacc cggaagaggc cccttcatca 2820
tccagaaata aaaaattgca tgtacattaa 2850
<210>48
<211>2817
<212>DNA
<213>光杆状菌W14菌株
<400>48
atggaaaaca ttgacccaaa actttatcac catacgccta ccgtcagtgt tcacgataac 60
cgtggactag ctatccgtaa tattagtttt caccgcacta ccgcagaagc aaataccgat 120
acccgtatta cccgccatca atataatgcc ggcggatatt tgaaccaaag cattgatcct 180
cgcctgtatg acgccaaaca gactaacaac gctgtacaac cgaattttat ctggcgacat 240
aatttgaccg gcaatatcct gcgaacagag agcgtcgatg ccggtcggac gattaccctc 300
aacgatattg aaggccgccc ggtgttgacc atcaatgcag ccggtgtccg gcaaaaccat 360
cgctacgaag ataacaccct gcccggtcgc ctgctcgcta tcagcgaaca aggacaggca 420
gaagagaaaa cgaccgagcg ccttatctgg gccggcaata cgccgcaaga aaaagaccac 480
aaccttgccg gtcagtgcgt ccgccattac gataccgcag gactcactca actcaacagc 540
cttgccctga ccggcgccgt tctatcacaa tctcaacaac tgcttaccga taaccaggat 600
gccgactgga caggtgaaga ccagagcctc tggcaacaaa aactgagtag tgatgtctat 660
atcacccaaa gtaacactga tgccaccggg gctttactga cccagaccga tgccaaaggc 720
aacattcagc ggctggccta tgatgtggcc gggcagctaa aagggagttg gttaacactc 780
aaaggtcagg cggaacaggt gattatcaaa tcgctaacct actccgccgc cgggcaaaaa 840
ttacgtgaag agcacggtaa cgggattgtc actgaataca gctacgaacc ggaaacccaa 900
cggcttatcg gcattaccac tcgccgtcca tcagacgcca aggtgttgca agacctacgc 960
tatcaatatg acccagtagg caatgtcatt agtatccgta atgatgcgga agccactcgc 1020
ttttggcgca atcagaaagt agccccggag aatagctata cctacgattc cctgtatcag 1080
cttatcagcg ccaccgggcg cgagatggcc aatatcggtc agcaaagcaa ccaacttccc 1140
tctccggcgc taccttctga taacaatacc tacaccaact atactcgcac ttatacttat 1200
gaccgtggcg gcaatttgac gaaaattcag catagttcac cagccgcgca aaataactac 1260
acgacggata taacggtttc aaatcgcagc aaccgcgcgg tactcagcac attgaccgca 1320
gatccaactc aagtcgatgc cttatttgat gcgggaggcc atcaaaccag cttgttatcc 1380
ggccaagttc taacttggac accgcgaggc gaattgaaac aagccaacaa tagcgcagga 1440
aatgagtggt atcgctacga tagcaacggc atacgccagc taaaagtgaa tgaacaacaa 1500
actcagaata tcccgcaaca acaaagggta acttatctac cggggctgga aatacgtaca 1560
acccagaaca acgccacaac aacagaagag ttacacgtta tcacactcgg taaagccggc 1620
cgcgcgcaag tccgagtatt gcattgggag agcggtaaac cagaagatat taataacaat 1680
cagcttcgtt acagctacga taatcttatt ggctccagcc aacttcaatt agatagcgac 1740
ggacaaatta tcagtgaaga agaatattat ccatttggtg gtacagcgct gtgggcggca 1800
aggaatcaaa ccgaagccag ctataaaacc attcgttatt ctggtaaaga gcgggatgtt 1860
accgggctgt attattatgg ctaccgttat taccaaccgt gggcgggcag atggttaagt 1920
gcagacccgg caggaaccat tgatggactg aatttatatc gcatggtgag aaataacccg 1980
gtgacgcaat ttgatgttca gggattatca ccggccaaca gaacagaaga agcgataata 2040
aaacagggtt cctttacggg aatggaagaa gctgtttata aaaaaatggc taaacctcaa 2100
actttcaaac gccaaagagc tatcgctgcc caaacagagc aagaagccca tgaatcattg 2160
accaacaacc ctagtgtaga tattagccca attaaaaact acaccacaga tagctcacaa 2220
attaatgccg cgataaggga aaatcgtatt acgccagcag tggaaagttt agacgccaca 2280
ttatcttccc tacaagatag acaaatgagg gtaacttatc gggtgatgac ctatgtagat 2340
aattccacgc catcgccttg gcactcgcca caggaaggaa atagtattaa tgttggtgat 2400
atcgtttcgg ataacgctta tttatcaaca tcggcccatc gtggttttct gaattttgtt 2460
cacaaaaaag aaaccagtga aactcgatac gtcaagatgg catttttaac gaatgcgggt 2520
gtcaatgtct cagcagcatc tatgtataat aatgctggcg aggagcaagt atttaaaatg 2580
gatttaaacg attcaagaaa aagccttgct gaaaaattaa aactaagagt cagtggacca 2640
caatcgggac aagcggaaat attactacct agggaaacac agttcgaagt tgtttcaatg 2700
aaacatcaag gcagagatac ctatgtatta ttgcaagata ttaaccaatc cgcagccact 2760
catagaaatg tacgtaacac ttacaccggt aatttcaaat catccagtgc aaattaa 2817
<210>49
<211>2538
<212>PRT
<213>嗜线虫致病杆菌Xenorhabdus nematophilus)
<400>49
Met Tyr Ser Thr Ala Val Leu Leu Asn Lys Ile Ser Pro Thr Arg Asp
1 5 10 15
Gly Gln Thr Met Thr Leu Ala Asp Leu Gln Tyr Leu Ser Phe Ser Glu
20 25 30
Leu Arg Lys Ile Phe Asp Asp Gln Leu Ser Trp Gly Glu Ala Arg His
35 40 45
Leu Tyr His Glu Thr Ile Glu Gln Lys Lys Asn Asn Arg Leu Leu Glu
50 55 60
Ala Arg Ile Phe Thr Arg Ala Asn Pro Gln Leu Ser Gly Ala Ile Arg
65 70 75 80
Leu Gly Ile Glu Arg Asp Ser Val Ser Arg Ser Tyr Asp Glu Met Phe
85 90 95
Gly Ala Arg Ser Ser Ser Phe Val Lys Pro Gly Ser Val Ala Ser Met
100 105 110
Phe Ser Pro Ala Gly Tyr Leu Thr Glu Leu Tyr Arg Glu Ala Lys Asp
115 120 125
Leu His Phe Ser Ser Ser Ala Tyr His Leu Asp Asn Arg Arg Pro Asp
130 135 140
Leu Ala Asp Leu Thr Leu Ser Gln Ser Asn Met Asp Thr Glu Ile Ser
145 150 155 160
Thr Leu Thr Leu Ser Asn Glu Leu Leu Leu Glu His Ile Thr Arg Lys
165 170 175
Thr Gly Gly Asp Ser Asp Ala Leu Met Glu Ser Leu Ser Thr Tyr Arg
180 185 190
Gln Ala Ile Asp Thr Pro Tyr His Gln Pro Tyr Glu Thr Ile Arg Gln
195 200 205
Val Ile Met Thr His Asp Ser Thr Leu Ser Ala Leu Ser Arg Asn Pro
210 215 220
Glu Val Met Gly Gln Ala Glu Gly Ala Ser Leu Leu Ala Ile Leu Ala
225 230 235 240
Asn Ile Ser Pro Glu Leu Tyr Asn Ile Leu Thr Glu Glu Ile Thr Glu
245 250 255
Lys Asn Ala Asp Ala Leu Phe Ala Gln Asn Phe Ser Glu Asn Ile Thr
260 265 270
Pro Glu Asn Phe Ala Ser Gln Ser Trp Ile Ala Lys Tyr Tyr Gly Leu
275 280 285
Glu Leu Ser Glu Val Gln Lys Tyr Leu Gly Met Leu Gln Asn Gly Tyr
290 295 300
Ser Asp Ser Thr Ser Ala Tyr Va1 Asp Asn Ile Ser Thr Gly Leu Val
305 310 315 320
Val Asn Asn Glu Ser Lys Leu Glu Ala Tyr Lys Ile Thr Arg Val Lys
325 330 335
Thr Asp Asp Tyr Asp Lys Asn Ile Asn Tyr Phe Asp Leu Met Tyr Glu
340 345 350
Gly Asn Asn Gln Phe Phe Ile Arg Ala Asn Phe Lys Val Ser Arg Glu
355 360 365
Phe Gly Ala Thr Leu Arg Lys Asn Ala Gly Pro Ser Gly Ile Val Gly
370 375 380
Ser Leu Ser Gly Pro Leu Ile Ala Asn Thr Asn Phe Lys Ser Asn Tyr
385 390 395 400
Leu Ser Asn Ile Ser Asp Ser Glu Tyr Lys Asn Gly Val Lys Ile Tyr
405 410 415
Ala Tyr Arg Tyr Thr Ser Ser Thr Ser Ala Thr Asn Gln Gly Gly Gly
420 425 430
Ile Phe Thr Phe Glu Ser Tyr Pro Leu Thr Ile Phe Ala Leu Lys Leu
435 440 445
Asn Lys Ala Ile Arg Leu Cys Leu Thr Ser Gly Leu Ser Pro Asn Glu
450 455 460
Leu Gln Thr Ile Val Arg Ser Asp Asn Ala Gln Gly Ile Ile Asn Asp
465 470 475 480
Ser Val Leu Thr Lys Val Phe Tyr Thr Leu Phe Tyr Ser His Arg Tyr
485 490 495
Ala Leu Ser Phe Asp Asp Ala Gln Val Leu Asn Gly Ser Val Ile Asn
500 505 510
Gln Tyr Ala Asp Asp Asp Ser Val Ser His Phe Asn Arg Leu Phe Asn
515 520 525
Thr Pro Pro Leu Lys Gly Lys ILe Phe Glu Ala Asp Gly Asn Thr Val
530 535 540
Ser Ile Asp Pro Asp Glu Glu Gln Ser Thr Phe Ala Arg Ser Ala Leu
545 550 555 560
Met Arg Gly Leu Gly Val Asn Ser Gly Glu Leu Tyr Gln Leu Gly Lys
565 570 575
Leu Ala Gly Val Leu Asp Ala Gln Asn Thr Ile Thr Leu Ser Val Phe
580 585 590
Val Ile Ser Ser Leu Tyr Arg Leu Thr Leu Leu Ala Arg Val His Gln
595 600 605
Leu Thr Val Asn Glu Leu Cys Met Leu Tyr Gly Leu Ser Pro Phe Asn
610 615 620
Gly Lys Thr Thr Ala Ser Leu Ser Ser Gly Glu Leu Pro Arg Leu Val
625 630 635 640
Ile Trp Leu Tyr Gln Val Thr Gln Trp Leu Thr Glu Ala Glu Ile Thr
645 650 655
Thr Glu Ala Ile Trp Leu Leu Cys Thr Pro Glu Phe Ser Gly Asn Ile
660 665 670
Ser Pro Glu Ile Ser Asn Leu Leu Asn Asn Leu Arg Pro Ser Ile Ser
675 680 685
Glu Asp Met Ala Gln Ser His Asn Arg Glu Leu Gln Ala Glu Ile Leu
690 695 700
Ala Pro Phe Ile Ala Ala Thr Leu His Leu Ala Ser Pro Asp Met Ala
705 710 715 720
Arg Tyr Ile Leu Leu Trp Thr Asp Asn Leu Arg Pro Gly Gly Leu Asp
725 730 735
Ile Ala Gly Phe Met Thr Leu Val Leu Lys Glu Ser Leu Asn Ala Asn
740 745 750
Glu Thr Thr Gln Leu Val Gln Phe Cys His Val Met Ala Gln Leu Ser
755 760 765
Leu Ser Val Gln Thr Leu Arg Leu Ser Glu Ala Glu Leu Ser Va1 Leu
770 775 780
Val Ile Ser Gly Phe Ala Val Leu Gly Ala Lys Asn Gln Pro Ala Gly
785 790 795 800
Gln His Asn Ile Asp Thr Leu Phe Ser Leu Tyr Arg Phe His Gln Trp
805 810 815
Ile Asn Gly Leu Gly Asn Pro Gly Ser Asp Thr Leu Asp Met Leu Arg
820 825 830
Gln Gln Thr Leu Thr Ala Asp Arg Leu Ala Ser Val Met Gly Leu Asp
835 840 845
Ile Ser Met Val Thr Gln Ala Met Val Ser Ala Gly Val Asn Gln Leu
850 855 860
Gln Cys Trp Gln Asp Ile Asn Thr Val Leu Gln Trp Ile Asp Val Ala
865 870 875 880
Ser Ala Leu His Thr Met Pro Ser Val Ile Arg Thr Leu Val Asn Ile
885 890 895
Arg Tyr Val Thr Ala Leu Asn Lys Ala Glu Ser Asn Leu Pro Ser Trp
900 905 910
Asp Glu Trp Gln Thr Leu Ala Glu Asn Met Glu Ala Gly Leu Ser Thr
915 920 925
Gln Gln Ala Gln Thr Leu Ala Asp Tyr Thr Ala Glu Arg Leu Ser Ser
930 935 940
Val Leu Cys Asn Trp Phe Leu Ala Asn Ile Gln Pro Glu Gly Val Ser
945 950 955 960
Leu His Ser Arg Asp Asp Leu Tyr Ser Tyr Phe Leu Ile Asp Asn Gln
965 970 975
Val Ser Ser Ala Ile Lys Thr Thr Arg Leu Ala Glu Ala Ile Ala Gly
980 985 990
Ile Gln Leu Tyr Ile Asn Arg Ala Leu Asn Arg Ile Glu Pro Asn Ala
995 1000 1005
Arg Ala Asp Val Ser Thr Arg Gln Phe Phe Thr Asp Trp Thr Val
1010 1015 1020
Asn Asn Arg Tyr Ser Thr Trp Gly Gly Val Ser Arg Leu Val Tyr
1025 1030 1035
Tyr Pro Glu Asn Tyr Ile Asp Pro Thr Gln Arg Ile Gly Gln Thr
1040 1045 1050
Arg Met Met Asp Glu Leu Leu Glu Asn Ile Ser Gln Ser Lys Leu
1055 1060 1065
Ser Arg Asp Thr Val Glu Asp Ala Phe Lys Thr Tyr Leu Thr Arg
1070 1075 1080
Phe Glu Thr Val Ala Asp Leu Lys Val Val Ser Ala Tyr His Asp
1085 1090 1095
Asn Val Asn Ser Asn Thr Gly Leu Thr Trp Phe Val Gly Gln Thr
1100 1105 1110
Arg Glu Asn Leu Pro Glu Tyr Tyr Trp Arg Asn Val Asp Ile Ser
1115 1120 1125
Arg Met Gln Ala Gly Glu Leu Ala Ala Asn Ala Trp Lys Glu Trp
1130 1135 1140
Thr Lys Ile Asp Thr Ala Va1 Asn Pro Tyr Lys Asp Ala Ile Arg
1145 1150 1155
Pro Val Ile Phe Arg Glu Arg Leu His Leu Ile Trp Val Glu Lys
1160 1165 1170
Glu Glu Val Ala Lys Asn Gly Thr Asp Pro Val Glu Thr Tyr Asp
1175 1180 1185
Arg Phe Thr Leu Lys Leu Ala Phe Leu Arg His Asp Gly Ser Trp
1190 1195 1200
Ser Ala Pro Trp Ser Tyr Asp Ile Thr Thr Gln Val Glu Ala Val
1205 1210 1215
Thr Asp Lys Lys Pro Asp Thr Glu Arg Leu Ala Leu Ala Ala Ser
1220 1225 1230
Gly Phe Gln Gly Glu Asp Thr Leu Leu Val Phe Val Tyr Lys Thr
1235 1240 1245
Gly Lys Ser Tyr Ser Asp Phe Gly Gly Ser Asn Lys Asn Val Ala
1250 1255 1260
Gly Met Thr Ile Tyr Gly Asp Gly Ser Phe Lys Lys Met Glu Asn
1265 1270 1275
Thr Ala Leu Ser Arg Tyr Ser Gln Leu Lys Asn Thr Phe Asp Ile
1280 1285 1290
Ile His Thr Gln Gly Asn Asp Leu Val Arg Lys Ala Ser Tyr Arg
1295 1300 1305
Phe Ala Gln Asp Phe Glu Val Pro Ala Ser Leu Asn Met Gly Ser
1310 1315 1320
Ala Ile Gly Asp Asp Ser Leu Thr Val Met Glu Asn Gly Asn Ile
1325 1330 1335
Pro Gln Ile Thr Ser Lys Tyr Ser Ser Asp Asn Leu Ala Ile Thr
1340 1345 1350
Leu His Asn Ala Ala Phe Thr Val Arg Tyr Asp Gly Ser Gly Asn
1355 l360 1365
Val Ile Arg Asn Lys Gln Ile Ser Ala Met Lys Leu Thr Gly Val
1370 1375 1380
Asp Gly Lys Ser Gln Tyr Gly Asn Ala Phe Ile Ile Ala Asn Thr
1385 1390 1395
Val Lys His Tyr Gly Gly Tyr Ser Asp Leu Gly Gly Pro Ile Thr
1400 1405 1410
Val Tyr Asn Lys Thr Lys Asn Tyr Ile Ala Ser Val Gln Gly His
1415 1420 1425
Leu Met Asn Ala Asp Tyr Thr Arg Arg Leu Ile Leu Thr Pro Val
1430 1435 1440
Glu Asn Asn Tyr Tyr Ala Arg Leu Phe Glu Phe Pro Phe Ser Pro
1445 1450 1455
Asn Thr Ile Leu Asn Thr Val Phe Thr Val Gly Ser Asn Lys Thr
1460 1465 1470
Ser Asp Phe Lys Lys Cys Ser Tyr Ala Val Asp Gly Asn Asn Ser
1475 1480 1485
Gln Gly Phe Gln Ile Phe Ser Ser Tyr Gln Ser Ser Gly Trp Leu
1490 1495 1500
Asp Ile Asp Thr Gly Ile Asn Asn Thr Asp Ile Lys Ile Thr Val
1505 1510 1515
Met Ala Gly Ser Lys Thr His Thr Phe Thr Ala Ser Asp His Ile
1520 1525 1530
Ala Ser Leu Pro Ala Asn Ser Phe Asp Ala Met Pro Tyr Thr Phe
1535 1540 1545
Lys Pro Leu Glu Ile Asp Ala Ser Ser Leu Ala Phe Thr Asn Asn
1550 1555 1560
Ile Ala Pro Leu Asp Ile Val Phe Glu Thr Lys Ala Lys Asp Gly
1565 1570 1575
Arg Val Leu Gly Lys Ile Lys Gln Thr Leu Ser Val Lys Arg Val
1580 1585 1590
Asn Tyr Asn Pro Glu Asp Ile Leu Phe Leu Arg Glu ThrHis Ser
1595 1600 1605
Gly Ala Gln Tyr Met Gln Leu Gly Val Tyr Arg Ile ArgLeu Asn
1610 1615 1620
Thr Leu Leu Ala Ser Gln Leu Val Ser Arg Ala Asn Thr Gly Ile
1625 1630 1635
Asp Thr Ile Leu Thr Met Glu Thr Gln Arg Leu Pro Glu Pro Pro
1640 1645 1650
Leu Gly Glu Gly Phe Phe Ala Asn Phe Val Leu Pro Lys Tyr Asp
1655 1660 1665
Pro Ala Glu His Gly Asp Glu Arg Trp Phe Lys Ile His Ile Gly
1670 1675 1680
Asn Val Gly Gly Asn Thr Gly Arg Gln Pro Tyr Tyr Ser Gly Met
1685 1690 1695
Leu Ser Asp Thr Ser Glu Thr Ser Met Thr Leu Phe Val Pro Tyr
1700 1705 1710
Ala Glu Gly Tyr Tyr Met His Glu Gly Val Arg Leu Gly Val Gly
1715 1720 1725
Tyr Gln Lys Ile Thr Tyr Asp Asn Thr Trp Glu Ser Ala Phe Phe
1730 1735 1740
Tyr Phe Asp Glu Thr Lys Gln Gln Phe Val Leu Ile Asn Asp Ala
1745 1750 1755
Asp His Asp Ser Gly Met Thr Gln Gln Gly Ile Val Lys Asn Ile
1760 1765 1770
Lys Lys Tyr Lys Gly Phe Leu Asn Val Ser Ile Ala Thr Gly Tyr
1775 1780 1785
Ser Ala Pro Met Asp Phe Asn Ser Ala Ser Ala Leu Tyr Tyr Trp
1790 1795 1800
Glu Leu Phe Tyr Tyr Thr Pro Met Met Cys Phe Gln Arg Leu Leu
1805 1810 1815
Gln Glu Lys Gln Phe Asp Glu Ala Thr Gln Trp Ile Asn Tyr Val
1820 1825 1830
Tyr Asn Pro Ala Gly Tyr Ile Val Asn Gly Glu Ile Ala Pro Trp
1835 1840 1845
Ile Trp Asn Cys Arg Pro Leu Glu GLu Thr Thr Ser Trp Asn Ala
1850 1855 1860
Asn Pro Leu Asp Ala Ile Asp Pro Asp Ala Val Ala Gln Asn Asp
1865 1870 1875
Pro Met His Tyr Lys Ile Ala Thr Phe Met Arg Leu Leu Asp Gln
1880 1885 1890
Leu Ile Leu Arg Gly Asp Met Ala Tyr Arg Glu Leu Thr Arg Asp
1895 1900 1905
Ala Leu Asn Glu Ala Lys Met Trp Tyr Val Arg Thr Leu Glu Leu
1910 1915 1920
Leu Gly Asp Glu Pro Glu Asp Tyr Gly Ser Gln Gln Trp Ala Ala
l925 1930 1935
Pro Ser Leu Ser Gly Ala Ala Ser Gln Thr Val Gln Ala Ala Tyr
1940 1945 1950
Gln Gln Asp Leu Thr Met Leu Gly Arg Gly Gly Val Ser Lys Asn
1955 1960 1965
Leu Arg Thr Ala Asn Ser Leu Val Gly Leu Phe Leu Pro Glu Tyr
1970 1975 1980
Asn Pro Ala Leu Thr Asp Tyr Trp Gln Thr Leu Arg Leu Arg Leu
1985 1990 1995
Phe Asn Leu Arg His Asn Leu Ser Ile Asp Gly Gln Pro Leu Ser
2000 2005 2010
Leu Ala Ile Tyr Ala Glu Pro Thr Asp Pro Lys Ala Leu Leu Thr
2015 2020 2025
Ser Met Val Gln Ala Ser Gln Gly Gly Ser Ala Val Leu Pro Gly
2030 2035 2040
Thr Leu Ser Leu Tyr Arg Phe Pro Val Met Leu Glu Arg Thr Arg
2045 2050 2055
Asn Leu Val Ala Gln Leu Thr Gln Phe Gly Thr Ser Leu Leu Ser
2060 2065 2070
Met Ala Glu His Asp Asp Ala Asp Glu Leu Thr Thr Leu Leu Leu
2075 2080 2085
Gln Gln Gly Met Glu Leu Ala Thr Gln Ser Ile Arg Ile Gln Gln
2090 2095 2100
Arg Thr Val Asp Glu Val Asp Ala Asp Ile Ala Val Leu Ala Glu
2105 2110 2115
Ser Arg Arg Ser Ala Gln Asn Arg Leu Glu Lys Tyr Gln Gln Leu
2120 2l25 2130
Tyr Asp Glu Asp Ile Asn His Gly Glu Gln Arg Ala Met Ser Leu
2135 2140 2145
Leu Asp Ala Ala Ala Gly Gln Ser Leu Ala Gly Gln Val Leu Ser
2150 2155 2160
Ile Ala Glu Gly Val Ala Asp Leu Val Pro Asn Val Phe Gly Leu
2165 2170 2175
Ala Cys Gly Gly Ser Arg Trp Gly Ala Ala Leu Arg Ala Ser Ala
2180 2185 2190
Ser Val Met Ser Leu Ser Ala Thr Ala Ser Gln Tyr Ser Ala Asp
2195 2200 2205
Lys Ile Ser Arg Ser Glu Ala Tyr Arg Arg Arg Arg Gln Glu Trp
2210 2215 2220
Glu Ile Gln Arg Asp Asn Ala Asp Gly Glu Val Lys Gln Met Asp
2225 2230 2235
Ala Gln Leu Glu Ser Leu Lys Ile Arg Arg Glu Ala Ala Gln Met
2240 2245 2250
Gln Val Glu Tyr Gln Glu Thr Gln Gln Ala His Thr Gln Ala Gln
2255 2260 2265
Leu Glu Leu Leu Gln Arg Lys Phe Thr Asn Lys Ala Leu Tyr Ser
2270 2275 2280
Trp Met Arg Gly Lys Leu Ser Ala Ile Tyr Tyr Gln Phe Phe Asp
2285 2290 2295
Leu Thr Gln Ser Phe Cys Leu Met Ala Gln Glu Ala Leu Arg Arg
2300 2305 2310
Glu Leu Thr Asp Asn Gly Val Thr Phe Ile Arg Gly Gly Ala Trp
2315 2320 2325
Asn Gly Thr Thr Ala Gly Leu Met Ala Gly Glu Thr Leu Leu Leu
2330 2335 2340
Asn Leu Ala Glu Met Glu Lys Val Trp Leu Glu Arg Asp Glu Arg
2345 2350 2355
Ala Leu Glu Val Thr Arg Thr Val Ser Leu Ala Gln Phe Tyr Gln
2360 2365 2370
Ala Leu Ser Ser Asp Asn Phe Asn Leu Thr Glu Lys Leu Thr Gln
2375 2380 2385
Phe Leu Arg Glu Gly Lys Gly Asn Val Gly Ala Ser Gly Asn Glu
2390 2395 2400
Leu Lys Leu Ser Asn Arg Gln Ile Glu Ala Ser Val Arg Leu Ser
2405 2410 2415
Asp Leu Lys Ile Phe Ser Asp Tyr Pro Glu Ser Leu Gly Asn Thr
2420 2425 2430
Arg Gln Leu Lys Gln Val Ser Va1 Thr Leu Pro Ala Leu Val Gly
2435 2440 2445
Pro Tyr Glu Asp Ile Arg Ala Val Leu Asn Tyr Gly Gly Ser Ile
2450 2455 2460
Val Met Pro Arg Gly Cys Ser Ala Ile Ala Leu Ser His Gly Val
2465 2470 2475
Asn Asp Ser Gly Gln Phe Met Leu Asp Phe Asn Asp Ser Arg Tyr
2480 2485 2490
Leu Pro Phe Glu Gly Ile Ser Val Asn Asp Ser Gly Ser Leu Thr
2495 2500 2505
Leu Ser Phe Pro Asp Ala Thr Asp Arg Gln Lys Ala Leu Leu Glu
2510 2515 2520
Ser Leu Ser Asp Ile Ile Leu His Ile Arg Tyr Thr Ile Arg Ser
2525 2530 2535
Claims (24)
1.筛选类芽孢杆菌(paenibacillus)分离株培养物用于编码选自对鳞翅目害虫有毒性的Cry蛋白及毒素复合体蛋白的基因的方法,其中所述方法包括至少一个以下步骤:
(a)自所述培养物获得DNA并分析所述DNA中所述基因的存在;及
(b)获得由所述培养物产生的蛋白质并分析所述蛋白质是否存在表明在所述分离株中存在所述基因的蛋白质。
2.筛选类芽孢杆菌分离株培养物抗鳞翅目害虫的具有毒素活性蛋白质的方法,其中所述方法包括至少一个以下步骤:
(a)获得由所述培养物产生的培养液并分析所述培养液抗鳞翅目害虫的毒素活性;及
(b)将多种所述分离株喂饲鳞翅目害虫,并观察毒素对所述害虫的作用。
3.权利要求1的方法,其中所述方法包括筛选一群类芽孢杆菌分离株的所述蛋白质,且所述分离株在所述群体中。
4.权利要求1的方法,其中所述蛋白质为毒素复合体蛋白。
5.权利要求4的方法,其中所述蛋白质增强毒素复合体毒素蛋白质的活性。
6.权利要求1的方法,其中所述蛋白质为对鳞翅目害虫有毒性的Cry蛋白。
7.权利要求1的方法,其中自所述培养物获得DNA的所述步骤包括产生来自所述DNA的克隆文库并分析至少一个所述克隆是否存在所述基因。
8.权利要求7的方法,其中用于分析所述克隆存在所述多核苷酸的所述步骤包括分析所述克隆对鳞翅目的毒素活性,由此表明存在所述多核苷酸。
9.权利要求1的方法,其中分析所述DNA的所述步骤包括用至少一个引物进行聚合酶链反应,其中所述引物设计为用以表明存在所述基因。
10.权利要求1的方法,其中分析所述蛋白质的所述步骤包括将抗体与所述蛋白质进行免疫反应,其中所述抗体设计为用以表明存在所述蛋白质。
11.权利要求1的方法,其中分析所述DNA的所述步骤包括将核酸探针与所述DNA杂交,其中所述探针设计为用以表明存在所述基因。
12.具有抗昆虫害虫毒素活性的经分离蛋白质,其中所述蛋白质由这样的多核苷酸序列编码,所述多核苷酸序列与选自SEQ ID NO:2,4,6,8,10,12,14,32,34,35,38及40的序列互补物杂交。
13.权利要求12的蛋白质,其中所述蛋白质为Cry蛋白,且所述探针为SEQ ID NO:14的互补物。
14.权利要求12的蛋白质,其中所述蛋白质为毒素复合体蛋白,且所述探针为选自SEQ ID NO:2,4,6,8,10,12,32,34,35,38及40的序列的互补物。
15.根据权利要求12所述蛋白质的免疫反应性片段。
16.经分离多核苷酸,其编码根据权利要求12所述的蛋白质。
17.细胞,其包含根据权利要求16所述的多核苷酸。
18.根据权利要求17所述的细胞,其中所述细胞选自植物细胞及微生物细胞。
19.控制昆虫害虫的方法,其中所述方法包括将所述害虫与蛋白质接触的步骤,其中所述蛋白质包含选自SEQ ID NO:3,5,7,9,11,13,15,18,19,33,36,37,39及41的氨基酸序列。
20.权利要求1的方法,其中所述类芽孢杆菌分离株为选自蜂类芽孢杆菌(P.apiarius)、软骨素类芽孢杆菌(P.chondroitinus)、解藻酸类芽孢杆菌(P.alginolyticus)、幼虫类芽孢杆菌(P.larvae)、强壮类芽孢杆菌(P.validus)、戈氏类芽孢杆菌(P.gordonae)、蜂房类芽孢杆菌(P.alvei)、缓病类芽孢杆菌(P.lentinnorbus)、日本甲虫类芽孢杆菌(P.popilliae)、解硫胺素类芽孢杆菌(P.thiaminolyticus)、解菌多糖类芽孢杆菌(P.curdlanolyticus)、神户类芽孢杆菌(P.kobensis)、解糖类芽孢杆菌(P.glucanolyticus)、灿烂类芽孢杆菌(P.lautus)、千叶类芽孢杆菌(P.chibensis)、马阔里类芽孢杆菌(P.macquariensis)、固氮类芽孢杆菌(P.azotofixans)、皮奥利亚类芽孢杆菌(P.peoriae)、多粘类芽孢杆菌(P.polymyxa)、依利诺斯类芽孢杆菌(P.illinoisensis)、解淀粉类芽孢杆菌(P.amylolyticus)、饲料类芽孢杆菌(P.pabuli)及浸麻类芽孢杆菌(P.macerans)的种。
21.权利要求11的方法,其中所述探针衍生自选自tcaA、tcaB、tcaC、tcbA、tccA、tccB、tccC、tcdA、tcdB、xptA1、xptD1、xptB1、xptC1、xptA2、sepA、sepB及sepC的基因。
22.权利要求9的方法,其中所述引物衍生自选自tcaA、tcaB、tcaC、tcbA、tccA、tccB、tccC、tcdA、tcdB、xptA1、xptD1、xptB1、xptC1、xptA2、sepA、sepB及sepC的基因。
23.权利要求9的方法,其中所述引物选自SEQ ID NO:22,23,24,25,26,27,28,29,30及31。
24.类芽孢杆菌菌株的生物学纯的培养物,其中所述类芽孢杆菌菌株选自DAS1529(可获自NRRL B-30599)及DB482(可获自NRRL B-30670)。
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US39263302P | 2002-06-28 | 2002-06-28 | |
| US60/392,633 | 2002-06-28 | ||
| US44164703P | 2003-01-21 | 2003-01-21 | |
| US60/441,647 | 2003-01-21 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN1684974A true CN1684974A (zh) | 2005-10-19 |
Family
ID=30003267
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CNA038153378A Pending CN1684974A (zh) | 2002-06-28 | 2003-06-27 | 可获自类芽孢杆菌种的杀虫活性蛋白质及多核苷酸 |
Country Status (11)
| Country | Link |
|---|---|
| US (2) | US20040110184A1 (zh) |
| EP (2) | EP1532165B1 (zh) |
| JP (1) | JP2005536198A (zh) |
| CN (1) | CN1684974A (zh) |
| AT (1) | ATE405581T1 (zh) |
| AU (1) | AU2003247650A1 (zh) |
| BR (1) | BR0312448A (zh) |
| CA (1) | CA2486543A1 (zh) |
| DE (1) | DE60323103D1 (zh) |
| ES (1) | ES2311731T3 (zh) |
| WO (1) | WO2004002223A2 (zh) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110257269A (zh) * | 2018-03-12 | 2019-09-20 | 屏东科技大学 | 一种产细菌素的类芽孢杆菌及其应用 |
| CN110786293A (zh) * | 2019-11-01 | 2020-02-14 | 中国人民解放军陆军军医大学 | 能够导致斯氏按蚊传疟能力增强的生物杀虫剂及使用方法 |
| CN114292799A (zh) * | 2015-03-26 | 2022-04-08 | 拜耳作物科学有限合伙公司 | 新型类芽孢杆菌属菌株、抗真菌化合物以及它们的使用方法 |
| CN114828880A (zh) * | 2019-09-18 | 2022-07-29 | 达兰动物保健有限公司 | 蜜蜂疫苗和使用方法 |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7491698B2 (en) | 2003-01-21 | 2009-02-17 | Dow Agrosciences Llc | Mixing and matching TC proteins for pest control |
| CA2558656A1 (en) | 2004-03-02 | 2005-09-15 | Dow Agrosciences Llc | Insecticidal toxin complex fusion proteins |
| BRPI0603879B1 (pt) * | 2006-08-29 | 2018-02-06 | Empresa Brasileira De Pesquisa Agropecuária - Embrapa | COMPOSIÇÃO BASEADA EM BACILLUS spp. E GÊNEROS CORRELATOS E SEU USO NO CONTROLE DE PRAGAS |
| AR091910A1 (es) * | 2012-07-26 | 2015-03-11 | Pioneer Hi Bred Int | Proteinas insecticidas y metodos de uso |
| US9475847B2 (en) | 2012-07-26 | 2016-10-25 | Pioneer Hi-Bred International, Inc. | Insecticidal proteins and methods for their use |
| EA037469B1 (ru) * | 2015-08-27 | 2021-03-31 | Монсанто Текнолоджи Ллс | Новые белки, проявляющие ингибирующую активность по отношению к насекомым |
| CN110618281B (zh) * | 2019-09-10 | 2022-09-27 | 沈阳农业大学 | 一种昆虫体内生物素含量测定方法 |
| EP4334457A1 (en) * | 2021-05-06 | 2024-03-13 | Agbiome, Inc. | Pesticidal genes and methods of use |
| US12385050B1 (en) | 2024-05-07 | 2025-08-12 | United Arab Emirates University | Heat resistant biopesticide and a method of preparing the same |
Family Cites Families (66)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4762785A (en) | 1982-08-12 | 1988-08-09 | Calgene, Inc. | Novel method and compositions for introducting alien DNA in vivo |
| EP0116718B2 (en) | 1983-01-13 | 1996-05-08 | Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. | Process for the introduction of expressible genes into plant cell genomes and agrobacterium strains carrying hybrid Ti plasmid vectors useful for this process |
| EP0131624B1 (en) | 1983-01-17 | 1992-09-16 | Monsanto Company | Plasmids for transforming plant cells |
| NL8300699A (nl) | 1983-02-24 | 1984-09-17 | Univ Leiden | Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; werkwijze voor het produceren van agrobacterium tumefaciens bacterien; stabiele cointegraat plasmiden; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten. |
| NL8300698A (nl) | 1983-02-24 | 1984-09-17 | Univ Leiden | Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten. |
| US5380831A (en) | 1986-04-04 | 1995-01-10 | Mycogen Plant Science, Inc. | Synthetic insecticidal crystal protein gene |
| US5567600A (en) | 1983-09-26 | 1996-10-22 | Mycogen Plant Sciences, Inc. | Synthetic insecticidal crystal protein gene |
| NL8401048A (nl) | 1984-04-03 | 1985-11-01 | Rijksuniversiteit Leiden En Pr | Werkwijze voor het inbouwen van vreemd dna in het genoom van eenzaadlobbige planten. |
| US5231019A (en) | 1984-05-11 | 1993-07-27 | Ciba-Geigy Corporation | Transformation of hereditary material of plants |
| US5149645A (en) | 1984-06-04 | 1992-09-22 | Rijksuniversiteit Leiden | Process for introducing foreign DNA into the genome of plants |
| NL8401780A (nl) | 1984-06-04 | 1986-01-02 | Rijksuniversiteit Leiden En Pr | Werkwijze voor het inbouwen van vreemd dna in het genoom van planten. |
| US4945050A (en) | 1984-11-13 | 1990-07-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
| US4695455A (en) | 1985-01-22 | 1987-09-22 | Mycogen Corporation | Cellular encapsulation of pesticides produced by expression of heterologous genes |
| US4695462A (en) | 1985-06-28 | 1987-09-22 | Mycogen Corporation | Cellular encapsulation of biological pesticides |
| CA1288073C (en) | 1985-03-07 | 1991-08-27 | Paul G. Ahlquist | Rna transformation vector |
| US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
| US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
| US5569597A (en) | 1985-05-13 | 1996-10-29 | Ciba Geigy Corp. | Methods of inserting viral DNA into plant material |
| US4800159A (en) | 1986-02-07 | 1989-01-24 | Cetus Corporation | Process for amplifying, detecting, and/or cloning nucleic acid sequences |
| AU7360087A (en) | 1986-04-30 | 1987-11-24 | Boyce Thompson Institute For Plant Research Inc. | Electric field mediated dna transformation of plant cells and organelles |
| US5188958A (en) | 1986-05-29 | 1993-02-23 | Calgene, Inc. | Transformation and foreign gene expression in brassica species |
| US5177010A (en) | 1986-06-30 | 1993-01-05 | University Of Toledo | Process for transforming corn and the products thereof |
| EP0267159A3 (de) | 1986-11-07 | 1990-05-02 | Ciba-Geigy Ag | Verfahren zur genetischen Modifikation monokotyler Pflanzen |
| SE455438B (sv) | 1986-11-24 | 1988-07-11 | Aga Ab | Sett att senka en brennares flamtemperatur samt brennare med munstycken for oxygen resp brensle |
| US5004863B2 (en) | 1986-12-03 | 2000-10-17 | Agracetus | Genetic engineering of cotton plants and lines |
| ES2121803T3 (es) | 1987-05-20 | 1998-12-16 | Novartis Ag | Plantas de zea mays y plantas transgenicas de zea mays generadas a partir de protoplastos o celulas derivadas de protoplastos. |
| US5316931A (en) | 1988-02-26 | 1994-05-31 | Biosource Genetics Corp. | Plant viral vectors having heterologous subgenomic promoters for systemic expression of foreign genes |
| US5674485A (en) | 1988-11-01 | 1997-10-07 | The Regents Of The University Of California | Insect diagnostic and control compositions with truncated JHE |
| US5135867A (en) | 1988-11-01 | 1992-08-04 | Mycogen Corporation | Gene encoding a lepidopteran-active toxin from Bacillus thuringiensis isolate denoted B.t. .PS81GG active against lepidopteran pests |
| ATE206462T1 (de) | 1989-02-24 | 2001-10-15 | Monsanto Technology Llc | Synthetische pflanzengene und verfahren zu ihrer herstellung |
| US5908970A (en) | 1989-05-31 | 1999-06-01 | Plant Genetic Systems N.V. | Recombinant plant expressing non-competitively binding Bt insecticidal crystal proteins |
| EP0400246A1 (en) | 1989-05-31 | 1990-12-05 | Plant Genetic Systems, N.V. | Prevention of Bt resistance development |
| US5302523A (en) | 1989-06-21 | 1994-04-12 | Zeneca Limited | Transformation of plant cells |
| US5141131A (en) | 1989-06-30 | 1992-08-25 | Dowelanco | Method and apparatus for the acceleration of a propellable matter |
| ES2260886T3 (es) | 1990-11-23 | 2006-11-01 | Bayer Bioscience N.V. | Procedimiento para transformar plantas monocotiledoneas. |
| US5384253A (en) | 1990-12-28 | 1995-01-24 | Dekalb Genetics Corporation | Genetic transformation of maize cells by electroporation of cells pretreated with pectin degrading enzymes |
| ATE244259T1 (de) | 1992-02-12 | 2003-07-15 | Chromagen Inc | Verwendungen von fluoreszierenden n-nukleosiden und dessen analogen |
| US5712248A (en) * | 1992-02-27 | 1998-01-27 | Sandoz Ltd. | Method of controlling insect with novel insecticidal protein |
| US5679558A (en) | 1992-04-15 | 1997-10-21 | Plant Genetic Systems, N.V. | Transformation of monocot cells |
| IL105772A (en) | 1992-06-01 | 1998-07-15 | Univ Florida | Methods and materials for pest control |
| US5591616A (en) | 1992-07-07 | 1997-01-07 | Japan Tobacco, Inc. | Method for transforming monocotyledons |
| ATE290083T1 (de) | 1993-03-25 | 2005-03-15 | Syngenta Participations Ag | Pestizid-proteine und stämme |
| US5469976A (en) | 1993-04-30 | 1995-11-28 | Burchell; James R. | Shelf allocation and management system |
| US6528484B1 (en) * | 1993-05-18 | 2003-03-04 | Wisconsin Alumni Research Foundation | Insecticidal protein toxins from Photorhabdus |
| EP0627752B1 (en) | 1993-06-04 | 1997-07-23 | CAVIS S.r.l. | An inertia device for interrupting the electrical circuit of a vehicle with an internal combustion engine |
| JPH09500264A (ja) | 1993-06-25 | 1997-01-14 | コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガニゼーション | Xenorhabdus nematophilusの毒性遺伝子 |
| US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
| DE69638032D1 (de) | 1995-10-13 | 2009-11-05 | Dow Agrosciences Llc | Modifiziertes bacillus thuringiensis gen zur kontrolle von lepidoptera in pflanzen |
| PL186242B1 (pl) * | 1995-11-06 | 2003-12-31 | Wisconsin Alumni Res Found | Polinukleotyd kodujący zrekombinowane białko i zrekombinowane białko o aktywności toksycznej przeciwko szkodliwym owadom |
| US6083499A (en) | 1996-04-19 | 2000-07-04 | Mycogen Corporation | Pesticidal toxins |
| GB9618083D0 (en) | 1996-08-29 | 1996-10-09 | Mini Agriculture & Fisheries | Pesticidal agents |
| AU2829997A (en) | 1996-08-29 | 1998-03-19 | Dowelanco | Insecticidal protein toxins from (photorhabdus) |
| US6110668A (en) * | 1996-10-07 | 2000-08-29 | Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. | Gene synthesis method |
| CA2267996A1 (en) | 1996-10-30 | 1998-05-07 | Mycogen Corporation | Novel pesticidal toxins and nucleotide sequences which encode these toxins |
| US6242669B1 (en) | 1996-10-30 | 2001-06-05 | Mycogen Corporation | Pesticidal toxins and nucleotide sequences which encode these toxins |
| CN1137137C (zh) | 1997-05-05 | 2004-02-04 | 道农业科学公司 | 来自致病杆菌的杀昆虫蛋白毒素 |
| AUPO808897A0 (en) | 1997-07-17 | 1997-08-14 | Commonwealth Scientific And Industrial Research Organisation | Toxin genes from the bacteria xenorhabdus nematophilus and photohabdus luminescens |
| US6218188B1 (en) | 1997-11-12 | 2001-04-17 | Mycogen Corporation | Plant-optimized genes encoding pesticidal toxins |
| US6281413B1 (en) | 1998-02-20 | 2001-08-28 | Syngenta Participations Ag | Insecticidal toxins from Photorhabdus luminescens and nucleic acid sequences coding therefor |
| WO1999042589A2 (en) | 1998-02-20 | 1999-08-26 | Novartis Pharma Ag. | Insecticidal toxins from photorhabdus |
| US6174860B1 (en) | 1999-04-16 | 2001-01-16 | Novartis Ag | Insecticidal toxins and nucleic acid sequences coding therefor |
| KR100649909B1 (ko) | 1998-04-21 | 2006-11-27 | 신젠타 파티서페이션즈 아게 | 제노르하브두스 네마토필러스로부터의 신규한 살충 독소, 이를 암호화하는 핵산 서열 및 이의 생산 방법 |
| GB9825418D0 (en) | 1998-11-19 | 1999-01-13 | Horticulture Res Int | Insecticidal agents |
| GB9901499D0 (en) | 1999-01-22 | 1999-03-17 | Horticulture Res Int | Biological control |
| AR025097A1 (es) | 1999-08-11 | 2002-11-06 | Dow Agrosciences Llc | Plantas transgenicas expresando la toxina photorhabdus |
| US6639129B2 (en) | 2000-03-24 | 2003-10-28 | Wisconsin Alumni Research Foundation | DNA sequences from photorhabdus luminescens |
-
2003
- 2003-06-27 ES ES03762046T patent/ES2311731T3/es not_active Expired - Lifetime
- 2003-06-27 EP EP03762046A patent/EP1532165B1/en not_active Expired - Lifetime
- 2003-06-27 DE DE60323103T patent/DE60323103D1/de not_active Expired - Fee Related
- 2003-06-27 BR BR0312448-7A patent/BR0312448A/pt not_active IP Right Cessation
- 2003-06-27 CN CNA038153378A patent/CN1684974A/zh active Pending
- 2003-06-27 CA CA002486543A patent/CA2486543A1/en not_active Abandoned
- 2003-06-27 WO PCT/US2003/020082 patent/WO2004002223A2/en not_active Ceased
- 2003-06-27 AU AU2003247650A patent/AU2003247650A1/en not_active Abandoned
- 2003-06-27 AT AT03762046T patent/ATE405581T1/de not_active IP Right Cessation
- 2003-06-27 US US10/609,113 patent/US20040110184A1/en not_active Abandoned
- 2003-06-27 EP EP08010923A patent/EP2019115A3/en not_active Withdrawn
- 2003-06-27 JP JP2004517835A patent/JP2005536198A/ja active Pending
-
2007
- 2007-07-10 US US11/775,663 patent/US7902334B2/en not_active Expired - Fee Related
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114292799A (zh) * | 2015-03-26 | 2022-04-08 | 拜耳作物科学有限合伙公司 | 新型类芽孢杆菌属菌株、抗真菌化合物以及它们的使用方法 |
| CN110257269A (zh) * | 2018-03-12 | 2019-09-20 | 屏东科技大学 | 一种产细菌素的类芽孢杆菌及其应用 |
| CN110257269B (zh) * | 2018-03-12 | 2022-11-25 | 屏东科技大学 | 一种产细菌素的类芽孢杆菌及其应用 |
| CN114828880A (zh) * | 2019-09-18 | 2022-07-29 | 达兰动物保健有限公司 | 蜜蜂疫苗和使用方法 |
| CN110786293A (zh) * | 2019-11-01 | 2020-02-14 | 中国人民解放军陆军军医大学 | 能够导致斯氏按蚊传疟能力增强的生物杀虫剂及使用方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP1532165A2 (en) | 2005-05-25 |
| EP1532165B1 (en) | 2008-08-20 |
| US20040110184A1 (en) | 2004-06-10 |
| DE60323103D1 (de) | 2008-10-02 |
| EP2019115A2 (en) | 2009-01-28 |
| CA2486543A1 (en) | 2004-01-08 |
| AU2003247650A1 (en) | 2004-01-19 |
| WO2004002223A3 (en) | 2004-11-04 |
| US20080019914A1 (en) | 2008-01-24 |
| BR0312448A (pt) | 2005-10-18 |
| ES2311731T3 (es) | 2009-02-16 |
| JP2005536198A (ja) | 2005-12-02 |
| ATE405581T1 (de) | 2008-09-15 |
| US7902334B2 (en) | 2011-03-08 |
| EP2019115A3 (en) | 2009-07-08 |
| EP1532165A4 (en) | 2006-05-17 |
| WO2004002223A2 (en) | 2004-01-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7902334B2 (en) | Pesticidally active proteins and polynucleotides obtainable from Paenibacillus species | |
| CN1751125A (zh) | 混合并匹配tc蛋白质用于病虫害防治 | |
| CN1026497C (zh) | 昆虫抗性植物 | |
| CN1849397A (zh) | 苏云金芽孢杆菌分泌的杀虫蛋白及其应用 | |
| CN1296482C (zh) | 杀虫毒素和编码这些毒素的核苷酸序列 | |
| CN1414973A (zh) | 苏云金芽孢杆菌(bacillus thur_ingiensis)的杀虫蛋白 | |
| CN1119877A (zh) | 新杀虫蛋白和菌株 | |
| CN1639338A (zh) | 修饰的Cry3A毒素及编码它的核酸序列 | |
| CN1408023A (zh) | 杀虫蛋白 | |
| CN1270497A (zh) | 来源于嗜线虫致病杆菌细菌和发光光杆状菌细菌的毒素基因 | |
| JP2001502919A (ja) | 新規殺虫性毒素およびこれらの毒素をコードする塩基配列 | |
| CN1250743C (zh) | 测定核酸碱基序列的方法 | |
| CN1261572C (zh) | 来源于侧孢芽孢杆菌菌株的杀虫毒素与基因 | |
| US7071386B2 (en) | Xenorhabdus TC gene for pest control | |
| CN1918296A (zh) | 来自伯氏致病杆菌的毒素复合物蛋白和基因 | |
| CN1084565A (zh) | 具有腈水合酶活性的新型蛋白和编码该蛋白的基因 | |
| CN1305528A (zh) | 控制鞘翅目害虫的苏云金芽孢杆菌毒素和基因 | |
| CN1610744A (zh) | 胃蛋白酶敏感经过修饰的苏云金芽孢杆菌杀虫毒素 | |
| CN1950395A (zh) | 杀虫毒素复合体融合蛋白 | |
| CN1261569C (zh) | 对大肠杆菌o145型的o-抗原特异的核苷酸 | |
| CN1257279C (zh) | 对大肠杆菌o163的o-抗原特异的核苷酸 | |
| JP2025023671A (ja) | Bst DNAポリメラーゼ、試薬組成物及び核酸増幅方法 | |
| CN1256433C (zh) | 对大肠杆菌o36的o-抗原特异的核苷酸 | |
| CN1553956A (zh) | 来自棉桃阿舒氏囊霉的与跨膜转运相关的新基因产物 | |
| JP2002335967A (ja) | 新規な細菌、殺虫性タンパク質をコードする遺伝子及びタンパク質 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
| WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20051019 |