CN1973037B - 二肽或二肽衍生物的制造方法 - Google Patents
二肽或二肽衍生物的制造方法 Download PDFInfo
- Publication number
- CN1973037B CN1973037B CN2005800207400A CN200580020740A CN1973037B CN 1973037 B CN1973037 B CN 1973037B CN 2005800207400 A CN2005800207400 A CN 2005800207400A CN 200580020740 A CN200580020740 A CN 200580020740A CN 1973037 B CN1973037 B CN 1973037B
- Authority
- CN
- China
- Prior art keywords
- amino acid
- protein
- dna
- dipeptides
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 0 *=C1C*CC1 Chemical compound *=C1C*CC1 0.000 description 3
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/34—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Corynebacterium (G)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K5/00—Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof
- C07K5/04—Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof containing only normal peptide links
- C07K5/06—Dipeptides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1229—Phosphotransferases with a phosphate group as acceptor (2.7.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Gastroenterology & Hepatology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
本发明提供特征如下的二肽或二肽衍生物的制造方法:使磷酸供与体、选自腺苷-5’-一磷酸、腺苷-5’-二磷酸和腺苷-5’-三磷酸中的物质、具有多磷酸激酶活性的蛋白质或具有生产该蛋白质能力的细胞的培养物或该培养物的处理物、具有ATP依赖性的、由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质或具有生产该蛋白质的能力的细胞的培养物或该培养物的处理物、和1种以上的氨基酸或氨基酸衍生物在水性介质中共存,使二肽或二肽衍生物在该水性介质中生成、蓄积,从该水性介质回收该二肽或二肽衍生物。
Description
【技术领域】
本发明涉及到由氨基酸和氨基酸衍生物有效制造二肽或二肽衍生物的方法。
【背景技术】
有关肽的大量合成法已知有化学合成法(液相法、固相法)、酶促合成法和使用DNA重组法的生物合成法。现在,对于50残基以上的长链肽使用酶促合成法或生物合成法,对于二肽主要使用化学合成法和酶促合成法。
使用化学合成法合成二肽需要对官能团进行保护和去保护等操作,由于也合成消旋体,化学合成法不能说是经济、有效的方法。另外由于化学合成法使用大量的有机溶剂等,从环境卫生方面看也不是一个好的方法。
通过酶法合成二肽已知有利用使用蛋白分解酶(蛋白水解酶)的逆反应的方法(参照非专利文献1)、利用耐热性氨酰t-RNA合成酶的方法(参照专利文献1~4)、利用非核糖体肽合成酶(以下,称为NRPS)的方法(参照非专利文献2、3和专利文献5、6)。
然而,就利用蛋白水解酶的逆反应的方法来说,需要对底物氨基酸的官能团进行保护和去保护,存在着难于提高肽形成反应效率和阻止肽分解反应的问题。至于利用耐热性氨酰t-RNA合成酶的方法,存在着酶的表达、阻止目的产物以外的副生物反应困难的问题。NRPs由于该反应需要腺苷-5’一三磷酸(以下,略为ATP),必须要向反应系添加大量ATP,所以制造效率低。
而作为具有二肽合成活性的蛋白质,已知有γ-谷氨酰半胱氨酸合成酶(γ-glutamylcysteine synthetase)、谷胱甘肽合成酶(glutathione synthetase)、D-丙氨酰-D-丙氨酸(D-Ala-D-Ala)连接酶(D-Ala-D-Ala ligase)、聚-γ-谷氨酸合成酶(poly-y-glutamatesynthetase)等一组肽合成酶。然而几乎所有这些酶由于都具有作为底物使用D-氨基酸或催化在γ位羧基形成肽键等特征,所以不能用于在L-氨基酸的α位羧基形成肽键的二肽的合成。
已知通过在L-氨基酸的α位羧基形成肽键活性生成二肽只有作为来自属于芽孢杆菌属的微生物的二肽抗生物质的杆菌溶素合成酶。已知杆菌溶素合成酶具有合成杆菌溶素(L-丙氨酰-L-anticapsin、L-Ala-L-anticapsin)和L-丙氨酰-L-丙氨酸(L-Ala-L-Ala)的活性,但有关其它二肽的合成活性还不清楚(参照非专利文献4和5)。
另外,关于全基因组信息已阐明的枯草芽孢杆菌(Bacillus subtilis)168株(非专利文献6参照)中的杆菌溶素合成酶基因组,已知如果扩增含有ywfA~F的ORF的杆菌溶素操纵子,杆菌溶素的产率会增加(参照专利文献7)。然而,在这些ORF中是否含有编码具有通过肽键连接2种以上的氨基酸的活性的蛋白质的ORF,如果含有,也不知道哪个ORF编码该蛋白质。
另外,据报道已知作为抗生物质ァルホ·ノルシン(albonoursin)的生产株诺尔斯氏链霉菌(Streptomyces noursei)ATCC11455株中,与NRPS酶完全不相似蛋白质(albC基因产物)负责环(L-苯丙氨酰-L-亮氨酸)[cyclo(L-phenylalanyl-L-leucine)]结构的合成,如果使环二肽氧化酶作用于导入了albC基因的大肠杆菌(Escherichia coli)和浅青紫链霉菌(Streptomycesl ividans)的培养液,可以检测到albonoursin(参照非专利文献6),但还没有albC基因产物生成直链状二肽的报告。
而作为各种酶反应能源的ATP的供给方法,已知有利用糖酵解途径由ADP生成ATP的再生法、利用多磷酸激酶和多磷酸由ADP生成ATP的再生法(参照非专利文献8~10)。利用糖酵解途径的由ADP生成ATP的再生法存在于具有糖酵解途径的所有微生物。另外,已知能够利用多磷酸由ADP再生ATP的多磷酸激酶也广泛存在于细菌(参照非专利文献11~14)、酵母(参照非专利文献15和16)、植物(参照非专利文献17)、动物(参照非专利文献18)中。
然而,还不清楚通过将需要ATP的二肽生成反应和利用多磷酸激酶和多磷酸的ATP再生反应组合,能否有效生产二肽。
【非专利文献1】
J.Biol.Chem.,119,707-720(1937)
【专利文献1】
特开昭58-146539号公报
【专利文献2】
特开昭58-209991号公报
【专利文献3】
特开昭58-209992号公报
【专利文献4】
特开昭59-106298号公报
【非专利文献2】
Chem.Biol.,7,373-384(2000)
【专利文献5】
美国专利第5795738号
【专利文献6】
美国专利第5652116号
【非专利文献3】
FEBS Lett.,498,42-45(2001)
【非专利文献4】
J.Ind.Microbiol.,2,201-208(1987)
【非专利文献5】
Enzyme.Microbial.Technol.,29,400-406(2001)
【非专利文献6】
Nature,390,249-256(1997)
【专利文献7】
国際公开专利第00-03009号小册子
【非专利文献7】
Chemistry & Biol.,9,1355-1364(2002)
【非专利文献8】
Agric.Biol.Chem.,52,1471-1477(1988)
【非专利文献9】
Biotech.Appl.Biochem.,10,107-117(1988)
【非专利文献10】
Biotech.Appl.Biochem.,15,125-133(1992)
【非专利文献11】
Agric.Biol.Chem.,52(6),1471-1477(1988)
【非专利文献12】
Biotech.Appl.Biochem.,10,107-117(1988)
【非专利文献13】
Biotech.Appl.Biochem.,15,125-133(1992)
【非专利文献14】
J.Biol.Chem.,267,22556-22561(1992)
【非专利文献15】
J.Biol.Chem.,234,2595-2604(1959)
【非专利文献16】
Arch.Biochem.Biophys.,83,259-267(1959)
【非专利文献17】
Biochem.J.,124,407-417(1971)
【非专利文献18】
Biochem.J.,75,417-428(1960)
【发明内容】
【发明要解决的课题】
本发明的目的在于提供有效制造二肽或二肽衍生物的方法。
【用于解决课题的手段】
本发明涉及到以下(1)~(34)内容。
(1)二肽或二肽衍生物(PI)的制造方法,其特征是使i)磷酸供体、ii)选自腺苷-5’-一磷酸(以下,略为AMP)、腺苷-5’-二磷酸(以下,略为ADP)和腺苷-5’-三磷酸(以下,略为ATP)中的物质、iii)具有多磷酸激酶活性的蛋白质或具有生产该蛋白质能力的细胞培养物或该培养物的处理物、iv)具有ATP依赖性的、由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质或具有生产该蛋白质的能力的细胞的培养物或该培养物的处理物、和v)1种以上的氨基酸或氨基酸衍生物在水性介质中共存,使二肽或二肽衍生物[以下称为二肽或二肽衍生物(PI)]在该水性介质中生成、蓄积,从该水性介质回收该二肽或二肽衍生物(PI)。
(2)二肽或二肽衍生物(PII)的制造方法,其特征是使i)磷酸供体、ii)选自腺苷-5’-一磷酸(以下,略为AMP)、腺苷-5’-二磷酸(以下,略为ADP)和腺苷-5’-三磷酸(以下,略为ATP)中的物质、iii)具有多磷酸激酶活性的蛋白质或具有生产该蛋白质能力的细胞培养物或该培养物的处理物、iv)具有ATP依赖性的、由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质或具有生产该蛋白质的能力的细胞培养物或该培养物的处理物、和v)1种以上的氨基酸或氨基酸衍生物在水性介质中共存,使二肽或二肽衍生物(PI)在该水性介质中生成、蓄积,直接进行修饰或从该水性介质回收该二肽或二肽衍生物(PI)后对该二肽或二肽衍生物(PI)进行修饰,使二肽或二肽衍生物[以下,称为二肽或二肽衍生物(PII)]生成,回收该二肽或二肽衍生物(PII)。
(3)上述(1)或(2)所述的制造方法,其中具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽的活性的蛋白质是选自以下[1]~[8]中的蛋白质。
具有序列号1~13中的任一个表示的氨基酸序列的蛋白质
由在序列号1~13中的任一个表示的氨基酸序列中缺失、置换或附加了1个以上的氨基酸的氨基酸序列构成,而且具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽的活性的蛋白质
由与序列号1~13中的任一个表示的氨基酸序列具有65%以上同源性的氨基酸序列构成,而且具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽的活性的蛋白质
具有与序列号27表示的氨基酸序列有80%以上同源性的氨基酸序列,而且具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质
具有由序列号47或48表示的氨基酸序列的蛋白质
由在序列号47或48表示的氨基酸序列中缺失、置换或附加1个以上的氨基酸的氨基酸序列构成,而且具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质
由与序列号47或48表示的氨基酸序列具有65%以上同源性的氨基酸序列构成,而且具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质
具有非核糖体肽合成酶(以下称为NRPS)活性的蛋白质
(4)上述(1)~(3)中的任一种制造方法,其中具有生产ATP依赖性的、由氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质能力的细胞是具有选自以下[1]~[6]中的DNA的细胞。
具有序列号14~26和46中的任一个表示的碱基序列的DNA
与具有序列号14~26和46中的任一个表示的碱基序列互补的碱基序列的DNA在严格的条件下杂交,而且编码具有ATP依赖性的、由氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质的DNA
与具有序列号28表示的碱基序列互补的碱基序列的DNA在严格的条件下杂交,而且编码具有ATP依赖性的、由氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质的DNA
具有序列号49或50表示的碱基序列的DNA
与具有序列号49或50表示的碱基序列互补的碱基序列的DNA在严格的条件下杂交,而且编码具有ATP依赖性的、由氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质的DNA
编码具有NRPS活性的蛋白质的DNA
(5)上述(1)~(4)中的任一种制造方法,其中具有多磷酸激酶活性的蛋白质是选自以下[1]~[3]中的蛋白质。
具有序列号124~131中的任一个表示的氨基酸序列的蛋白质
由在序列号124~131中的任一个表示的氨基酸序列中缺失、置换或附加了1个以上的氨基酸的氨基酸序列构成,而且具有多磷酸激酶活性的蛋白质
由与序列号124~131中的任一个表示的氨基酸序列具有65%以上同源性的氨基酸序列构成,而且具有多磷酸激酶活性的蛋白质
(6)上述(1)~(5)中的任一种制造方法,其中具有生产具有多磷酸激酶活性的蛋白质能力的细胞是具有以下[1]或[2]所述的DNA的细胞。
具有序列号116~123中的任一个表示的碱基序列的DNA
与具有序列号116~123中的任一个表示的碱基序列互补的碱基序列的DNA在严格条件下进行杂交的、而且编码具有多磷酸激酶活性的蛋白质的DNA
(7)上述(1)~(6)中的任一种制造方法,其中氨基酸或氨基酸衍生物是式(I)
(式中、n1表示1~3的整数,
R1a和R1b可以相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或R1a和R1b中的任一方也可以与邻接的氮原子、该氮原子邻接的碳原子以及该碳原子上的R2a和R2b的任一方一起形成取代或未取代的杂环基,
R2a和R2b可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R1aR1bN邻接的碳原子上的R2a和R2b中的任一方也可以与邻接的碳原子、该碳原子邻接的氮原子以及R1a和R1b中的任一方一起形成取代或未取代的杂环基,n1为2或3时,2个或3个的R2a和2个或3个的R2b可分别相同,也可以不同),或
式(II)
[式中、n2与上述n1意义相同。
R3a和R3b可以相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R4HN邻接的碳原子上的R3a和R3b中的任一方与邻接的碳原子、与该碳原子邻接的氮原子和R4一起形成取代或未取代的杂环基,当n2为2或3时,2个或3个的R3a和2个或3个的R3b可分别相同,也可以不同,
R4代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或与R4邻接的氮原子、与该氮原子邻接的碳原子以及该碳原子上的R3a和R3b中的任一方一起形成取代或未取代的杂环基,
R5代表氨基、羟基、取代或未取代的低级烷氧基、一(取代或未取代的低级烷基)氨基、二(取代或未取代的低级烷基)氨基或脂环式杂环基]
表示的氨基酸或氨基酸衍生物[但当氨基酸或氨基酸衍生物只是式(I)表示的氨基酸或氨基酸衍生物时,R1a和R1b中至少有一方是氢原子,而当氨基酸或氨基酸衍生物只是式(II)表示的氨基酸或氨基酸衍生物时,R5为羟基]。
(8)上述(1)~(6)中的任一种制造方法,其中氨基酸或氨基酸衍生物是式(III)
(式中、R1c和R1d可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,
R2c和R2d可相同或不同,代表氢原子或取代或未取代的低级烷基),或
式(IV)
(式中、R3c和R3d可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基,
R5与上述意义相同)
表示的氨基酸或氨基酸衍生物[但当氨基酸或氨基酸衍生物只是式(III)表示的氨基酸或氨基酸衍生物时,R1c和R1d中至少有一方是氢原子,当氨基酸或氨基酸衍生物只是式(IV)表示的氨基酸或氨基酸衍生物时,R5为羟基]。
(9)上述(1)~(6)中的任一种制造方法,其中氨基酸或氨基酸衍生物是式(V)或式(VI)表示的氨基酸或氨基酸衍生物:
(式中、R2e表示取代或未取代的甲基)
(式中、R3e代表取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基)。
(10)上述(1)~(6)中的任一种制造方法,其中氨基酸或氨基酸衍生物是选自L-氨基酸、甘氨酸和β-丙氨酸中的氨基酸或其衍生物。
(11)上述(10)的制造方法,其中L-氨基酸是选自L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸中的L-氨基酸。
(12)上述(1)~(7)中的任一种制造方法,其中二肽或二肽衍生物(PI)是式(VIIa)表示的二肽或二肽衍生物:
[式中、n3a和n4a分别与上述n1具有相同意义,
R6a和R6b可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或R6a和R6b中的任一方可以与邻接的氮原子、与该氮原子邻接的碳原子和该碳原子上的R7a和R7b中的任一方一起形成取代或未取代的杂环基,
R7a和R7b可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R6aR6bN邻接的碳原子上的R7a和R7b中的任一方可以与邻接的碳原子、与该碳原子邻接的氮原子和R6a和R6b中的任一方一起形成取代或未取代的杂环基,当n3a为2或3时,2个或3个R7a和2个或3个R7b可分别相同,也可以不同,
R8a代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或R8a与邻接的氮原子、与该氮原子邻接而且与R9a和R9b结合的碳原子和该碳原子上的R9a和R9b中的任一方一起形成取代或未取代的杂环基,
R9a和R9b可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R8aN邻接的碳原子上的R9a和R9b中的任一方可以与邻接的碳原子、与该碳原子邻接的氮原子和R8a一起形成取代或未取代的杂环基,当n4a为2或3时,2个或3个R9a和2个或3个R9b可分别相同,也可以不同,
R10a代表氨基、羟基、取代或未取代的低级烷氧基、一(取代或未取代的低级烷基)氨基、二(取代或未取代的低级烷基)氨基或脂环式杂环基]。
(13)上述(2)~(7)中的任一种制造方法,其中二肽或二肽衍生物(PII)是式(VIIb)表示的二肽或二肽衍生物:
[式中、n3A和n4A分别与上述n1具有相同意义,
R6A和R6B可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或R6A和R6B中的任一方也可以与邻接的氮原子、与该氮原子邻接的碳原子和该碳原子上的R7A和R7B中的任一方一起形成取代或未取代的杂环基,
R7A和R7B可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R6AR6BN邻接的碳原子上的R7A和R7B中的任一方也可以与邻接的碳原子、与该碳原子邻接的氮原子和R6A和R6B中的任一方一起形成取代或未取代的杂环基,当n3A为2或3时,2个或3个R7A和2个或3个R7B可分别相同,也可以不同,
R8A代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或R8A与邻接的氮原子、与该氮原子邻接而且与R9A和R9B结合的碳原子以及该碳原子上的R9A和R9B中的任一方一起形成取代或未取代的杂环基,
R9A和R9B可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R8AN邻接的碳原子上的R9A和R9B中的任一方可以与邻接的碳原子、与该碳原子邻接的氮原子和R8A一起形成取代或未取代的杂环基,当n4A为2或3时,2个或3个R9A和2个或3个R9B可分别相同,也可以不同,
R10A与上述R10a具有同样的意义]。
(14)上述(1)~(8)中的任一种制造方法,其中二肽或二肽衍生物(PI)是式(VIIIa)表示的二肽或二肽衍生物。
(式中、R6c和R6d可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,
R7c和R7d可相同或不同,代表氢原子或取代或未取代的低级烷基,
R9c和R9d可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基,
R10a与上述同义)。
(15)上述(2)~(8)中的任一种制造方法,其中二肽或二肽衍生物(PII)是式(VIIIb)表示的二肽或二肽衍生物。
(式中、R6C、R6D、R7C、R7D、R9C和R9D分别与上述R6c、R6d、R7c、R7d、R9c和R9d具有同样意义,R10A与上述同义)。
(16)上述(1)~(9)中的任一种制造方法,其中二肽或二肽衍生物(PI)是式(IXa)表示的二肽或二肽衍生物。
(式中、R7e代表取代或未取代的甲基,R9e代表取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基)。
(17)上述(2)~(9)中的任一种制造方法,其中二肽或二肽衍生物(PII)是式(IXb)表示的二肽或二肽衍生物。
(式中、R7E和R9E分别与上述R7e和R9e具有同样意义)。
(18)上述(1)~(10)中的任一种制造方法,其中二肽或二肽衍生物(PI)或二肽或二肽衍生物(PII)是从L-氨基酸、甘氨酸、和β-丙氨酸、以及它们的衍生物选出的相同或不同的氨基酸或氨基酸衍生物通过肽键形成的二肽或二肽衍生物。
(19)上述(18)的制造方法,其中L-氨基酸是选自L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸中的L-氨基酸。
(20)上述(1)~(19)中的任一种制造方法,其中细胞是微生物的细胞。
(21)上述(20)的制造方法,其中微生物是原核生物。
(22)上述(21)的制造方法,其中原核生物是1种以上的肽酶和1种以上的具有肽转运活性的蛋白质(以下,也称为肽转运蛋白质)的活性低下或丧失的微生物。
(23)上述(21)的制造方法,其中原核生物是3种以上的肽酶的活性低下或丧失的微生物。
(24)上述(22)或(23)的制造方法,其中肽酶是具有序列号55~58中的任一个表示的氨基酸序列的蛋白质、或具有与序列号55~58中的任一个表示的氨基酸序列有80%以上同源性的氨基酸序列,而且具有肽酶活性的蛋白质。
(25)上述(22)或(24)的制造方法,其中肽转运蛋白质是具有序列号59~63中的任一个表示的氨基酸序列的蛋白质、或具有与序列号59~63中的任一个表示的氨基酸序列有80%以上同源性的蛋白质,而且具有肽转运活性的蛋白质。
(26)上述(21)~(25)中的任一种制造方法,其中原核生物是属于埃希氏菌(Escherichia)属、芽孢杆菌(Bacillus)属或棒杆菌(Corynebacterium)属的微生物。
(27)上述(26)的制造方法,其中属于埃希氏菌属、芽孢杆菌属或棒杆菌属的微生物是大肠杆菌(Escherichia coli)、谷氨酸棒杆菌(Corynebacterium glutamicum)、产氨棒杆菌(Corymebac terium ammoniagenes)、乳酸发酵棒杆菌(Corynebacterium lactofermentum)、黄色短杆菌(Brevibacterium flavum)、Corvnebacterium efficiens、枯草芽孢杆菌(Bacilluss ubtilis)或巨大芽孢杆菌(Bacillus megaterium)。
(28)上述(1)~(27)中的任一种制造方法,其中培养物的处理物是从培养物的热处理物、培养物的浓缩物、培养物的干燥物、对培养物进行离心分离得到的细胞、该细胞的热处理物、该细胞的干燥物、该细胞的冷冻干燥物、该细胞的表面活性剂处理物、该细胞的超声波处理物、该细胞的机械性磨碎处理物、该细胞的溶剂处理物、该细胞的酶处理物、该细胞的蛋白质分级物、该细胞的固定化物和从该细胞提取得到的酶标准品选出的处理物,而且具有ATP依赖性的、由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性或多磷酸激酶活性的处理物。
(29)上述(28)的制造方法,其中热处理物是培养物或细胞的二肽分解酶活性减少或丧失的热处理物。
(30)具有序列号9~13表示的氨基酸序列的蛋白质。
(31)具有序列号22~26表示的碱基序列的DNA。
(32)将上述(31)的DNA和载体DNA连接后得到的重组DNA。
(33)带有上述(32)的重组DNA的细胞。
(34)蛋白质的制造方法,该方法是将上述(33)的细胞在培养基中进行培养,使上述(30)的蛋白质在培养物中生成、蓄积,从该培养物回收该蛋白质。
【发明的效果】
通过本发明可以提供由1种以上的氨基酸或氨基酸衍生物有效地制造二肽或二肽衍生物的方法。
【附图说明】
【图1】 图1是表示质粒pPE43的构建过程的图。
【图2】 图2是表示质粒pQE60ywfE的构建过程的图。
【图3】 图3是表示具有直链二肽合成活性的蛋白质的表达质粒载体pAL-nou和pAL-alb的构建过程的图。
【图4】 图4是表示ywfE基因表达强化型载体pPE56的构建过程的图。
【符号说明】
ywfE:来自枯草芽孢杆菌168株的ywfE基因
Ptrp:色氨酸启动子基因
PT5:T5启动子
Ampr:氨苄青霉素抗性基因
lacI q:乳糖阻遏物基因
albC:albC基因或albC类似基因
【具体实施方式】
1.本发明使用的具有ATP依赖性的、由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质
本发明使用的具有ATP依赖性的、由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质(以下,略为具有二肽生成活性的蛋白质)只要是具有该活性的蛋白质,不管其来源、制备方法等都可以使用,例如以下[1]~[8]所述的蛋白质、
具有序列号1~13中的任一个表示的氨基酸序列的蛋白质
由在序列号1~13中的任一个表示的氨基酸序列缺失、置换或附加1个以上的氨基酸的氨基酸序列构成,而且具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质
由与序列号1~13中的任一个表示的氨基酸序列具有65%以上同源性的氨基酸序列构成,而且具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质
具有与序列号27表示的氨基酸序列有80%以上同源性的氨基酸序列,而且具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质
具有由序列号47或48表示的氨基酸序列的蛋白质
由在序列号47或48表示的氨基酸序列中缺失、置换或附加1个以上的氨基酸的氨基酸序列构成,而且具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质
由与序列号47或48表示的氨基酸序列有65%以上同源性的氨基酸序列构成,而且具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质
具有非核糖体肽合成酶(以下称为NRPS)活性的蛋白质。
作为具有NRPS活性的蛋白质,如具有序列号53表示的氨基酸序列的蛋白质、具有由在该氨基酸序列中缺失、置换或附加了1个以上的氨基酸的氨基酸序列构成,而且具有NRPS活性的蛋白质,以及具有与该氨基酸序列有65%以上同源性的氨基酸序列,而且具有NRPS活性的蛋白质等。
在上述中,由缺失、置换或附加了1个以上的氨基酸的氨基酸序列构成,而且具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质可以通过使用Molecular Cloning,ALaboratoy Manual,Third Edition,Cold Spring Harbor LaboratoryPress(2001)(以下,略为Moleeular Cloning第3版)、CurrentProtocols in Molecular Biology, John Wiley&Sons(1987-1997)(以下,略为Current Protocols in Molecular Biology)、Nucleic Acids Research,10,6487(1982)、Proc.Natl.Acad.Sci.USA,79,6409(1982)、Gene,34,315(1985)、Nucleic Acids Research,13,4431(1985)、Proc.Natl.Acad.Sci.USA,82,488(1985)等所述的定点突变导入法,例如可以通过在由编码序列号1~13、47、48或53中的任一个表示的氨基酸序列构成的蛋白质的DNA中导入定点突变取得。
缺失、置换或附加的氨基酸的数目没有特别限定,只要是通过上述的定点突变法等众所周知的方法能够缺失、置换或附加程度的数目,可以是从1个至数十个、优选1~20个、更优选1~10个、再优选1~5个。
所谓在序列号1~13、47、48或53中的任一个表示的氨基酸序列中缺失、置换或附加1个以上的氨基酸指的是可以在同一序列中的任意位置缺失、置换或附加1个或多个氨基酸。
作为可置换的氨基酸,例如用众所周知的对比软件对序列号1~13、以及序列号47和48表示的氨基酸序列之间进行比较时,所有氨基酸序列中非保守的氨基酸。作为众所周知的对比软件,例如基因解析软件Genetyx(软件开发株式会社)中含有的序列对比解析软件。作为该解析软件的解析参数,可以使用default值。
另外作为可进行氨基酸缺失或附加的氨基酸位置,例如序列号1~13、47、48以及53中的任一个表示的氨基酸序列的N末端和C末端。
缺失、置换或附加可以同时出现,被置换或附加的氨基酸无论天然型,还是非天然型都可以。作为天然型氨基酸,如L-丙氨酸、L-天冬酰胺、L-天冬氨酸、L-谷氨酰胺、L-谷氨酸、甘氨酸、L-精氨酸、L-组氨酸、L-异亮氨酸、L-亮氨酸、L-赖氨酸、L-蛋氨酸、L-苯丙氨酸、L-脯氨酸、L-丝氨酸、L-苏氨酸、L-色氨酸、L-酪氨酸、L-缬氨酸、L-半胱氨酸等。
以下给出了可相互置换的氨基酸的例子。同一组中含有的氨基酸可相互置换。
A组:亮氨酸、异亮氨酸、正亮氨酸、缬氨酸、正缬氨酸、丙氨酸、2-氨基丁酸、蛋氨酸、0-甲基丝氨酸、t-丁基甘氨酸、t-丁基丙氨酸、环己基丙氨酸
B组:天冬氨酸、谷氨酸、异天冬氨酸、异谷氨酸、2-氨基己二酸、2-氨基辛二酸
C组:天冬酰胺、谷氨酰胺
D组:赖氨酸、精氨酸、鸟氨酸、2,4-二氨基丁酸、2,3-二氨基丙酸
E组:脯氨酸、3-羟基脯氨酸、4-羟基脯氨酸
F组:丝氨酸、苏氨酸、同型丝氨酸
G组:苯丙氨酸、酪氨酸
另外由在序列号1~13、47、48和53中的任一个表示的氨基酸序列中缺失、置换或附加了1个以上的氨基酸的氨基酸序列构成的蛋白质为了具有二肽生成活性,希望是序列号1~13、47、48和53中的任一个表示的氨基酸序列、优选与序列号1、47或53中的任一个表示的氨基酸序列的同源性具有65%以上、优选75%以上、更优选85%以上、再优选90%以上、特别优选95%以上、最好优选98%以上的序列。
氨基酸序列或碱基序列的同源性可以使用Karlin and Altschul提出的算法BLAST[Pro.Natl.Acad.Sci.USA,90,5873(1993)]或FASTA[Methods Enzymol.,183,63(1990)]决定。根据这个算法BLAST开发了称为BLASTN和BLASTX的程序[J.Mo l.Biol.,215,403(1990)]。当根据BLAST通过BLASTN对碱基序列进行解析时,参数定为例如Score=100、wordlength=12。另外当根据BLAST通过BLASTX对氨基酸序列进行解析时,参数定为例如score=50、wordlength=3。当使用BLAST和Gapped BLAST程序时,使用各程序的default参数。这 些 解 析 方 法 的 具 体 手 法 众 所 周 知(http://www.ncbi.nlm.nih.gov.)。
另外,由与序列号1~13、47、48和53中的任一个表示的氨基酸序列、优选与序列号1、47或53中的任一个表示的氨基酸序列具有65%以上、优选75%以上、更优选85%以上、再优选90%以上、特别优选95%以上、最好优选98%以上同源性的氨基酸序列构成,而且具有二肽生成活性的蛋白质也是可在本发明中使用的蛋白质。氨基酸序列的同源性可以象上述那样使用BLAST或FASTA决定。
序列号27表示的氨基酸序列是被保存在具有序列号1~7表示的氨基酸序列的蛋白质中的区域,而且是对应于具有各种微生物的Ala-Ala连接酶活性的蛋白质的共有序列区域。
具有与序列号27表示的氨基酸序列有80%以上、优选90%以上、更优选95%以上同源性的氨基酸序列,而且具有二肽生成活性的蛋白质也是可在本发明中使用的蛋白质。
为了使与序列号27表示的氨基酸序列有80%以上、优选90%以上、再优选95%以上同源性的氨基酸序列的蛋白质成为具有生成二肽的活性的蛋白质,希望该蛋白质的氨基酸序列与序列号1~8中的任一个表示的氨基酸序列的同源性至少具有80%以上、通常为90%以上、最好具有95%以上的同源性。
氨基酸序列的同源性可以象上述那样使用BLAST或FASTA决定。
作为确认本发明中可使用的蛋白质是具有二肽生成活性的蛋白质的手段,例如使用DNA重组法制作表达可用于本发明的蛋白质的转化体,使用该转化体制造在本发明中使用的蛋白质后,使该蛋白质、1种以上的氨基酸或氨基酸衍生物、和ATP存在于水性介质中,通过HPLC等分析二肽或二肽衍生物是否在该水性介质中生成、蓄积的方法。
2.可用于本发明的具有多磷酸激酶活性的蛋白质
可用于本发明的具有多磷酸激酶活性的蛋白质只要是具有该活性的蛋白质,不管其来源、制备方法等,如下面的[1]~[3]中的任一项所述的蛋白质。
具有序列号124~131中的任一个表示的氨基酸序列的蛋白质、
由在序列号124~131中的任一个表示的氨基酸序列中缺失、置换或附加1个以上的氨基酸的氨基酸序列构成,而且具有多磷酸激酶活性的蛋白质、和
由与序列号124~131中的任一个表示的氨基酸序列有65%以上同源性的氨基酸序列构成、而且具有多磷酸激酶活性的蛋白质等。
上述之中,所谓在序列号124~131中的任一个表示的氨基酸序列中缺失、置换或附加了1个以上的氨基酸的氨基酸序列以及与序列号124~131中的任一个表示的氨基酸序列具有65%以上同源性的氨基酸序列指的是除了具有该氨基酸序列的蛋白质具有多磷酸激酶活性以外,还是与上述1同样定义的氨基酸序列。
作为确认本发明中使用的蛋白质是具有多磷酸激酶活性的蛋白质的手段,例如使用DNA重组法制作表达可用于本发明的蛋白质的转化体,使用该转化体制造本发明中使用的蛋白质后,使该蛋白质、ADP和多磷酸在水性介质中存在,通过HPLC等分析在该水性介质中是否有ATP生成、蓄积的方法。
3.可用于本发明的编码具有由1种以上的氨基酸或氨基酸衍生物生成二肽的活性的蛋白质的DNA
作为编码可用于本发明的具有由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质的DNA(以下,略为编码具有二肽生成活性的蛋白质的DNA),如以下[1]~[6]所述的DNA。
具有序列号14~26和46中的任一个表示的碱基序列的DNA、
与具有序列号14~26和46中的任一个表示的碱基序列互补的碱基序列的DNA在严格的条件下杂交,而且编码具有ATP依赖性的、由氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质的DNA、
与具有序列号28表示的碱基序列互补的碱基序列的DNA在严格的条件下杂交,而且编码具有ATP依赖性的、由氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质的DNA、
具有序列号49或50表示的碱基序列的DNA、
与具有序列号49或50表示的碱基序列互补的碱基序列的DNA在严格的条件下杂交,而且编码具有ATP依赖性的、由氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质的DNA、
编码具有NRPS活性的蛋白质的DNA。
作为编码具有NRPS活性的蛋白质的DNA,如具有序列号54表示的碱基序列的DNA、和具有与该碱基序列互补的碱基序列的DNA在严格条件下进行杂交的、而且编码具有NRPS活性的蛋白质的DNA。
所谓上述的在严格条件下可杂交的DNA指的是以具有与序列号14~26、28、46、49、50和54中的任一个表示的碱基序列互补的碱基序列的DNA的一部分、或全部作为探针,通过使用茵落杂交法、噬斑杂交法或Southern blot杂交法等得到的DNA,具体来说,使用固定了来自菌落或噬斑的DNA的滤器,在0.7~1.0mol/L、优选0.9mol/L氯化钠存在下、于65℃下进行杂交后、使用0.1~2倍、优选0.1倍浓度的SSC溶液(1倍浓度的SSC溶液组成由150mmol/l氯化钠、15mmol/l柠檬酸钠构成),于65℃条件下,通过清洗滤器能够鉴定的DNA。杂交可以根据Molecular Cloning第3版、Current Protocols in MolecularBiology、DNA Cloning1:Core Techniques,APractical Approach,Second Edition,Oxford University(1995)等记载的方法进行。作为可杂交的DNA,具体而言使用上述的BLAST和FASTA等,在根据上述参数计算时,与序列号14~26、28、46、49、50和54中的任一个表示的碱基序列至少具有75%以上、优选85%以上、再优选90%以上、特别优选95%以上同源性的DNA。
和具有与序列号14~26、28、46、49、50和54中的任一个表示的碱基序列互补的碱基序列的DNA在严格条件下进行杂交的DNA是编码具有二肽生成活性的蛋白质的DNA如上述所述那样,可以通过使用重组DNA法制造该DNA编码的蛋白质,测定该蛋白质的活性进行确认。
4.可用于本发明的编码具有多磷酸激酶活性的蛋白质的DNA
作为可用于本发明的编码具有多磷酸激酶活性的蛋白质的DNA,如以下的[1]和[2]所述的DNA。
具有序列号116~123中的任一个表示的碱基序列的DNA,和
和具有与序列号116~123中的任一个表示的碱基序列互补的碱基序列的DNA在严格条件下进行杂交、而且编码具有多磷酸激酶活性的蛋白质的DNA等。
所谓和具有与序列号116~123中的任一个表示的碱基序列互补的碱基序列的DNA在严格条件下进行杂交的、而且编码具有多磷酸激酶活性的蛋白质的DNA除了该DNA具有多磷酸激酶活性以外,还有与上述3同样被定义的DNA。
和具有与序列号116~123中的任一个表示的碱基序列互补的碱基序列的DNA在严格条件下进行杂交的DNA是编码具有多磷酸激酶活性的蛋白质的DNA,如上所述可以通过使用重组DNA法,制造该DNA编码的蛋白质,测定该蛋白质的活性进行确认。
5.本发明的蛋白质
作为本发明的蛋白质,如具有序列号9~13中的任一个表示的氨基酸序列的蛋白质。
6.作为本发明的DNA如具有序列号22~26表示的碱基序列的DNA等。
7.编码具有ATP依赖性的、由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质的DNA和编码具有多磷酸激酶活性的蛋白质的DNA的制备
具有二肽生成活性的DNA可以通过使用能够根据序列号14~26、46、49、50和54中的任一个表示的碱基序列设计的探针,例如使用对芽孢杆菌(Bacillus)属或链霉菌(Streptomyces)属的微生物的染色体DNA文库进行Southern杂交、或可以根据序列号14~26、46、49、50和54中的任一个表示的碱基序列设计的引物DNA,以使用芽孢杆菌属或链霉菌属的微生物的染色体DNA作为模板的PCR[PCR Protocols,Academic Press(1990)]取得,编码具有多磷酸激酶活性的蛋白质的DNA可以通过使用根据具有序列号116~123中的任一个表示的碱基序列的DNA设计的探针的对属于埃希氏菌属、红细菌(Rhodobaer)属、绿屈挠菌属(Chloroflexus)、メ ソ リ ソ·ヒ·ウム属Mesorhizobium)、链霉菌属、假单胞菌(Pseudomonus)属或中华根瘤菌(Sinorbizobium)属的微生物等的染色体DNA文库进行Southern杂交、或可根据序列号116~123中的任一个表示的碱基序列设计的引物DNA,以属于埃希氏菌属、红细菌属、绿屈挠菌属、Mesorhizobium属、链霉菌属、假单胞菌属或中华根瘤菌属的微生物等的染色体DNA为模板的PCR取得。
另外,对于各种基因序列数据库,检索与序列号14~26、46、49、50和54、或序列号116~123中的任一个编码氨基酸序列的DNA的碱基序列具有75%以上、优选85%以上、更优选90%以上、进一步优选95%以上、特别优选98%以上同源性的序列,根据通过该检索得到的碱基序列,使用上述的方法由具有该碱基序列的生物的染色体DNA、cDNA文库等也可以取得可用于本发明的DNA。
取得的DNA可以直接、或用适当的限制酶等进行酶切,通过常规方法转运到载体,然后将得到的的重组DNA导入宿主细胞后,通过使用通常用的碱基序列解析方法、例如双脱氧法[Proc.Natl.Acad.Sci.,USA,74,5463(1977)]或373A·DNA序列仪(Perkin-Elmer公司生产)等碱基序列分析仪进行分析,可以决定该DNA的碱基序列。
当决定碱基序列的结果发现取得的DNA为部分长时,通过使用该部分长DNA作为探针,对染色体DNA文库的Southern杂交法等可以取得全长DNA。
然后根据决定的DNA的碱基序列,通过使用PerSeptiveBiosystems公司制造的8905型DNA合成仪进行化学合成,也可以制备目的DNA。
作为象上述那样取得的DNA,其中作为编码具有二肽生成活性的蛋白质的DNA,例如具有序列号14~26、46、49、50和54表示的碱基序列的DNA、作为编码具有多磷酸激酶活性的蛋白质的DNA,例如具有序列号116~123表示的碱基序列的DNA。
作为本发明的制造方法中可使用的转运了DNA的载体,如pBluescriptIIKS(+)(Stratagene公司生产)、pDIRECT[NucleicAcids Res.,18,6069(1990)]、pCR-Script Amp SK(+)(Stratagene公司生产)、pT7Blue(Novagen公司生产)、pCRII(Invitrogen公司生产)和pCR-TRAP(Genhunter公司生产)等。
作为宿主细胞,如属于埃希氏茵属的微生物等。作为属于埃希氏茵属的微生物,例如大肠杆菌XL1-Blue、大肠杆菌XL2-Blue、大肠杆菌DH1、大肠杆菌MC1000、大肠杆菌KY3276、大肠杆菌W1485、大肠杆菌JM109、大肠杆菌HB101、大肠杆菌No.49、大肠杆菌W3110、大肠杆菌NY49,大肠杆菌MP347、大肠杆菌NM522、大肠杆菌ME8415等。
作为重组DNA的导入方法,只要是将DNA导入到上述宿主细胞的方法,可以使用任一种方法,例如使用钙离子的方法[Proc.Nat1.Acad.Sci.,USA,69,2110(1972)]、原生质体法(特开昭63-248394)、电穿孔法[Nucleic Acids Res.,16,6127(1988)]等。
作为通过上述方法得到的带有可用于本发明的制造方法的DNA的微生物,例如带有含具有序列号14表示的碱基序列的DNA的重组DNA的微生物大肠杆菌NM522/pPE43、带有含具有序列号122表示的碱基序列的DNA的重组DNA的大肠杆菌BL21-Gold(DE3)/pPK-Ecl。
8.可用于本发明的细胞的制备
(1)作为可用于本发明的细胞,如具有生产具有二肽生成活性的蛋白质能力的细胞、具有生产具有多磷酸激酶活性的蛋白质能力的细胞、和具有生产具有二肽生成活性的蛋白质和具有多磷酸激酶活性的蛋白质的两方蛋白质能力的细胞。
作为具有生产具有二肽生成活性的蛋白质能力的细胞,如属于在染色体DNA上含有上述3的DNA的芽孢杆菌属或链霉菌属的细菌、优选使用具有杆菌溶素合成活性的芽孢杆茵属的细菌或属于具有生产albonoursin能力的链霉菌属的细菌、更优选属于枯草芽孢杆菌、解淀粉芽孢杆菌、凝结芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、微白链霉菌和诺尔斯氏链霉菌中任一种类的细菌、进一步优选枯草芽孢杆菌ATCC15245、枯草芽孢杆菌ATCC6633、枯草芽孢杆菌IAM1213、枯草芽孢杆菌IAM1107、枯草芽孢杆菌IAM1214、枯草芽孢杆菌ATCC9466、枯草芽孢杆菌IAM1033、枯草芽孢杆菌ATCC21555、解淀粉芽孢杆菌IFO3022、短小芽孢杆菌NRRLB-12025、诺尔斯氏链霉菌IFO15452和微白链霉菌IFO14147中任一菌株的细菌、和使用分子克隆第3版、Current Protocols in Molecular Biology等所述的方法等,例如通过以下的方法,通过将使用上述3的方法取得的DNA导入宿主细胞制备的转化体。
作为具有生产具有多磷酸激酶活性的蛋白质能力的细胞,如属于在染色体DNA上含有上述4的DNA的埃希氏菌属、红细菌属、绿屈挠茵属、Mesorhizobium属、链霉菌属、假单胞菌属或中华根瘤茵属的细菌、更优选大肠杆菌W3110、类球红细菌(Rhodobacter sphaeroides)ATCC17023、橙色绿屈挠茵(Chloroflexus aurantiacus)ATCC29366、天蓝色链霉菌(Streptomyces coelicolor)ATCC BAA-471、恶臭假单胞菌(Pseudominus putida)KT2440和苜蓿中华根瘤菌(Sinorhizobium meliloti)ATCC51124中任一茵属的细菌、以及属于分子克隆第3版、Current Protocols in Molecular Biology等所述的方法等,例如使用以下的方法,可通过将用上述4的方法取得的DNA导入宿主细胞制备的转化体。
上述转化体可以通过例如以下的方法制备。
以上述3和4的DNA作为基础,根据需要,制备含有可用于本发明的编码蛋白质的部分的适当长度的DNA片段。另外,通过置换碱基使编码该蛋白质的部分的碱基序列变成最适宿主表达的密码子,可以取得该蛋白质的产率提高的细胞。
通过将该DNA片段插入到适当的表达载体的启动子的下游,制作重组DNA。
通过将该重组DNA导入到适合该表达载体的宿主细胞,可以得到生产本发明的蛋白质的转化体。
作为宿主细胞,如原核生物和酵母等微生物的细胞、动物细胞、昆虫细胞、植物细胞等只要是可以表达目的基因的都可以使用,优选微生物、更优选原核生物、进一步优选细菌。
作为表达载体,使用可在上述宿主细胞自我复制或可转运到染色体中,在能够转录本发明的DNA或可用于本发明的制造方法中的DNA的位置含有启动子的载体。
使用细菌等原核生物作为宿主细胞时,含有本发明使用的DNA的重组DNA最好是可在原核生物中自我复制的同时,由启动子、核糖体结合序列、本发明的DNA或本发明的制造方法使用的DNA、转录终止序列构成的重组DNA。也可以含有调控启动子的基因。
作为表达载体,例如pBTrp2、pBTacl、pBTac2(都是BoehringerMannheim公司生产)、pHelixl(Roche Diagnostics公司生产)、pKK233-2(Amersham Pharmacia Biotech 公 司 生 产) 、pSE280(Invitrogen公司生产)、pGEMEX-1(Promega公司生产)、pQE-8(Qiagen公司生产)、pET-3(Novagen公司生产)、pKYP10(特开昭58-110600)、pKYP200[Agric.Biol.Chem.,48 ,669(1984)]、pLSA1[Agric.Biol.Chem.,53,277(1989)]、pGEL1[Proc.Nat1.Acad.Sci.,USA,82,4306(1985)]、pBluescriptII SK(+)、pBluescriptII KS(-)(Stratagene公司生产)、pTrS30[由大肠杆菌JM109/pTrS30(FERM BP-5407)制备]、pTrS32[由大肠杆菌JM109/pTrS32(FERMBP-5408)制备]、pPAC31(WO98/12343)、pUC19[Gene,33,103(1985)]、pSTV28(Takara Bio公司生产)、pUC118(Takara Bio公司生产)、pPA1(特开昭63-233798)、pWH1520(MoBiTec社制)、pCS299P(WO0 /63388)、pVLT31[Gene,123,17(1993)]和plJ702(Genetic Manipulation of Streptomyces:aLaboratory Manua1:John Innes Foundation)等。
作为启动子只要是可在大肠杆菌等宿主细胞内发挥功能的,无论那一种都可以,例如trp启动子(P trp )、lac启动子(P lac )、PL启动子、PR启动子、PSE启动子等来自大肠杆菌或噬菌体等的启动子、SP01启动子、SPO2启动子、penP启动子等。也可以使用人为设计使Ptrp改变为两个串联的启动子、tac启动子、lacT7启动子、letI启动子那样的启动子等。
另外也可以使用用于在属于杆菌属的微生物中表达的xylA启动子[Appl.Microbiol.Biotechnol.,35,594-599(1991)]、用于在属于棒杆菌属的微生物中表达的P54-6启动子[Appl.Microbiol.Biotechnol.,53,674-679(2000)]、用于在属于假单孢茵属的微生物中表达的tac启动子[Gene,123,17-24(1993)]、用于在属于链霉菌属的微生物中表达的xylA启动子(Genetic Manipulation ofStreptomyces:a Laboratory Manual:John Innes Foundation)等。
最好是使用将作为核糖体结合序列的Shine-Dalgarno序列与起始密码子之间调节到适当的距离(例如6~18碱基)的质粒。
在使本发明的制造方法中使用的DNA与表达载体结合的重组DNA中,不一定需要转录终止序列,但最好是在紧靠结构基因的下面配置转录终止序列。
作为这样的重组DNA,例如pPE43和pPK-Ecl。
作为原核生物,如属于埃希氏茵(Escherichia)属、沙雷氏菌(Serratia)属、杆菌属、短杆菌(Brevibacterium)属、棒杆菌(Corynebacterium)属、微杆菌属(Microbacterium)、假单胞菌(Pseudomonas)属、土壤杆菌(Agrobacterium)属、脂环酸杆菌属(Alicyclobacillus)、鱼腥蓝细菌(Anabaena)属、组囊蓝细菌(Anacystis)属、节杆菌(Arthrobacter)属、固氮菌(Azotobacter)属、着色菌(Chromatium)属、欧文氏茵(Erwinia)属、甲基杆菌(Methylobacterium)属、席蓝细菌(Phormidium)属、红细菌(Rhodobacter)属、红假单胞菌(Rhodopseudomonas)属、红螺菌(RhodoSpirillum)属、セネテ·スムス(Scenedesmus)属、链霉菌(Streptomyces)属、聚球蓝细菌(Synechoccus)属、发酵单胞菌(Zymomonas)属等的微生物,例如,大肠杆茵、枯草芽孢杆菌(Bacillus subtilis)、巨大芽孢杆菌(Bacillus megaterium)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens) 、凝 结 芽 孢 杆 菌(BacilluscoagUlans)、地衣芽孢杆菌(Bacillus licheniformis)、短小芽孢杆菌(Bacillus pumilus)、产氨短杆菌(Brevibacterium ammoniagenes)、フ·レヒ·ハ·クテリ ウム·イマ リオフイルム(Brevibacterium immariophilum)、解糖短杆菌(Brevibacterium saccharolyticum)、黄色短杆菌(Brevibacterium flavum)、乳发酵短杆菌(Brevibacterium lactofermentum)、 谷氨酸棒杆菌(Corynebacterium glutamicum) 、嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophilum)、嗜氨微杆菌(Microbacterium ammoniaphilum)、无花果沙雷氏茵(Serratiaficaria)、居泉沙雷氏茵(Serratiafonticola)、液化沙雷氏茵(Serratia liquefacciens)、粘质沙雷氏茵(Serratia marcescens)、铜绿假单胞菌(Pseudomonas aeruginosa)、恶臭假单胞菌(Pseudomonas putida)、放射形土壤杆菌(Agrobacterium radiobacter)、发根土壤杆菌(Agrobacterium rhizogenes)、悬钩子土壤杆菌(Agrobacterium rubi)、柱孢鱼腥蓝细菌(Anabaena cylindrica)、桶形鱼腥蓝细菌(Anabaena doliolum)、水华鱼腥蓝细菌(Anabaenaflos-aquae)、金黄节杆菌(Arthrobacter aurescens)、柠檬节杆菌(Arthrobacter citreus)、球形节杆菌(Arthrobacter globformis)、ァ—スロハ·クタ—·ヒト·ロカ一木·ク·ルタミカス(Arthrobacter hydrocarboglutamcus)、迈索尔节杆菌(Arthrobacter mysorens)、烟草节杆菌(Arthrobacter nicotianae)、石蜡节杆菌(Arthrobacter paraffineus)、原玻璃蝇节杆菌(Arthrobacter protophormiae)、玫瑰色石蜡节杆菌(Arthrobacter roseoparaffinus)、硫磺节杆菌(Arthrobacter sulfureus)、产尿节杆菌(Arthrobacter ureafaciens)、巴氏着色菌(Chromatium buderi)、微温着色菌(Chromatium tepidum)、酒色着色菌(Chromatium vinosum)、沃氏着色茵(Chromatium warmingii)、クロマチウム·フ ルヒ·ァタテイレ(Chromatium fluviatile)、噬夏孢欧文氏菌(Erwinia uredovora)、胡萝卜软腐欧文氏菌(Erwinia carotovora)、波萝欧文氏茵(Erwinia ananas)、草生欧文氏茵(Erwinia herbicola)、ェルヒ·二ァ·ハ °ンク タタ(Erwinia punctata)、ェルヒ·ニァ·テレウス(Erwinia terreus)、罗得西亚甲基杆菌(Methylobacterium rhodesianum)、扭脱甲基杆茵(Methylobacterium extorquens)、フ才ルミテ·イウム·エスヒ° 一(Phormidium sp.) ATCC29409、夹膜红细菌(Rhodobacter capsulatus)、类球红细菌(Rhodobacter sphaeroides)、生芽红细菌(Rhodopseudomonas blastica)、海红菌(Rhodopseudomonas marina)、血色红假单胞茵(Rhodopseudomonas palustris)、深红红螺茵(Rhodospirillum rubrum)、需盐红螺茵(Rhodospirillum salexigens)、盐场红螺菌(Rhodospirillum salinarum)、产二素链霉菌(Streptomyces ambofaciens)、金霉素链霉菌(Streptomyces aureofaciens)、金色链霉菌(Streptomyces aureus)、杀真菌素链霉菌(Streptomyces fungicidicus)、灰产色链霉菌(Streptomyces griseochromogenes)、灰色链霉菌(Streptomyces griseus)、浅青紫链霉菌(Streptomyces lividans)、橄榄灰链霉菌(Streptomyces olivogriseus)、枝链霉菌(Streptomyces rameus)、田无链霉菌(Streptomyces tanashiensis)、酒红链霉菌(Streptomyces vinaceus)、运动发酵单胞茵(Zymomonas mobilis)等、作为理想的原核生物,如属于埃希氏茵属、沙雷氏茵属、杆菌属、短杆菌属、棒杆菌属、假单孢菌属或链霉菌属等的细菌、例如上述的属于埃希氏茵属、沙雷氏菌属、杆菌属、短杆菌属、棒杆菌属、假单孢茵属或链霉菌属等细菌,作为更理想的细菌,如大肠杆菌、谷氨酸棒杆菌、产氨棒杆菌、乳酸发酵棒杆菌、黄色棒杆菌、Corynebacterium efficiens、枯草芽孢杆菌、巨大芽孢杆菌、粘质沙雷氏菌、恶臭假单胞菌、铜绿假单胞菌、天蓝色链霉菌或浅青紫链霉菌,特别优选大肠杆菌。
作为重组DNA的导入方法,只要是将DNA导入到上述宿主细胞的方法,可以使用任一种方法,例如使用钙离子的方法[Proc.Natl.Acad.Sci.,USA,69,2110(1972)]、原生质体法(特开昭63-248394)、电穿孔法[Nucleic Acids Res.,16,6127(1988)]等。
当使用酵母菌株作为宿主细胞时,作为表达载体可以使用例如YEp13(ATCC37115)、YEp24(ATCC37051)、YCp50(ATCC37419)、pHS19、pHS15等。
作为启动子,只要是在酵母菌株中发挥作用的启动子,可以使用任一种,例如PHO5启动子、PGK启动子、GAP启动子、ADH启动子、gal1启动子、gal10启动子、热休克多肽启动子、MFα1启动子、CUP1启动子等启动子。
作为宿主细胞,如属于酵母(Saccharomyces)属、裂殖酵母(Schizosaccharomyces)属、克鲁维酵母(Kluyveromyces)属、丝孢酵母(Trichosporon)属、许旺酵母(Schwanniomyces)属、毕赤酵母(Pichia)属、或假丝酵母(Candida)属等的酵母菌株,具体的例如酿酒酵母(Saccharomyces cerevisiae)、シソ·サツカロマイセス·ホ°ンヘ· (Schizosaccharomyces pombe)、クルイヘ·ロマイセス·ラクテイス(Kluyveromyces lactis)、ト リコス木°ロン·フ°ルランス(Trichosporon pullulans)、シワニ 才マイセス·アルヒ·ウス(Schwanniomyces alluvius)、ヒ°チァ·ハ°スト リス(Pichia Dastoris)、产朊假丝酵母(Candida utilis)等。
作为重组DNA的导入方法,只要是将DNA导入酵母的方法,可以使用任一种,例如电穿孔法[Methods Enzymol.,194,182(1990)]、原生质体法[Proc.Natl.Acad.Sci.,USA,81,4889(1984)]、乙酸锂法[J.Bacteriol.,153,163(1983)]等。
当使用动物细胞作为宿主时,作为表达载体,可以使用例如pcDNAI、pcDM8(由Funakoshi公司销售)、pAGE107(特开平3-22979)、DAS3-3(特开平2-227075)、pCDM8[Nature,329,840(1987)]、pcDNAI/Amp(Invitrogen公司生产)、pREP4(Invitrogen公司生产)、pAGE103[J.Biochem,101,1307(1987)]、pAGE210、pAMo、pAMoA等。
作为启动子,只要是在动物细胞中行使功能的,可以使用任一种,例如巨细胞病毒(CMV)的IE(immediate early)基因的启动子、SV40的初期启动子或金属硫因的启动子、逆病毒的启动子、热休克启动子、SRα启动子等。另外也可以将人CMV的IE基因的增强子与启动子一起使用。
作为宿主细胞,如小鼠骨髓瘤细胞、大鼠骨髓瘤细胞、小鼠杂交瘤细胞、人的细胞Namalwa细胞或Namalwa KJM-1细胞、人胎儿肾脏细胞、人白血病细胞、AfRican greenmonkey肾脏细胞、中国仓鼠细胞的CHO细胞、HBT5637(特开昭63-299)等。
作为小鼠骨髓瘤细胞,如SP2/0、NSO等、作为大鼠骨髓瘤细胞,如YB2/0等、作为人胎儿肾脏细胞,如HEK293(ATCC CRL-1573)、作为人白血病细胞,如BALL-1等、作为African green monkey肾脏细胞,如COS-1、COS-7等。
作为重组DNA的导入方法,只要是可将DNA导入动物细胞的方法,可以使用任一种,例如电穿孔法[Cytotechnology,3,133(1990)]、磷酸钙法(特开平2-227075)、脂质转染法[Proc.Natl.Acad.Sci.,USA,84,7413(1987)]、Virology,52,456(1973)所述的方法等。
当使用昆虫细胞作为宿主时,通过例如Baculovirus ExpRessionVectors,A Laboratory Manual,W.H.Freeman and Company,NewYork(1992)、Current protocols in Molecular Biology、MolecularBiology,A Laboratory Manual、Bio/Technology,6,47(1988)等所述的方法可以生产蛋白质。
即,将重组基因导入载体和杆状病毒一起导入昆虫细胞,在昆虫细胞培养上清中得到重组病毒后,再使重组病毒感染昆虫细胞,可以生产蛋白质。
作为在该方法可使用的基因导入载体,例如pVL1392、pVL1393、pBlueBacIII(都是Invitrogen公司生产)等。
作为杆状病毒,可以使用例如感染夜盗蛾科昆虫的病毒Autographa californica nuclar polyhedrosis virus等。
作为昆虫细胞,可以使用Spodoptera frugiperda的卵巢细胞、Trichoplusia ni的卵巢细胞、来自蚕卵巢的培养细胞等。
作为Spodoptera frugiperda的卵巢细胞,如Sf9、Sf21(杆状病毒表达载体实验手册)等、作为Trichoplusia ni的卵巢细胞,如High5、BTI-TN-5B1-4(Invitrogen公司生产)等、作为来自蚕卵巢的培养细胞,如Bombyx mori N4等。
作为用于制备重组病毒,将上述重组基因导入载体与上述杆状病毒一起导入昆虫细胞的导入方法,例如磷酸钙法(特开平2-227075)、脂质转染法[Proc.Nat1.Acad.Sci.,USA,84,7413(1987)]等。
当使用植物细胞作为宿主细胞时,作为表达载体,例如Ti质粒、烟草花叶病毒载体等。
作为启动子,只要是可在植物细胞中行使功能的,可以使用任一种,例如花椰菜花叶病毒(CaMV)的35S启动子、水稻肌动蛋白1启动子等。
作为宿主细胞,如烟草、马铃薯、西红柿、人参、大豆、油菜、紫花苜蓿、水稻、小麦、大麦等植物细胞等。
作为重组载体的导入方法,只要是可将DNA导入植物细胞的方法,可使用任一种,例如使用土壤杆菌(Agrobacterium)的方法(特开昭59-140885、特开昭60-70080.WO94/00977)、电穿孔法(特开昭60-251887)、使用基因枪(particlegun)的方法(日本专利第2606856、日本专利第2517813)等。
当通过酵母、动物细胞、昆虫细胞或植物细胞进行表达时,可以获得生产附加了糖或糖链的蛋白质的细胞。
(2)作为本发明的制造方法中使用的微生物,如在通过上述(1)的方法制备的微生物中,1种以上的肽酶和1种以上的具有肽转运活性的蛋白质(以下,略为肽转运蛋白质)的活性低下或丧失的微生物、或3种以上的肽酶的活性低下或丧失的微生物。
该微生物例如可以(a)通过上述(1)的方法赋予1种以上肽酶和1种以上肽转运蛋白质的功能低下或丧失的微生物、或3种以上肽酶的功能低下或丧失的微生物具有生产具有生成二肽活性的蛋白质能力或生产具有多磷酸激酶活性的蛋白质的能力的方法,或(b)使通过上述(1)的方法能够制备的具有生产具有生成二肽活性的蛋白质能力或生产具有多磷酸激酶活性的蛋白质能力的微生物的a)1种以上的肽酶和1种以上肽转运蛋白质、或b)3种以上肽酶的功能低下或丧失的方法等也可取得。
作为1种以上的肽酶和1种以上的肽转运蛋白质的活性低下或丧失的微生物,只要是该微生物能正常生长繁殖,如任意1种以上的肽酶和任意1种以上的肽转运蛋白质的活性低下或丧失的微生物,优选1种以上9种以下,更优选1种以上7种以下,再优选1种以上4种以下的肽酶的活性低下或丧失,而且优选1种以上5种以下,更优选1种以上3种以下,再优选1种以上2种以下,特别优选1种的肽转运蛋白质活性低下或丧失的微生物。
作为该微生物,更具体讲,在该微生物的基因组DNA上存在的编码肽酶的基因(以下,略为肽酶基因)和编码肽转运蛋白质的基因(以下,略为肽转运蛋白质基因)中,如在1种以上的肽酶基因的碱基序列和1种以上肽转运蛋白质基因的碱基序列中,由于缺失该碱基序列的全部或一部,或由于在该碱基序列中存在碱基的置换或附加,该肽酶和该肽转运蛋白质的活性低下或丧失的微生物。
所谓肽酶的活性低下指的是与上述的碱基没有缺失、置换或附加的基因编码的肽酶相比,肽分解活性变低,通常低至80%以下,优选50%以下,更优选30%以下,再优选20%以下,特别优选10%以下,最好优选5%以下。
微生物的肽分解活性可以使作为底物的肽和微生物菌体在水性介质中共存,进行肽分解反应后,通过众所周知的方法、例如使用HPLC等的分析法对残存的肽量进行定量测定。
作为上述肽酶,只要是具有肽分解活性的蛋白质就可以,优选二肽分解活性高的蛋白质、更优选二肽酶。
作为更具体的肽酶,例如存在于大肠杆菌的具有序列号55表示的氨基酸序列的PepA、具有序列号56表示的氨基酸序列的PepB、具有序列号57表示的氨基酸序列的PepD、具有序列号58表示的氨基酸序列的PepN、PepP[GenBank accession no.(以下,略为GenBank)AAC75946]、PepQ(GenBank AAC76850)、PepE(GenBank AAC76991)、PepT(GenBank AAC74211)、Dcp(GenBank AAC74611)和IadA(GenBankAAC77284)等、存在于枯草芽孢杆菌的AmpS(GenBank AFO12285)、PepT(GenBank X99339)、YbaC(GenBank Z99104)、YcdD(GenBankZ99105)、YjbG(GenBank Z99110)、YkvY(GenBank Z99111)、YqjE(GenBank Z99116)、YwaD(GenBank Z99123)等、存在于谷氨酸棒杆菌的具有BAB97732、BAB97858、BAB98080、BAB98880、BAB98892、BAB99013、BAB99598和BAB99819(都是日本DNA数据库的登录号)表示的氨基酸序列的蛋白质等,作为二肽酶,如具有序列号55~58表示的氨基酸序列的PepA、PepB、PepD和PepN、以及PepQ、PepE、IadA。另外与序列号55~58中的任一个氨基酸序列具有80%以上、优选90%以上、更优选95%以上同源性,而且具有肽酶活性的蛋白质也可以作为二肽分解活性高的蛋白质。氨基酸序列或碱基序列的同源性可以使用上述的BLAST和FASTA等决定。
而所谓肽转运蛋白质的活性低下指的是与由上述的没有缺失、置换或附加碱基的基因编码的肽转运蛋白质相比,肽转运活性变低,通常指的是降低到80%以下,优选50%以下,更优选30%以下,再优选20%以下,特别优选10%以下,最好优选5%以下。
微生物的肽转运活性可以通过使作为底物的肽和微生物菌体共存于水性介质中进行肽转运反应后,利用众所周知的方法,例如使用HPLC等分析法对残存于水性介质中的肽量进行定量进行测定。
上述肽转运蛋白质是由染色体DNA上形成操纵子的基因编码的蛋白质,只要是在细胞膜上形成复合体后表达肽转运活性的蛋白质,以及作为单独的蛋白质具有肽转运活性的蛋白质等参与微生物的肽转运的任一种蛋白质都可以,优选二肽转运活性高的蛋白质。
作为更具体的肽转运蛋白质,例如存在于大肠杆菌的具有序列号59表示的氨基酸序列的DppA、具有序列号60表示的氨基酸序列的DppB、具有序列号61表示的氨基酸序列的DppC、具有序列号62表示的氨基酸序列的DppD、具有序列号63表示的氨基酸序列的DppF、OppA(GenBank AAC76569)、OppB(GenBank AAC76568)、OppC(GenBankAAC 76567)、OppD(GenBank AAC76566)、OppF(GenBank AAC76565)、YddO(GenBank AAC74556)、YddP(GenBank AAC74557)、YddQ(GenBankAAC74558)、YddR(GenBank AAC74559)、YddS(GenBank AAC74560)、YbiK(GenBank AAC73915)、MppA(GenBank AAC74411)、SapA(GenBankAAC74376)、SapB(GenBank AAC74375)、SapC(GenBank AAC74374)、SapD(GenBank AAC74373)、和SapF(GenBank AAC74372)等、存在于枯草芽孢杆菌的DppA(GenBank CAA40002)、DppB(GenBank CAA40003)、DppC(GenBank CAA40004)、DppD(GenBank CAA40005)、DppE(GenBankCAA40006)、OppA(GenBank CAA39787)、OppB(GenBank CAA39788)、OppC(GenBank CAA39789)、OppD(GenBank CAA39790)、OppF(GenBankCAA39791)、AppA(GenBank CAA62358)、AppB(GenBank CAA62359)、AppC(GenBank CAA62360)、AppD(GenBank CAA62356)、AppF(GenBankCAA62357)、Yc1F(GenBank CAB12175)YkfD(GenBank CAB1357)等、存在于谷氨酸棒杆菌的具有BAB99048、BAB99383、BAB99384、BAB99385、BAB99713、BAB99714、BAB99715、BAB99830、BAB99831、BAB99832(都是日本DNA数据库的登录号)表示的氨基酸序列的蛋白质等,另外作为肽转运活性高的蛋白质,如具有序列号59~63表示的氨基酸序列的DppA、DppB、DppC、DppD、DppF和与它们中的任一个表示的氨基酸序列具有80%以上、优选90%以上、更优选95%以上同源性的蛋白质也可作为肽转运活性高的肽转运蛋白质。
上述氨基酸序列的同源性可以使用上述的BLAST或FASTA等程序决定。
作为3种以上肽酶的活性低下或丧失的微生物,只要是该微生物能正常生长繁殖,如任意3种以上肽酶的活性低下或丧失的微生物,优选3种以上9种以下,更优选3种以上6种以下,再优选3种或4种肽酶的活性低下或丧失的微生物。
作为具体的肽酶,如存在于上述的大肠杆菌、枯草芽孢杆菌和谷氨酸棒杆菌的肽酶和二肽酶。而由与序列号55~58中的任一个氨基酸序列有80%以上、优选90%以上、更优选95%以上同源性的氨基酸序列构成、而且具有肽酶活性的蛋白质也可以作为二肽分解活性高的蛋白质。
上述氨基酸序列的同源性可以使用上述的BLAST或FASTA等程序决定。
肽酶和肽转运蛋白质的活性低下或丧失的微生物只要是能够取得该微生物的方法,其取得方法没有限制,例如通过在以下所示的微生物的染色体DNA的肽酶基因或肽转运蛋白质基因导入碱基的缺失、置换或附加的方法可以取得。
作为在微生物的染色体DNA的基因导入碱基缺失、置换或附加的方法,如利用同源重组的方法。作为利用一般的同源重组的方法,如使用将导入了碱基缺失、置换或附加的突变基因与在希望导入碱基缺失等的宿主细胞内含有不能自我复制的抗药(性)基因的质粒DNA连接制作的同源重组用质粒的方法。
通过常规方法将该同源重组用质粒导入宿主细胞后,以抗药(性)作为指标选择通过同源重组在染色体DNA上转运了该同源重组用质粒的转化株。通过将得到的转化株于不含有该药物的培养基中培养数小时~1天后,涂布于含有该药物的琼脂培养基和不含有该药物的琼脂培养基,选择在前者培养基中不生长发育,而在后者培养基能够繁殖株,可以取得在染色体DNA上发生第2次同源重组的株。通过决定染色体DNA上的导入了缺失等的基因存在区域的碱基序列,可以确认染色体DNA上目的基因中导入了碱基的缺失、置换或附加。
作为能够通过上述方法在染色体DNA上的目的基因导入碱基的缺失、置换或附加的微生物,例如属于埃希氏菌属、杆菌属或棒杆菌属的微生物。
而作为利用同源重组向多个基因有效导入碱基的缺失、置换或附加的方法,如使用直链DNA的方法。
具体来说,是使含有希望导入碱基缺失、置换或附加的基因的直链DNA转运到细胞内,在染色体DNA与导入的直链DNA之间发生同源重组的方法。本方法只要是可有效转运直链DNA的微生物,也可以适用于任一种微生物,作为理想的微生物,如属于埃希氏菌属或杆菌属的微生物、更优选大肠杆菌、再优选表达来自λ噬茵体的重组蛋白质组(Red重组系)的大肠杆菌。
作为表达λRed重组系的大肠杆菌,如带有含λRed重组系基因的质粒DNA pKD46[可从大肠杆菌基因储备中心(美国耶鲁大学)获得]的大肠杆菌JM101株等。
作为可用于同源重组的DNA,如
(a)在抗药(性)基因的两端含有与位于作为碱基的缺失、置换或附加的导入对象的染色体DNA上区域两端外侧的DNA具有同源性的DNA的直链DNA、
(b)直接连接了与位于作为碱基的缺失、置换或附加的导入对象的染色体DNA上区域两端外侧的DNA具有同源性的DNA的直链DNA、
(c)在含有抗药(性)基因和能够用于负选择的基因的DNA的两端含有与位于作为碱基的缺失、置换或附加的导入对象的染色体DNA上区域的两端外侧的DNA具有同源性的DNA的直链DNA、和
(d)在上述(a)的直链DNA中,在位于抗药(性)基因和与作为缺失等的导入对象的染色体DNA上区域的两端外侧的DNA具有同源性的DNA之间,还含有来自酵母的Flp重组酶〔Proc.Natl.Acad.Sci.USA.,82,5875(1985)〕识别的碱基序列的DNA。
作为抗药(性)基因,只要是对于宿主微生物表现出敏感性的药物,赋予抗药(性)的抗药(性)基因,也可以使用任一种抗药(性)基因。作为宿主微生物使用大肠杆菌时,作为抗药(性)基因,例如,卡那霉素抗性基因、氯霉素抗性基因、庆大霉素抗性基因、大观霉素抗性基因、四环素抗性基因和氨苄青霉素抗性基因等。
所谓能够用于负选择的基因指的是当在宿主微生物中使该基因表达时,在一定培养条件下,使该微生物致死的基因,作为该基因,例如来自属于杆菌属的微生物的sacB基因〔Appl.Environ.Microbiol.,59,1361-1366(1993)〕、和来自属于埃希氏茵属的微生物的rpsL基因〔Genomics,72,99-104(2001)〕等。
与存在于上述的直链DNA的两末端的位于成为染色体DNA上置换或缺失的导入对象的区域两端外侧的DNA具有同源性的DNA在直链DNA中被配置在与染色体DNA上的方向相同的方向,其长度优选10bp~100bp左右,更有效优选bp~50bp左右、进一步优选30~40bp左右。
所谓来自酵母的Flp重组酶识别的碱基序列只要是该蛋白质识别、催化同源重组的碱基序列,没有特别限定,优选具有序列号64表示的碱基序列的DNA、和具有在该DNA中缺失、置换或附加了1个~数个碱基的碱基序列、而且来自酵母的Flp重组酶识别、催化同源重组的碱基序列的DNA。
所谓具有同源性是上述直链DNA在染色体DNA上的目的区域具有同源重组发生程度的同源性,作为具体的同源性,如80%以上、优选90%以上、更优选95%以上、再优选100%的同源性。
上述碱基序列的同源性可以使用上述的BLAST或FASTA等程序决定。
上述直链DNA片段可以通过PCR制作。另外在质粒上构建了含有上述直链DNA的DNA后,经限制酶处理也可以得到目的直链DNA。
作为在微生物的染色体DNA中导入碱基的缺失、置换或附加的方法,如以下的方法1~4。
方法1:将上述(a)或(d)的直链DNA导入宿主微生物,以抗药(性)为指标选择通过同源重组该直链DNA被插入到染色体DNA上的转化株的方法。
方法2:向通过上述方法1取得的转化株导入上述(b)的直链DNA,通过消除经该方法插入到染色体DNA上的药物基因,使微生物的染色体DNA上的区域置换或缺失的方法。
方法3:
将上述(c)的直链DNA导入宿主微生物,以抗药(性)为指标选择通过同源重组该直链DNA被插入到染色体DNA上的转化株、
合成在与染色体DNA上的方向同一方向连接了与位于作为染色体DNA上的置换或缺失对象区域两端外侧的DNA具有同源性的DNA的DNA,导入到上述[1]中得到的转化株,
在可用于负选择的基因表达的条件下,对进行了上述[2]操作的转化株进行培养,选择在该培养条件下可生长繁殖的株作为从染色体DNA上削除抗药(性)基因和可用于负选择的基因的菌株的方法。
方法4:
将上述(d)的直链DNA导入宿主微生物,以抗药(性)为指标选择通过同源重组该直链DNA被插入到染色体DNA上的转化株、
向上述[1]中得到的转化株导入Flp重组酶基因表达质粒,使该基因表达后,取得对上述[1]中使用的药物有敏感性的菌株的方法。
作为将在上述方法中使用的直链DNA导入宿主微生物的方法,只要是将DNA导入该微生物的方法,可以使用任一种方法,例如使用钙离子的方法〔Proc.Natl.Acad.Sci.,USA,69,2110(1972)〕、原生质体法(特开昭63-248394)、电穿孔法〔Nucleic Acids Res.,16,6127(1988)〕等。
通过使用转运希望插入到在方法2或方法3[2]中使用的直链DNA中的该DNA的中央部附近染色体DNA上的任意基因的直链DNA,在削除抗药(性)基因等的同时,可以将任意基因插入到染色体DNA上。
就上述方法2~4来说,由于是在最终得到的转化株的染色体DNA上不保留抗药(性)基因和可用于负选择的基因等外来基因的方法,所以通过使用同一抗药(性)基因和可用于负选择的基因,反复进行该方法的操作,容易制造在染色体DNA上的位置不同的2个以上区域带有碱基的缺失、置换或附加的微生物。
9.本发明的蛋白质和可用于本发明的蛋白质的制备
所谓本发明的蛋白质和可用于本发明的蛋白质(以下,称为可用于本发明的蛋白质)可以通过将用上述8的方法得到的转化体在培养基中进行培养,使可用于本发明的蛋白质在培养物中生成、蓄积,从该培养物回收该蛋白质,制造该蛋白质。
作为用于制造可用于本发明的蛋白质的上述转化体的宿主,可以是原核生物和酵母等微生物、动物细胞、昆虫细胞等或植物细胞等中的任一种,优选微生物、更优选原核生物、进一步优选细菌、特别优选属于埃希氏菌属的细菌、最好优选大肠杆菌。
将上述转化体在培养基中进行培养的方法可以根据宿主细胞的培养中使用的通常的方法进行。
将大肠杆菌等原核生物和酵母等真核生物作为宿主细胞,对得到的微生物的转化体进行培养的培养基,只要是含有该微生物可利用的碳源、氮源、无机盐类等、可有效进行转化体的培养的培养基,可以使用天然培养基、合成培养基中的任一种。
作为碳源,只要是该微生物可利用的就可以,可以使用葡萄糖、乳糖、蔗糖、含有这些糖的糖蜜、淀粉或淀粉水解物等碳水化合物、醋酸、丙酸等有机酸、乙醇、丙醇等醇类等
作为氮源可以使用氨、氯化铵、硫酸铵、醋酸铵、磷酸铵等无机酸或有机酸的铵盐、其它的含氮化合物、以及胨、肉提取物、酵母提取物、玉米浸渍液、酪蛋白水解物、大豆粕和大豆粕水解物、各种发酵茵体和其它消化物等。
作为无机盐,可以使用磷酸二氢钾、磷酸氢二钾、磷酸镁、硫酸镁、氯化钠、硫酸亚铁、硫酸锰、硫酸銅、碳酸钙等。
培养在通常振荡培养或深部通气搅拌培养等好氧条件下进行。培养温度为15~40℃比较好、培养时间通常为5小时~7日间。培养中pH保持3.0~9.0。pH的调整使用无机或有机的酸、碱性溶液、尿素、碳酸钙、氨等进行。
另外根据培养中需要,也可以向培养基中添加氨苄青霉素或四环素等抗生素。
当对用使用诱导性的启动子作为启动子的表达载体转化的微生物进行培养时,根据需要,也可以向培养基中添加诱导物。例如,对用使用lac启动子的表达载体转化的微生物进行培养时,可以添加异丙基-β-D-硫代半乳糖苷等,当用使用trp启动子的表达载体转化的微生物进行培养时,也可以向培养基添加吲哚丙烯酸等。
作为对以动物细胞作为宿主得到的转化体进行培养的培养基,可以使用一般使用的RPMI1640培养基[J.Am.Med.Assoc.,199,519(1967)]、Eagle的MEM培养基[Science,122,501(1952)]、DMEM培养基[Virology,8,396(1959)]、199培养基[Proc.Soc.Biol.Med.,73,1(1950)]或在这些培养基中添加了胎牛血清等的培养基等。
培养通常在pH 6~8、25~40℃、5%CO2存在下等的条件下进行1~7天。
另外根据培养中需要,也可以在培养基中添加卡那霉素、青霉素、链霉素等抗生素。
作为对以昆虫细胞作为宿主得到的转化体进行培养的培养基,可以使用一般使用的TNM-FH培养基(PharMingen公司生产)、Sf-900IISFM培养基(Life Technologies公司生产)、ExCe11400、ExCel1405[都是JRH BIOSCIENCES公司生产]、Grace'sInsect Medium[Nature,195,788(1962)]等。
培养通常在pH 6~7、25~30℃等的条件下进行1~5天。
另外根据培养中需要,也可以在培养基中添加庆大霉素等抗生素。
以植物细胞作为宿主得到的转化体,可以以细胞的形式,或使其分化为植物的细胞或器官后培养。作为培养该转化体的培养基,可以使用通常使用的Murashige-Skoog(MS)培养基、White培养基、或向这些培养基中添加了生长素、细胞激动素等植物激素的培养基等。
培养通常在pH5~9、20~40℃条件下进行3~60天。
另外根据培养中需要,也可以在培养基中添加卡那霉素、潮霉素等抗生素。
作为本发明中可使用的蛋白质的生产方法,有使蛋白质在宿主细胞内生产的方法、分泌到宿主细胞外的方法、或在宿主细胞外膜上生产的方法,可以根据使用的宿主细胞不同和使生产的蛋白质的构造发生不同变化选择上述方法。
当本发明中使用的蛋白质在宿主细胞内或宿主细胞外膜上生产时,通过利用Paulson等人的方法[J.Biol.Chem.,264,17619(1989)]、Lowe等人的方法[Proc.Nat l.Acad.Sci.,USA,868,227(1989)、Genes Develop.,4,1288(1990)]、或特开平05-336963、WO94/23021等所述的方法,可以使该蛋白质有效地分泌在宿主细胞外。
即,通过使用基因重组的手法,以在紧接在含有本发明使用的蛋白质的活性部位的蛋白质前面附加信号肽的形式使该蛋白质生产,可以有效地使该蛋白质分泌到宿主细胞外。
另外根据特开平2-227075所述的方法,利用使用了二氢叶酸还原酶基因等的基因扩增系也可以使产量上升。
另外,通过使导入基因的动物或植物的细胞再分化,制造导入了基因的动物个体(转基因非人动物)或植物个体(转基因植物),使用这些个体也可以制造本发明的蛋白质。
当生产本发明使用的蛋白质的转化体为动物个体或植物个体时,根据通常的方法,通过进行饲养或栽培使该蛋白质生成、蓄积,从该动物个体或植物个体回收该蛋白质,可以制造该蛋白质。
作为使用动物个体制造可用于本发明的蛋白质的方法,例如根据众所周知的方法[Am.J.Clin.Nutr.,63,639S(1996)、Am.J.Clin.Nutr.,63,627S(1996)、Bio/Technology,9,830(1991)]在导入基因制造的动物中生产该蛋白质的方法。
对于动物个体的情况,例如通过对导入本发明使用的DNA的转基因的非人动物进行饲养,使可用于本发明的蛋白质在该动物中生成、蓄积,从该动物中回收该蛋白质,可以制造该蛋白质。作为该动物中使该蛋白质生成、蓄积的场所,例如该动物的奶(特开昭63-309192)、卵等。作为此时可使用的启动子,只要是可在动物中行使功能的启动子,可以使用任一个,最好使用例如乳腺细胞特异的启动子α酪蛋白启动子、β酪蛋白启动子、β乳球蛋白启动子、乳清酸性蛋白启动子等。
作为使用植物个体制造本发明的蛋白质的方法,例如根据众所周知的方法[组织培养,20(1994)、组织培养,21(1995)、TrendsBiotechnol.,15,45(1997)]通过对导入了编码可用于本发明的蛋白质的DNA的转基因植物进行栽培,使该蛋白质在该植物中生成、蓄积,从该植物中回收该蛋白质,生产该蛋白质的方法。
作为对使用生产可用于本发明的蛋白质的转化体制造的该蛋白质进行分离纯化的方法,可以使用通常的酶的分离纯化法。
例如,当可用于本发明的蛋白质以在细胞内溶解状态生产时,培养结束后,通过对细胞离心分离,进行回收,悬浮于水系缓冲液后,通过超声波破碎机、弗氏细胞压碎器、Manton-Gaulin匀浆器、Dynomill等将细胞破碎,得到无细胞提取液。
从通过对该无细胞提取液离心分离得到的上清通过单独或组合使用通常的酶的分离纯化法、即溶剂提取法、通过硫铵等的盐析法、脱盐法、通过有机溶剂的沉淀法、使用二乙氨基乙基(DEAE)-纤维素、DIAION HPA-75(三菱化成公司生产)等树脂的阴离子交换层析法、使用S-Sepharose FF(Pharmacia公司生产)等树脂的阳离子交换层析法、使用丁基纤维素、苯基纤维素等的树脂的疏水层析法、使用分子筛的凝胶过滤法、亲和层析法、层析聚集法、等电聚焦电泳等的电泳法等的手法,可以得到纯化标准品。
另外当该蛋白质以在细胞内形成包涵体形式生产时,同样回收细胞进行破碎,使用通常的方法从通过离心分离得到的沉淀级分回收该蛋白质后,将该蛋白质的包涵体用蛋白质变性剂溶化。
将该溶化液稀释、或透析到不含有蛋白质变性剂或蛋白质变性剂的浓度稀到蛋白质不变性的程度的溶液,使该蛋白质构成正常的立体构造后,通过与上述同样的分离纯化法可以得到纯化标准品。
当可用于本发明的蛋白质或其糖修饰体等衍生物分泌到细胞外时,可以在培养上清回收该蛋白质或它的糖附加体等衍生物。
即,通过与上述同样的离心分离等手法对该培养物进行处理,取得可溶性级分,使用与上述同样的分离纯化法从该可溶性级分可以得到纯化标准品。
作为象上述那样取得的蛋白质,例如由序列号1~13、47、48、53和124~131中的任一个表示的氨基酸序列构成的蛋白质。
另外,当可用于本发明的蛋白质以与其它蛋白质的融合蛋白质形式生产时,利用使用对融合的蛋白质具有亲和性的物质的亲和层析也可以进行纯化。
作为使其融合的蛋白质,如β-半乳糖苷酶、蛋白A、蛋白A的免疫球蛋白G结合区域、氯霉素·转乙酰酶、聚(Arg)、聚(Glu)、蛋白G、麦芽糖结合蛋白质、谷胱甘肽S-转移酶、聚组氨酸链(His-tag)、S肽、DNA结合蛋白质结构域、Tac抗原、硫氧还蛋白、绿色荧光蛋白、FLAG肽、和任意的抗体的表位等〔山川彰夫,实验医学,13,469-474(1995)〕。
作为对上述可用于融合的蛋白质具有亲和性的物质,如识别β-半乳糖苷酶、蛋白A、蛋白A的免疫球蛋白G结合区域、氯霉素·转乙酰酶、聚(Arg)、聚(Glu)、蛋白G、麦芽糖结合蛋白质、谷胱甘肽S-转移酶、聚组氨酸链(His-tag)、S肽、DNA结合蛋白质结构域、Tac抗原、硫氧还蛋白、绿色荧光蛋白、FLAG肽或任意抗体表位的抗体、例如免疫球蛋白G等。
具体来讲,当可用于本发明的蛋白质以与蛋白A的融合蛋白质进行生产时,根据Lowe等人的方法[Proc.Natl.Acad.Sci.,USA,86,8227(1989)、Genes Develop.,4,1288(1990)]、特开平5-336963、WO94/23021所述的方法等,当以与Flag肽的融合蛋白质形式生产时,根据proc.Natl.Acad.Sci.,USA,86,8227(1989)、Genes Develop.,4,1288(1990)等所述的方法可以纯化融合蛋白质。另外也可以通过使用对该蛋白质自身的抗体的亲和层析进行纯化。
以上述取得的蛋白质的氨基酸序列情报为基础通过Fmoc法(9-笏甲氧羰基法)、tBoc法(t-丁氧羰基法)等化学合成法可以制造本发明的蛋白质。另外也可以利用Advanc ed ChemTech社、Perkin-Elmer公司、Pharmacia 社、 Protein Technology Instrument 社、Synthecell-Vega社、PerSeptive社、岛津制作所等肽合成仪进行化学合成。
10.本发明的二肽和二肽衍生物的制造方法
作为本发明的制造方法,如(1)特征如下的二肽或二肽衍生物(PI)的制造方法:使i)磷酸供体、ii)选自AMP、ADP和ATP中的物质、iii)具有多磷酸激酶活性的蛋白质或具有生产该蛋白质能力的细胞的培养物或该培养物的处理物、iv)具有ATP依赖性的、由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质或具有生产该蛋白质的能力的细胞的培养物或该培养物的处理物、和v)1种以上的氨基酸或氨基酸衍生物在水性介质中共存,使二肽或二肽衍生物(PI)在该水性介质中生成、蓄积,从该水性介质回收该二肽或二肽衍生物(PI),和
(2)特征如下的二肽或二肽衍生物(PII)的制造方法:使i)磷酸供体、ii)选自AMP、ADP和ATP中的物质、iii)具有多磷酸激酶活性的蛋白质或具有生产该蛋白质能力的细胞的培养物或该培养物的处理物、iv)具有ATP依赖性的、由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质或具有生产该蛋白质的能力的细胞的培养物或该培养物的处理物、和v)1种以上的氨基酸或氨基酸衍生物在水性介质中共存,使二肽或二肽衍生物(PI)在该水性介质中生成、蓄积,直接进行修饰或从该水性介质回收该二肽或二肽衍生物(PI)后对该二肽或二肽衍生物(PI)进行修饰,使二肽或二肽衍生物[以下,称为二肽或二肽衍生物(PII)]生成,回收该二肽或二肽衍生物(PII)。
通过众所周知的有机合成的手法等对二肽或二肽衍生物(PI)进行修饰可以制造二肽或二肽衍生物(PII)。
作为上述氨基酸或氨基酸衍生物,如式(I)
(式中、n1、R1a、R1b、R2a和R2b分别与上述同义),或式(II)
(式中、n2、R3a、R3b、R4和R5分别与上述同义)
表示的氨基酸或氨基酸衍生物[但当1种以上的氨基酸或氨基酸衍生物只是式(I)时,R1a和R1b中至少有一方是氢原子,当1种以上的氨基酸或氨基酸衍生物只是式(II)时,R5为羟基],
优选式(III)
(式中、R1c、R1d、R2c和R2d分别与上述同义),或式(IV)
(式中、R3c、R3d及び R5分别与上述同义)
表示的氨基酸或氨基酸衍生物[但当氨基酸或氨基酸衍生物只是式(III)时,R1c和R1d中至少有一方是氢原子,当氨基酸或氨基酸衍生物只是式(IV)时,R5为羟基],
更优选式(V)或式(VI)表示的氨基酸或氨基酸衍生物:
(式中、R2e与上述同义),
(式中、R3e与上述同义)。
作为用上述制造方法制造的肽或二肽衍生物(PI),如式(VIIa)
表示的二肽衍生物,
(式中、n3a、n4a、R6a、R6b、R7a、R7b、R8a、R9a、R9b和R10a分别与上述同义)
优选式(VIIIa)表示的二肽衍生物,
(式中、R6c、R6d、R7c、R7d、R9c、R9d和R10a分别与上述同义)
更优选式(IXa)表示的二肽衍生物。
(式中、R7e和R9e分别与上述同义)
作为用上述制造方法制造的二肽或二肽衍生物(PII),如式(VIIb)表示的二肽衍生物,
(式中、n3A、n4A、R6A、R6B、R7A、R7B、R8A、R9A、R9B和R10A分别与上述同义)
优选式(VIIIb)表示的二肽衍生物,
(式中、R6C、R6D、R7C、R7D、R9C、R9D和R10A分别与上述同义),
更优选式(IXb)表示的二肽衍生物。
(式中、R7E和R9E分别与上述同义)。
但该二肽衍生物不包括由从L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基酪酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸、甘氨酸和β-丙氨酸选出的相同的或不同的氨基酸通过肽键形成的化合物。
在式(I)~(VI)、(VIIa)、(VIIb)、(VIIIa)、(VIIIb)、(IXa)和(IXb)的各基团的定义中,作为低级烷基、低级烷氧基、低级烷酰基、低级烷氧羰基、一(低级烷基)氨基和二(低级烷基)氨基的低级烷基部分,例如碳原子数1至10的直链状、支链状、环状或由它们的组合组成的烷基,更具体讲,作为直链或支链状的烷基,例如甲基、乙基、n-丙基、异丙基、n-丁基、异丁基、sec-丁基、tert-丁基、n-戊基、新戊基、n-己基、n-庚基、n-辛基、n-壬基、n-癸基等,作为环状的烷基,例如环丙基、环丁基、环戊基、环己基、环庚基、环辛基、环癸基、去甲金刚烷基、金刚烷基、双环[2.2.1]庚基、双环[2.2.2]辛基、双环[3.3.0]辛基、双环[3.3.1]壬基等,作为由直链或支链状和环状的组合构成的烷基,例如环丙基甲基、环庚基甲基、环辛基乙基等。而二(低级烷基)氨基中的2个低级烷基部分可以相同,也可以不同。
作为低级烯基,例如碳原子数2至10的直链或支链状的烯基,更具体的例子如乙烯基、烯丙基、1-丙烯基、1-丁烯基、3-丁烯基、2-戊烯基、4-戊烯基、2-己烯基、5-己烯基、2-癸烯基、9-癸烯基等。
作为低级炔基,例如碳原子数2至10的直链或支链状的炔基,更具体的例子如乙炔、2-丙炔、3-丁炔、4-戊炔、5-己炔、9-癸炔等。
作为芳基、芳烷基和芳酰基的芳基部分,例如单环性或2个以上的环缩合的缩环性的芳基,更具体讲如环构成碳原子数从6至14的芳基、例如苯基、萘、茚基、蒽基等。
作为脂环式杂环基,例如单环性或2个以上的环缩合的缩环性的脂环式杂环基,脂环式杂环基中含有的杂原子的种类以及个数没有特别限定,例如可以含有1或2个以上从氮原子、硫原子和氧原子选出的杂原子,更具体的例子,例如吡咯烷基、2,5-二氧吡咯烷基、噻唑烷基、唑烷基、哌啶基、1,2-二氢吡啶基、哌嗪基、同型哌嗪基、吗啉基、硫代吗啉基、吡唑啉基、噁唑啉基、二氧戊环基、四氢吡喃基、四氢硫代吡喃基、四氢呋喃基、四氢喹啉基、四氢异喹啉基、四氢喹喔啉基、八氢喹啉基、二氢吲哚基、1,3-二氧异吲哚基等。
作为杂环烷基的杂环基部分,例如芳香族杂环基、脂环式杂环基等,作为芳香族杂环基,例如单环性或2个以上的环缩合的缩环性的芳香族杂环基,芳香族杂环基中含有的杂原子的种类以及个数没有特别限定,例如可以含有1或2个以上从氮原子、硫原子和氧原子选出的杂原子,更具体讲,从构成环的原子数5至14的芳香族杂环基、例如呋喃基、噻吩基、吡咯基、咪唑、吡唑基、三唑基、四唑基、六唑基、噁二唑基、噻唑基、吡啶基、吡嗪基、嘧啶基、哒嗪基、三嗪基、吲哚基、吲唑基、苯并咪唑基、苯并噁唑基、苯并噻唑基、喹啉基、异喹啉基、2,3-二氮杂萘基、1,5-二氮杂萘基、喹喔啉基、喹唑啉基、噌啉基、嘌呤基、香豆酸基等。而脂环式杂环基与上述同义。
芳烷基和杂环烷基的亚烷基部分在上述低级烷基之中与从一个直链或支链状的烷基除去氢原子后的部分相同含义。
作为邻接的氮原子和与该氮原子邻接的碳原子一起形成的杂环基、以及邻接的碳原子和与该碳原子邻接的氮原子一起形成的杂环基,例如至少含有1个氮原子的5元或6元的单环性脂环式杂环基(该单环性脂环式杂环基也可以含有其它的氮原子、氧原子或硫原子)、在3~8元的环缩合的二环或三环性中至少含有1个氮原子的缩环性杂环基(该缩环性杂环基也可以含有其它的氮原子、氧原子或硫原子)等,更具体的例子,如吡咯烷、哌啶基、哌嗪基、吗啉基、硫代吗啉基、同型哌啶基、同型哌嗪基、四氢吡啶基、四氢喹啉基、四氢异喹啉基等。
作为取代低级烷基、取代低级烯基、取代低级炔基、取代低级烷氧基、取代低级烷酰基、取代低级烷氧羰基、取代芳烷基、取代芳基、取代芳酰基、取代杂环烷基、一(取代低级烷基)氨基、低级烷基(取代低级烷基)氨基、二(取代低级烷基)氨基以及邻接的氮原子和与该氮原子邻接的碳原子一起形成的取代杂环基、和邻接的碳原子和与该碳原子邻接的氮原子一起形成的取代杂环基中的取代基,可以相同或不同,从取代数1起始的可取代数,优选取代数1~3的、例如卤素、氨基、硝基、羟基、巯基、胍基、脲基、氰基、甲酰基、羧基、氨羰基、重氮乙酰基、低级烷基、低级烷氧基、低级烷酰基、低级烷氧羰基、一或二(低级烷基)氨羰基、低级烷基巯基、芳基、芳烷基、芳酰基、杂环羰基等。其中低级烷基、低级烷氧基、低级烷酰基和低级烷氧羰基的低级烷基部分、芳基、芳烷基和芳酰基的芳基部分以及芳烷基的烯基部分分别与上述同样含义,一或二(低级烷基)氨羰基和低级烷硫基中的低级烷基部分与上述低级烷基同样含义,杂环羰基中的杂环基部分与上述杂环烷基中的杂环基部分相同含义。卤素表示氟、氯、溴、碘各原子。而二(低级烷基)氨羰基中的2个低级烷基部分可以相同,也可以不同。
另外,作为理想的氨基酸或氨基酸衍生物,如由L-氨基酸、甘氨酸(Gly)和β-丙氨酸(β-Ala)和它们的衍生物选出的氨基酸或氨基酸衍生物。作为L-氨基酸,例如L-丙氨酸(L-Ala)、L-谷氨酰胺(L-Gln)、L-谷氨酸(L-Glu)、L-缬氨酸(L-Val)、L-亮氨酸(L-Leu)、L-异亮氨酸(L-Ile)、L-脯氨酸(L-Pro)、L-苯丙氨酸(L-Phe)、L-色氨酸(L-Trp)、L-蛋氨酸(L-Met)、L-丝氨酸(L-Ser)、L-苏氨酸(L-Thr)、L-半胱氨酸(L-Cys)、L-天冬酰胺(L-Asn)、L-酪氨酸(L-Tyr)、L-赖氨酸(L-Lys)、L-精氨酸(L-Arg)、L-组氨酸(L-His)、L-天冬氨酸(L-Asp)、L-α-氨基酪酸(L-α-AB)、L-氮丝氨酸(L-Azaserine)、L-茶氨酸(L-theanine)、L-4-羟基脯氨酸(L-4-HYP)、L-3-羟基脯氨酸(L-3-HYP)、L-鸟氨酸(L-Orn)、L-瓜氨酸(L-Cit)和L-6-重氮-5-氧代正亮氨酸(L-6-diazo-5-oxo-norleucine)等。
作为上述制造方法中可使用的氨基酸或氨基酸衍生物的组合,如选自L-Ala、Gly、L-Met、L-Ser、L-Thr和β-Ala中的一种氨基酸或它的衍生物与选自L-Ala、L-Gln、L-G l u、Gly、L-Val、L-Leu、L-Ile、L-Pro、L-Phe、L-Trp、L-Me t、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-Asp、L-α-AB、β-Ala、L-Azaserine、L-theanine、L-4-HYP、L-3-HYP、L-Orn、L-Cit 及L-6-diazo--oxo-norleucine中的一种氨基酸或它的衍生物的组合、L-Gln或它的衍生物与L-Phe或它的衍生物的组合、和L-α-AB或它的衍生物与选自L-Gln、L-Arg和-α-AB中的一种氨基酸或它的衍生物的组合,更优选L-Ala或它的衍生物与选自L-Gln、Gly、L-Val、L-Leu、L-Ile、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-α-AB、L-Azaserine、L-Cit和L-theanine中的一种氨基酸或它的衍生物的组合、Gly或它的衍生物与选自L-Gln、Gly、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Tyr、L-Lys、L-Arg、L-α-AB和L-Cit中的一种氨基酸或它的衍生物的组合、L-Met或它的衍生物与选自L-Phe、L-Met、L-Ser、L-Thr、L-Cys、L-Tyr、L-Lys和L-His中的一种氨基酸或它的衍生物的组合、L-Ser或它的衍生物与选自L-Gln、L-Phe、L-Ser、L-Thr、L-Tyr、L-His和L-α-AB中的一种氨基酸或它的衍生物的组合、L-Thr或它的衍生物与选自L-Gln、L-Phe、L-Leu、L-Thr和L-α-AB中的一种氨基酸或它的衍生物的组合、L-Gln或它的衍生物与L-Phe或它的衍生物的组合、β-Ala或它的衍生物与选自L-Phe、L-Met、L-His和L-Git中的一种氨基酸或它的衍生物的组合、和L-α-AB或它的衍生物与L-Gln、L-Arg和L-α-AB中的一种氨基酸或它的衍生物的组合。
在上述制造方法中,使用蛋白质本身作为酶源时,水性介质中的该蛋白质的量相对于每1mg用作底物的氨基酸或氨基酸衍生物为0.01~100mg、优选0.1mg~10mg,当使用具有生产具有二肽生成活性的蛋白质能力的细胞或具有生产具有多磷酸激酶活性的蛋白质能力的细胞的培养物或该培养物的处理物作为酶源时,该酶源的量因该酶源的比活性等不同而有所差异,例如,对于每1mg用作底物的氨基酸或氨基酸衍生物,添加作为湿菌体重量5~1000mg、优选10~400mg。
作为培养物的处理物,如培养物的热处理物、培养物的浓缩物、培养物的干燥物、培养物离心分离后得到的细胞、该细胞的热处理物、该细胞的干燥物、该细胞的冷冻干燥物、该细胞的表面活性剂处理物、该细胞的超声波处理物、该细胞的机械磨碎处理物、该细胞的溶剂处理物、该细胞的酶处理物、该细胞的蛋白质分级物、该细胞的固定化物和从该细胞提取得到的酶标准品选出的处理物,而且具有ATP依赖性的、由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性、或具有多磷酸激酶活性的处理物等,优选热处理物。作为热处理的条件,只要是热处理的培养物或细胞具有生成反应需要的二肽或二肽衍生物的活性和多磷酸激酶活性,而且使二肽或二肽衍生物的分解活性低下或丧失的条件,没有特别限制,如40℃~90℃下5~120分钟、优选45℃~70℃下10~60分钟的条件。
另外,当使用上述的培养物或细胞的热处理物作为酶源时,最好使用热稳定的具有二肽生成活性的蛋白质和具有多磷酸激酶活性的蛋白质。具有生产热稳定的具有二肽生成活性的蛋白质和具有多磷酸激酶活性的蛋白质的细胞可以通过使用易错PCR[Technique,1,11-15(1989)]等手法,在例如具有序列号14或117表示的碱基序列的DNA中导入突变,通过上述3的方法制备生产该DNA编码的蛋白质的转化体,使该蛋白质生产,选择在上述条件的热处理后也生产保持二肽生成活性或多磷酸激酶活性的蛋白质的转化体取得。具体来讲,通过易错PCR在具有序列号14表示的碱基序列的DNA中导入突变后得到的带有具有序列号22~26中的任一个表示碱基序列的DNA的细胞。
在上述制造方法中,用作底物的氨基酸或氨基酸衍生物按照浓度达到0.1~500g/L、优选0.2~200g/L的浓度在开始或反应途中添加到水性介质中。
上述制造方法中可使用的选自AMP、ADP和ATP的物质只要是ATP消耗反应(二肽或二肽衍生物的生成反应)和ATP再生反应(通过多磷酸激酶催化的ATP生成反应)偶联反应开始的浓度,可以是任意浓度,通常使用0.1mmol~100mol/L、优选1mmol~10mol/L、更优选2mmol~5mol/L的浓度。
另外当在上述制造方法中使用细胞的培养物或该培养物的处理物作为酶源时,取代AMP、ADP和ATP,可以使用通过细胞的代谢能力能够变换为AMP、ADP或ATP的AMP、ADP或ATP的前体物质、或作为AMP、ADP或ATP的供给源的葡萄糖那样的糖类、乙醇那样的醇类、醋酸那样的有机酸类等。
作为可用于上述制造方法中的磷酸供体,只要是可成为多磷酸激酶底物的磷酸供体,可以使用任意物质,优选多磷酸。作为多磷酸,只要是可作为多磷酸激酶底物的多磷酸,没有特别限制,聚合度为8~1000、优选聚合度为10~75的多磷酸。该多磷酸按照浓度达到0.5g/L~200g/L、优选5g/L~100g/L的浓度添加到水性介质中。
作为可在上述制造方法中使用的水性介质,只要不抑制二肽衍生物的生成反应,可以是任意成分、组成的水性介质,例如,水、磷酸盐、碳酸盐、乙酸盐、硼酸盐、柠檬酸盐、Tris等缓冲液等。另外也可以含有甲醇、乙醇等醇类、乙酸乙酯等酯类、丙酮等酮类、乙酰胺等酰胺类。另外当使用细胞的培养物或该培养物的处理物作为酶源时,作为水性介质,也可以使用该细胞的培养中使用的培养液作为水性介质。
另外,在上述制造方法中当使用细胞的培养物或该培养物的处理物作为酶源时,根据需要,也可以在水性介质中添加表面活性剂或有机溶剂。作为表面活性剂,polyoxyethylene cotadecylamine(例如Nymeen S-215、日本油脂社制)等非离子表面活性剂、cetyltrimethylammonium bromide和alkyldimethylbenzyIammoniumchloride(例如Cation F2-40E、日本油脂社制)等阳离子系表面活性剂、lauroyl sarcosinate 等阴离子系表面活性剂、alkyldimethylamine(例如Tertiary AmineFB、日本油脂社制)等的Tertiary Amine类等;作为有机溶剂,如二甲苯、甲苯、脂(肪)族醇、丙酮、醋酸乙酯等,本发明的制造方法中使用的细胞只要是具有由氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性,可以使用任一种,也可以将1种或数种混合后使用。表面活性剂和有机溶剂的种类和浓度可以在可用于本发明的细胞具有上述活性的范围中的任意选择,例如表面活性剂通常在0.1~50g/l的浓度范围使用,有机溶剂通常在0.1~50ml/l的浓度范围使用。
另外根据需要,可以在水性介质中添加EDTA、EGTA、植酸等螯合剂、PMSF(Phenylmethylsulfonylfluoride)、--4-Amidinophenylbenzoate等蛋白酶抑制剂和Actinonin、DiprotinA等肽酶抑制剂、或镉、铬等金属离子,也可以抑制生成的二肽或二肽衍生物的分解,螯合剂可以在0.01~100mmol/L的浓度范围使用,蛋白酶或肽酶抑制剂在0.01~10mmol/L的浓度范围内使用,金属离子在0.1~100mg/L的浓度范围内使用。
二肽或二肽衍生物的生成反应在水性介质中、在pH5~11、优选pH 6~10、20~50℃、优选25~45℃的条件进行2~150小时、优选进行6~120小时。
在上述制造方法中,在水性介质中生成、蓄积的二肽或二肽衍生物的采取可以通过使用活性炭或离子交换树脂等通常的方法,或利用有机溶剂的提取、结晶、薄层层析、高效液相层析等进行。
以下给出了实验例,对可用于本发明的DNA、蛋白质和细胞的制备方法进行了说明,但该制备方法并不限定于下面实验例。
实验例1 利用数据库检索具有二肽合成活性的蛋白质
以来自枯草芽孢杆菌168株的D-Ala-D-Ala连接酶基因的氨基酸序列[Nature,390,249-256(1997)]作为质询,使用作为枯草芽孢杆菌168株的基因组DNA数据库的Subtilist(http://genolist.pasteur.fr/SubtiList/)的同源性检索功能,对编码存在于枯草芽孢杆菌168株基因组DNA序列中的具有同源性的蛋白质的基因进行检索。
结果在提取的序列中,选择编码作为D-Ala-D-Ala连接酶基序[Biochemistry,30,1673(1991)]的序列号43、44或45表示的氨基酸序列,而且去除掉编码其功能已经被鉴定的蛋白质的基因后,表现出与D-Ala-D-Ala连接酶基序最高同源性(29.1%)的序列作为功能未知基因ywfE。
ywfE的碱基序列如序列号14所示,由该碱基序列编码的蛋白质的氨基酸序列如序列号1所示。
实验例2 ywfE基因表达株的构建
根据实验例1得到的碱基序列情报,象以下那样操作可以取得枯草芽孢杆菌的ywfE基因片段。
首先将枯草芽孢杆菌168株(ATCC 23857)接种于LB培养基[10g/l细菌培养用胰化蛋白胨(Difco公司生产)、5g/l酵母提取物(Difco公司生产)、5g/l氯化钠],于30℃下静置培养过夜。培养后通过使用Current Protocolsin Molecular Biology所述的饱和酚方法,对该微生物的染色体DNA进行分离纯化。
使用Perseptive Biosystems公司制造8905型DNA合成仪,合成具有序列号29~32表示的碱基序列的DNA(以下,分别称之为引物A、引物B、引物C和引物D)。引物A是附加在枯草芽孢杆菌染色体DNA的含有ywfE起始密码子区域的5'端的含有XhoI识别序列的碱基序列。引物B是附加在与含有ywfE的终止密码子的序列互补的碱基序列的5'端的含有BamHI识别序列的碱基序列。而引物C是附加在含有trp启动子的表达载体pTrS30[由大肠杆菌JM109/pTrS30(FERM BP-5407)制备]的trp启动子区域的碱基序列号5'端的含有EcoRI识别序列的碱基序列。引物D是附加在与含有trp启动子的表达载体pTrS30的trp启动子区域的序列互补的序列的5'端的含有XhoI识别序列的碱基序列。
在ywfE基因片段的扩增中使用上述引物A和引物B,作为模板使用枯草芽孢杆菌染色体DNA,在trp启动子区域的片段扩增中使用引物C和引物D、作为模板使用pTrS30进行PCR。PCR通过制备含有作为模板的0.1μg染色体DNA或10ng的pTrS30、0.5μmol/L的各引物、2.5units的Pfu DNA聚合酶(Stratagene公司生产)、4μL的Pfu DNA聚合酶用×10缓冲液(Stratagene公司生产)、各200μmol/L的dNTP(dATP、dGTP、dCTP和dTTP)的反应液40μL,按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一个循环,反复进行30次循环来实施。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认在使用引物A和引物B的PCR中扩增了相当于ywfE基因片段的约1.4kb,在使用引物C和引物D的反应中扩增了相当于trp启动子区域的DNA片段约0.3kbDNA 片段后,添加与剩下反应液等量的TE[10mmol/LTris-HCl(pH8.0)、1mmol/LEDTA]饱和酚/氯仿(lvol/lvol)溶液,并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇,并混合,于-80℃ 下放置30分钟。将该溶液离心分离使DNA沉淀后,将该DNA溶解于20μL的TE。
使用各个该溶解液各5μL,将用引物A和引物B扩增的DNA用限制酶XhoI和BamHI进行酶切,而使用引物C和引物D扩增的DNA用限制酶EcoRI和XhoI进行酶切,通过琼脂糖凝胶电泳将DNA片段分离后,使用genecleanII试剂盒(GENECLEANIIkit、BIO101社制),分别回收含有ywfE的1.4kb和含有trp启动子区域的0.3kb的DNA片段。
将含有trp启动子的表达载体pTrS30[由大肠杆菌JM09/pTrS30(FERM BP-5407)制备]0.2μg用限制酶EcoRI和BamHI酶切后,通过琼脂糖凝胶电泳分离DNA片段,通过与上述同样的方法,回收4.5kb的DNA片段。
使用连接试剂盒(Takara Bio公司生产),使上述得到的含有ywfE的1.4kb片段、含有trp启动子区域的0.3kb片段和4.5kb的片段于16℃下反应16小时,进行连接。
通过使用钙离子的方法[Proc.Natl.Acad.Sci.,USA,69,2110(1972)]用该反应液转化大肠杆菌NM522株(Stratagene公司生产)后涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
根据众所周知的方法从生长繁殖的转化体茵落提取质粒,通过使用限制酶解析其构造,确认取得了在trp启动子下游连接了ywfE的表达载体pPE43(图1)。
实验例3 二肽的生产
将实验例2得到的带有pPE43的大肠杆菌NM522(大肠杆菌NM522/pPE 43株)接种在加入了含有50μg/ml的氨苄青霉素的8ml LB培养基的大型试管,于28℃下培养17小时。对该培养液进行离心分离、取得湿茵体。
制备由终浓度60mg/ml的该湿茵体、120mmol/L的磷酸钾缓冲液(pH7.4)、60mmol/L的氯化镁、60mmol/L的ATP、30mmol/L的L-Ala、30mmol/L的L-Gln.0.4%的NymeenS-215构成的0.1ml反应液,于37℃下反应3分钟。
反应结束后,将反应生成物用二硝基酚法进行衍生化后通过HPLC法进行分析。用HPLC法进行分析,分离柱使用关东化学社制的Lichrosorb-RP-18柱,洗脱液使用1%(v/v)磷酸、25%(v/v)乙腈,以0.7ml/分钟的流速进行。其结果确认反应液中生成蓄积120mg/L的L-丙氨酰-L-谷氨酰胺(L-Ala-L-Gln)。
在作为对照菌株只含有载体的大肠杆菌NM522/pTrS30株的茵体中没有能确认到L-Ala-L-Gln的生成。
实验例4 C末端附加His-tag型重组型二肽合成酶的纯化
使用上述DNA合成仪,合成具有序列号33和34表示的碱基序列的DNA(以下,分别称为引物E、引物F)。引物E是含有将ywfE的起始密码子(atg)置换为NcoI识别序列(ccatgg)的区域的碱基序列。引物F是含有将ywfE的终止密码子置换为BamH I识别序列(ggatcc)的区域的碱基序列。
以枯草芽孢杆菌168株(ATCC23857)的染色体DNA作为模板,使用上述引物E和引物F作为引物组进行PCR。PCR通过制备含有0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的Pfu DNA聚合酶、4μL的Pfu DNA聚合酶用×10缓冲液、200μmol/L的各dNTP的反应液40μL,按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环,反复进行30次来实施。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认扩增了相当于ywfE基因片段的约1.4kb后,添加与剩下反应液等量的TE饱和酚/氯仿溶液,并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。
使用各个该溶解液各5μL,将扩增的DNA用限制酶NcoI和BamHI进行酶切,通过琼脂糖凝胶电泳将DNA片段分离后,使用genecleanII试剂盒回收含有ywfE的1.4kb的DNA片段。
将C末端附加His-tag型重组体表达载体pQE60(Qiagen公司生产)0.2g用限制酶NcoI和BamHI酶切后,通过琼脂糖凝胶电泳将DNA片段分离后,使用与上述同样的方法回收3.4kb的DNA片段。
使用连接试剂盒,使上述得到的含有ywfE的1.4kb的DNA片段和3.4kb的DNA片段于16℃下反应16小时,进行连接。
通过使用钙离子的方法用该连接反应液转化大肠杆菌NM522株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
通过众所周知的方法从生长繁殖的转化体茵落提取质粒,使用限制酶对其构造进行解析,确认取得了作为C末端附加His-tag型ywfE表达载体的pQE60ywfE(图2)。
将带有pQE60ywfE的大肠杆菌NM522(大肠杆菌NM522/pQE60ywfE株)接种在加入了含有50μg/ml的氨苄青霉素的8mlLB培养基的大型试管,于28℃下培养17小时。将该培养液接种在加入了含有50μg/ml的氨苄青霉素的50mlLB培养基的250ml容量三角烧瓶,于30℃下培养3小时后,按照终浓度达到1mmol/L那样添加异丙醇-β-D-硫代半乳糖苷(IPTG),再于30℃下培养4小时。对该培养液进行离心分离取得湿茵体,使用HisTrap(附加His-tag蛋白质纯化试剂盒、Amersham Pharmasia Biotech社制),根据说明书从该湿茵体纯化附加His-tag重组型酶。
实验例5 使用附加His-tag重组型酶进行二肽的生产(1)
(i)制备由实验例4中取得的纯化的附加His-tag重组型酶0.04mg、100mmo l/L的Tris-HCl(pH8.0)、60mmol/L的氯化镁、60mmol/L的ATP、3Dmmol/L的L-Ala、30mmol/L的L-Gln构成的0.1ml的反应液,于37℃进行16小时反应。
反应结束后,通过与上述实验例3同样的方法分析反应生成物,确认反应液中生成蓄积3.7g/L的L-Ala-L-Gln和0.3g/L的L-丙氨酰-L-丙氨酸(L-Ala-L-Ala)。
(ii)除了酶为0.01mg、用L-Phe、L-Met、L-Leu或L-Val取代L-Gln以外,制备与上述(i)的反应液组成相同的反应液,于上述(i)的反应条件下进行反应。
反应结束后,通过与上述实验例3同样的方法对反应生成物进行分析,确认反应液中分别生成蓄积:只有7.0g/L的L-丙氨酰-L-苯丙氨酸(L-Ala-L-Phe)、7.0g/L的L-丙氨酰-L-蛋氨酸(L-Ala-L-Met)和0.03g/L的L-Ala-L-Ala、5.0g/L的L-丙氨酰-L-亮氨酸(L-Ala-L-Leu)和0.2g/L的L-Ala-L-Ala、或1.6g/L的L-丙氨酰-L-缬氨酸(L-Ala-L-Val)和0.3g/L的L-Ala-L-Ala。
(iii)除了酶为0.01mg、用Gly取代L-Ala、用L-Phe或L-Met取代L-Gln以外,制备与上述(i)的反应液的组成相同的反应液,在上述(i)的反应条件使其反应。
反应结束后,通过与上述实验例3同样的方法对反应生成物进行分析,确认反应液中分别生成蓄积5.2g/L的甘氨酰-L-苯丙氨酸(Gly-L-Phe)或1.1g/L的甘氨酰-L-蛋氨酸(Gly-L-Met)。
如果从上述反应液组成中去除ATP,完全不能生成二肽。
以上结果表明ywfE基因产物在ATP存在下具有生成由L-Ala和L-Gln、L-Phe、L-Met、L-Leu或L-Val生成L-Ala-L-Gln和L-Ala-L-Ala、L-Ala-L-Phe、L-Ala-L-Met 和L-Ala-L-Ala、L-Ala-L-Leu和L-Ala-L-Ala、或L-Ala-L-Val和L-Ala-L-Ala的活性,由Gly和L-Phe或L-Met生成Gly-L-Phe或Gly-L-Met的活性。
实验例6 使用附加His-tag重组型酶的二肽的生产(2)
制备由实验例4中得到的纯化的附加His-tag重组型酶0.04mg、100mmol/L的Tris-HCl(pH8.0)、60mmol/L的氯化镁、60mmol/L的ATP构成的0.1ml反应液,按照分别达到30mmol/L那样向反应液中添加由表1的第1行和最左列的氨基酸的组合构成的各种L-氨基酸、Gly或β-Ala,于37℃下进行16小时反应。反应结束后,对反应生成物进行HPLC分析,确认生成表1所示的二肽。
【表1-1】
[表1-2】
【表1-3】
将以表1的第1行和最左列所述的2种(或1种)L-氨基酸、Gly或β-Ala作为底物反应时生成的二肽记在表格内。○表示生成了二肽,但序列未确定,×表示不能确认二肽的生成,而空栏表示未实施。
实验例7 使用附加His-tag重组型酶表达株的二肽的生产
将实验例4得到的大肠杆菌NM522/pQE60ywfE株接种在加入了含有50μg/ml的氨苄青霉素的8mlLB培养基的大型试管,于28℃下培养17小时。将该培养液接种在加入了含有50μg/ml的氨苄青霉素的50mlLB培养基的250ml容量三角烧瓶,于30℃下培养3小时后,按照终浓度达到1mmol/L那样添加IPTG,再于30℃下培养4小时。对该培养液进行离心分离取得湿菌体。
将由200g/L的湿茵体、50g/L的葡萄糖、5g/L的肌醇六磷酸(使用33%的浓氢氧化钠溶液稀释成中性)、15g/L的磷酸二氢钾、5g/L的硫酸镁·7水合物、4g/L的NymeenS-215、10ml/L的二甲苯、200mmol/L的L-Ala、200mmol/L的L-Gln构成的20ml反应液(pH7.2)加入到50ml容量的烧杯、于32℃、900rpm的条件下进行2小时反应。反应中使用2mol/L的氢氧化钾将反应液的pH保持在7.2。
将反应生成物用与实验例3所述方法同样的方法进行分析,确认25mg/L的L-Ala-L-Gln蓄积。
实验例8 相当于来自属于杆菌属的各种微生物的ywfE基因的基因的克隆和该基因的解析
根据序列号9表示的碱基序列,象以下那样操作取得相当于存在于枯草芽孢杆菌ATCC15245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555、解淀粉芽孢杆菌IFO3022和短小芽孢杆菌NRRL B-12025的ywfE基因的基因。
首先,将枯草芽孢杆菌ATCC15245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555、解淀粉芽孢杆菌IFO3022和短小芽孢杆菌NRRL B-12025分别接种于LB培养基,于30℃下静置培养过夜。培养后,通过使用Current Protocols in MolecularBiology所述的饱和酚方法,对于各个微生物的染色体DNA分别进行分离纯化。
使用PerSeptive Biosystems公司制造8905型DNA合成仪,合成具有序列号25和26表示的碱基序列的DNA(以下,分别称为引物G、引物H)。引物G是含有从枯草芽孢杆菌168株的染色体DNA的ywfE的起始密码子开始的上游区域的序列。引物H是与含有从ywfE的终止密码子开始的下游序列互补的序列。
以枯草芽孢杆菌ATCC15245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555或解淀粉芽孢杆茵IFO3022的染色体DNA作为模板,使用上述引物G和引物H作为引物组进行PCR。PCR通过制备含有0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的PfuDNA聚合酶、4μL的PfuDNA聚合酶用×10缓冲液、200μmol/L的各dNTP的反应液40μL,按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环,反复进行30次来实施。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认扩增了相当于ywfE基因片段的约1.4kb后,添加与剩下反应液等量的TE饱和酚/氯仿溶液,并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。
使用连接试剂盒,将上述得到的来自各菌株染色体DNA的1.4kb片段和pCR-blunt(Invitrogen公司生产)于16℃下反应16小时,进行连接。
通过使用钙离子的方法用该反应液转化大肠杆菌NM522株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
通过根据众所周知的方法从生长繁殖的转化体菌落提取质粒,用限制酶对各个构造进行解析,确认取得含有相当于ywfE基因的基因的
质粒pYWFE1(来自ATCC15245株,具有序列号46表示的碱基序列的
DNA)、pYWFE2(来自ATCC6633株,具有序列号15表示的碱基序列的
DNA)、pYWFE3(来自IAM1213株,具有序列号16表示的碱基序列的
DNA)、pYWFE4(来自IAM1107株,具有序列号17表示的碱基序列的
DNA)、pYWFE5(来自IAM1214株,具有序列号18表示的碱基序列的
DNA)、pYWFE6(来自ATCC9466株,具有序列号14表示的碱基序列的
DNA)、pYWFE7(来自IAM1033株,具有序列号46表示的碱基序列的
DNA)、pYWFE8(来自ATCC21555株,具有序列号19表示的碱基序列的
DNA)、pYWFE9(来自IFO3022株,具有序列号20表示的碱基序列的
DNA)。
另外相当于来自短小芽孢杆菌NRRL B-12025的ywfE的基因(具有序列号21表示的碱基序列的DNA)象以下那样取得。
以上述制备的NRRL B-12025株的染色体DNA作为模板,使用序列号37和38表示的碱基序列构成的DNA作为引物组,进行PCR。PCR通过制备含有0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的Z-taq聚合酶(Takara Bio公司生产)、5μL的Z-taq聚合酶用×10缓冲液(Takara Bio公司生产)、200μmol/L的各dNTP的反应液50μL,按照98℃下5秒钟、55℃下30秒钟、72℃下1分钟为一次循环,反复进行30次来实施。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认约0.8kb的片段扩增后,添加与剩下反应液等量的TE饱和酚/氯仿溶液,并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。
使用连接试剂盒将上述得到的0.8kb片段和pGEM T-easy(Promega公司生产)于16℃下反应16小时,进行连接。
通过使用钙离子的方法用该反应液转化大肠杆菌DH5α株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
从上述得到的转化体提取质粒,决定约0.8kb的插DNA片段的碱基序列,确认由序列号21表示的碱基序列中的第358~1160位碱基构成的碱基序列。
然后将该质粒用EcoRI进行酶切后,通过琼脂糖凝胶电泳将DNA片段分离。使用genecleanII试剂盒纯化该DNA片段。使用DIG-HighPrime DNA Labeling&Detection Starter KitI(Roche Diagnostics公司生产)对约0.5μg该纯化DNA片段进行DIG标记。DIG标记根据该试剂盒附带的说明书进行。
使用上述得到的DIG标记的DNA,进行NRRLB-12025株的染色体DNA的Southern解析。
将NRRL B-12025株的染色体DNA分别使用BamHI、EcoRI、HindIII、KpnI、PstI、SacI、SalI和SphI完全消化,通过琼脂糖电泳将DNA片段分离后,根据常规方法转移到nylon membrane pluscharge(Roche Diagnostics公司生产)。
通过照射UV,将DNA片段固定在该尼龙膜后,使用上述探针DNA和该尼龙膜进行Southern杂交。
杂交通过使该探针DNA和该尼龙膜在65℃下接触16小时,然后使用0.1%SDS和2×SSC构成的溶液将该尼龙膜于室温下清洗5分钟,清洗2次,再用0.1%SDS和0.5×SSC构成的溶液,于65℃下15分钟、清洗2次进行,其它操作、条件和杂交的DNA的检测根据上述的DIG-High Prime DNA Labeling&Detection Starter KitI附带的说明书进行。
该结果表明在HindIII和PstI完全消化片段的3.5kbp附近看到发色。
然后,将NRRLB-12025株的染色体DNA使用HindIII和PstI分别完全消化,通过琼脂糖凝胶电泳分离DNA片段。使用genecleanII试剂盒从来自各个限制酶消化DNA中纯化3-4kbp的片段,使用连接试剂盒使其自环化。
根据上述决定的0.8kb的DNA片段的碱基序列,设计、合成序列号39和340表示的碱基序列,以上述取得的环化DNA作为模板进行PCR。PCR通过制备含有10ng的环化DNA、0.5μmol/L的各引物、2.5units的pyrobest聚合酶(Takara Bio公司生产)、5μL的pyrobest聚合酶用×10缓冲液(Takara Bio公司生产)、200μmol/L的各dNTP的反应液50μL,按照98℃下5秒钟、55℃下30秒钟、72℃下3分30秒钟为一次循环,反复进行30次来实施。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认约3.0kb片段扩增后,添加与剩下反应液等量的TE饱和酚/氯仿溶液,并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。
使用连接试剂盒对上述得到的DNA片段和Zero Blunt PCRCloning Kit(Invitrogen公司生产)进行连接。
通过使用钙离子的方法用该反应液转化大肠杆菌NM522株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
根据众所周知的方法从生长繁殖的转化体菌落提取质粒,通过使用限制酶对其构造进行解析,确认得到了含有相当于ywfE基因的基因的质粒pYWFE10(来自NRRL B-12025株、具有序列号21表示的碱基序列的DNA)。
使用碱基序列分析装置373A·DNA序列仪决定上述得到的分别相当于pYWFE1~pYWFE10含有的ywfE基因各基因的碱基序列。
虽然由pYWFE1、pYWFE6和pYWFE7含有的基因编码的蛋白质的氨基酸序列与ywfE基因编码的蛋白质的氨基酸序列相同,但由pYWFE2、pYWFE3、pYWFE4、pYWFE5、pYWFE8、pYWFE9和pYWFE10含有的基因编码的蛋白质的氨基酸序列与ywfE基因编码的蛋白质的氨基酸序列不同。
由相当于pYWFE2、pYWFE3、pYWFE4、pYWFE5、pYWFE8、pYWFE9、pYWFE10以及pYWFE1和pYWFE7中含有的ywfE基因的基因编码的蛋白质的氨基酸序列如序列号2~8以及1所示,而该基因的碱基序列分别如序列号14~21和46所示。
实验例9C末端附加His-tag型重组型二肽合成酶的纯化
以枯草芽孢杆菌ATCC15245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555、或解淀粉芽孢杆菌IFO3022的染色体DNA为模板,使用实验例2所述的引物A和引物B作为引物组进行PCR。PCR通过制备含有0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的PfuDNA聚合酶、4μL的PfuDNA聚合酶用×10缓冲液、200μmol/L的各dNTP的反应液40μL,按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环,反复进行30次来实施。
以短小芽孢杆菌NRRL B-12025的染色体DNA作为模板时,使用具有序列号41和42表示的碱基序列的DNA作为引物组,在与上述同样条件下进行PCR。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认相当于ywfE基因片段的约1.4kb分别扩增后,添加与剩下反应液等量的TE饱和酚/氯仿溶液,并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。
使用各个该溶解液5μL,将扩增的DNA用限制酶NcoI和BamHI酶切,通过琼脂糖凝胶电泳分离DNA片段后,使用genecleanII试剂盒,回收含有相当于ywfE基因的基因的1.4kb DNA片段。
然后将C末端附加His-tag型重组体表达载体pQE600.2μg用限制酶NcoI和BamHI酶切后,通过琼脂糖凝胶电泳分离DNA片段,通过与上述同样的方法回收3.4kb的DNA片段。
使用连接试剂盒使上述得到的含有相当于枯草芽孢杆菌168株的ywfE基因的基因的1.4kb DNA片段和3.4kb的DNA片段于16℃下反应16小时进行连接。
通过使用钙离子的方法用该反应液转化大肠杆菌NM522株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
根据众所周知的方法从生长繁殖的转化体菌落提取质粒,通过使用限制酶对它们的构造进行解析,确认取得了作为C末端附加His-tag型基因表达载体的pQE60ywfE1(含有来自ATCC15245的基因的载体)、pQE60ywfE2(含有来自ATCC6633的基因的载体)、pQE60ywfE3(含有来自IAM1213的基因的载体)、pQE60ywfE4(含有来自IAM1107的基因的载体)、pQE60ywfE5(含有来自IAM1214的基因的载体)、pQE60ywfE6(含有来自ATCC9466的基因的载体)、pQE60ywfE7(含有来自IAM1033的基因的载体)、pQE60ywfE8(含有来自ATCC21555的基因的载体)、pQE60ywfE9(含有来自IFO3022的基因的载体)、和pQE60ywfE10(含有来自NRRLB-12025的基因的载体)。
将上述得到的大肠杆菌NM522/pQE60ywfE1-NM522/pQE60ywfE10株分别接种在加入了含有50μg/ml的氨苄青霉素的8mlLB培养基的大型试管,于28℃下培养17小时。将该培养液接种于加入了含有50μg/ml的氨苄青霉素的50ml的LB培养基的250ml容量的三角烧瓶,于30℃下培养3小时后,按照终浓度达到1mmol/L那样添加IPTG,再于30℃下培养4小时。使用HisTrap,根据其使用说明书,从对该培养液进行离心分离得到的湿菌体纯化附加His-tag重组型酶。
实验例10 使用纯化酶生产二肽
制备由实验例9得到的重组型酶0.04mg、100mmol/LTris-HCl(pH8.0)、60mmol/L的氯化镁、60mmol/L的ATP、30mmol/L的L-Ala和30mmol/L的L-Gln构成的0.1ml的反应液,于37℃下进行16小时反应。
反应结束后,通过实验例3所述的方法对反应液进行分析,结果确认3.0~3.5g/L的L-Ala-L-Gln和0.25~0.3g/L的L-Ala-L-Ala生成蓄积。
而如果从上述反应液组成除去ATP,完全不能生成L-Ala-L-Gln和L-Ala-L-Ala。
以上结果表明实验例8得到的基因产物无论那一个都具有在ATP存在下由L-Ala和L-Gln生成L-Ala-L-Gln和L-Ala-L-Ala的活性。
实验例11albC基因和其类似基因的取得
根据诺尔斯氏链霉菌的albC基因的碱基序列[Chemistry&Biol.,9,1355(2002)],通过以下方法从诺尔斯氏链霉菌和小白链霉菌取得albC基因和其类似基因。
首先将诺尔斯氏链霉菌IFO15452株和小白链霉菌IFO14147株分别接种于添加了1%甘氨酸的KM73培养基[2g/1酵母提取液(Difco公司生产)、10g/l可溶性淀粉(和光纯药工业社制)]、KP培养基[15g/l葡萄糖、10g/1甘油、10g/l多胨(日本制药株式会社制)、10g/l肉浸渍液(极东制药工业株式会社生产)、4g/l碳酸钙],于28℃下振荡培养过夜。而诺尔斯氏链霉菌IFO15452株和小白链霉菌IFO14147株由独立行政法人制品评价技术基盘机构生物资源部门[NationalInstitute of Technology and Evalution(NITE)BiologicalResource Center(BRC)](292-0818千葉県木更津市かずさ鎌足2-5-8)慧赠。
培养后,根据Genetic Manipulation of Streptomyces:aLaboratory Manual:John Innes Foundation所述的方法对该微生物的染色体DNA进行分离纯化。
根据albC基因的碱基序列,使用PerSeptive Biosystems公司制造8905型DNA合成仪,合成具有序列号51和52表示的碱基序列的DNA(以下,分别称为引物J、引物K)。引物J是附加在含有诺尔斯氏链霉菌的染色体DNA的albC基因起始密码子的区域5'端的含有NcoI识别序列的碱基序列。引物K是附加在与含有albC基因的终止密码子的序列互补的碱基序列的5'端的含有BglII识别序列的碱基序列。
使用上述的引物J和引物K作为引物组,作为模板使用诺尔斯氏链霉菌或小白链霉菌的染色体DNA进行PCR。PCR通过制备含有作为模板的0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的ExTaqDNA聚合酶(Takara Bio公司生产)、5μL的ExTaqDNA聚合酶用×10缓冲液(Takara Bio公司生产)、各200μmol/L的dNTP、5μL的二甲基亚砜的反应液50μL,按照94℃下1分钟、55℃下30秒钟、72℃下1分钟为一次循环,反复进行30次来实施。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认约0.7kb的DNA片段扩增后,添加与剩下反应液等量的TE饱和酚/氯仿溶液,并混合。向该溶液经离心分离后得到的上层加 2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。
使用各个该溶解液各5μL,将扩增的DNA用限制酶NcoI和BglII进行酶切,通过琼脂糖凝胶电泳将DNA片段分离后,使用genecleanII试剂盒分别回收700bp的DNA片段。
将0.2g含有噬菌体T5启动子的表达载体pQE60用限制酶NcoI和BglII酶切后,通过琼脂糖凝胶电泳将DNA片段分离后,使用与上述同样的方法回收3.4kb的DNA片段。
使用连接试剂盒,使含有上述得到的来自各放线茵的0.7kb片段和来自pQE60的3.4kb片段于16℃下反应16小时,进行连接。
通过使用钙离子的方法用该连接反应液转化大肠杆菌NM522株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
通过众所周知的方法从生长繁殖的转化体茵落提取质粒,使用限制酶对其构造进行解析,确认取得了作为在噬茵体T5启动子下游连接了来自诺尔斯氏链霉菌的DNA的表达载体pAL-nou、和连接了来自小白链霉菌的DNA的表达载体pAL-alb(图3)。
当使用碱基序列决定装置373A·DNA序列仪决定插入到各个质粒的来自放线茵的DNA部分的碱基序列时,确认pAL-alb中含有编码具有序列号47表示的氨基酸序列的蛋白质的DNA、即含有序列号49表示的碱基序列的DNA,在pAL-nou含有编码具有序列号48表示的氨基酸序列的蛋白质的DNA、即具有序列号50表示的碱基序列的DNA
实验例12 使用菌体作为酶源的二肽的制造
将实验例11得到的带有pAL-nou或pAL-alb的大肠杆菌NM522(大肠杆菌NM522/pAL-nou株或NM522/pAL-alb株)和不带有质粒的NM522株接种于加入了含有50μg/ml的氨苄青霉素的10mlLB培养基的试管(对于不带有质粒的株的情况不添加氨苄青霉素,以下同样),于30℃下培养17小时。将该培养液0.5ml分别接种于加入了50ml的LB培养基的250ml容量的三角烧瓶,于30℃下振荡培养1小时后,按照终浓度达到1mmol/L那样添加IPTG,再继续培养4小时。对该培养液进行离心分离,取得湿茵体。
制备由终浓度100mg/ml的该湿茵体、60mmol/L的磷酸钾缓冲液(pH7.2)、10mmol/L的氯化镁、10mmol/L的ATP、1g/L的L-Leu、1g/L的L-Phe构成的3.0ml反应液,于30℃下进行反应。反应1小时后取样,按照浓度达到20%(v/v)那样加乙腈后,使用HPLC分析反应生成物。通过HPLC进行分析,分离柱使用ODS-HA柱(YMC社制)、作为洗脱液使用30%(v/v)乙腈,以流速0.6ml/min、测定215nm的紫外吸收的条件进行。
分析结果确认在大肠杆菌NM522/pAL-nou株的反应液中有36.7mg/l的环(L-亮氨酰-L-苯丙氨酸)[cyclo(L-Leu-L-Phe)]的蓄积,但在大肠杆菌NM522株的反应液中完全没有检测到cyclo(L-Leu-L-Phe)。将同样反应液在以下的条件下用HPLC进行分析,测定到作为直链二肽(以下,“直链二肽”简称为“二肽”)的L-亮氨酰-L-苯丙氨酸(L-Leu-L-Phe)和L-苯丙氨酰-L-亮氨酸(L-Phe-L-Leu)。
两二肽用F-moc化法进行衍生化后,使用HPLC进行分析。通过HPLC进行分析,分离柱使用ODS-HG5(野村化学社制)、作为洗脱液使用A液(醋酸6ml/l、20%(v/v)乙腈、用三乙胺调整到pH4.8)和B液(醋酸6ml/1、70%(v/v)乙腈、用三乙胺调整到pH4.8),按照分析开始后头5分钟洗脱,按照A液∶B液=8∶2进行,5分钟~20分钟之前进行线性梯度洗脱,在20分钟时A液∶B液=1∶1,流速0.6ml/分钟、激发波长254nm、荧光波长630nm检测二肽的条件下进行。
结果确认在大肠杆菌NM522/pAL-nou株的反应液中有21.9mg/L的L-Leu-L-Phe和12.0mg/L的L-Phe-L-Leu蓄积。而在作为对照株使用的大肠杆菌NM522株的反应液中没有检测到任何二肽。
这表明实验例11中取得的环二肽合成酶具有合成直链二肽的能力。
实验例13 使用纯化酶制造二肽(1)
与实验例12同样培养大肠杆菌NM522/pAL-nou株。培养结束后通过离心分离取得湿茵体,用60mmol/L的磷酸钾缓冲液(pH7.2)清洗后,悬浮于含有10mmol/L咪唑的20mmol/L磷酸钾缓冲液。将该悬浮液于4℃下进行超声波处理,取得菌体裂解液。将该茵体裂解液(10ml、含蛋白质0.863mg)加到Amersham公司生产的His-tag纯化柱,通过加含有10mmol/L的咪唑的20mmol/L的磷酸钾缓冲液15ml进行清洗,于柱内对附带His-tag的albC蛋白质进行纯化。然后向保持这个附带His-tag的albC蛋白质的柱加与实验例12同组成的反应液(反应液组成:60mmol/L的磷酸钾缓冲液(pH7.2)、10mmol/L的氯化镁、10mmol/L的ATP、1g/L的L-Leu、1g/L的L-Phe构成的反应液)2ml,在柱内保持底物的状态下,于30℃进行温育。24小时后用同组成的反应液3ml对柱内的反应液进行洗脱,通过与实验例12同样的方法对反应液中的环二肽和二肽进行定量。
从结果可知生成了cyclo(L-Leu-L-Phe)6.8mg/L、L-Leu-L-Phe28.7mg/L和L-Phe-L-Leu 18.5mg/L。在用不含有ATP的反应液进行同样温育时,环二肽、肽都没有检测到。
实验例14 使用纯化酶制造二肽(2)
除了将底物氨基酸换成其它的氨基酸以外,用与实验例13同样的方法进行酶反应,对生成物进行分析。反应液除了将底物氨基酸换成为1g/L的L-Ala、L-Leu或L-Phe以外,使用与实验例13同样组成的溶液。
从该结果可知在反应开始后24小时内,分别生成了9.41mg/L的L-Ala-L-Ala、7.85mg/L的L-Leu-L-Leu、或5.20mg/L 的L-Phe-L-Phe。
实验例15 强化ywfE基因表达的大肠杆菌的制作
使用PerSeptive Biosystems公司制造8905型DNA合成仪,合成分别具有序列号94~97表示的序列的DNA(以下,分别称为引物L、引物M、引物N、引物0)。序列号94是附加在含有作为质粒pQE60ywfE的vwfE基因的核糖体结合序列的Shine-Dalgarno序列区域5’端的含有XhoI识别序列的序列。序列号95的序列是附加在与含有ywfE基因的终止密码子的序列互补的序列的5’端的含有BamHI识别序列的序列。而序列号96是附加在含有trp启动子的表达载体pTrS30的trp启动子区域序列的5’端的含有EcoRI识别序列的序列。序列号97是附加在与含有trp启动子的表达载体pTrS30的trp启动子区域的序列互补的序列号5’端的含有XhoI识别序列的序列。
以质粒pQE60ywfE作为模板,在ywfE基因片段的扩增中,使用上述的引物L和引物M,在trp启动子区域的片段的扩增中使用引物N和引物0作为引物组进行PCR。PCR通过制备含有10ng的pQE60ywfE、0.5μmol/L的各引物、2.5units的PfuDNA聚合酶、4μL的Pfu DNA聚合酶用×10缓冲液、200μmol/L的各dNTP的40μL的反应液,按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环,反复进行30次来实施。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认在使用引物L和引物M的PCR中相当于ywfE基因片段的约1.4kb、在使用引物N和引物0的反应中相当于trp启动子区域的DNA片段的约0.3kb DNA片段分别扩增后,添加与剩下反应液等量的TE饱和酚/氯仿溶液,并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离使DNA沉淀后,将该DNA溶解于20μL的TE。
使用上述得到的各个DNA溶液5μL,将用引物L和引物M扩增的DNA用限制酶XhoI和BamHI进行酶切,而使用引物N和引物0扩增的DNA用限制酶EcoRI和XhoI进行酶切,通过琼脂糖凝胶电泳将DNA片段分离后,使用genecleanII试剂盒,分别回收含有ywfE的1.4kb和含有trp启动子区域的0.3kb的DNA片段。
将含有0.2μg的trp启动子的表达载体pTrS30用限制酶EcoRI和BamHI酶切后,通过琼脂糖凝胶电泳分离DNA片段,同样回收4.5kb的DNA片段。
使用连接试剂盒,使上述得到的含有ywfE的1.4kb片段、含有trp启动子区域的0.3kb片段和4.5 kb的片段于16℃下进行16小时连接反应。
通过使用钙离子的方法用该反应液转化大肠杆菌NM522株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
根据众所周知的方法从生长繁殖的转化体茵落提取质粒,得到在trp启动子下游含有ywfE基因的表达载体pPE56。通过限制酶消化确认了该载体的构造(图4)。
实验例16pepD基因、pepN基因、pepB基因、pepA基因和dpp操纵子缺失株的制作
大肠杆菌染色体DNA上的特定基因缺失的菌株根据利用λ噬茵体的同源重组系的方法[Proc.Natl.Acad.Sci.USA,97,6641-6645(2000)]进行制作。
以下所述的质粒pKD46、pKD3和pCP20使用通过从大肠杆菌基因贮存中心(美国耶鲁大学)获得保持该质粒的大肠杆菌株,通过众所周知的方法从该株提取的。
(1)基因缺失用DNA片段的克隆
以使存在于大肠杆菌K12株的染色体DNA上的具有序列号65表示的碱基序列的pepD基因、具有序列号66表示的碱基序列的pepN基因、具有序列号67表示的碱基序列的pepB基因、具有序列号68表示的碱基序列的pepA基因和具有序列号69表示的碱基序列的dppA基因、具有序列号70表示的碱基序列的dppB、具有序列号71表示的碱基序列的dppC基因、具有序列号72表示的碱基序列的dppD基因和具有序列号73表示的碱基序列的dppF基因缺失为目的,使用PerSeptive Biosystems公司制造8905型DNA合成仪,合成与位于大肠杆菌K12株的染色体DNA上的各个缺失靶基因的上游和下游的由36bp构成的碱基序列同源的碱基序列、和具有序列号64表示的来自酵母的Flp重组酶识别的碱基序列的DNA。但是dppA基因、dppB基因、dppC基因、dppD基因和dppF基因因为形成操纵子,合成与位于该操纵子的上游和下游的碱基序列同源的碱基序列的DNA。
即,分别合成由作为pepD基因缺失用DNA片段扩增用引物组的序列号74和75、作为pepN基因缺失用DNA片段扩增用引物组的序列号76和77、作为pepA基因缺失用DNA片段扩增用引物组的序列号78和79、作为pepB基因缺失用DNA片段扩增用引物组的序列号80和81、作为dpp操纵子缺失用DNA片段扩增用引物组的序列号82和83表示的碱基序列构成的DNA。
然后使用上述合成DNA作为引物组,pKD 3DNA作为模板进行PCR。PCR通过使用含有l0ng的质粒DNA、0.5μmol/L的各引物、2.5units的PfuDNA聚合酶、4μL的PfuDNA聚合酶用×10缓冲液、200μmol/L的各deoxyNTP的40μL反应液,按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环,反复进行30次来实施。
将各个反应液的1/10量进行琼脂糖凝胶电泳,确认目的片段扩增后,添加与剩下的反应液等量的TE饱和酚/氯仿,并进行混合。
将该混合液离心分离后,向得到的上层加 2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。对该溶液进行离心分离,取得含有pepD基因、DeDN基因、pepB基因、pepA基因和dpp操纵子缺失用氯霉素抗性基因的DNA片段。
(2)pepD基因缺失大肠杆菌JM101的制作
用pKD46转化大肠杆菌JM101株后,涂布于含有100mg/L的氨苄青霉素的LB琼脂培养基,通过于30℃下进行培养,选择带有pKD46的大肠杆菌JM101株(以下,称为大肠杆菌JM101/pKD46)。
质粒pKD46含有λRed重组酶基因,该基因的表达可以通过L-阿拉伯糖诱导。因此如果将在L-阿拉伯糖存在下能够生长繁殖的带有pKD46的大肠杆菌用直链状DNA进行转化,会高频率地发生同源重组。另外pKD46由于具有温度敏感性的复制起点,通过在42℃下使其生长繁殖,可以很容易地使质粒脱落。
通过电脉冲法将上述取得的含有pepD基因缺失用氯霉素抗性基因的DNA片段导入在10mmol/L的L-阿拉伯糖和50μg/ml的氨苄青霉素存在下培养得到的大肠杆菌JM101/pKD46,将通过同源重组在大肠杆菌JM101的染色体DNA中转运了pepD基因缺失用含有氯霉素抗性基因的DNA片段的转化株涂布于含有25mg/L的氯霉素的LB琼脂培养基(细菌培养用胰化蛋白胨10g/L、细菌培养用酵母提取物5g/L、氯化钠5g/L、琼脂15g/L),通过于30℃下培养进行选择。
将选择的氯霉素抗性株接种于含有25mg/L的氯霉素的LB琼脂培养基,于42℃下培养14小时后,进行单茵落分离。将得到的各茵落影印在含有25mg/L的氯霉素的LB琼脂培养基、以及含有100mg/l的氨苄青霉素的LB琼脂培养基,于37℃培养,通过选择表现出氯霉素抗性,而且表现出氨苄青霉素敏感性的菌落,取得pKD46脱落株。
然后使用pCP20转化上述得到的pKD46脱落株,通过在含有100mg/l的氨苄青霉素的LB琼脂培养基上进行选择,取得保持pCP20的pKD46脱落株。
质粒pCP20具有来自酵母的Flp重组酶基因,该基因的表达可以在42℃下进行诱导。
另外由于在上述制作的含有pepD基因、pepN基因、pepB基因、pepA基因和dpp操纵子缺失用氯霉素抗性基因的DNA片段的氯霉素抗性基因的两端存在Flp重组酶识别的碱基序列,通过Flp重组酶催化的同源重组可以很容易地使该抗性基因脱落。
另外由于pCP20含有温度敏感性的复制起点,通过使pCP20保持株在42℃下生长繁殖,可以同时诱导Flp重组酶的表达和pCP20的脱落。
将上述取得的带有pCP20的pKD46脱落株接种于没有添加药物的LB琼脂培养基,于42℃下培养14小时后,进行单茵落分离。将得到的各茵落影印在没有添加药物的LB琼脂培养基、含有25mg/L氯霉素的LB琼脂培养基和含有100mg/L氨苄青霉素的LB琼脂培养基,于30℃下培养,选择表现出氯霉素敏感性,而且表现出氨苄青霉素敏感性的菌落。
根据常规方法(生物工学实验书、日本生物工学会编97~98页、培风馆、1992年)从上述选择的各株制备各个染色体DNA。使用根据缺失靶基因pepD基因的内部碱基序列设计的具有序列号84和85表示的碱基序列的DNA作为引物组,以染色体DNA作为模板进行PCR。PCR通过使用含有0.1g的染色体DNA、0.5μmol/L的各引物、2.5units的PfuDNA聚合酶、4μL的Pfu DNA聚合酶用×10缓冲液、200μmol/L的各deoxyNTP的40μL反应液,按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环,反复进行30次来实施。
在上述PCR中,将没有检测到扩增DNA片段的株作为pepD基因缺失株,命名为大肠杆菌JPD1株。
(3)大肠杆菌JM101的染色体DNA上的pepD基因和pepN基因缺失株的制作
将上述(2)得到的大肠杆菌JPD1株用pKD46转化后,涂布于含有100mg/l氨苄青霉素的LB琼脂培养基,通过于30℃下进行培养,选择保持pKD46的大肠杆菌JPD1(以下,称为大肠杆菌JPD1/pKD46)。通过电脉冲法将含有pepN基因缺失用氯霉素抗性基因的DNA片段导入大肠杆菌JPD1/pKD46,通过同源重组取得在大肠杆菌JPD1/pKD46的染色体DNA上转运了含有pepN基因缺失用氯霉素抗性基因的DNA片段的转化株。
然后通过进行与上述(2)同样的操作,取得从染色体DNA上氯霉素抗性基因脱落的株,将该株命名为大肠杆菌JPDN2。
(4)大肠杆菌JM101的染色体DNA上的pepN基因、pepA基因、pepB基因或dpp操纵子缺失株和多重基因缺失株的制作
pepN基因、peppA基因、pepB基因或dpp操纵子的缺失株使用上述(1)制作的含有各基因或操纵子缺失用氯霉素抗性基因的DNA片段,通过与上述(2)同样的方法进行制作。
通过上述方法取得的各个基因缺失株可以通过使用根据各个缺失基因的内部碱基序列设计、合成的具有序列号86~93表示的碱基序列的DNA作为引物组,通过与上述(2)同样的PCR确认。其中由序列号86和87表示的碱基序列构成的DNA为pepN缺失确认用、由序列号88和89表示的碱基序列构成的DNA为pepA缺失确认用、由序列号90和91表示的碱基序列构成的DNA为pepB缺失确认用、由序列号92和93表示的碱基序列构成的DNA为dpp操纵子缺失确认用引物组。
将上述方法取得的dpp操纵子缺失株取名为大肠杆菌JDPP1株、pepN基因缺失株取名为大肠杆菌JPN1株、pepA基因缺失株取名为大肠杆菌JPA1株、pepB基因缺失株取名为大肠杆菌JPB7株。
另外根据上述(3)的方法,制作由pepD基因、pepN基因、pepA基因、pepB基因和dpp操纵子中选择的2个以上基因或操纵子的多重缺失株。多重缺失株能够取得的确认通过与上述(2)同样的PCR确认。将用上述方法取得的pepD基因和dpp操纵子缺失的二重基因缺失株命名为大肠杆菌JPDP49株,将pepB基因、pepD基因和pepN基因缺失的三重基因缺失株命名为大肠杆菌JPDNB43株,将pepD基因、DepN基因和dpp操纵子缺失的三重基因缺失株命名为大肠杆菌JPNDDP36株,将pepA基因、pepD基因、pepN基因和dpp操纵子缺失的四重基因缺失株命名为大肠杆菌JPNDAP5株,将pepB基因、pepD基因、pepN基因和dpp操纵子缺失的四重基因缺失株命名为大肠杆菌JPNDBP7株。
表2给出了各基因缺失株中缺失基因名。
【表2】
| 菌株名 | 缺失基因 |
| JM101 | 无 |
| JDPP1 | dpp操纵子 |
| JPN1 | pepN |
| JPA1 | pepA |
| JPB7 | pepB |
| JPD1 | PepD |
| JPDN2 | pepD,pepN |
| JPNDB43 | PepB,pepD,pepN |
| JPDP49 | pepD,dpp操纵子 |
| JPNDDP36 | pepD,pepN,dpp操纵子 |
| JPNDAP5 | pepA,pepD,pepN,dpp操纵子 |
| JPNDBP7 | pepB,pepD,pepN,dpp操纵子 |
实验例17 使用肽酶和二肽转运活性丧失的大肠杆菌的L-Ala-L-Gln和L-Ala-L-Ala产率的评价
用实验例15制作的质粒pPE56转化实验例16得到的编码各种肽酶和二肽转运蛋白质的基因的缺失株,取得表现出氨苄青霉素抗性的转化株。
将得到的转化株接种于加入了含有50μg/ml的氨苄青霉素的8mlLB培养基的试管,于28℃下培养17小时。将1%该培养液添加到加入了含有100μg/ml的氨苄青霉素的8ml水性介质(磷酸氢二钾16g/L、磷酸二氢钾14g/L、硫酸铵5g/L、柠檬酸(无水)1g/L、Casamino acid(Difco社制)0.5g/L、L-Pro1g/L、L-Ala2.5g/L、L-Gln 2.5g/L、葡萄糖10g/l、维生素B110mg/L、硫酸镁·7水合物25mg/l、硫酸铁7水合物50mg/l、使用10mol/l的氢氧化钠溶液调整到pH7.2。L-Gln为10倍浓缩液经滤膜过滤灭菌后添加、葡萄糖、维生素B1、硫酸镁·7水合物、硫酸铁·7水合物分别蒸气灭菌后添加)的试管中,于30℃下反应24小时。将该水性介质进行离心分离,取得上清。
该上清中的产物用F-moc化法进行衍生化后,使用HPLC进行分析。通过HPLC进行分析,分离柱使用ODS-HG5(野村化学社制)、作为洗脱液使用A液(醋酸6ml/l、20%(v/v)乙腈、用三乙胺调整到pH4.8)和B液(醋酸6ml/l、70%(v/v)乙腈、用三乙胺调整到pH4.8),在分析开始后头5分钟,A液∶B液=8∶2,在5分~20分钟进行线性梯度洗脱,当20分钟时,使A液∶B液=1∶1的条件下进行。分析结果如表3所示。
【表3】
| 菌株名 | 缺失基因 | AlaGln(g/l) | AlaAla(g/l) |
| JM101 | 无 | 0 | 0 |
| JDPP1 | dpp操纵子 | 0.02 | 0.01 |
| JPN1 | pepN | 0.01 | 0.01 |
| JPA1 | pepA | 0.01 | 0.01 |
| JPB7 | pepB | 0.01 | 0.01 |
| JPD1 | pepD | 0.01 | 0.011 |
| JPDN2 | pepD,pepN | 0.02 | 0.03 |
| JPNDB43 | pepB,pepD,pepN | 0.05 | 0.12 |
| JPDP49 | PepD,dpp操纵子 | 0.11 | 0.08 |
| JPNDDP36 | pepD,pepN,dpp操纵子 | 0.16 | 0.21 |
| JPNDAP5 | pepA,pepD,pepN,dpp操纵子 | 0.28 | 0.26 |
| JPNDBP7 | pepB,pepD,pepN,dpp操纵子 | 0.43 | 0.22 |
由表3可知在2种以下肽酶基因缺失的微生物、仅1种肽转运蛋白质缺失的微生物中,二肽的生成、蓄积量低,而在1种以上肽酶基因和1种肽转运蛋白质缺失的微生物、或3种以上肽酶活性丧失的微生物中,二肽的生成、蓄积量大幅度增加。
实验例18使用肽酶和肽转运蛋白质活性丧失的大肠杆菌株的L-丙氨酰-L-缬氨酸(以下,称为L-Ala-L-Val)产率的评价
与实验例17同样,用pPE56转化编码各种肽酶的基因和编码肽转运蛋白质的操纵子缺失的大肠杆菌株。将得到的转化株接种于加入了含有50μg/ml的氨苄青霉素的8mlLB培养基的试管,于28℃下培养17小时。将该培养液1%添加到加入了含100μg/ml氨苄青霉素的8ml水性介质(磷酸氢二钾16g/l、磷酸二氢钾14g/l、硫酸铵5g/l、柠檬酸(无水)1g/l、Casaminoacid(Difco社制)0.5g/l、L-Pro1g/l、L-Ala2.5g/l、L-Val2.5g/l、葡萄糖10g/l、维生素B110mg/l、硫酸镁·7水合物25mg/l、硫酸铁·7水合物50mg/l、用10mol/l的氢氧化钠溶液调整到pH7.2。葡萄糖、维生素B1、硫酸镁·7水合物、硫酸铁·7水合物分别蒸煮后添加)的试管,于30℃下反应24小时。对该水性介质进行离心分离,取得上清。
通过实验例17所述的方法对该上清中的生成物进行分析。结果如表4所示。
【表4】
| 菌株名 | 缺失基因 | AlaGln(g/l) |
| JM101 | 无 | 0 |
| JDPP1 | dpp操纵子 | 0 |
| JPN1 | pepN | 0 |
| JPA1 | pepA | 0 |
| JPB7 | pepB | 0 |
| JPD1 | pepD | 0 |
| JPDN2 | pepD,pepN | 0 |
| JPNDB43 | pepB,pepD,pepN | 0.04 |
| JPDP49 | pepD,dpp操纵子 | 0.11 |
| JPNDDP36 | pepD,pepN,dpp操纵子 | 0.22 |
| JPNDBP7 | pepB,pepD,pepN,dpp操纵子 | 0.20 |
由表4可知2种以下肽酶基因缺失的微生物和只1种肽转运蛋白质缺失的微生物不生产二肽,3种以上肽酶基因缺失的微生物、或1种以上肽酶基因和1种肽转运蛋白质缺失的微生物生产二肽。
实验例19使用肽酶和二肽转运系蛋白质的活性丧失的大肠杆菌株的甘氨酰-L-谷氨酰胺(以下,称为Gly-L-Gln)产率的评价
与实验例17同样,用pPE56转化编码各种肽酶的基因和编码二肽转运蛋白质的操纵子缺失株。将得到的转化株接种于加入了含有50μg/ml的氨苄青霉素的8mlLB培养基的试管,于28℃下培养17小时。将该培养液1%添加到加入了含100μg/ml氨苄青霉素的8ml水性介质(磷酸氢二钾16g/l、磷酸二氢钾14g/l、硫酸铵5g/l、柠檬酸(无水)1g/l、Casaminoacid(Difco社制)05g/L、L-Pro1g/L、Gly2.5g/L、L-Gln2.5g/L、葡萄糖10g/l、维生素B110mg/l、硫酸镁·7水合物25mg/l、硫酸铁·7水合物50mg/l、用10mol/l的氢氧化钠溶液调整到pH7.2。L-Gln为10倍浓缩液经滤膜过滤灭菌后添加、葡萄糖、维生素B1、硫酸镁·7水合物、硫酸铁·7水合物分别经蒸气灭菌后添加)的试管,于30℃下反应24小时。对该水性介质进行离心分离,取得上清。
通过实验例17所述的方法对该该上清中的生成物进行分析。结果如表5所示。
【表5】
| 菌株名 | 缺失基因 | AlaGln(g/l) |
| JM101 | 无 | 0 |
| JDPP1 | dpp操纵子 | 0 |
| JPDN2 | pepD,pepN | 0 |
| JPNDB43 | pepB,pepD,pepN | 0.01 |
| JPNDDP36 | pepD,pepN,dpp操纵子 | 0.02 |
| JPNDBP7 | pepB,pepD,pepN,dpp操纵子 | 0.03 |
由表5可知2种以下肽酶基因缺失的微生物、和只1种肽转运蛋白质缺失的微生物不生产二肽,3种以上肽酶缺失的微生物、或2种以上肽酶基因和1种肽转运蛋白质缺失的微生物生产二肽。
实验例20 使用氨基酸和氨基酸衍生物作为底物的二肽或二肽衍生物的酶催化制造方法
制备由实验例4中取得的纯化的附加His-tag重组型酶40mg/L、100mmol/L的Tris-HCl(pH9.0)、30mmol/L的氯化镁、10mmol/L的ATP、各10mmol/L的表6记载的氨基酸或氨基酸衍生物组成的0.1ml反应液,于37℃下反应2小时。
反应结束后,向反应液中加反应液的100倍量的停止缓冲液(4mol/L尿素、100mmol/LEDTA·2钠盐),停止反应,通过使用HPLC对因酶反应消耗ATP时生成的ADP量进行分析,确认反应进行。利用HPLC分析,柱子使用Develosil C30-UG-5(150×4.6mm、野村化学公司生产)、移动相使用由200mmol/L的醋酸和200mmol/L的三乙基胺构成的溶液(pH6.6),流速1.0ml/分钟、室温、测定254nm的紫外吸收的条件下进行。结果如表6所示。
【表6-1】
| 添加氨基酸 | 生成ADP量(mmol/L) |
| 不添加 | 0.05 |
| 仅是Ala | 0.13 |
| Ala+cyc(5)Ala | 5.67 |
| Ala+cyc(3)Ala | 3.64 |
| Ala+cyc(6)Ala | 3.78 |
【表6-2】
| 添加氨基酸 | 生成ADP量(mmol/L) |
| 不添加 | 0.05 |
| 仅是Ala | 0.13 |
| 仅是Phe | 0.02 |
| Ala+Phe | 5.84 |
| Cl-Ala+Phc | 2.75 |
| CN-Ala+Phe | 1.11 |
| Ala+Cl-Phe | 4.78 |
| Ala+F-Phc | 4.44 |
| Ala+Ni-Phe | 4.42 |
| Ala+NII2-Phe | 1.89 |
| Ala+Kynurenin | 2.11 |
【表6-3】
| 添加氨基酸 | 生成ADP量(mmol/L) |
| 不添加 | 0.05 |
| 仅是Ala | 0.13 |
| 仅是Glu | 0.13 |
| Ala+Glu(OMe) | 2.60 |
| Ala+Glu(OEt) | 3.93 |
| Ala+Glu(OtBu) | 6.43 |
| Ala+Glu(OBz1) | 6.01 |
【表6-4】
| 添加氨基酸 | 生成ADP量(mmol/L) |
| 不添加 | 0.05 |
| 仅是Ala | 0.13 |
| 仅是Asp | 0.16 |
| Ala+Asp(OMe) | 0.54 |
| Ala+Asp(OtBu) | 4.42 |
| Ala+Asp(OBz1) | 3.23 |
【表6-5】
| 添加氨基酸 | 生成ADP量(mmol/L) |
| 不添加 | 0.05 |
| 仅是Ala | 0.13 |
| 仅是Lys | 0.17 |
| Ala+Lys(Ac) | 0.75 |
| Ala+Lys(Boc) | 3.64 |
表6-1是使用L-Ala和L-Ala衍生物、表6-2是使用L-Ala和L-Phe衍生物、表6-3是使用L-Ala和L-Glu衍生物、表6-4是使用L-Ala和L-Asp衍生物、表6-5是使用L-Ala和L-Lys衍生物作为底物的实验结果,作为底物使用的氨基酸和氨基酸衍生物的简称如下所示。
Ala:L-丙氨酸
Phe:L-苯丙氨酸
Glu:L-谷氨酸
Asp:L-天冬氨酸
Lys:L-赖氨酸
Cl-Ala:β-氯-L-丙氨酸
CN-Ala:β-氰-L-丙氨酸
cyc(5)Ala:β-环五-DL-丙氨酸
cyc(3)Ala:β-环三丙氨酸
cyc(6)Ala:β-环六丙氨酸
Cl-Phe:4-氯苯丙氨酸
F-Phe:4-氟苯丙氨酸
Ni-Phe:p-镍苯丙氨酸
NH2-Phe:p-氨基苯丙氨酸
Phe-NH2:苯丙氨酸酰胺
Kynurenin:L-犬尿氨酸
Glu(OMe):谷氨酸-γ-甲酯
Glu(OEt):谷氨酸-γ-乙酯
Glu(OtBu):谷氨酸-γ-t丁酯
Glu(OBz1):谷氨酸-γ-苄酯
Asp(OMe):天冬氨酸-β-甲酯
Asp(OtBu):天冬氨酸-β-t丁酯
Asp(OBz1):天冬氨酸-β-苄酯
Lys(Ac):乙酰赖氨酸
Lys(Boc):Boc-赖氨酸
就象表6表示的那样,作为对照的没有添加底物区和在分别仅使用L-Ala、L-Phe、L-Glu、L-Asp、L-Lys作为单独底物的试验区的ADP生成量为0.02~0.16mmol/L,而相反在表6给出的氨基酸和氨基酸衍生物的组合中,生成了0.54~6.43mmol/L的ADP。
另外,通过质子NMR分析,对在与上述同样反应条件反应的存在于反应液中的化合物的构造进行解析。但反应中使用的底物氨基酸和氨基酸衍生物的浓度,在反应液1、4、10和11中为20mmol/L、其它的反应液用10mmol/L的浓度。
质子NMR分析使用Bruker公司生产的DMX500,在以下的条件下进行。
温度:303K
标准物质:1mmpl/L的3-(Trimethylsily1)-Propionicacid-D4sodium salt(TSP)
介质:反应液4、10和11为轻水、其它的反应液为重水
反应液中化合物的构造根据α位的质子化学位移进行鉴定。各化合物的浓度以TSP的面积作为内部标准,以α位的质子的信号面积为基础算出的(表7)。但是L-Ala-L-Ala由于浓度低、α位的质子的信号重合,所以以β位的质子的信号面积为基础算出。另外括弧内表示各化合物的α位质子化学位移(单位为ppm)。
使用Cl-Ala和Phe作为底物的反应液(反应液1)
Cl-Ala(4.20)、Phe(4.02)、Cl-Ala-Phe(3.93,4.50)、Aziridine-2-carboxylic acid[Azc](2.73)、Azc-Phe(2.59,4.47)
使用CN-Ala和Phe作为底物的反应液(反应液2)
CN-Ala(3.87)、Phe(4.00)、CN-Ala-Phe(3.71,4.48)
使用Ala和Cl-Phe作为底物的反应液(反应液3)
Ala(3.79)、Cl-Phe(3.97)、Ala-Cl-Phe(3.90,4.43)
使用Ala和NH2-Phe作为底物的反应液(反应液4)
Ala(3.78)、NH2-Phe(3.9 3)、Ala-NH2-Phe(3.95,4.39)、Ala-Ala(β;1.55,1.36)
使用Ala和Kinurenine作为底物的反应液(反应液5)
Ala(3.79)、Kinurenine(4.16)、Ala-Kinurenine(3.96,4.64)
使用Ala和Phe-NH2作为底物的反应液(反应液6)
Ala(3.79)、Phe-NH2(4.02)、Ala-Phe-NH2(3.90,4.60)
使用Ala和Glu(OMe)作为底物的反应液(反应液7)
Ala(3.79)、Glu(OMe)(3.76)、Ala-Glu(OMe)(4.05,4.18)、Ala-Ala(β;1.55,1.36)
使用Ala和Glu(OtBu)作为底物的反应液(反应液8)
Ala(3.79)、Glu(OtBu)(3.76)、Ala-Glu(OtBu)(4.04,4.18)
使用Ala和Asp(OtBu)作为底物的反应液(反应液9)
Ala(3.81)、Asp(OtBu)(3.98)、Ala-Asp(OtBu)(4.04,4.46)
使用Ala和Lys(Boc)作为底物的反应液(反应液10)
Ala(3.78)、Lys(Boc)(3.73)、Ala-Lys(Boc)(4.02,4.14)
使用Ala和cyc(3)Ala作为底物的反应液(反应液11)
Ala(3.78)、cyc(3)Ala(3.82)、Ala-cyc(3)Ala(4.08,4.24)
使用Ala和cyc(6)Ala作为底物的反应液(反应液12)
Ala(3.79)、cyc(6)Ala(3.76)、Ala-cyc(6)Ala(4.02,4.22)
【表7】
表中的“oVer1ap"表示由于信号重合,不能进行正确定量。
上述结果表明通过本发明的制造方法以氨基酸和氨基酸衍生物作为底物,可以直接制造由氨基酸和氨基酸衍生物通过肽键形成的二肽衍生物。
实验例21 N一[2一(乙酰氨基)丙酰]苯丙氨酸的制造
将实验例6中得到的L-A1a-L-phe(100mg,0.423mmo1)悬浮于二氯甲烷(10mL),于室温下加吡啶(10mL)和无水醋酸(1mL,11mmo1)。室温下搅拌24小时后,加水,用氯仿萃取3次。将有机层用饱和盐水清洗,用无水磷酸镁干燥后,通过减压下对溶剂进行蒸馏,得到N-[2-(乙酰氨基)丙酰]苯丙氨酸。
实验例221-{2-[N-(2-(乙酰氨基)丙酰)氨基]-3-苯丙酰}哌啶的制造
将实验例21得到的N-[2-(乙酰氨基)丙酰]苯丙氨酸(10mg,0.036mmol)悬浮于N,N-二甲基甲酰胺(5mL),于室温下加1-(3-二甲基氨基丙基)-3-乙基碳二亚胺盐酸盐(14mg,0.073mmol)、1-羟基苯并三唑基(15mg,0.11mmol)和哌啶(40μL,0.40mmol),在50℃下搅拌24小时。向反应混合物中加水,用氯仿萃取3次。将有机层用10%盐酸和饱和盐水清洗,用无水磷酸镁干燥后,在减压下将溶剂蒸馏。通过将得到的残留物用硅胶柱层析进行纯化,得到1-{2-[N-(2-(乙酰氨基)丙酰)氨基]-3-苯丙酰}哌啶。
以下给出了实施例,但本发明并不限于下面实施例。
在以下的实施例中,二肽和氨基酸在用二硝基苯酚法进行衍生化后通过HPLC法进行分析。在利用HPLC法分析中,分离柱使用Lichrosorb-RP-18柱(关东化学公司生产)、作为洗脱液使用1%(v/v)磷酸、25%(v/v)乙腈,以0.7ml/分钟的流速进行。
ATP、ADP、AMP的分析、定量法
ATP、ADP和AMP的分析通过使用终止溶液[4mol/L尿素、100mmol/L EDTA·2Na(pH 8.0)]将反应液稀释400倍后,用HPLC法进行。在利用HPLC法分析中,通过分离柱使用DevelosilC30-UG-5(150×4.6mm、野村科学公司生产),作为洗脱液使用200mmol/L醋酸、200mmol/L三乙基胺(pH6.6)、流速为1.0ml/分钟、测定波长254nm的吸收来进行。
【实施例1】
编码耐热性ywfE蛋白质基因的取得
使用在实验例4取得的含有ywfE基因的质粒pQE60ywfE上,位于编码ywfE蛋白质的DNA5’端上游的具有序列号98表示的碱基序列的DNA和位于3’下游的具有序列号99表示的碱基序列的DNA作为引物组、以质粒pQEE0ywfE作为模板、进行易错PCR[Technique,1,11-15,(1989)]。PCR通过使用含有模板DNA 0.1μg、引物各0.5μmol/L、Taq DNA聚合酶(Takara Bio公司生产)2.5units、TaqDNA聚合酶用×10缓冲液5μl、deoxyNTP各200μmol/L、和氯化锰0.075mmol/L的反应液50μl,按照94℃下30秒钟、57℃下30秒钟、72℃下1分30秒钟为一个循环,反复进行30循环,最后在72℃下温育3分钟来实施。将扩增片段用限制酶NcoI和BamHI酶切后,象实验例1那样进行回收,与经限制酶NcoI和BamHI酶切的载体质粒pQE60连接,做成表达质粒,用该质粒和pQE60ywfE转化大肠杆菌DH5α/pREP4[用pREP4(Qiagen公司生产)转化大肠杆菌DH5α取得的菌株],取得转化体。将各转化体分别命名为大肠杆菌DH5α/pBTS1~pBTS5和大肠杆菌DH5α/pQE60ywfE。根据常规方法,从大肠杆菌DH 5α/pBTS1~pBTS5提取各个质粒,决定碱基序列。pBTS1中含有的DNA的碱基序列如序列号22所示、该DNA编码的氨基酸序列如序列号9所示,pBTS2中含有的DNA的碱基序列如序列号23所示,该DNA编码的氨基酸序列如序列号10所示,pBTS3中含有的DNA的碱基序列如序列号24所示,该DNA编码的氨基酸序列如序列号11,pBTS4中含有的DNA的碱基序列如序列号25所示,该DNA编码的氨基酸序列如序列号12所示,pBTS5中含有的DNA的碱基序列如序列号26所示,该DNA编码的氨基酸序列如序列号13所示。
将大肠杆菌DH5α/pBTS1~pBTS5和大肠杆菌DH5α/pQE60ywfE(在下面表1中,略为pBTS1~pBTS5和pQE60ywfE)生产的各个蛋白质根据实验例4所述的方法进行纯化,将该蛋白质于55℃下保温15分钟进行热处理后,供二肽生成反应。
制备由上述得到的纯化的各蛋白质50mg/L、100mmol/L的Tris-HCl(pH8.0)、30mmol/L的氯化镁、60mmol/L的ATP构成的0.1ml反应液,向反应液添加使浓度各达到30mmol/L的L-Ala和L-Gln,于37℃下进行1小时二肽生成反应。将使用热处理蛋白质时的L-Ala-L-Gln生成量表示为相对于不进行热处理使用大肠杆菌DH5α/pQE60ywfE生产的蛋白质时的L-Ala-L-Gln生成量的剩余活性(%)。结果如表8所示。
【表8】
| 菌株名 | 剩余活性(%) |
| pQE60ywfE | 0 |
| pBTS1 | 45 |
| pBTS2 | 40 |
| pBTS3 | 8 |
| pBTS4 | 37 |
| pBTS5 | 37 |
就象表8表示的那样,可知可以取得与作为野生型的蛋白质由序列号1表示的氨基酸序列构成的ywfE蛋白质(二肽合成酶)相比,耐热性提高的突变型二肽合成酶。
【实施例2】
生产多磷酸激酶的细胞的制作
(1)各种细菌的染色体DNA的制备
大肠杆菌W3110、类球红细菌ATCC17023、恶臭假单胞菌KT2440(ATCC47054)和苜蓿中华根瘤菌(Sinorhizobium meliloti)ATCC51124使用LB培养基,橙色绿屈挠菌(Chloroflexusaurantiacus)ATCC29366使用ATCC medium920培养基[相对于1L培养基分别含有1ml0.1g/l次氮基三乙酸、0.06g/l硫酸钙·二水合物、0.1g/l硫酸镁·七水合物、0.008g/l氯化钠、0.103g/l硝酸钾、0.689g/l硝酸钠、0.111g/l磷酸氢二钠、0.2g/l氯化铵、0.5g/l酵母提取物、0.5g/l甘氨酰甘氨酸、0.5g/l硫酸钠、微量金属溶液(0.5ml/l浓硫酸、2.28g/l硫酸锰·七水合物、0.5g/l硫酸锌·七水合物、0.5g/l硼酸、0.025g/l硫酸銅·二水合物、0.025g/l钼酸钠·二水合物(Na2MoO4·2H2O)、0.045g/l氯化钴·六水合物)和0.2905g/l的氯化铁(FeCl3)溶液。pH8.2~8.4],メソ·リ ソ·ヒ·ウム·ロテイ(Mesorhizobiumloti)MAFF303099(由Kazusa DNA研究所提供)使用由1g/l酵母提取物、5g/l甘露醇、0.7g/l磷酸氢二钾、0.1g/l磷酸二氢钾和1g/l硫酸镁·七水合物构成的培养基(pH7.0~7.2),天蓝色链霉菌(Streptomycescoelicolor)ATCC BAA-471株使用由5g/l胰蛋白胨(Difco公司生产)、3g/l酵母提取物(Difco公司生产)构成的培养基(pH7.0~7.2),分别于30℃下培养24小时,将培养物离心分离得到茵体。
使用Current Protocols in Molecular Biology所述方法从各个该茵体分别分离纯化各个细菌的染色体DNA。
(2)编码来自各种细菌的多磷酸激酶的基因的扩增
编码大肠杆菌W3110的多磷酸激酶的基因(以下,略为ppk基因)通过使用具有序列号100和101表示的碱基序列的DNA、类球红细菌ATCC17023的ppk基因通过使用具有序列号102和103表示的碱基序列的DNA、橙色绿屈挠菌ATCC29366的ppk基因通过使用具有序列号104和105表示的碱基序列的DNA、Mesorhizobiumloti MAFF303099的ppk基因通过使用具有序列号106和107表示的碱基序列的DNA、天蓝色链霉菌ATCC BAA-471的ppk基因通过使用具有序列号108和109表示的碱基序列的DNA、恶臭假单胞茵KT2440的ppk基因通过使用具有序列号110和111表示的碱基序列的DNA、苜蓿中华根瘤茵ATCC51124的ppk基因通过使用具有序列号112和113或序列号114和115表示的碱基序列的DNA作为引物组,以上述(1)的各细菌的染色体DNA作为模板通过PCR法取得。
PCR通过使用含有各细菌的染色体DNA 0.1μg、引物各0.5μmol/L、Pyrobest DNA聚合酶(Takara Bio公司生产)2.5units、Pyrobest DNA聚合酶用×l0缓冲液5μl、deoxyNTP各200μmol/L的反应液50μl,按照由98℃下5秒钟、59℃下40秒钟、72℃下2分钟构成的一个循环,反复进行30次,最后于72℃下温育2分钟来实施。
添加与该反应液等量的TE饱和酚/氯仿,并进行混合。
将该混合液离心分离后,向得到的上层加2倍容量的冷乙醇,并混合,于-80℃放置30分钟。将该溶液离心分离,得到的DNA溶解于TE。
(3)编码多磷酸激酶的DNA的克隆
将以上述2取得的大肠杆菌W3110的染色体DNA作为模板扩增的DNA片段经NcoI和BamHI消化后,通过琼脂糖凝胶电泳分离约1.4kb的DNA片段,用geneclean试剂盒回收后,溶解于TE。使用连接试剂盒将得到的DNA片段与经NcoI和BamHI消化的pET-28a(+)载体(Novagen公司生产)于16℃下连接1小时,取得重组DNA。
用该重组DNA转化大肠杆菌TOP10(Invitrogen公司生产)后,涂布于含有50μg/ml卡那霉素的LB寒天培养基,于30℃下培养过夜。
根据分子克隆第3版所述的方法从生长繁殖的转化体茵落提取质粒,通过限制酶处理解析其构造,确认取得了具有序列号116表示的碱基序列的来自大肠杆菌的ppk基因表达质粒pPK-Ecl。
根据Invitrogen公司的程序将以类球红细菌ATCC17023、橙色绿屈挠菌ATCC29366、Mesorhizobiumloti MAFF303099、天蓝色链霉菌ATCC BAA-471、恶臭假单胞菌 KT2440和苜蓿中华根瘤菌ATCC51124的染色体DNA作为模板扩增的DNA片段分别与pCR-Blunt载体(Invitrogen公司生产)连接。
用该重组DNA转化大肠杆菌TOP10后,涂布于含有50μg/ml卡那霉素的LB寒天培养基,于30℃下培养过夜。
根据分子克隆第3版所述的方法从生长繁殖的转化体茵落提取质粒,带有来自类球红细菌ATCC17023的DNA的质粒和带有来自橙色绿屈挠菌ATCC29366的DNA的质粒用NdeI和SalI、带有来自Mesorhizobiumloti MAFF303099的DNA的质粒和带有来自恶臭假单胞菌KT2440的DNA的质粒用NdeI和HindIII、带有来自天蓝色链霉菌ATCC BAA-471的DNA的质粒分别用NcoI和SalI、带有来自苜蓿中华根瘤茵ATCC51124的DNA的质粒(使用含有由序列号112和113表示的碱基序列构成的引物DNA扩增的DNA的质粒)用NdeI和SalI、而对于含有使用由序列号114和115表示的碱基序列构成的引物DNA扩增的DNA的质粒用NdeI和BamHI分别消化后,通过琼脂糖凝胶电泳分离各DNA片段,使用geneclean试剂盒进行回收,溶解于TE。
使用连接试剂盒将得到的DNA片段与用于制备各个DNA片段使用的上述限制酶消化的pET-27b(+)载体(Novagen公司生产)于16℃下连接1小时。
使用得到的各个重组DNA转化大肠杆菌TOP10后,涂布于含有50μg/ml卡那霉素的LB寒天培养基,于30℃下培养过夜。
根据分子克隆第3版所述的方法从生长繁殖的转化体菌落提取质粒,通过限制酶处理解析其构造,确认取得了目的ppk基因表达质粒。将具有序列号117表示的碱基序列的来自类球红细菌的ppk基因的表达质粒命名为pPK-Rs-21、将具有序列号118表示的碱基序列的来自橙色绿屈挠菌ATCC29366的ppk基因的表达质粒命名为pPK-Ca-2、将具有序列号119表示的碱基序列的来自Mesorhizobiumloti MAFF303099的ppk基因的表达质粒命名为pPK-M12-1、将具有序列号120表示的碱基序列的来自天蓝色链霉菌ATCC BAA-471的ppk基因的表达质粒命名为pPK-Sc2、将具有序列号121表示的碱基序列的来自恶臭假单胞菌KT2440的ppk基因的表达质粒命名为pPK-Pp2-2、将具有序列号122表示的碱基序列的来自苜蓿中华根瘤茵ATCC51124的ppk基因的表达质粒命名为pPK-Sm2-1、将具有序列号123表示的碱基序列的来自苜蓿中华根瘤菌ATCC51124的ppk基因的表达质粒命名为pPK-Sm2-2。由序列号116~123表示的碱基序列构成的DNA编码的多磷酸激酶的氨基酸序列分别如序列号124~131所示。
(4)多磷酸激酶生产株的制作
使用上述(3)中取得的各表达质粒转化大肠杆菌BL21-Gold(DE3)(Stratagene公司生产)后,涂布于含有50μg/ml卡那霉素的LB琼脂培养基,于30℃下培养过夜。
根据众所周知的方法从生长繁殖的转化体菌落提取质粒,确认上述(3)中取得的保持各表达质粒的大肠杆菌BL21-Gold(DE3),分别命名为大肠杆菌BL21-Gold(DE3)/pPK-Ec1、大肠杆菌BL21-Gold(DE3)/pPK-Rs-21、大肠杆菌BL21-Gold(DE3)/pPK-Ca-2、大肠杆菌BL21-Gold(DE3)/pPK-M12-1、大肠杆菌BL21-Gold(DE3)/pPK-Sc2、大肠杆菌BL21-Gold(DE3)/pPK-Pp2-2、大肠杆菌BL21-Gold(DE3)/pPK-Sm2-1、大肠杆菌BL21-Gold(DE3)/pPK-Sm2-2。
【实施例3】
多磷酸激酶的生产
将实施例2中取得的生产多磷酸激酶的大肠杆菌转化体使用LB培养基于30℃下进行培养。在0D(660nm)达到3.0~5.0时,按照浓度达到2mmol/L那样添加 IPTG,培养至0D(660nm)达到8.0。将得到的培养物离心分离后得到的茵体按照终浓度达到50g/L那样悬浮于反应液[5mmol/L多磷酸(Sigma公司生产P8510)、5mmol/LAMP、1mmol/LADP、20mmol/L氯化镁、100mmol/L硫酸铵、60mmol/LHEPES-KOH、pH7.2],于37℃下反应1小时。
反应结束后,通过上述的HPLC法对反应液的上清进行分析,在使用任一种茵体的反应中,根据反应液中依赖于多磷酸生成ATP,确认实施例2中取得的转化体无论那一个都生产多磷酸激酶。
【实施例4】
使用细胞作为酶源生产二肽(1)
将在实施例1中取得的表达具有生成序列号1表示的二肽的活性的蛋白质的大肠杆菌DH5α/pQE60ywfE接种在加入了含有50μg/ml氨苄青霉素8mlLB培养基的大型试管,于28℃下培养17小时。将该培养液接种在加入了含有50μg/ml氨苄青霉素的50mlLB培养基的250ml容量的三角烧瓶,于30℃下培养3小时后,按照终浓度达到1mmol/L那样添加IPTG,再于30℃下培养4小时。将该培养液离心分离后取得湿菌体。
将实施例2中取得的生产来自大肠杆菌W3110的多磷酸激酶的大肠杆菌BL21-Gold(DE3)/pPK-Ec1接种在加入了含有50μg/ml卡那霉素的8mlLB培养基的大型试管,于28℃下培养17小时。将该培养液接种在加入了含有50μg/ml卡那霉素的50mlLB培养基的250ml容量的三角烧瓶,于30℃下培养3小时后,按照终浓度达到1mmol/L那样添加异丙基-β-D-硫代半乳糖苷(IPTG),再于30℃下培养4小时后,将该培养液离心分离后取得湿菌体。
将大肠杆菌DH5α/pQE60ywfE的湿茵体和大肠杆菌BL21-Gold(DE3)/pPK-Ec1的湿菌体分别按照浓度达到30g/L和20g/L那样添加到反应液[100mmol/L磷酸缓冲液(pH8.0)、50g/L多磷酸、100mmol/L硫酸镁、5mmol/LATP、各50mmol/L底物氨基酸]中,于37℃下反应1小时。结果如表9所示。
【表9】
| 底物氨基酸 | L-AlaL-Met | L-AlaL-Leu | L-AlaL-Val | L-AlaL-Ile |
| 生成二肽 | L-Ala-L-Met | L-Ala-L-Leu | L-Ala-L-Val | L-Ala-L-Ile |
| 二肽生成量(g/L) | 0.5 | 0.7 | 0.4 | 0.4 |
就象表9表示的那样,可知即使只有5mmol/L的少量的ATP存在,通过二肽合成酶的ATP消耗反应(ADP生成反应)和利用多磷酸激酶的ATP再生反应(以ADP作为底物的反应)的偶联反应,可以更有效地生产二肽。
【实施例5】
使用细胞作为酶源生产二肽(2)
将实施例3中取得的生产来自类球红细菌ATCC17023的多磷酸激酶的大肠杆菌BL21-Gold(DE3)/pPK-Rs2-1接种在加入了含有50μg/ml卡那霉素的8mlLB培养基的大型试管,于28℃下培养17小时。将该培养液接种在加入了含有50μg/ml卡那霉素的50mlLB培养基的250ml容量的三角烧瓶中,于30℃下培养3小时后,按照终浓度达到1mmol/L那样添加IPTG,再于30℃下培养4小时后,将该培养液离心分离,取得湿茵体。
将实施例4中制备的大肠杆菌DH5α/pQE60ywfE的湿菌体和大肠杆菌BL21-Gold(DE3)/pPK-Rs2-1的湿菌体分别按照浓度达到30g/L和20g/l那样添加到实施例4所述的反应液中,于37℃下反应1小时。结果如表10所示。
【表10】
| 底物氨基酸 | L-AlaL-Met | L-AlaL-Leu | L-AlaL-Val | L-AlaL-IIe | GlvL-Met |
| 生成二肽 | L-Ala-L-Met | L-Ala-L-Leu | L-Ala-L-Val | L-Ala-L-IIe | Gly-L-Met |
| 二肽生成量(g/L) | 3.0 | 3.2 | 1.1 | 1.2 | 0.2 |
就象表10表示的那样,可知通过使用来自类球红细菌的多磷酸激酶,可以更有效生产二肽。
【实施例6]
使用细胞作为酶源生产二肽(3)
使用与实验例4同样的方法,制备大肠杆菌BL21-Gold(DE3)/pPK-Ec1的湿菌体。将该湿菌体按照最终达到20g/L那样加到含有50g/L的多磷酸和100mmol/L的硫酸镁的100mmol/L的磷酸缓冲液(pH8.0)中,于45℃下加热处理1小时。将该溶液冷却到37℃后,按照终浓度分别达到30g/L、5mmol/L和各200mmol/L那样添加实施例4中制备的大肠杆菌DH5α/pQE60ywfE的湿菌体、ATP和底物氨基酸,于37℃下进行2小时反应。而作为对照使用没有进行加热处理的BL21-Gold(DE3)/pPK-Ec1的湿茵体,与上述同样进行二肽生成反应。结果如表11所示。
[表11】
| 底物氨基酸 | L-AlaL-Met | L-AlaL-Leu | L-AlaL-Val | L-AlaL-Ile | |
| 生成二肽 | L-Ala-L-Met | L-Ala-L-Leu | L-Ala-L-Val | L-Ala-L-Ile | |
| 二肽生成量(g/L) | 没有加热处理 | 0.5 | 0.4 | 0.3 | 0.5 |
| 进行加热处理 | 1.5 | 1.3 | 0.7 | 0.8 | |
就象表11表示的那样,可知当使用进行了加热处理的细胞时,与使用没有进行加热处理的细胞时相比,二肽生成量显著提高。
【实施例7】
使用细胞作为酶源生产二肽(4)
将实施例4中制备的大肠杆菌DH5α/pQE60ywfE的湿茵体和实施例5中制备的大肠杆菌BL21-Gold(DE3)/pPK-Rs-21的湿菌体按照最终分别达到30g/L和20g/L那样加到含有50g/L的多磷酸和100mmol/L的硫酸镁的100mmol/L的磷酸缓冲液(pH8.0)中,于45℃下加热处理1小时。将该溶液冷却到37℃后,按照终浓度分别达到5mmol/L和各200mmol/L那样添加ATP和底物氨基酸后,于37℃下反应2小时。作为对照使用没有进行加热处理的湿菌体作为酶源,与上述同样进行二肽生成反应。结果如表12所示。
【表12】
| 底物氨基酸 | L-AlaL-Met | L-AlaL-Leu | |
| 生成二肽 | L-Ala-L-Met | L-Ala-L-Leu | |
| 二肽生成量(g/L) | 没有加热处理 | 2.8 | 3.8 |
| 进行加热处理 | 4.5 | 4.2 | |
就象表12表示的那样,可知当使用进行了加热处理的湿菌体时,与使用没有进行加热处理的该湿菌体时相比,二肽生成量显著提高。
【实施例8】
使用耐热二肽合成酶生产二肽
使用与实验例4同样的方法,制备生产实施例1中取得的耐热的突变型二肽合成酶的大肠杆菌DH5α/pBTS2湿菌体。将该湿菌体和实施例5中制备的大肠杆菌BL21-Gold(DE3)/pPK-Rs-21的湿菌体按照最终分别达到30g/L和20g/L那样加到含有50g/L的多磷酸和100mmol/L的硫酸镁的100mmol/L的磷酸缓冲液(pH8.0)中,于52℃下进行30分钟加热处理。将该溶液冷却到37℃后,按照终浓度分别达到5mmol/L和各200mmol/L那样添加ATP和底物氨基酸后进行反应。反应中适当添加2mol/L氢氧化钠,将pH调到7.5~8.0。结果如表13所示。
【表13】
| 底物氨基酸 | 生成二肽 | 二肽生成量(g/L) | 反应时间(小时) |
| L-Ala、L-Met | L-Ala-L-Met | 28.6 | 27 |
| L-Ala、L-Phe | L-Ala-L-Phe | 8.1 | 27 |
| L-Ala、L-Leu | L-Ala-L-Leu | 16.0 | 27 |
| L-Ala、L-Val | L-Ala-L-Val | 15.8 | 27 |
| L-Ala、L-Ile | L-Ala-L-Ile | 13.2 | 27 |
| L-Thr、L-Met | L-Thr-L-Met | 8.7 | 19 |
| L-Thr、L-Phe | L-Thr-L-Phe | 8.5 | 24 |
| Glv、L-Met | Glv-L-Met | 13.2 | 27 |
| Glv、L-Phe | Glv-L-Phe | 10.6 | 24 |
就象表13表示的那样,可知通过使用进行了加热处理的耐热的生产突变型二肽合成酶的细胞作为酶源,可以更显著提高二肽生成量。
【产业上利用的可能性】
通过本发明可以有效地制造各种二肽和二肽衍生物。
【序列表Free Text】
序列号9-人工序列的说明:突变蛋白质
序列号10-人工序列的说明:突变蛋白质
序列号11-人工序列的说明:突变蛋白质
序列号12-人工序列的说明:突变蛋白质
序列号13-人工序列的说明:突变蛋白质
序列号22-人工序列的说明:突变蛋白质
序列号23-人工序列的说明:突变蛋白质
序列号24-人工序列的说明:突变蛋白质
序列号25-人工序列的说明:突变蛋白质
序列号26-人工序列的说明:突变蛋白质
序列号29-人工序列的说明:合成DNA
序列号30-人工序列的说明:合成DNA
序列号31-人工序列的说明:合成DNA
序列号32-人工序列的说明:合成DNA
序列号33-人工序列的说明:合成DNA
序列号34-人工序列的说明:合成DNA
序列号35-人工序列的说明:合成DNA
序列号36-人工序列的说明:合成DNA
序列号37-人工序列的说明:合成DNA
序列号38-人工序列的说明:合成DNA
序列号39-人工序列的说明:合成DNA
序列号40-人工序列的说明:合成DNA
序列号41-人工序列的说明:合成DNA
序列号42-人工序列的说明:合成DNA
序列号43-人工序列的说明:数据库检索中使用的氨基酸序列
序列号44-人工序列的说明:数据库检索中使用的氨基酸序列
序列号45-人工序列的说明:数据库检索中使用的氨基酸序列
序列号51-人工序列的说明:合成DNA
序列号52-人工序列的说明:合成DNA
序列号64-人工序列的说明:合成DNA
序列号74-人工序列的说明:合成DNA
序列号75-人工序列的说明:合成DNA
序列号76-人工序列的说明:合成DNA
序列号77-人工序列的说明:合成DNA
序列号78-人工序列的说明:合成DNA
序列号79-人工序列的说明:合成DNA
序列号80-人工序列的说明:合成DNA
序列号81-人工序列的说明:合成DNA
序列号82-人工序列的说明:合成DNA
序列号83-人工序列的说明:合成DNA
序列号84-人工序列的说明:合成DNA
序列号85-人工序列的说明:合成DNA
序列号86-人工序列的说明:合成DNA
序列号87-人工序列的说明:合成DNA
序列号88-人工序列的说明:合成DNA
序列号89-人工序列的说明:合成DNA
序列号90-人工序列的说明:合成DNA
序列号91-人工序列的说明:合成DNA
序列号92-人工序列的说明:合成DNA
序列号93-人工序列的说明:合成DNA
序列号94-人工序列的说明:合成DNA
序列号95-人工序列的说明:合成DNA
序列号96-人工序列的说明:合成DNA
序列号97-人工序列的说明:合成DNA
序列号98-人工序列的说明:合成DNA
序列号99-人工序列的说明:合成DNA
序列号100-人工序列的说明:合成DNA
序列号101-人工序列的说明:合成DNA
序列号102-人工序列的说明:合成DNA
序列号103-人工序列的说明:合成DNA
序列号104-人工序列的说明:合成DNA
列号105-人工序列的说明:合成DNA
序列号106-人工序列的说明:合成DNA
序列号107-人工序列的说明:合成DNA
序列号108-人工序列的说明:合成DNA
序列号109-人工序列的说明:合成DNA
序列号110-人工序列的说明:合成DNA
序列号111-人工序列的说明:合成DNA
序列号112-人工序列的说明:合成DNA
序列号113-人工序列的说明:合成DNA
序列号114-人工序列的说明:合成DNA
序列号115-人工序列的说明:合成DNA
序列表
<110>协和发酵工业株式会社
<120>二肽或二肽衍生物的制造方法
<130>1000P11697WO0
<150>JP2004-189007
<151>2004-06-25
<160>131
<170>PatentIn Ver.2.1
<210>1
<211>472
<212>PRT
<213>枯草芽孢杆菌168(Bacillus subtilis 168)
<400>1
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>2
<211>472
<212>PRT
<213>枯草芽孢杆菌ATCC6633
<400>2
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>3
<211>472
<212>PRT
<213>枯草芽孢杆菌IAM1213
<400>3
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Leu Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>4
<211>472
<212>PRT
<213>枯草芽孢杆菌IAM1107
<400>4
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Val Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Val Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Phe
405 410 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>5
<211>472
<212>PRT
<213>枯草芽孢杆菌IAM1214
<400>5
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Tle Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>6
<211>472
<212>PRT
<213>枯草芽孢杆菌ATCC21555
<400>6
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
85 90 95
Asp Met Phe Gly Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Lys Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
130 135 140
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
180 185 190
Glu Met Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ala His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Tyr Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
355 360 365
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Glu Asn Gly Gln Leu Pro Glu Thr Val Val Asp Phe Val Ile Glu
385 390 395 400
Ser Ile Glu Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Leu Val
405 410 415
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Asn Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Ala Leu Ser Val
465 470
<210>7
<211>472
<212>PRT
<213>解淀粉芽孢杆菌IF03022(Bacillus amyloliquefaciens IF03022)
<400>7
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
85 90 95
Gly Met Phe Ala Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
130 135 140
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Arg Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
180 185 190
Glu Arg Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
355 360 365
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Glu Asn Gly Gln Leu Pro Glu Thr Ala Val Asp Phe Val Ile Glu
385 390 395 400
Ser Ile Asp Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gly Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Ala Leu Pro Val
465 470
<210>8
<211>476
<212>PRT
<213>短小芽孢杆菌NRRL B-12025(Bacillus pumilus NRRL B-12025)
<400>8
Val Leu Ser Leu Ser Lys Lys Thr Val Leu Val Ile Ala Asp Leu Gly
1 5 10 15
Gly Cys Pro Pro His Met Phe Tyr Glu Ser Val Ala Ala Ser Tyr His
20 25 30
Ile Val Ser Tyr Ile Pro Arg Pro Phe Ala Ile Thr Lys Gly His Ala
35 40 45
Glu Leu Ile Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Arg Asp Tyr
50 55 60
Phe Glu Thr His Pro Ser Phe Glu His Pro Asp Ser Ile Tyr Trp Ala
65 70 75 80
His Asp Asp Tyr Pro Lys Ser Glu Glu Glu Val Val Glu Asp Phe Ile
85 90 95
Arg Val Ala Ser Phe Phe Lys Ala Asp Ala Ile Thr Thr Asn Asn Glu
100 105 110
Leu Phe Ile Ala Pro Met Ala Lys Ala Ala Glu Arg Leu Gly Leu Arg
115 120 125
Gly Ala Gly Val Lys Ala Ala Glu Met Ala Arg Asp Lys Ser Gln Met
130 135 140
Arg Ala Ala Phe Asn Ala Ser Gly Val Lys Ala Val Lys Thr Gln Pro
145 150 155 160
Val Thr Thr Leu Ser Asp Phe Gln Gln Ala Ile Glu Ser Ile Gly Thr
165 170 175
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
180 185 190
Leu Phe His Asp Lys Ala Gly Ser Asp Asp Leu Phe Leu Gln Val Gln
195 200 205
Ser Tyr Leu Glu Thr Ile Pro Val Pro Asp Ala Val Thr Tyr Glu Ala
210 215 220
Pro Phe Val Ala Glu Thr Tyr Leu Glu Gly Ala Tyr Glu Asp Trp Tyr
225 230 235 240
Glu Asp Glu Gly Tyr Ala Asp Tyr Val Ser Val Glu Gly Leu Val Val
245 250 255
Glu Gly Glu Tyr Leu Pro Phe Val Ile His Asp Lys Thr Pro Gln Ile
260 265 270
Gly Phe Thr Glu Thr Ala His Ile Thr Pro Thr Ile Leu Asp Asn Glu
275 280 285
Ala Lys Gln Ile Ile Ile Glu Ala Ala Arg Lys Ala Asn Glu Gly Leu
290 295 300
Gly Leu Glu His Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn
305 310 315 320
Arg Glu Thr Gly Leu Ile Glu Ala Ala Ala Arg Phe Ala Gly Trp Asn
325 330 335
Met Ile Pro Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Lys Leu
340 345 350
Leu Ile Asp Val Leu Val Asp Gly Lys Lys Ala Val Leu Pro Lys Gln
355 360 365
Leu Leu Ser Gly His Thr Phe Tyr Val Ala Asp Cys His Leu Tyr Pro
370 375 380
Gln His Phe Lys Glu Ser Gly Leu Ile Pro Pro Glu Ala Thr His Tle
385 390 395 400
Thr Ile Asp His Val Ser Ile Pro Gln Glu Ala Phe Val Gly Asp Thr
405 410 415
Ala Ile Val Ser Gln Ser Phe Pro Ala Lys Gly Thr Ile Val Asp Leu
420 425 430
Glu Leu Phe Glu Ala Phe Asn Gly Ile Val Ser Leu Glu Leu Lys Gly
435 440 445
Ser Ser Ser Gln Asp Val Ala Ala Ser Ile Arg Asn Ile Gln Lys Gln
450 455 460
Ala Thr Ile Gln Leu Met Asp Glu Leu Val Lys Gly
465 470 475
<210>9
<211>472
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:Mutant PRT
<400>9
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Pro Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Val Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Val Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys Arg Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>10
<211>472
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:Mutant PRT
<400>l0
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Pro Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Tle Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Val Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys Arg Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Val Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>11
<211>472
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:Mutant PRT
<400>11
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Pro Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Val Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys Arg Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Pro Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>12
<211>472
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:Mutant PRT
<400>12
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Pro Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Ala Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro LysAl a ValTh r Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Val Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys Arg Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>13
<211>472
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:Mutant PRT
<400>13
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Pro Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Ala Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Val Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys Arg Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Ile Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>14
<211>1416
<212>DNA
<213>枯草芽孢杆菌168
<400>14
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
aaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gaa cac cct gat tcc att tat tgg gcg cat gaa gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tct atc ggt gta acg ctg att acg 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac ucc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt gga ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gca gcc aga ttt gcc ggc tgg aat atg atc ccc 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtc ctc tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc caa att cct gaa act gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tct ttt tcg gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>15
<211>1416
<212>DNA
<213>枯草芽孢杆菌ATCC6633
<400>15
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtt agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att ccg aga cct ttt gca ata aca gcc tcc cat gca gca ctg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt cag agc 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
50 55 60
tta gct gat ttt gag cat ccc gat tca att tat tgg gcg cat gag gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat gac aag cct gaa gaa gag gtt gtc gag caa atc gtc aag gtt gcc 288
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
caa atg ttt gag gcg gac gcc atc aca aca aac aat gaa tta ttc att 336
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gcc ccg atg gcg aaa gcc tgt gaa cgc ctt ggc ctg agg ggc gcc gga 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcg gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcg gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gag gat ttt cgt gct gca ctt gaa gag atc ggc aca cct cta atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tca atc ggc gta acg ctg att acc 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac acg gag acg gca gaa gat gaa ttt aac aga gtc aat gac tac ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tcg att aac gtg ccg aag gcg gtc aca ttt gaa gca ccg ttt att 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gag gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agc ata gaa ggc att atg gca gat ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttt ccg atc gcc att cat gac aaa acg ccg caa att gga ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tca cat att acg cca tcc att ctg gat gaa gag gcg aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gcg gct aaa aag gca aat gaa ggg ctt gga ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gaa atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gct gcc aga ttc gca ggc tgg aat atg att cct 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtt ctc tgt ttc gga aaa gat gct gat ctg ccg gac ggg tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tac tat gtt gct gac tgc cat ctg tac cct cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc cag atc cct gaa act gcc gag gat ttg gta atc gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gat ggg ctt ttg aag ggt gat aca gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
act ttt tcg gct gcg gca cca gga aca tca gtt gat ttg aca ctg ttt 1296
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gcc ttc aac tcc att gct gca ttt gaa ctg aaa ggc agc aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>16
<211>1416
<212>DNA
<213>枯草芽孢杆菌IAM1213
<400>16
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc get gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gag cat cct gac tcc att tat tgg gcg cat gag gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ctg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctc gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tca atc ggt gta acg ctg att acg 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggt ctt ggc ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aat aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta att gaa tcg gca gcc aga ttc gcc ggc tgg aat atg atc ccc 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Tle Pro
325 330 335
aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtc ctt tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg caa cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc cag att cca gaa act gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg ate gat ctg cct gac ggg ctt tta aaa ggg gat act gag atc gtt 1248
Ala Ile Asp Leu Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tct ttt tcg gcc gca gca cca gga act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>17
<211>1416
<212>DNA
<213>枯草芽孢杆菌IAM1107
<400>17
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc gta aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Val Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gag cat cct gac tcc att tat tgg gcg cat gag gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttc ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tct atc ggt gta acg ctg att acg 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt ggc ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag gtc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Val Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta att gaa tcg gca gcc aga ttt gcc ggc tgg aat atg atc cct 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtc ctc tgt ttc gga aaa gat gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tac tat gtc gcc gac tgc cat ttg tac ccg cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc cag att cca gaa acc gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc ttt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Phe
405 410 415
tct ttt tcg gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>18
<211>1416
<212>DNA
<213>枯草芽孢杆菌IAM1214
<400>18
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtt agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att ccg aga cct ttt gca ata aca gcc tcc cat gca gca ctg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt cag agc 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
50 55 60
tta gct gat ttt gag cat ccc gat tca att tat tgg gcg cat gag gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat gac aag cct gaa gaa gag gtt gtc gag caa atc gtc aag gtt gcc 288
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
caa atg ttt gag gcg gac gcc atc aca aca aac aat gaa tta ttc att 336
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gcc ccg atg gcg aaa gcc tgt gaa cgc ctt ggc ctg agg ggc gcc gga 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcg gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcg gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gag gat ttt cgt gct gca ctt gaa gag atc ggc aca cct cta atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tca atc ggc gta acg ctg att acc 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac acg gag acg gca gaa gat gaa ttt aac aga gtc aat gac tac ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tcg att aac gtg ccg aag gcg gtc aca ttt gaa gca ccg ttt att 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gag gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agc ata gaa ggc att atg gca gat ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttt ccg atc gcc att cat gac aaa acg ccg caa att gga ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tca cat att acg cca tcc att ctg gat gaa gag gcg aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gcg gct aaa aag gca aat gaa ggg ctt gga ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gaa atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gct gcc aga ttc gca ggc tgg aat atg att cct 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtt ctc tgt ttc gga aaa gat gct gat ctg ccg gac ggg tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tac tat gtt gct gac tgc cat ctg tac cct cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc cag atc cct gaa act gcc gag gat ttg gta atc gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gat ggg ctt ttg aag ggt gat aca gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
act ttt tcg gct gcg gca cca gga aca rca gtt gat ttg aca ctg ttt 1296
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gcc ttc aac tcc att get gca ttt gaa ctg aaa ggc agc aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>19
<211>1416
<212>DNA
<213>枯草芽孢杆菌ATCC21555
<400>19
atg gag aga aaa aca gta ttg gtt atc gct gat ctt ggg ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cat atg ttt tac aaa agc gca gcc gaa aaa tac aac ctc gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att ccg aga ccc ttt gca att aca gcc tct cat gcg gcc tta att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg att gcg gtc att aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
ctg gct gat ttt gaa cat ccc gat tcg att tat tgg gct cat gaa gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat gac aaa cct gag gaa gaa gtc gtc gaa gaa atc gtg aaa gtg gcc 288
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
85 90 95
gac atg ttt ggg gtt gac gcc att acg acc aac aat gaa ctg ttt atc 336
Asp Met Phe Gly Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gca aaa gcg tgt aaa cgt ctc ggc ctg cgg gga gcg ggc 384
Ala Pro Met Ala Lys Ala Cys Lys Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gta cag gcc gct gaa aac gcc aga gat aaa aat aaa atg aga gcc gcc 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
130 135 140
ttc aac cgg gcc ggc gtc aaa tcc atc aaa aac aaa cgg gtg acg acc 480
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctg gaa gat ttc cgc gcc gcg ctt cag gaa atc gga acg ccg ctt att 528
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
165 170 175
ctg aag cct aca tat ctg gca agc tcg atc ggc gtg acg ctt att aaa 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
180 185 190
gag atg gaa acg gcc gaa gct gaa ttc aac aga gtc aat gag tac ttg 624
Glu Met Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
195 200 205
aaa tcg att aat gta ccg aaa gcg gtg acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gcg gaa gaa ttc ttg cag ggc gag tat gat gac tgg tac gaa aca agc 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225 230 235 240
ggt tat tcc gac tat atc agc atc gaa ggc atc atg gcc gac gga gaa 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tac ttc ccc gtt gcg atc cat gat aaa aca ccg caa atc gga ttc acg 816
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca gcg cat att acg ccg tcc atc ctg gat gat gac gcc aag cgg 864
Glu Thr Ala His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
275 280 285
aaa atc gtc gaa gct gcc aag aag gcg aat gaa gga ctc ggc ctc gaa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
290 295 300
aac tgt gca acg cat aca gaa ata aaa tta atg aaa aac cgg gaa gcc 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305 310 315 320
gga ctg att gag tca gcg gcc aga ttc gcg gga tgg aat atg att ccg 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttc ggc gtt gat atg gcg cag cta tta ttg gat 1056
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtt ctc tgt tac gga aaa gaa gct gat ctg ccg aaa gga tta ttg gag 1104
Val Leu Cys Tyr Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
355 360 365
cag gag cca tgc tat gtc gca gac tgc cac ttg tat cct cag cat ttc 1152
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa gag aac ggc cag ctg cct gag acg gtt gtc gat ttc gtc att gaa 1200
Lys Glu Asn Gly Gln Leu Pro Glu Thr Val Val Asp Phe Val Ile Glu
385 390 395 400
agc att gaa att cct gac ggc gtc tta aag gga gac act gaa ctc gtt 1248
Ser Ile Glu Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Leu Val
405 410 415
tct ttc tca gcg gct gag gcg ggt acg tca gtg gat ctg cgg ctg ttc 1296
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
420 425 430
gaa gcg ttc aac agc att gcg gcg ttt gag ctg aaa gga agc aat tcg 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
aac gac gtg gcc gaa tca atc aaa caa att cag cag cag gcg aag ctg 1392
Asn Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
450 455 460
act gca aag tat gcg tta tcg gta 1416
Thr Ala Lys Tyr Ala Leu Ser Val
<210>20
<211>1416
<212>DNA
<213>解淀粉芽孢杆菌IF03022
<400>20
atg gag aga aaa aca gta ttg gtt atc gct gac ctt ggg gga tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cat atg ttt tac aaa agc gca gcc gaa aaa tac aac ctc gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att ccg aga cct ttt gca att aca gcc tct cat gcg gca tta att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
ctg gct gaL ttt gag cat ccc gat tcg att tac tgg gct cat gaa gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat gac aaa cct gag gaa gaa gta gtc gaa gaa atc gtc aag gtg gcc 288
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
85 90 95
ggc atg ttc gcg gtt gac gcc att acg acc aac aat gaa ctg ttt atc 336
Gly Met Phe Ala Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gca aaa gcg tgt gaa cgt ctc ggc ctg cgg gga gcg ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gta cag gcc gct gaa aat gcc aga gat aaa aac aaa atg aga gcc gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
130 135 140
ttc aac cgg gcc ggc gtc aag tct atc aaa aac aga cgg gtg acg acg 480
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Arg Arg Val Thr Thr
145 150 155 160
ctg gaa gat ttc cgc gcc gcg ctt cag gaa atc gga acg ccg ctc att 528
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
165 170 175
ctg aag cct aca tat ctg gcg agc tcc atc ggc gtg acg ctc atc aaa 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
180 185 190
gag agg gaa acg gcc gaa gcc gaa ttt aac aga gtc aat gaa tac ctg 624
Glu Arg Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
195 200 205
aag tcg atc aac gta ccg aaa gcg gtc acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gcg gaa gaa ttt ttg cag ggc gag tat gac gac tgg tac gaa aca agc 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225 230 235 240
ggt tat tcc gac tat atc agc ata gaa ggc atc atg gcc gac gga gaa 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tac ttc cct gtc gca att cat gat aaa aca ccg caa atc gga ttc acg 816
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcg cat att acg ccg tcc atc ctg gat gat gac gcg aag cgg 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
275 280 285
aaa atc gtc gaa gca gcc aaa aag gcg aat gaa gga ctc ggc ctc gaa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
290 295 300
aac tgc gca acc cat aca gag att aaa tta atg aaa aac cgg gaa gcc 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305 310 315 320
gga ctg att gaa tca gcg gca cga ttt gcg ggc tgg aac atg att ccg 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttc ggc gtc gat atg gcg cag ctg tta ttg gat 1056
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtt ctc tgt ttc gga aaa gaa gcc gat ctg ccg aaa gga tta ttg gag 1104
Val Leu Cys Phe Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
355 360 365
cag gag ccg tgc tat gtc gcc gac tgc cac ttg tat cct cag cat ttc 1152
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa gag aac ggc cag ctg cct gag acg gct gtc gat ttc gtc att gaa 1200
Lys Glu Asn Gly Gln Leu Pro Glu Thr Ala Val Asp Phe Val Ile Glu
385 390 395 400
agc att gac att ccc gac ggc gtc tta aag gga gac acc gaa atc gtt 1248
Ser Ile Asp Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tct ttc tcg gcg gcc gag gcg ggt aca tcc gtg gat ctg cgg ctg ttc 1296
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
420 425 430
gaa gcg ttc aac agc att gcg gcg ttc gag ctg aaa gga agc aat tcg 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
ggt gac gtg gcc gaa tca atc aaa caa att cag cag cag gcg aag ctg 1392
Gly Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
450 455 460
act gca aag tat gcg tta ccg gta 1416
Thr Ala Lys Tyr Ala Leu Pro Val
<210>21
<211>1428
<212>DNA
<213>短小芽孢杆菌NRRL B-12025
<400>21
gtg ctt tca ttg agt aaa aaa act gta ctt gtc att gct gac tta gga 48
Val Leu Ser Leu Ser Lys Lys Thr Val Leu Val Ile Ala Asp Leu Gly
1 5 10 15
ggg tgc ccg ccc cat atg ttt tat gaa agc gtg gcg gca tca tac cat 96
Gly Cys Pro Pro His Met Phe Tyr Glu Ser Val Ala Ala Ser Tyr His
20 25 30
atc gtt tct tat atc cca aga ccc ttt gcg att aca aag gga cat gcc 144
Ile Val Ser Tyr Ile Pro Arg Pro Phe Ala Ile Thr Lys Gly His Ala
35 40 45
gag cta atc gaa aaa tac tcc att gcc gtc atc aaa gac cgt gat tat 192
Glu Leu Ile Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Arg Asp Tyr
50 55 60
ttt gag aca cac cct tct ttt gaa cac cct gat tct att tac tgg gca 240
Phe Glu Thr His Pro Ser Phe Glu His Pro Asp Ser Ile Tyr Trp Ala
65 70 75 80
cat gat gat tat cca aaa tca gaa gaa gaa gtt gtg gaa gac ttc att 288
His Asp Asp Tyr Pro Lys Ser Glu Glu Glu Val Val Glu Asp Phe Ile
85 90 95
cga gta gct tcc ttt ttc aaa gca gat gca atc acg acc aat aat gaa 336
Arg Val Ala Ser Phe Phe Lys Ala Asp Ala Ile Thr Thr Asn Asn Glu
100 105 110
tta ttc att gca ccg atg gca aag gcc gct gaa cgt ctt ggg cta cga 384
Leu Phe Ile Ala Pro Met Ala Lys Ala Ala Glu Arg Leu Gly Leu Arg
115 120 125
ggt gcc ggt gtc aag gca gcc gaa atg gcg cgt gat aaa agc caa atg 432
Gly Ala Gly Val Lys Ala Ala Glu Met Ala Arg Asp Lys Ser Gln Met
130 135 140
agg gct gca ttc aat gcc tct ggc gtc aaa gcg gtg aaa act cag cct 480
Arg Ala Ala Phe Asn Ala Ser Gly Val Lys Ala Val Lys Thr Gln Pro
145 150 155 160
gtc acg act tta tct gat ttc caa caa gcc att gag tct atc gga aca 528
Val Thr Thr Leu Ser Asp Phe Gln Gln Ala Ile Glu Ser Ile Gly Thr
165 170 175
ccg ctc att tta aag cct aca tat tta gcc agt tct att ggc gtc acc 576
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
180 185 190
ttg ttt cat gac aaa gcc gga agt gat gac ttg ttt tta caa gta caa 624
Leu Phe His Asp Lys Ala Gly Ser Asp Asp Leu Phe Leu Gln Val Gln
195 200 205
tcg tat ttg gaa acc ata cca gtc cca gac gct gtc acg tat gaa gca 672
Ser Tyr Leu Glu Thr Ile Pro Val Pro Asp Ala Val Thr Tyr Glu Ala
210 215 220
ccg ttt gtc gct gaa aca tat tta gag ggt gct tac gaa gat tgg tat 720
Pro Phe Val Ala Glu Thr Tyr Leu Glu Gly Ala Tyr Glu Asp Trp Tyr
225 230 235 240
gaa gac gaa gga tat gct gat tat gtc agt gta gaa ggg ctg gtc gta 768
Glu Asp Glu Gly Tyr Ala Asp Tyr Val Ser Val Glu Gly Leu Val Val
245 250 255
gag ggc gaa tat ctc cct ttt gtc ata cat gat aaa acc cct caa atc 816
Glu Gly Glu Tyr Leu Pro Phe Val Ile His Asp Lys Thr Pro Gln Ile
260 265 270
ggc ttt aca gaa acg gct cat atc act ccg acg atc tta gac aat gaa 864
Gly Phe Thr Glu Thr Ala His Ile Thr Pro Thr Ile Leu Asp Asn Glu
275 280 285
gcc aag caa atc atc att gaa gca gca agg aag gca aat gaa ggg cta 912
Ala Lys Gln Ile Ile Ile Glu Ala Ala Arg Lys Ala Asn Glu Gly Leu
290 295 300
ggt ctt gaa cat tgt gca acc cat aca gaa atc aaa ctc atg aaa aat 960
Gly Leu Glu His Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn
305 310 315 320
cga gaa act gga ctg atc gag gca gcg gct cga ttc gct ggc tgg aat 1008
Arg Glu Thr Gly Leu Ile Glu Ala Ala Ala Arg Phe Ala Gly Trp Asn
325 330 335
atg atc ccg aat att aaa aaa gtc ttt ggc gtc gat atg gcg aag cta 1056
Met Ile Pro Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Lys Leu
340 345 350
ttg att gat gta tta gtt gat ggt aaa aag gct gta ctg cca aaa cag 1104
Leu Ile Asp Val Leu Val Asp Gly Lys Lys Ala Val Leu Pro Lys Gln
355 360 365
ctg ctt tct gga cat aca ttt tat gta gcg gac tgc cac ctg tac cct 1152
Leu Leu Ser Gly His Thr Phe Tyr Val Ala Asp Cys His Leu Tyr Pro
370 375 380
cag cat ttt aaa gag agt ggg ctt atc ccg cct gaa gcc aca cat att 1200
Gln His Phe Lys Glu Ser Gly Leu Ile Pro Pro Glu Ala Thr His Ile
385 390 395 400
acc att gat cat gtg tct att ccg cag gaa gca ttc gtt gga gat act 1248
Thr Ile Asp His Val Ser Ile Pro Gln Glu Ala Phe Val Gly Asp Thr
405 410 415
gcg att gtc agt caa tca ttc cct gcc aaa ggg act att gtg gat ctt 1296
Ala Ile Val Ser Gln Ser Phe Pro Ala Lys Gly Thr Ile Val Asp Leu
420 425 430
gaa tta ttt gaa gct ttt aat gga atc gta tct ctt gaa tta aaa gga 1344
Glu Leu Phe Glu Ala Phe Asn Gly Ile Val Ser Leu Glu Leu Lys Gly
435 440 445
tca tcc tca caa gat gtt gcc gcg tcc atc cgc aac att cag aaa cag 1392
Ser Ser Ser Gln Asp Val Ala Ala Ser Ile Arg Asn Ile Gln Lys Gln
450 455 460
gca acg att cag tta atg gat gaa tta gtg aag gga 1428
Ala Thr Ile Gln Leu Met Asp Glu Leu Val Lys Gly
465 470 475
<210>22
<211>1416
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:Mutant DNA
<400>22
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gaa cac cct gat ccc att tat tgg gcg cat gaa gat 240
Leu Ala Asp Phe Glu His Pro Asp Pro Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aac gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
115 150 155 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tct atc ggt gta acg ctg att acg 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gta gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Val Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt gga ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gca gcc aga ttt gcc ggc tgg aat atg atc ccc 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttt ggc ctt gat atg gtg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Val Gln Leu Leu Leu Asp
340 345 350
gtc ctc tgc ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tat tat gtt gcc gac tgc cgt ttg tac ccg cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys Arg Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc caa att cct gaa act gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tct ttt tcg gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>23
<211>1416
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:Mutant DNA
<400>23
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cot ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gaa cac cct gat ccc att tat tgg gcg cat gaa gat 240
Leu Ala Asp Phe Glu His Pro Asp Pro Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aac gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tct atc ggt gta acg ctg att acg 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ger Asp Tyr Ile Ser Tle Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt gga ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gca gcc aga ttt gcc ggc tgg aat atg atc ccc 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttt ggc ctt gat atg gtg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Val Gln Leu Leu Leu Asp
340 345 350
gtc ctc tgc ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tat tat gtt gcc gac tgc cgt ttg tac ccg cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys Arg Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc caa att cct gaa act gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tct ttt tcg gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gtt gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Val Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>24
<211>1416
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:Mutant DNA
<400>24
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gaa cac cct gat ccc att tat tgg gcg cat gaa gat 240
Leu Ala Asp Phe Glu His Pro Asp Pro Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aac gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tct atc ggt gta acg ctg att acg 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt gga ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gca gcc aga ttt gcc ggc tgg aat atg atc ccc 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttt ggc ctt gat atg gtg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Val Gln Leu Leu Leu Asp
340 345 350
gtc ctc tgc ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tat tat gtt gcc gac tgc cgt ttg tac ccg cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys Arg Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc caa att cct gaa act gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tct ttt tcg gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat ccc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Pro Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>25
<211>1416
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:Mutant DNA
<400>25
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gaa cac cct gat ccc att tat tgg gcg cat gaa gat 240
Leu Ala Asp Phe Glu His Pro Asp Pro Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Tle Val Lys Val Ala
85 90 95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aac gaa tta tc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct gca tac tta gcg agt tct atc ggt gta acg ctg att acg 576
Leu Lys Pro Ala Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt gga ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gca gcc aga ttt gcc ggc tgg aat atg atc ccc 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttt ggc ctt gat atg gtg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Val Gln Leu Leu Leu Asp
340 345 350
gtc ctc tgc ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tat tat gtt gcc gac tgc cgt ttg tac ccg cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys Arg Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc caa att cct gaa act gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tct ttt tcg gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca alc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>26
<211>1416
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:Mutant DNA
<400>26
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gaa cac cct gat ccc att tat tgg gcg cat gaa gat 240
Leu Ala Asp Phe Glu His Pro Asp Pro Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aac gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct gca tac tta gcg agt tct atc ggt gta acg ctg att acg 576
Leu Lys Pro Ala Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt gga ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gca gcc aga ttt gcc ggc tgg aat atg atc ccc 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttt ggc ctt gat atg gtg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Val Gln Leu Leu Leu Asp
340 345 350
gtc ctc tgc ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tat tat gtt gcc gac tgc cgt ttg tac ccg cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys Arg Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc caa att cct gaa act gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tct ttt tcg gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt att tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Ile Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>27
<211>93
<212>PRT
<213>枯草芽孢杆菌168
<400>27
Gly Ala Gly Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met
1 5 10 15
Arg Asp Ala Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg
20 25 30
Val Thr Thr Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr
35 40 45
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
50 55 60
Leu Ile Thr Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn
65 70 75 80
Asp Tyr Leu Lys Ser Ile Asn Val Pro Lys Ala Val Thr
85 90
<210>28
<211>279
<212>DNA
<213>枯草芽孢杆菌168
<400>28
ggt gcc ggc gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg 48
Gly Ala Gly Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met
1 5 10 15
agg gac gct ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga 96
Arg Asp Ala Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg
20 25 30
gtc aca act ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca 144
Val Thr Thr Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr
35 40 45
cct ctt atc tta aag cct aca tac tta gcg agt tct atc ggt gta acg 192
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
50 55 60
ctg att acg gac act gag acg gca gaa gat gaa ttt aac aga gtc aat 240
Leu Ile Thr Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn
65 70 75 80
gac tat ctg aaa tca att aac gtg cca aag gcg gtt acg 279
Asp Tyr Leu Lys Ser Ile Asn Val Pro Lys Ala Val Thr
85 90
<210>29
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>29
attctcgagt agagaaggag tgttttacat 30
<210>30
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>30
ttaggatcct catactggca gcacatactt 30
<210>31
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>31
caagaattct catgtttgac agct 24
<210>32
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>32
taactcgaga ttcccttttt acgtgaac 28
<210>33
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>33
ttaaccatgg agagaaaaac agtattg 27
<210>34
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>34
atatggatcc tactggcagc acatactttg 30
<210>35
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>35
caccgcagac ggaggataca c 21
<210>36
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>36
cggacgtcac ccaataatcg tg 22
<210>37
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>37
ccgatggcra aagcstgtra acg 23
<210>38
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>38
cggcagatcr gcdtcttttc c 21
<210>39
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>39
gctaggtctt gaacattgtg caaccc 26
<210>40
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>40
ggtgttccga tagactcaat ggc 23
<210>41
<211>44
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>41
catgccatgg agaaaaaaac tgtacttgtc attgctgact tagg 44
<210>42
<211>38
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>42
cgcggatccc ttcactaatt catccattaa ctgaatcg 38
<210>43
<211>12
<212>PRT
<213>人工序列
<220>
<221>UNSURE
<222>(3)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一氨基酸
<220>
<221>UNSURE
<222>(4)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一氨基酸
<220>
<221>UNSURE
<222>(9)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一氨基酸
<220>
<221>UNSURE
<222>(10)
<223>Xaa表示选自Leu,Ile,Val,Met和Ala中的任一氨基酸
<220>
<221>UNSURE
<222>(11)
<223>Xaa表示Glu,Ser或Ala
<220>
<221>UNSURE
<222>(12)
<223>Xaa表示Gly,Ser或Ala
<220>
<223>人工序列的描述:用于数据库检索的氨基酸序列
<400>43
His Gly Xaa Xaa Gly Gln Asp Gly Xaa Xaa Xaa Xaa
5 10
<210>44
<211>28
<212>PRT
<213>人工序列
<220>
<221>UNSURE
<222>(1)
<223>Xaa表示Leu Ile或Val
<220>
<221>UNSURE
<222>(2)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基酸
<220>
<221>UNSURE
<222>(3)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基酸
<220>
<221>UNSURE
<222>(4)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基酸
<220>
<221>UNSURE
<222>(5)
<223>Xaa表示Gly或Ala
<220>
<221>UNSURE
<222>(6)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基酸
<220>
<221>UNSURE
<222>(7)
<223>Xaa表示选自Gly,Ser,Ala,Ile和Val中的任一个氨基酸
<220>
<221>UNSURE
<222>(9)
<223>Xaa表示选自Leu,Ile,Val,Met,Cys和Ala中的任一个氨基酸
<220>
<221>UNSURE
<222>(11)
<223>Xaa表示选自Leu,Ile,Val,Met,Phe和Ala中的任一个氨基酸
<220>
<221>UNSURE
<222>(12)
<223>Xaa表示选自Leu,Ile,Val,Met,Phe和Ala中的任一个氨基酸
<220>
<221>UNSURE
<222>(13)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基酸
<220>
<221>UNSURE
<222>(14)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基酸
<220>
<221>UNSURE
<222>(15)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基酸
<220>
<221>UNSURE
<222>(16)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基酸
<220>
<221>UNSURE
<222>(17)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基酸
<220>
<221>UNSURE
<222>(18)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基酸
<220>
<221>UNSURE
<222>(19)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基酸
<220>
<221>UNSURE
<222>(20)
<223>Xaa表示Leu,Ile或Val
<220>
<221>UNSURE
<222>(21)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基酸
<220>
<221>UNSURE
<222>(23)
<223>Xaa表示选自Leu,Ile,Val,Ala和Pro中的任一个氨基酸
<220>
<221>UNSURE
<222>(25)
<223>Xaa表示Ser,Thr或Pro
<220>
<221>UNSURE
<222>(26)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基酸
<220>
<221>UNSURE
<222>(28)
<223>Xaa表示Gly或Ala
<220>
<223>人工序列的描述:用于数据库检索的氨基酸序列
<400>44
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp Xaa Xaa Xaa Xaa Xaa Xaa
5 10 15
Xaa Xaa Xaa Xaa Xaa Gln Xaa Asn Xaa Xaa Pro Xaa
20 25
<210>45
<211>30
<212>PRT
<213>人工序列
<220>
<221>UNSURE
<222>(1)
<223>Xaa表示Leu Ile或Val
<220>
<221>UNSURE
<222>(2)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(3)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(4)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(5)
<223>Xaa表示Gly或Ala
<220>
<221>UNSURE
<222>(6)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(7)
<223>Xaa表示选自Gly,Ser,Ala,Ile和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(9)
<223>Xaa表示选自Leu,Ile,Val,Met,Cys和Ala中的任一个氨基的
<220>
<221>UNSURE
<222>(11)
<223>Xaa表示选自Leu,Ile,Val,Met,Phe和Ala中的任一个氨基的
<220>
<221>UNSURE
<222>(12)
<223>Xaa表示选自Leu,Ile,Val,Met,Phe和Ala中的任一个氨基的
<220>
<221>UNSURE
<222>(13)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(14)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(15)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(16)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(17)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(18)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(19)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(20)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(21)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(22)
<223>Xaa表示Leu,Ile或Val
<220>
<221>UNSURE
<222>(23)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(25)
<223>Xaa表示选自Leu,Ile,Val,Ala和Pro中的任一个氨基的
<220>
<221>UNSURE
<222>(27)
<223>Xaa表示Ser,Thr或Pro
<220>
<221>UNSURE
<222>(28)
<223>Xaa表示选自Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val中的任一个氨基的
<220>
<221>UNSURE
<222>(30)
<223>Xaa表示Gly或Ala
<220>
<223>人工序列的描述:用于数据库检索的氨基酸序列
<400>45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp Xaa Xaa Xaa Xaa Xaa Xaa
5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gln Xaa Asn Xaa Xaa Pro Xaa
20 25 30
<210>46
<211>1416
<212>DNA
<213>枯草芽孢杆菌ATCC 15245和枯草芽孢杆菌IAM 1033
<400>46
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gag cat cct gat tcc att tat tgg gcg cat gag gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ctg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tca atc ggt gta acg ctg att acg 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt ggc ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gca gcc aga ttc gca ggc tgg aat atg att cct 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtc ctc tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc cag att cca gaa acc gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tca ttt tca gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gca aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>47
<211>239
<212>PRT
<213>Streptomyces noursei IFO15452
<400>47
Met Leu Ala Gly Leu Val Pro Ala Pro Asp His Gly Met Arg Glu Glu
1 5 10 15
Ile Leu Gly Asp Arg Ser Arg Leu Ile Arg Gln Arg Gly Glu His Ala
20 25 30
Leu Ile Gly Ile Ser Ala Gly Asn Ser Tyr Phe Ser Gln Lys Asn Thr
35 40 45
Val Met Leu Leu Gln Trp Ala Gly Gln Arg Phe Glu Arg Thr Asp Val
50 55 60
Val Tyr Val Asp Thr His Ile Asp Glu Met Leu Ile Ala Asp Gly Arg
65 70 75 80
Ser Ala Gln Glu Ala Glu Arg Ser Val Lys Arg Thr Leu Lys Asp Leu
85 90 95
Arg Arg Arg Leu Arg Arg Ser Leu Glu Ser Val Gly Asp His Ala Glu
100 105 110
Arg Phe Arg Val Arg Ser Leu Ser Glu Leu Gln Glu Thr Pro Glu Tyr
115 120 125
Arg Ala Val Arg Glu Arg Thr Asp Arg Ala Phe Glu Glu Asp Ala Glu
130 135 140
Phe Ala Thr Ala Cys Glu Asp Met Val Arg Ala Val Val Met Asn Arg
145 150 155 160
Pro Gly Asp Gly Val Gly Ile Ser Ala Glu His Leu Arg Ala Gly Leu
165 170 175
Asn Tyr Val Leu Ala Glu Ala Pro Leu Phe Ala Asp Ser Pro Gly Val
180 185 190
Phe Ser Val Pro Ser Ser Val Leu Cys Tyr His Ile Asp Thr Pro Ile
195 200 205
Thr Ala Phe Leu Ser Arg Arg Glu Thr Gly Phe Arg Ala Ala Glu Gly
210 215 220
Gln Ala Tyr Val Val Val Arg Pro Gln Glu Leu Ala Asp Ala Ala
225 230 235
<210>48
<211>239
<212>PRT
<213>Streptomyces alborus IFO15452
<400>48
Met Leu Ala Gly Leu Val Pro Ala Leu Asp His Ser Met Arg Glu Glu
1 5 10 15
Ile Leu Gly Asn Arg Gly Arg Lys Ile Arg Gln Arg Gly Glu His Ala
20 25 30
Leu Ile Gly Ile Ser Ala Gly Asn Ser Tyr Phe Ser Gln Lys Asn Val
35 40 45
Thr Met Leu Leu Gln Trp Ala Gly Gln His Phe Glu Arg Thr Asp Val
50 55 60
Val Tyr Val Asp Thr His Ile Asp Asp Met Leu Met Ala Asp Gly Arg
65 70 75 80
Ser Ala Gln Glu Ala Glu Lys Ser Val Lys Arg Thr Leu Lys Asp Leu
85 90 95
Arg Arg Arg Leu Arg Arg Ser Leu Glu Ser Val Gly Asp His Ser Glu
100 105 110
Arg Phe Arg Val Arg Ser Leu Ser Glu Ile Gln Glu Thr Pro Glu Tyr
115 120 125
Arg Ala Ala Arg Glu Ser Thr Asp Arg Ala Phe Arg Glu Asp Gly Glu
130 135 140
Phe Ala Thr Val Cys Glu Glu Met Val Arg Ala Val Val Met Asn Arg
145 150 155 160
Pro Gly Asp Gly Val Asp Ile Ser Glu Glu His Leu Arg Ala Gly Leu
165 170 175
Asn Tyr Val Leu Ala Glu Ala Pro Leu Phe Ala Asp Ser Pro Gly Val
180 185 190
Phe Ser Val Pro Ser Ser Val Leu Cys Tyr His Ile Pro Thr Pro Val
195 200 205
Ser Thr Phe Leu Ala His Arg Glu Thr Gly Phe Gln Ala Ala Gln Gly
210 215 220
Gln Ala Tyr Val Val Val Arg Pro Gln Glu Leu Ala Asp Ala Ala
225 230 235
<210>49
<211>717
<212>DNA
<213>Streptomyces noursei IFO15452
<400>49
atg ctt gca ggc tta gtt ccc gcg ccg gac cac gga atg cgg gaa gaa 48
Met Leu Ala Gly Leu Val Pro Ala Pro Asp His Gly Met Arg Glu Glu
1 5 10 15
ata ctt ggc gac cgc agc cga ttg atc cgg caa cgc ggt gag cac gcc 96
Ile Leu Gly Asp Arg Ser Arg Leu Ile Arg Gln Arg Gly Glu His Ala
20 25 30
ctc atc gga atc agt gcg ggc aac agt tat ttc agc cag aag aac acc 144
Leu Ile Gly Ile Ser Ala Gly Asn Ser Tyr Phe Ser Gln Lys Asn Thr
35 40 45
gtc atg ctg ctg caa tgg gcc ggg cag cgt ttc gag cgc acc gat gtc 192
Val Met Leu Leu Gln Trp Ala Gly Gln Arg Phe Glu Arg Thr Asp Val
50 55 60
gtc tat gtc gac acc cac atc gac gag atg ctg atc gcc gac ggc cgc 240
Val Tyr Val Asp Thr His Ile Asp Glu Met Leu Ile Ala Asp Gly Arg
65 70 75 80
agc gcg cag gag gcc gag cgg tcg gtc aaa cgc acg ctc aag gat ctg 288
Ser Ala Gln Glu Ala Glu Arg Ser Val Lys Arg Thr Leu Lys Asp Leu
85 90 95
cgg cgc aga ctc cgg cgc tcg ctg gag agc gtg ggc gac cac gcc gag 336
Arg Arg Arg Leu Arg Arg Ser Leu Glu Ser Val Gly Asp His Ala Glu
100 105 110
cgg ttc cgt gtc cgg tcc ctg tcc gag ctc cag gag acc cct gag tac 384
Arg Phe Arg Val Arg Ser Leu Ser Glu Leu Gln Glu Thr Pro Glu Tyr
115 120 125
cgg gcc gta cgc gag cgc acc gac cgg gcc ttc gag gag gac gcc gaa 432
Arg Ala Val Arg Glu Arg Thr Asp Arg Ala Phe Glu Glu Asp Ala Glu
130 135 140
ttc gcc acc gcc tgc gag gac atg gtg cgg gcc gtg gtg atg aac cgg 480
Phe Ala Thr Ala Cys Glu Asp Met Val Arg Ala Val Val Met Asn Arg
145 150 155 160
ccc ggt gac ggc gtc ggc atc tcc gcg gaa cac ctg cgg gcc ggt ctg 528
Pro Gly Asp Gly Val Gly Ile Ser Ala Glu His Leu Arg Ala Gly Leu
165 170 175
aac tac gtg ctg gcc gag gcc ccg ctc ttc gcg gac tcg ccc gga gtc 576
Asn Tyr Val Leu Ala Glu Ala Pro Leu Phe Ala Asp Ser Pro Gly Val
180 185 190
ttc tcc gtc ccc tcc tcg gtg ctc tgc tac cac atc gac acc ccg atc 624
Phe Ser Val Pro Ser Ser Val Leu Cys Tyr His Ile Asp Thr Pro Ile
195 200 205
acg gcg ttc ctg tcc cgg cgc gag acc ggt ttc cgg gcg gcc gag gga 672
Thr Ala Phe Leu Ser Arg Arg Glu Thr Gly Phe Arg Ala Ala Glu Gly
210 215 220
cag gcg tac gtc gtc gtc agg ccc cag gag ctg gcc gac gcg gcc 717
Gln Ala Tyr Val Val Val Arg Pro Gln Glu Leu Ala Asp Ala Ala
225 230 235
<210>50
<211>717
<212>DNA
<213>Streptomyces alborus IFO15452
<400>50
atg ctt gca ggc tta gtt ccc gcg ctg gac cac agc atg cgg gaa gaa 48
Met Leu Ala Gly Leu Val Pro Ala Leu Asp His Ser Met Arg Glu Glu
1 5 10 15
ata ctt ggc aat cgc ggc cga aag atc cgg caa cgc ggt gag cac gct 96
Ile Leu Gly Asn Arg Gly Arg Lys Ile Arg Gln Arg Gly Glu His Ala
20 25 30
ctc att gga atc agt gcg ggc aac agt tat ttc agc cag aag aac gtc 144
Leu Ile Gly Ile Ser Ala Gly Asn Ser Tyr Phe Ser Gln Lys Asn Val
35 40 45
acc atg ctg ctg caa tgg gcc ggg cag cat ttc gag cgc acg gat gtc 192
Thr Met Leu Leu Gln Trp Ala Gly Gln His Phe Glu Arg Thr Asp Val
50 55 60
gtc tac gtg gac acg cac atc gac gac atg ctg atg gcg gac ggc cgc 240
Val Tyr Val Asp Thr His Ile Asp Asp Met Leu Met Ala Asp Gly Arg
65 70 75 80
agc gcg cag gaa gcc gag aag tcg gtc aag cgc acg ctc aag gat ctg 288
Ser Ala Gln Glu Ala Glu Lys Ser Val Lys Arg Thr Leu Lys Asp Leu
85 90 95
cgg cgc agg ctg cgg cgc tcg ttg gaa agc gtg ggc gac cac agc gag 336
Arg Arg Arg Leu Arg Arg Ser Leu Glu Ser Val Gly Asp His Ser Glu
100 105 110
cgg ttc cgc gtc cgg tcc ctg tcc gag atc cag gag acc cct gag tac 384
Arg Phe Arg Val Arg Ser Leu Ser Glu Ile Gln Glu Thr Pro Glu Tyr
115 120 125
cgg gcc gca cgc gag tcc acc gac cgg gcc ttc cgc gag gac ggc gag 432
Arg Ala Ala Arg Glu Ser Thr Asp Arg Ala Phe Arg Glu Asp Gly Glu
130 135 140
ttc gcc acc gtc tgc gag gag atg gtg cgc gcc gtg gtg atg aac cgg 480
Phe Ala Thr Val Cys Glu Glu Met Val Arg Ala Val Val Met Asn Arg
145 150 155 160
ccc ggt gac ggc gtc gac atc tcg gag gaa cac ctg cgg gcc ggt ctg 528
Pro Gly Asp Gly Val Asp Ile Ser Glu Glu His Leu Arg Ala Gly Leu
165 170 175
aac tac gtg ctc gcc gag gcc ccg ctc ttc gcg gac tcg ccc ggc gtg 576
Asn Tyr Val Leu Ala Glu Ala Pro Leu Phe Ala Asp Ser Pro Gly Val
180 185 190
ttc tcc gtc ccc tcg tcg gtg ctc tgc tac cac atc ccc acc ccg gta 624
Phe Ser Val Pro Ser Ser Val Leu Cys Tyr His Ile Pro Thr Pro Val
195 200 205
tcg acg ttc ctg gcc cat cgc gag acc ggt ttc cag gcg gct cag ggt 672
Ser Thr Phe Leu Ala His Arg Glu Thr Gly Phe Gln Ala Ala Gln Gly
210 215 220
cag gca tac gtc gtc gtc agg ccg cag gag ctg gcc gac gcg gcc 717
Gln Ala Tyr Val Val Val Arg Pro Gln Glu Leu Ala Asp Ala Ala
225 230 235
<210>51
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>51
agagccatgg gacttgcagg cttagttccc gc 32
<210>52
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>52
agagagatct ggccgcgtcg gccagctcc 29
<210>53
<211>1078
<212>PRT
<213>Brevibacillus brevis
<400>53
Met Leu Asn Ser Ser Lys Ser Ile Leu Ile His Ala Gln Asn Lys Asn
1 5 10 15
Gly Thr His Glu Glu Glu Gln Tyr Leu Phe Ala Val Asn Asn Thr Lys
20 25 30
Ala Glu Tyr Pro Arg Asp Lys Thr Ile His Gln Leu Phe Glu Glu Gln
35 40 45
Val Ser Lys Arg Pro Asn Asn Val Ala Ile Val Cys Glu Asn Glu Gln
50 55 60
Leu Thr Tyr His Glu Leu Asn Val Lys Ala Asn Gln Leu Ala Arg Ile
65 70 75 80
Phe Ile Glu Lys Gly Ile Gly Lys Asp Thr Leu Val Gly Ile Met Met
85 90 95
Glu Lys Ser Ile Asp Leu Phe Ile Gly Ile Leu Ala Val Leu Lys Ala
100 105 110
Gly Gly Ala Tyr Val Pro Ile Asp Ile Glu Tyr Pro Lys Glu Val His
115 120 125
Leu Ile His Asn Ile Gln Phe Asn Gly Gln Val Glu Ile Phe Glu Glu
130 135 140
Asp Thr Ile Lys Ile Arg Glu Gly Thr Asn Leu His Val Pro Ser Lys
145 150 155 160
Ser Thr Asp Leu Ala Tyr Val Ile Tyr Thr Ser Gly Thr Thr Gly Asn
165 170 175
Pro Lys Gly Thr Met Leu Glu His Lys Gly Ile Ser Asn Leu Lys Val
180 185 190
Phe Phe Glu Asn Ser Leu Asn Val Thr Glu Lys Asp Arg Ile Gly Gln
195 200 205
Phe Ala Ser Ile Ser Phe Asp Ala Ser Val Trp Glu Met Phe Met Ala
210 215 220
Leu Leu Thr Gly Ala Ser Leu Tyr Ile Ile Leu Lys Asp Thr Ile Asn
225 230 235 240
Asp Phe Val Lys Phe Glu Gln Tyr Ile Asn Gln Lys Glu Ile Thr Val
245 250 255
Ile Thr Leu Pro Pro Thr Tyr Val Val His Leu Asp Pro Glu Arg Ile
260 265 270
Leu Ser Ile Gln Thr Leu Ile Thr Ala Gly Ser Ala Thr Ser Pro Ser
275 280 285
Leu Val Asn Lys Trp Lys Glu Lys Val Thr Tyr Ile Asn Ala Tyr Gly
290 295 300
Pro Thr Glu Thr Thr Ile Cys Ala Thr Thr Cys Val Ala Thr Lys Glu
305 310 315 320
Thr Ile Gly His Ser Val Pro Ile Gly Ala Pro Ile Gln Asn Thr Gln
325 330 335
Ile Tyr Ile Val Asp Glu Asn Leu Gln Leu Lys Ser Val Gly Glu Ala
340 345 350
Gly Glu Leu Cys Ile Gly Gly Glu Gly Leu Ala Arg Gly Tyr Trp Lys
355 360 365
Arg Pro Glu Leu Thr Ser Gln Lys Phe Val Asp Asn Pro Phe Val Pro
370 375 380
Gly Glu Lys Leu Tyr Lys Thr Gly Asp Gln Ala Arg Trp Leu Ser Asp
385 390 395 400
Gly Asn Ile Glu Tyr Leu Gly Arg Ile Asp Asn Gln Val Lys Ile Arg
405 410 415
Gly His Arg Val Glu Leu Glu Glu Val Glu Ser Ile Leu Leu Lys His
420 425 430
Met Tyr Ile Ser Glu Thr Ala Val Ser Val His Lys Asp His Gln Glu
435 440 445
Gln Pro Tyr Leu Cys Ala Tyr Phe Val Ser Glu Lys His Ile Pro Leu
450 455 460
Glu Gln Leu Arg Gln Phe Ser Ser Glu Glu Leu Pro Thr Tyr Met Ile
465 470 475 480
Pro Ser Tyr Phe Ile Gln Leu Asp Lys Met Pro Leu Thr Ser Asn Gly
485 490 495
Lys Ile Asp Arg Lys Gln Leu Pro Glu Pro Asp Leu Thr Phe Gly Met
500 505 510
Arg Val Asp Tyr Glu Ala Pro Arg Asn Glu Ile Glu Glu Thr Leu Val
515 520 525
Thr Ile Trp Gln Asp Val Leu Gly Ile Glu Lys Ile Gly Ile Lys Asp
530 535 540
Asn Phe Tyr Ala Leu Gly Gly Asp Ser Ile Lys Ala Ile Gln Val Ala
545 550 555 560
Ala Arg Leu His Ser Tyr Gln Leu Lys Leu Glu Thr Lys Asp Leu Leu
565 570 575
Lys Tyr Pro Thr Ile Asp Gln Leu Val His Tyr Ile Lys Asp Ser Lys
580 585 590
Arg Arg Ser Glu Gln Gly Ile Val Glu Gly Glu Ile Gly Leu Thr Pro
595 600 605
Ile Gln His Trp Phe Phe Glu Gln Gln Phe Thr Asn Met His His Trp
610 615 620
Asn Gln Ser Tyr Met Leu Tyr Arg Pro Asn Gly Phe Asp Lys Glu Ile
625 630 635 640
Leu Leu Arg Val Phe Asn Lys Ile Val Glu His His Asp Ala Leu Arg
645 650 655
Met Ile Tyr Lys His His Asn Gly Lys Ile Val Gln Ile Asn Arg Gly
660 665 670
Leu Glu Gly Thr Leu Phe Asp Phe Tyr Thr Phe Asp Leu Thr Ala Asn
675 680 685
Asp Asn Glu Gln Gln Val Ile Cys Glu Glu Ser Ala Arg Leu Gln Asn
690 695 700
Ser Ile Asn Leu Glu Val Gly Pro Leu Val Lys Ile Ala Leu Phe His
705 710 715 720
Thr Gln Asn Gly Asp His Leu Phe Met Ala Ile His His Leu Val Val
725 730 735
Asp Gly Ile Ser Trp Arg Ile Leu Phe Glu Asp Leu Ala Thr Ala Tyr
740 745 750
Glu Gln Ala Met His Gln Gln Thr Ile Ala Leu Pro Glu Lys Thr Asp
755 760 765
Ser Phe Lys Asp Trp Ser Ile Glu Leu Glu Lys Tyr Ala Asn Ser Glu
770 775 780
Leu Phe Leu Glu Glu Ala Glu Tyr Trp His His Leu Asn Tyr Tyr Thr
785 790 795 800
Glu Asn Val Gln Ile Lys Lys Asp Tyr Val Thr Met Asn Asn Lys Gln
805 810 815
Lys Asn Ile Arg Tyr Val Gly Met Glu Leu Thr Ile Glu Glu Thr Glu
820 825 830
Lys Leu Leu Lys Asn Val Asn Lys Ala Tyr Arg Thr Glu Ile Asn Asp
835 840 845
Ile Leu Leu Thr Ala Leu Gly Phe Ala Leu Lys Glu Trp Ala Asp Ile
850 855 860
Asp Lys Ile Val Ile Asn Leu Glu Gly His Gly Arg Glu Glu Ile Leu
865 870 875 880
Glu Gln Met Asn Ile Ala Arg Thr Val Gly Trp Phe Thr Ser Gln Tyr
885 890 895
Pro Val Val Leu Asp Met Gln Lys Ser Asp Asp Leu Ser Tyr Gln Ile
900 905 910
Lys Leu Met Lys Glu Asn Leu Arg Arg Ile Pro Asn Lys Gly Ile Gly
915 920 925
Tyr Glu Ile Phe Lys Tyr Leu Thr Thr Glu Tyr Leu Arg Pro Val Leu
930 935 940
Pro Phe Thr Leu Lys Pro Glu Ile Asn Phe Asn Tyr Leu Gly Gln Phe
945 950 955 960
Asp Thr Asp Val Lys Thr Glu Leu Phe Thr Arg Ser Pro Tyr Ser Met
965 970 975
Gly Asn Ser Leu Gly Pro Asp Gly Lys Asn Asn Leu Ser Pro Glu Gly
980 985 990
Glu Ser Tyr Phe Val Leu Asn Ile Asn Gly Phe Ile Glu Glu Gly Lys
995 1000 1005
Leu His Ile Thr Phe Ser Tyr Asn Glu Gln Gln Tyr Lys Glu Asp Thr
1010 1015 1020
Ile Gln Gln Leu Ser Arg Ser Tyr Lys Gln His Leu Leu Ala Ile Ile
1025 1030 1035 1040
Glu His Cys Val Gln Lys Glu Asp Thr Glu Leu Thr Pro Ser Asp Phe
1045 1050 1055
Ser Phe Lys Glu Leu Glu Leu Glu Glu Met Asp Asp Ile Phe Asp Leu
1060 1065 1070
Leu Ala Asp Ser Leu Thr
1075
<210>54
<211>3234
<212>DNA
<213>Brevibacillus brevis
<400>54
atg tta aac agt tct aaa agt ata ttg att cat gct caa aat aaa aat 48
Met Leu Asn Ser Ser Lys Ser Ile Leu Ile His Ala Gln Asn Lys Asn
1 5 10 15
gga acg cat gaa gag gag cag tat ctc ttt gct gtg aac aac acc aaa 96
Gly Thr His Glu Glu Glu Gln Tyr Leu Phe Ala Val Asn Asn Thr Lys
20 25 30
gcg gag tat cca cgt gat aag acg atc cat cag tta ttt gaa gag cag 144
Ala Glu Tyr Pro Arg Asp Lys Thr Ile His Gln Leu Phe Glu Glu Gln
35 40 45
gtt agt aag aga cca aac aat gta gcc att gta tgt gaa aat gag caa 192
Val Ser Lys Arg Pro Asn Asn Val Ala Ile Val Cys Glu Asn Glu Gln
50 55 60
ctt acc tac cat gag ctt aat gtg aaa gcc aat caa cta gca cgg att 240
Leu Thr Tyr His Glu Leu Asn Val Lys Ala Asn Gln Leu Ala Arg Ile
65 70 75 80
ttt ata gaa aaa ggg att gga aaa gac act ctt gtt gga att atg atg 288
Phe Ile Glu Lys Gly Ile Gly Lys Asp Thr Leu Val Gly Ile Met Met
85 90 95
gag aaa tct atc gat tta ttt ata ggc ata tta gcc gtt tta aaa gca 336
Glu Lys Ser Ile Asp Leu Phe Ile Gly Ile Leu Ala Val Leu Lys Ala
100 105 110
ggt gga gca tat gtt ccg att gat att gaa tat cct aag gaa gtt cat 384
Gly Gly Ala Tyr Val Pro Tle Asp Ile Glu Tyr Pro Lys Glu Val His
115 120 125
tta att cat aat att caa ttt aat ggg caa gtg gaa att ttt gaa gaa 432
Leu Ile His Asn Ile Gln Phe Asn Gly Gln Val Glu Ile Phe Glu Glu
130 135 140
gat act atc aaa att aga gaa gga act aat cta cat gta cca agt aaa 480
Asp Thr Ile Lys Ile Arg Glu Gly Thr Asn Leu His Val Pro Ser Lys
145 150 155 160
tca acc gat ctt gct tat gtt att tat act tct ggt aca aca ggc aat 528
Ser Thr Asp Leu Ala Tyr Val Ile Tyr Thr Ser Gly Thr Thr Gly Asn
165 170 175
cca aaa ggt aca atg ctg gag cat aaa gga ata agt aat cta aag gta 576
Pro Lys Gly Thr Met Leu Glu His Lys Gly Ile Ser Asn Leu Lys Val
180 185 190
ttt ttc gaa aat agt ctt aac gtg act gaa aag gat aga att ggt caa 624
Phe Phe Glu Asn Ser Leu Asn Val Thr Glu Lys Asp Arg Ile Gly Gln
195 200 205
ttt gcc agc atc tct ttt gat gca tct gta tgg gag atg ttt atg gct 672
Phe Ala Ser Ile Ser Phe Asp Ala Ser Val Trp Glu Met Phe Met Ala
210 215 220
ttg tta acg ggg gct agc ctg tat att atc ctg aag gat aca atc aat 720
Leu Leu Thr Gly Ala Ser Leu Tyr Ile Ile Leu Lys Asp Thr Ile Asn
225 230 235 240
gat ttt gtg aag ttt gaa caa tac att aac caa aag gaa atc act gtt 768
Asp Phe Val Lys Phe Glu Gln Tyr Ile Asn Gln Lys Glu Ile Thr Val
245 250 255
att acg tta cca cct acc tat gta gtt cat ctt gat cca gaa cgt att 816
Ile Thr Leu Pro Pro Thr Tyr Val Val His Leu Asp Pro Glu Arg Ile
260 265 270
tta tcg ata caa acg tta att aca gca ggc tca gct acc tcg cct tcc 864
Leu Ser Ile Gln Thr Leu Ile Thr Ala Gly Ser Ala Thr Ser Pro Ser
275 280 285
tta gta aac aag tgg aag gag aaa gta act tac ata aat gcc tat ggc 912
Leu Val Asn Lys Trp Lys Glu Lys Val Thr Tyr Ile Asn Ala Tyr Gly
290 295 300
cct acg gaa aca act att tgt gcg act aca tgc gta gcc acc aaa gaa 960
Pro Thr Glu Thr Thr Ile Cys Ala Thr Thr Cys Val Ala Thr Lys Glu
305 310 315 320
aca ata ggt cat tca gtt cca atc gga gca cca att caa aat aca caa 1008
Thr Ile Gly His Ser Val Pro Ile Gly Ala Pro Ile Gln Asn Thr Gln
325 330 335
att tat att gtc gat gaa aat ctt caa tta aaa tcg gtt ggt gaa gct 1056
Ile Tyr Ile Val Asp Glu Asn Leu Gln Leu Lys Ser Val Gly Glu Ala
340 345 350
ggt gaa ttg tgt att ggt gga gaa ggg tta gca agg gga tat tgg aag 1104
Gly Glu Leu Cys Ile Gly Gly Glu Gly Leu Ala Arg Gly Tyr Trp Lys
355 360 365
cga ccg gaa tta act tcc cag aag ttc gtt gat aac ccg ttt gtt cca 1152
Arg Pro Glu Leu Thr Ser Gln Lys Phe Val Asp Asn Pro Phe Val Pro
370 375 380
gga gag aag ttg tat aaa aca gga gat cag gca aga tgg cta tct gat 1200
Gly Glu Lys Leu Tyr Lys Thr Gly Asp Gln Ala Arg Trp Leu Ser Asp
385 390 395 400
gga aat att gaa tat ctc gga aga ata gat aac cag gta aag att aga 1248
Gly Asn Ile Glu Tyr Leu Gly Arg Ile Asp Asn Gln Val Lys Ile Arg
405 410 415
ggt cac cga gtt gaa cta gaa gaa gtt gag tct att ctt cta aag cat 1296
Gly His Arg Val Glu Leu Glu Glu Val Glu Ser Ile Leu Leu Lys His
420 425 430
atg tat att agc gaa act gca gta agt gtg cat aaa gat cac caa gaa 1344
Met Tyr Ile Ser Glu Thr Ala Val Ser Val His Lys Asp His Gln Glu
435 440 445
cag ccg tat ttg tgc gct tat ttt gta tcg gaa aag cat ata cca cta 1392
Gln Pro Tyr Leu Cys Ala Tyr Phe Val Ser Glu Lys His Ile Pro Leu
450 455 460
gaa cag tta aga caa ttc tca tca gaa gaa ctg cca acg tat atg atc 1440
Glu Gln Leu Arg Gln Phe Ser Ser Glu Glu Leu Pro Thr Tyr Met Ile
465 470 475 480
cct tct tat ttt atc cag tta gac aaa atg ccg ctt aca tca aat ggg 1488
Pro Ser Tyr Phe Ile Gln Leu Asp Lys Met Pro Leu Thr Ser Asn Gly
485 490 495
aag att gat cga aag cag ttg ccg gaa cct gat tta act ttc ggg atg 1536
Lys Ile Asp Arg Lys Gln Leu Pro Glu Pro Asp Leu Thr Phe Gly Met
500 505 510
agg gta gac tat gaa gcg ccg cga aat gaa atc gag gaa acg ctt gtt 1584
Arg Val Asp Tyr Glu Ala Pro Arg Asn Glu Ile Glu Glu Thr Leu Val
515 520 525
act atc tgg cag gat gta tta ggt att gag aaa atc ggt att aaa gat 1632
Thr Ile Trp Gln Asp Val Leu Gly Ile Glu Lys Ile Gly Ile Lys Asp
530 535 540
aat ttc tat gca tta ggt gga gat tct att aaa gca ata cag gtt gct 1680
Asn Phe Tyr Ala Leu Gly Gly Asp Ser Ile Lys Ala Ile Gln Val Ala
545 550 555 560
gct cgc ctg cat tcc tac caa tta aag cta gaa aca aaa gat tta tta 1728
Ala Arg Leu His Ser Tyr Gln Leu Lys Leu Glu Thr Lys Asp Leu Leu
565 570 575
aag tat cca aca atc gat caa ctc gtt cat tat ata aaa gat agt aaa 1776
Lys Tyr Pro Thr Ile Asp Gln Leu Val His Tyr Ile Lys Asp Ser Lys
580 585 590
aga aga agt gag caa ggt att gtg gaa ggt gag att gga ctt aca cct 1824
Arg Arg Ser Glu Gln Gly Ile Val Glu Gly Glu Ile Gly Leu Thr Pro
595 600 605
att cag cat tgg ttc ttt gaa caa caa ttt aca aat atg cac cat tgg 1872
Ile Gln His Trp Phe Phe Glu Gln Gln Phe Thr Asn Met His His Trp
610 615 620
aac caa tcg tat atg ttg tat aga cca aat ggg ttt gat aaa gag atc 1920
Asn Gln Ser Tyr Met Leu Tyr Arg Pro Asn Gly Phe Asp Lys Glu Ile
625 630 635 640
ttg cta agg gta ttt aat aaa att gtt gag cat cat gat gca tta cgt 1968
Leu Leu Arg Val Phe Asn Lys Ile Val Glu His His Asp Ala Leu Arg
645 650 655
atg ata tac aaa cat cat aac gga aag atc gtg cag ata aat cgg ggg 2016
Met Ile Tyr Lys His His Asn Gly Lys Ile Val Gln Ile Asn Arg Gly
660 665 670
ctt gaa ggt acg ttg ttt gat ttt tat acc ttt gat tta act gca aat 2064
Leu Glu Gly Thr Leu Phe Asp Phe Tyr Thr Phe Asp Leu Thr Ala Asn
675 680 685
gat aat gag caa cag gtg att tgt gaa gaa tct gct cga tta caa aat 2112
Asp Asn Glu Gln Gln Val Ile Cys Glu Glu Ser Ala Arg Leu Glr Asn
690 695 700
agt ata aac ttg gaa gta ggc cct cta gta aag ata gcg ctg ttt cat 2160
Ser Ile Asn Leu Glu Val Gly Pro Leu Val Lys Ile Ala Leu Phe His
705 710 715 720
act cag aat gga gat cac ctg ttt atg gct att cat cat ttg gtt gtg 2208
Thr Gln Asn Gly Asp His Leu Phe Met Ala Ile His His Leu Val Val
725 730 735
gat ggt att tct tgg agg att ttg ttt gag gat ttg gcc aca gct tat 2256
Asp Gly Ile Ser Trp Arg Ile Leu Phe Glu Asp Leu Ala Thr Ala Tyr
740 745 750
gaa caa gca atg cat cag caa acg att gct tta cca gag aaa aca gat 2304
Glu Gln Ala Met His Gln Gln Thr Ile Ala Leu Pro Glu Lys Thr Asp
755 760 765
tca ttt aag gac tgg tct att gaa tta gaa aaa tat gcg aac agc gaa 2352
Ser Phe Lys Asp Trp Ser Ile Glu Leu Glu Lys Tyr Ala Asn Ser Glu
770 775 780
tta ttc cta gaa gaa gct gaa tat tgg cat cat ttg aat tat tat acc 2400
Leu Phe Leu Glu Glu Ala Glu Tyr Trp His His Leu Asn Tyr Tyr Thr
785 790 795 800
gag aac gtt caa att aag aaa gat tat gtc acc atg aac aat aaa caa 2448
Glu Asn Val Gln Ile Lys Lys Asp Tyr Val Thr Met Asn Asn Lys Gln
805 810 815
aag aat ata cgt tat gta gga atg gag tta aca ata gaa gag aca gaa 2496
Lys Asn Ile Arg Tyr Val Gly Met Glu Leu Thr Ile Glu Glu Thr Glu
820 825 830
aaa tta ttg aaa aat gta aat aaa gcg tat cga aca gaa att aat gat 2544
Lys Leu Leu Lys Asn Val Asn Lys Ala Tyr Arg Thr Glu Ile Asn Asp
835 840 845
att tta tta acg gca ctt ggc ttt gca ctc aaa gaa tgg gcc gat att 2592
Ile Leu Leu Thr Ala Leu Gly Phe Ala Leu Lys Glu Trp Ala Asp Ile
850 855 860
gat aaa att gta att aac tta gag gga cac gga cgg gaa gaa ata ctg 2640
Asp Lys Ile Val Ile Asn Leu Glu Gly His Gly Arg Glu Glu Ile Leu
865 870 875 880
gaa cag atg aac att gca agg acg gta ggc tgg ttt act tcc cag tat 2688
Glu Gln Met Asn Ile Ala Arg Thr Val Gly Trp Phe Thr Ser Gln Tyr
885 890 895
cct gtt gta ctt gat atg caa aaa tcg gat gat ttg tct tat caa atc 2736
Pro Val Val Leu Asp Met Gln Lys Ser Asp Asp Leu Ser Tyr Gln Ile
900 905 910
aaa tta atg aaa gaa aat tta cgc aga ata cct aac aaa gga atc gga 2784
Lys Leu Met Lys Glu Asn Leu Arg Arg Ile Pro Asn Lys Gly Ile Gly
915 920 925
tat gaa att ttt aag tat tta aca act gaa tat tta cgg cct gtt tta 2832
Tyr Glu Ile Phe Lys Tyr Leu Thr Thr Glu Tyr Leu Arg Pro Val Leu
930 935 940
ccc ttt aca tta aag ccg gaa att aac ttt aac tac tta gga cag ttc 2880
Pro Phe Thr Leu Lys Pro Glu Ile Asn Phe Asn Tyr Leu Gly Gln Phe
945 950 955 960
gat acg gac gtg aag act gaa ttg ttt act cgt tct cct tat agc atg 2928
Asp Thr Asp Val Lys Thr Glu Leu Phe Thr Arg Ser Pro Tyr Ser Met
965 970 975
ggt aat tca tta gga cca gat gga aaa aat aat tta agc cca gaa ggg 2976
Gly Asn Ser Leu Gly Pro Asp Gly Lys Asn Asn Leu Ser Pro Glu Gly
980 985 990
gaa agt tat ttt gta ctc aat att aat ggt ttt att gaa gaa ggt aag 3024
Glu Ser Tyr Phe Val Leu Asn Ile Asn Gly Phe Ile Glu Glu Gly Lys
995 1000 1005
ctt cac atc acc ttt tct tat aat gaa cag cag tat aag gag gat acc 3072
Leu His Ile Thr Phe Ser Tyr Asn Glu Gln Gln Tyr Lys Glu Asp Thr
1010 1015 1020
att cag caa ttg agc cgg agc tat aag caa cat ctt ttg gcc atc att 3120
Ile Gln Gln Leu Ser Arg Ser Tyr Lys Gln His Leu Leu Ala Ile Ile
1025 1030 1035 1040
gaa cat tgt gta cag aag gaa gat act gag tta act cca agt gat ttc 3168
Glu His Cys Val Gln Lys Glu Asp Thr Glu Leu Thr Pro Ser Asp Phe
1045 1050 1055
agt ttc aag gaa ctt gaa tta gaa gag atg gat gat att ttc gat ttg 3216
Ser Phe Lys Glu Leu Glu Leu Glu Glu Met Asp Asp Ile Phe Asp Leu
1060 1065 1070
ttg gcc gat tca tta acg 3234
Leu Ala Asp Ser Leu Thr
1075
<210>55
<211>503
<212>PRT
<213>大肠杆菌(Escherichia coli)
<400>55
Met Glu Phe Ser Val Lys Ser Gly Ser Pro Glu Lys GIn Arg Ser Ala
1 5 10 15
Cys Ile Val Val Gly Val Phe Glu Pro Arg Arg Leu Ser Pro Ile Ala
20 25 30
Glu Gln Leu Asp Lys Ile Ser Asp Gly Tyr Ile Ser Ala Leu Leu Arg
35 40 45
Arg Gly Glu Leu Glu Gly Lys Pro Gly Gln Thr Leu Leu Leu His His
50 55 60
Val Pro Asn Val Leu Ser Glu Arg Ile Leu Leu Ile Gly Cys Gly Lys
65 70 75 80
Glu Arg Glu Leu Asp Glu Arg Gln Tyr Lys Gln Val Ile Gln Lys Thr
85 90 95
Ile Asn Thr Leu Asn Asp Thr Gly Ser Met Glu Ala Val Cys Phe Leu
100 105 110
Thr Glu Leu His Val Lys Gly Arg Asn Asn Tyr Trp Lys Val Arg Gln
115 120 125
Ala Val Glu Thr Ala Lys Glu Thr Leu Tyr Ser Phe Asp Gln Leu Lys
130 135 140
Thr Asn Lys Ser Glu Pro Arg Arg Pro Leu Arg Lys Met Val Phe Asn
145 150 155 160
Val Pro Thr Arg Arg Glu Leu Thr Ser Gly Glu Arg Ala Ile Gln His
165 170 175
Gly Leu Ala Ile Ala Ala Gly Ile Lys Ala Ala Lys Asp Leu Gly Asn
180 185 190
Met Pro Pro Asn Ile Cys Asn Ala Ala Tyr Leu Ala Ser Gln Ala Arg
195 200 205
Gln Leu Ala Asp Ser Tyr Ser Lys Asn Val Ile Thr Arg Val Ile Gly
210 215 220
Glu Gln Gln Met Lys Glu Leu Gly Met His Ser Tyr Leu Ala Val Gly
225 230 235 240
Gln Gly Ser Gln Asn Glu Ser Leu Met Ser Val Ile Glu Tyr Lys Gly
245 250 255
Asn Ala Ser Glu Asp Ala Arg Pro Ile Val Leu Val Gly Lys Gly Leu
260 265 270
Thr Phe Asp Ser Gly Gly Ile Ser Ile Lys Pro Ser Glu Gly Met Asp
275 280 285
Glu Met Lys Tyr Asp Met Cys Gly Ala Ala Ala Val Tyr Gly Val Met
290 295 300
Arg Met Val Ala Glu Leu Gln Leu Pro Ile Asn Val Ile Gly Val Leu
305 310 315 320
Ala Gly Cys Glu Asn Met Pro Gly Gly Arg Ala Tyr Arg Pro Gly Asp
325 330 335
Val Leu Thr Thr Met Ser Gly Gln Thr Val Glu Val Leu Asn Thr Asp
340 345 350
Ala Glu Gly Arg Leu Val Leu Cys Asp Val Leu Thr Tyr Val Glu Arg
355 360 365
Phe Glu Pro Glu Ala Val Ile Asp Val Ala Thr Leu Thr Gly Ala Cys
370 375 380
Val Ile Ala Leu Gly His His Ile Thr Gly Leu Met Ala Asn His Asn
385 390 395 400
Pro Leu Ala His Glu Leu Ile Ala Ala Ser Glu Gln Ser Gly Asp Arg
405 410 415
Ala Trp Arg Leu Pro Leu Gly Asp Glu Tyr Gln Glu Gln Leu Glu Ser
420 425 430
Asn Phe Ala Asp Met Ala Asn Ile Gly Gly Arg Pro Gly Gly Ala Ile
435 440 445
Thr Ala Gly Cys Phe Leu Ser Arg Phe Thr Arg Lys Tyr Asn Trp Ala
450 455 460
His Leu Asp Ile Ala Gly Thr Ala Trp Arg Ser Gly Lys Ala Lys Gly
465 470 475 480
Ala Thr Gly Arg Pro Val Ala Leu Leu Ala Gln Phe Leu Leu Asn Arg
485 490 495
Ala Gly Phe Asn Gly Glu Glu
500
<210>56
<211>427
<212>PRT
<213>大肠杆菌
<400>56
Met Thr Glu Ala Met Lys Ile Thr Leu Ser Thr Gln Pro Ala Asp Ala
1 5 10 15
Arg Trp Gly Glu Lys Ala Thr Tyr Ser Ile Asn Asn Asp Gly Ile Thr
20 25 30
Leu His Leu Asn Gly Ala Asp Asp Leu Gly Leu Ile Gln Arg Ala Ala
35 40 45
Arg Lys Ile Asp Gly Leu Gly Ile Lys His Val Gln Leu Ser Gly Glu
50 55 60
Gly Trp Asp Ala Asp Arg Cys Trp Ala Phe Trp Gln Gly Tyr Lys Ala
65 70 75 80
Pro Lys Gly Thr Arg Lys Val Val Trp Pro Asp Leu Asp Asp Ala Gln
85 90 95
Arg Gln Glu Leu Asp Asn Arg Leu Met Ile Ile Asp Trp Val Arg Asp
100 105 110
Thr Ile Asn Ala Pro Ala Glu Glu Leu Gly Pro Ser Gln Leu Ala Gln
115 120 125
Arg Ala Val Asp Leu Ile Ser Asn Val Ala Gly Asp Arg Val Thr Tyr
130 135 140
Arg Ile Thr Lys Gly Glu Asp Leu Arg Glu Gln Gly Tyr Met Gly Leu
145 150 155 160
His Thr Val Gly Arg Gly Ser Glu Arg Ser Pro Val Leu Leu Ala Leu
165 170 175
Asp Tyr Asn Pro Thr Gly Asp Lys Glu Ala Pro Val Tyr Ala Cys Leu
180 185 190
Val Gly Lys Gly Ile Thr Phe Asp Ser Gly Gly Tyr Ser Ile Lys Gln
195 200 205
Thr Ala Phe Met Asp Ser Met Lys Ser Asp Met Gly Gly Ala Ala Thr
210 215 220
Val Thr Gly Ala Leu Ala Phe Ala Ile Thr Arg Gly Leu Asn Lys Arg
225 230 235 240
Val Lys Leu Phe Leu Cys Cys Ala Asp Asn Leu Ile Ser Gly Asn Ala
245 250 255
Phe Lys Leu Gly Asp Ile Ile Thr Tyr Arg Asn Gly Lys Lys Val Glu
260 265 270
Val Met Asn Thr Asp Ala Glu Gly Arg Leu Val Leu Ala Asp Gly Leu
275 280 285
Ile Asp Ala Ser Ala Gln Lys Pro Glu Met Ile Ile Asp Ala Ala Thr
290 295 300
Leu Thr Gly Ala Ala Lys Thr Ala Leu Gly Asn Asp Tyr His Ala Leu
305 310 315 320
Phe Ser Phe Asp Asp Ala Leu Ala Gly Arg Leu Leu Ala Ser Ala Ala
325 330 335
Gln Glu Asn Glu Pro Phe Trp Arg Leu Pro Leu Ala Glu Phe His Arg
340 345 350
Ser Gln Leu Pro Ser Asn Phe Ala Glu Leu Asn Asn Thr Gly Ser Ala
355 360 365
Ala Tyr Pro Ala Gly Ala Ser Thr Ala Ala Gly Phe Leu Ser His Phe
370 375 380
Val Glu Asn Tyr Gln Gln Gly Trp Leu His Ile Asp Cys Ser Ala Thr
385 390 395 400
Tyr Arg Lys Ala Pro Val Glu Gln Trp Ser Ala Gly Ala Thr Gly Leu
405 410 415
Gly Val Arg Thr Ile Ala Asn Leu Leu Thr Ala
420 425
<210>57
<211>485
<212>PRT
<213>大肠杆菌
<400>57
Met Ser Glu Leu Ser Gln Leu Ser Pro Gln Pro Leu Trp Asp Ile Phe
1 5 10 15
Ala Lys Ile Cys Ser Ile Pro His Pro Ser Tyr His Glu Glu Gln Leu
20 25 30
Ala Glu Tyr Ile Val Gly Trp Ala Lys Glu Lys Gly Phe His Val Glu
35 40 45
Arg Asp Gln Val Gly Asn Ile Leu Ile Arg Lys Pro Ala Thr Ala Gly
50 55 60
Met Glu Asn Arg Lys Pro Val Val Leu Gln Ala His Leu Asp Met Val
65 70 75 80
Pro Gln Lys Asn Asn Asp Thr Val His Asp Phe Thr Lys Asp Pro Ile
85 90 95
Gln Pro Tyr Ile Asp Gly Glu Trp Val Lys Ala Arg Gly Thr Thr Leu
100 105 110
Gly Ala Asp Asn Gly Ile Gly Met Ala Ser Ala Leu Ala Val Leu Ala
115 120 125
Asp Glu Asn Val Val His Gly Pro Leu Glu Val Leu Leu Thr Met Thr
130 135 140
Glu Glu Ala Gly Met Asp Gly Ala Phe Gly Leu Gln Gly Asn Trp Leu
145 150 155 160
Gln Ala Asp Ile Leu Ile Asn Thr Asp Ser Glu Glu Glu Gly Glu Ile
165 170 175
Tyr Met Gly Cys Ala Gly Gly Ile Asp Phe Thr Ser Asn Leu His Leu
180 185 190
Asp Arg Glu Ala Val Pro Ala Gly Phe Glu Thr Phe Lys Leu Thr Leu
195 200 205
Lys Gly Leu Lys Gly Gly His Ser Gly Gly Glu Ile His Val Gly Leu
210 215 220
Gly Asn Ala Asn Lys Leu Leu Val Arg Phe Leu Ala Gly His Ala Glu
225 230 235 240
Glu Leu Asp Leu Arg Leu Ile Asp Phe Asn Gly Gly Thr Leu Arg Asn
245 250 255
Ala Ile Pro Arg Glu Ala Phe Ala Thr Ile Ala Val Ala Ala Asp Lys
260 265 270
Val Asp Val Leu Lys Ser Leu Val Asn Thr Tyr Gln Glu Ile Leu Lys
275 280 285
Asn Glu Leu Ala Glu Lys Glu Lys Asn Leu Ala Leu Leu Leu Asp Ser
290 295 300
Val Ala Asn Asp Lys Ala Ala Leu Ile Ala Lys Ser Arg Asp Thr Phe
305 310 315 320
Ile Arg Leu Leu Asn Ala Thr Pro Asn Gly Val Ile Arg Asn Ser Asp
325 330 335
Val Ala Lys Gly Val Val Glu Thr Ser Leu Asn Val Gly Val Val Thr
340 345 350
Met Thr Asp Asn Asn Val Glu Ile His Cys Leu Ile Arg Ser Leu Ile
355 360 365
Asp Ser Gly Lys Asp Tyr Val Val Ser Met Leu Asp Ser Leu Gly Lys
370 375 380
Leu Ala Gly Ala Lys Thr Glu Ala Lys Gly Ala Tyr Pro Gly Trp Gln
385 390 395 400
Pro Asp Ala Asn Ser Pro Val Met His Leu Val Arg Glu Thr Tyr Gln
405 410 415
Arg Leu Phe Asn Lys Thr Pro Asn Ile Gln Ile Ile His Ala Gly Leu
420 425 430
Glu Cys Gly Leu Phe Lys Lys Pro Tyr Pro Glu Met Asp Met Val Ser
435 440 445
Ile Gly Pro Thr Ile Thr Gly Pro His Ser Pro Asp Glu Gln Val His
450 455 460
Ile Glu Ser Val Gly His Tyr Trp Thr Leu Leu Thr Glu Leu Leu Lys
465 470 475 480
Glu Ile Pro Ala Lys
485
<210>58
<211>870
<212>PRT
<213>大肠杆菌
<400>58
Met Thr Gln Gln Pro Gln Ala Lys Tyr Arg His Asp Tyr Arg Ala Pro
1 5 10 15
Asp Tyr Gln Ile Thr Asp Ile Asp Leu Thr Phe Asp Leu Asp Ala Gln
20 25 30
Lys Thr Val Val Thr Ala Val Ser Gln Ala Val Arg His Gly Ala Ser
35 40 45
Asp Ala Pro Leu Arg Leu Asn Gly Glu Asp Leu Lys Leu Val Ser Val
50 55 60
His Ile Asn Asp Glu Pro Trp Thr Ala Trp Lys Glu Glu Glu Gly Ala
65 70 75 80
Leu Val Ile Ser Asn Leu Pro Glu Arg Phe Thr Leu Lys Ile Ile Asn
85 90 95
Glu Ile Ser Pro Ala Ala Asn Thr Ala Leu Glu Gly Leu Tyr Gln Ser
100 105 110
Gly Asp Ala Leu Cys Thr Gln Cys Glu Ala Glu Gly Phe Arg His Ile
115 120 125
Thr Tyr Tyr Leu Asp Arg Pro Asp Val Leu Ala Arg Phe Thr Thr Lys
130 135 140
Ile Ile Ala Asp Lys Ile Lys Tyr Pro Phe Leu Leu Ser Asn Gly Asn
145 150 155 160
Arg Val Ala Gln Gly Glu Leu Glu Asn Gly Arg His Trp Val Gln Trp
165 170 175
Gln Asp Pro Phe Pro Lys Pro Cys Tyr Leu Phe Ala Leu Val Ala Gly
180 185 190
Asp Phe Asp Val Leu Arg Asp Thr Phe Thr Thr Arg Ser Gly Arg Glu
195 200 205
Val Ala Leu Glu Leu Tyr Val Asp Arg Gly Asn Leu Asp Arg Ala Pro
210 215 220
Trp Ala Met Thr Ser Leu Lys Asn Ser Met Lys Trp Asp Glu Glu Arg
225 230 235 240
Phe Gly Leu Glu Tyr Asp Leu Asp Ile Tyr Met Ile Val Ala Val Asp
245 250 255
Phe Phe Asn Met Gly Ala Met Glu Asn Lys Gly Leu Asn Ile Phe Asn
260 265 270
Ser Lys Tyr Val Leu Ala Arg Thr Asp Thr Ala Thr Asp Lys Asp Tyr
275 280 285
Leu Asp Ile Glu Arg Val Ile Gly His Glu Tyr Phe His Asn Trp Thr
290 295 300
Gly Asn Arg Val Thr Cys Arg Asp Trp Phe Gln Leu Ser Leu Lys Glu
305 310 315 320
Gly Leu Thr Val Phe Arg Asp Gln Glu Phe Ser Ser Asp Leu Gly Ser
325 330 335
Arg Ala Val Asn Arg Ile Asn Asn Val Arg Thr Met Arg Gly Leu Gln
340 345 350
Phe Ala Glu Asp Ala Ser Pro Met Ala His Pro Ile Arg Pro Asp Met
355 360 365
Val Ile Glu Met Asn Asn Phe Tyr Thr Leu Thr Val Tyr Glu Lys Gly
370 375 380
Ala Glu Val Ile Arg Met Ile His Thr Leu Leu Gly Glu Glu Asn Phe
385 390 395 400
Gln Lys Gly Met Gln Leu Tyr Phe Glu Arg His Asp Gly Ser Ala Ala
405 410 415
Thr Cys Asp Asp Phe Val Gln Ala Met Glu Asp Ala Ser Asn Val Asp
420 425 430
Leu Ser His Phe Arg Arg Trp Tyr Ser Gln Ser Gly Thr Pro Ile Val
435 440 445
Thr Val Lys Asp Asp Tyr Asn Pro Glu Thr Glu Gln Tyr Thr Leu Thr
450 455 460
Ile Ser Gln Arg Thr Pro Ala Thr Pro Asp Gln Ala Glu Lys Gln Pro
465 470 475 480
Leu His Ile Pro Phe Ala Ile Glu Leu Tyr Asp Asn Glu Gly Lys Val
485 490 495
Ile Pro Leu Gln Lys Gly Gly His Pro Val Asn Ser Val Leu Asn Val
500 505 510
Thr Gln Ala Glu Gln Thr Phe Val Phe Asp Asn Val Tyr Phe Gln Pro
515 520 525
Val Pro Ala Leu Leu Cys Glu Phe Ser Ala Pro Val Lys Leu Glu Tyr
530 535 540
Lys Trp Ser Asp Gln Gln Leu Thr Phe Leu Met Arg His Ala Arg Asn
545 550 555 560
Asp Phe Ser Arg Trp Asp Ala Ala Gln Ser Leu Leu Ala Thr Tyr Ile
565 570 575
Lys Leu Asn Val Ala Arg His Gln Gln Gly Gln Pro Leu Ser Leu Pro
580 585 590
Val His Val Ala Asp Ala Phe Arg Ala Val Leu Leu Asp Glu Lys Tle
595 600 605
Asp Pro Ala Leu Ala Ala Glu Ile Leu Thr Leu Pro Ser Val Asn Glu
610 615 620
Met Ala Glu Leu Phe Asp Ile Ile Asp Pro Ile Ala Ile Ala Glu Val
625 630 635 640
Arg Glu Ala Leu Thr Arg Thr Leu Ala Thr Glu Leu Ala Asp Glu Leu
645 650 655
Leu Ala Ile Tyr Asn Ala Asn Tyr Gln Ser Glu Tyr Arg Val Glu His
660 665 670
Glu Asp Ile Ala Lys Arg Thr Leu Arg Asn Ala Cys Leu Arg Phe Leu
675 680 685
Ala Phe Gly Glu Thr His Leu Ala Asp Val Leu Val Ser Lys Gln Phe
690 695 700
His Glu Ala Asn Asn Met Thr Asp Ala Leu Ala Ala Leu Ser Ala Ala
705 710 715 720
Val Ala Ala Gln Leu Pro Cys Arg Asp Ala Leu Met Gln Glu Tyr Asp
725 730 735
Asp Lys Trp His Gln Asn Gly Leu Val Met Asp Lys Trp Phe Ile Leu
740 745 750
Gln Ala Thr Ser Pro Ala Ala Asn Val Leu Glu Thr Val Arg Gly Leu
755 760 765
Leu Gln His Arg Ser Phe Thr Met Ser Asn Pro Asn Arg Ile Arg Ser
770 775 780
Leu Ile Gly Ala Phe Ala Gly Ser Asn Pro Ala Ala Phe His Ala Glu
785 790 795 800
Asp Gly Ser Gly Tyr Leu Phe Leu Val Glu Met Leu Thr Asp Leu Asn
805 810 815
Ser Arg Asn Pro Gln Val Ala Ser Arg Leu Ile Glu Pro Leu Ile Arg
820 825 830
Leu Lys Arg Tyr Asp Ala Lys Arg Gln Glu Lys Met Arg Ala Ala Leu
835 840 845
Glu Gln Leu Lys Gly Leu Glu Asn Leu Ser Gly Asp Leu Tyr Glu Lys
850 855 860
Ile Thr Lys Ala Leu Ala
865 870
<210>59
<211>535
<212>PRT
<213>大肠杆菌
<400>59
Met Arg Ile Ser Leu Lys Lys Ser Gly Met Leu Lys Leu Gly Leu Ser
1 5 10 15
Leu Val Ala Met Thr Val Ala Ala Ser Val Gln Ala Lys Thr Leu Val
20 25 30
Tyr Cys Ser Glu Gly Ser Pro Glu Gly Phe Asn Pro Gln Leu Phe Thr
35 40 45
Ser Gly Thr Thr Tyr Asp Ala Ser Ser Val Pro Leu Tyr Asn Arg Leu
50 55 60
Val Glu Phe Lys Ile GIy Thr Thr Glu Val Ile Pro Gly Leu Ala Glu
65 70 75 80
Lys Trp Glu Val Ser Glu Asp Gly Lys Thr Tyr Thr Phe His Leu Arg
85 90 95
Lys Gly Val Lys Trp His Asp Asn Lys Glu Phe Lys Pro Thr Arg Glu
100 105 110
Leu Asn Ala Asp Asp Val Val Phe Ser Phe Asp Arg Gln Lys Asn Ala
115 120 125
Gln Asn Pro Tyr His Lys Val Ser Gly Gly Ser Tyr Glu Tyr Phe Glu
130 135 140
Gly Met Gly Leu Pro Glu Leu Ile Ser Glu Val Lys Lys Val Asp Asp
145 150 155 160
Asn Thr Val Gln Phe Val Leu Thr Arg Pro Glu Ala Pro Phe Leu Ala
165 170 175
Asp Leu Ala Met Asp Phe Ala Ser Ile Leu Ser Lys Glu Tyr Ala Asp
180 185 190
Ala Met Met Lys Ala Gly Thr Pro Glu Lys Leu Asp Leu Asn Pro Ile
195 200 205
Gly Thr Gly Pro Phe Gln Leu Gln Gln Tyr Gln Lys Asp Ser Arg Ile
210 215 220
Arg Tyr Lys Ala Phe Asp Gly Tyr Trp Gly Thr Lys Pro Gln Ile Asp
225 230 235 240
Thr Leu Val Phe Ser Ile Thr Pro Asp Ala Ser Val Arg Tyr Ala Lys
245 250 255
Leu Gln Lys Asn Glu Cys Gln Val Met Pro Tyr Pro Asn Pro Ala Asp
260 265 270
Ile Ala Arg Met Lys Gln Asp Lys Ser Ile Asn Leu Met Glu Met Pro
275 280 285
Gly Leu Asn Val Gly Tyr Leu Ser Tyr Asn Val Gln Lys Lys Pro Leu
290 295 300
Asp Asp Val Lys Val Arg Gln Ala Leu Thr Tyr Ala Val Asn Lys Asp
305 310 315 320
Ala Ile Ile Lys Ala Val Tyr Gln Gly Ala Gly Val Ser Ala Lys Asn
325 330 335
Leu Ile Pro Pro Thr Met Trp Gly Tyr Asn Asp Asp Val Gln Asp Tyr
340 345 350
Thr Tyr Asp Pro Glu Lys Ala Lys Ala Leu Leu Lys Glu Ala Gly Leu
355 360 365
Glu Lys Gly Phe Ser Ile Asp Leu Trp Ala Met Pro Val Gln Arg Pro
370 375 380
Tyr Asn Pro Asn Ala Arg Arg Met Ala Glu Met Ile Gln Ala Asp Trp
385 390 395 400
Ala Lys Val Gly Val Gln Ala Lys Ile Val Thr Tyr Glu Trp Gly Glu
405 410 415
Tyr Leu Lys Arg Ala Lys Asp Gly Glu His Gln Thr Val Met Met Gly
420 425 430
Trp Thr Gly Asp Asn Gly Asp Pro Asp Asn Phe Phe Ala Thr Leu Phe
435 440 445
Ser Cys Ala Ala Ser Glu Gln Gly Ser Asn Tyr Ser Lys Trp Cys Tyr
450 455 460
Lys Pro Phe Glu Asp Leu Ile Gln Pro Ala Arg Ala Thr Asp Asp His
465 470 475 480
Asn Lys Arg Val Glu Leu Tyr Lys Gln Ala Gln Val Val Met His Asp
485 490 495
Gln Ala Pro Ala Leu Ile Ile Ala His Ser Thr Val Phe Glu Pro Val
500 505 510
Arg Lys Glu Val Lys Gly Tyr Val Val Asp Pro Leu Gly Lys His His
515 520 525
Phe Glu Asn Val Ser Ile Glu
530 535
<210>60
<211>339
<212>PRT
<213>大肠杆菌
<400>60
Met Leu Gln Phe Ile Leu Arg Arg Leu Gly Leu Val Ile Pro Thr Phe
1 5 10 15
Ile Gly Ile Thr Leu Leu Thr Phe Ala Phe Val His Met Ile Pro Gly
20 25 30
Asp Pro Val Met Ile Met Ala Gly Glu Arg Gly Ile Ser Pro Glu Arg
35 40 45
His Ala Gln Leu Leu Ala Glu Leu Gly Leu Asp Lys Pro Met Trp Gln
50 55 60
Gln Tyr Leu His Tyr Ile Trp Gly Val Met His Gly Asp Leu Gly Ile
65 70 75 80
Ser Met Lys Ser Arg Ile Pro Val Trp Glu Glu Phe Val Pro Arg Phe
85 90 95
Gln Ala Thr Leu Glu Leu Gly Val Cys Ala Met Ile Phe Ala Thr Ala
100 105 110
Val Gly Ile Pro Val Gly Val Leu Ala Ala Val Lys Arg Gly Ser Ile
115 120 125
Phe Asp His Thr Ala Val Gly Leu Ala Leu Thr Gly Tyr Ser Met Pro
130 135 140
Ile Phe Trp Trp Gly Met Met Leu Ile Met Leu Val Ser Val His Trp
145 150 155 160
Asn Leu Thr Pro Val Ser Gly Arg Val Ser Asp Met Val Phe Leu Asp
165 170 175
Asp Ser Asn Pro Leu Thr Gly Phe Met Leu Ile Asp Thr Ala Ile Trp
180 185 190
Gly Glu Asp Gly Asn Phe Ile Asp Ala Val Ala His Met Ile Leu Pro
195 200 205
Ala Ile Val Leu Gly Thr Ile Pro Leu Ala Val Ile Val Arg Met Thr
210 215 220
Arg Ser Ser Met Leu Glu Val Leu Gly Glu Asp Tyr Ile Arg Thr Ala
225 230 235 240
Arg Ala Lys Gly Leu Thr Arg Met Arg Val Ile Ile Val His Ala Leu
245 250 255
Arg Asn Ala Met Leu Pro Val Val Thr Val Ile Gly Leu Gln Val Gly
260 265 270
Thr Leu Leu Ala Gly Ala Ile Leu Thr Glu Thr Ile Phe Ser Trp Pro
275 280 285
Gly Leu Gly Arg Trp Leu Ile Asp Ala Leu Gln Arg Arg Asp Tyr Pro
290 295 300
Val Val Gln Gly Gly Val Leu Leu Val Ala Thr Met Ile Ile Leu Val
305 310 315 320
Asn Leu Leu Val Asp Leu Leu Tyr Gly Val Val Asn Pro Arg Ile Arg
325 330 335
His Lys Lys
<210>61
<211>300
<212>PRT
<213>大肠杆菌
<400>61
Met Ser Gln Val Thr Glu Asn Lys Val Ile Ser Ala Pro Val Pro Met
1 5 10 15
Thr Pro Leu Gln Glu Phe Trp His Tyr Phe Lys Arg Asn Lys Gly Ala
20 25 30
Val Val Gly Leu Val Tyr Val Val Ile Val Leu Phe Ile Ala Ile Phe
35 40 45
Ala Asn Trp Ile Ala Pro Tyr Asn Pro Ala Glu Gln Phe Arg Asp Ala
50 55 60
Leu Leu Ala Pro Pro Ala Trp Gln Glu Gly Gly Ser Met Ala His Leu
65 70 75 80
Leu Gly Thr Asp Asp Val Gly Arg Asp Val Leu Ser Arg Leu Met Tyr
85 90 95
Gly Ala Arg Leu Ser Leu Leu Val Gly Cys Leu Val Val Val Leu Ser
100 105 110
Leu Ile Met Gly Val Ile Leu Gly Leu Ile Ala Gly Tyr Phe Gly Gly
115 120 125
Leu Val Asp Asn Ile Ile Met Arg Val Val Asp Ile Met Leu Ala Leu
130 135 140
Pro Ser Leu Leu Leu Ala Leu Val Leu Val Ala Ile Phe Gly Pro Ser
145 150 155 160
Ile Gly Asn Ala Ala Leu Ala Leu Thr Phe Val Ala Leu Pro His Tyr
165 170 175
Val Arg Leu Thr Arg Ala Ala Val Leu Val Glu Val Asn Arg Asp Tyr
180 185 190
Val Thr Ala Ser Arg Val Ala Gly Ala Gly Ala Met Arg Gln Met Phe
195 200 205
Ile Asn Ile Phe Pro Asn Cys Leu Ala Pro Leu Tle Val Gln Ala Ser
210 215 220
Leu Gly Phe Ser Asn Ala Ile Leu Asp Met Ala Ala Leu Gly Phe Leu
225 230 235 240
Gly Met Gly Ala Gln Pro Pro Thr Pro Glu Trp Gly Thr Met Leu Ser
245 250 255
Asp Val Leu Gln Phe Ala Gln Ser Ala Trp Trp Val Val Thr Phe Pro
260 265 270
Gly Leu Ala Ile Leu Leu Thr Val Leu Ala Phe Asn Leu Met Gly Asp
275 280 285
Gly Leu Arg Asp Ala Leu Asp Pro Lys Leu Lys Gln
290 295 300
<210>62
<211>327
<212>PRT
<213>大肠杆菌
<400>62
Met Ala Leu Leu Asn Val Asp Lys Leu Ser Val His Phe Gly Asp Glu
1 5 10 15
Ser Ala Pro Phe Arg Ala Val Asp Arg Ile Ser Tyr Ser Val Lys Gln
20 25 30
Gly Tlu Val Val Gly Ile Val Gly Glu Ser Gly Ser Gly Lys Ser Val
35 40 45
Ser Ser Leu Ala Ile Met Gly Leu Ile Asp Tyr Pro Gly Arg Val Met
50 55 60
Ala Glu Lys Leu Glu Phe Asn Gly Gln Asp Leu Gln Arg Ile Ser Glu
65 70 75 80
Lys Glu Arg Arg Asn Leu Val Gly Ala Glu Val Ala Met Ile Phe Gln
85 90 95
Asp Pro Met Thr Ser Leu Asn Pro Cys Tyr Thr Val Gly Phe Gln Ile
100 105 110
Met Glu Ala Ile Lys Val His Gln Gly Gly Asn Lys Ser Thr Arg Arg
115 120 125
Gln Arg Ala Ile Asp Leu Leu Asn Gln Val Gly Ile Pro Asp Pro Ala
130 135 140
Ser Arg Leu Asp Val Tyr Pro His Gln Leu Ser Gly Gly Met Ser Gln
145 150 155 160
Arg Val Met Ile Ala Met Ala Ile Ala Cys Arg Pro Lys Leu Leu Ile
165 170 175
Ala Asp Glu Pro Thr Thr Ala Leu Asp Val Thr Ile Gln Ala Gln Ile
180 185 190
Ile Glu Leu Leu Leu Glu Leu Gln Gln Lys Glu Asn Met Ala Leu Val
195 200 205
Leu Ile Thr His Asp Leu Ala Leu Val Ala Glu Ala Ala His Lys Ile
210 215 220
Ile Val Met Tyr Ala Gly Gln Val Val Glu Thr Gly Asp Ala His Ala
225 230 235 240
Ile Phe His Ala Pro Arg His Pro Tyr Thr Gln Ala Leu Leu Arg Ala
245 250 255
Leu Pro Glu Phe Ala Gln Asp Lys Glu Arg Leu Ala Ser Leu Pro Gly
260 265 270
Val Val Pro Gly Lys Tyr Asp Arg Pro Asn Gly Cys Leu Leu Asn Pro
275 280 285
Arg Cys Pro Tyr Ala Thr Asp Arg Cys Arg Ala Glu Glu Pro Ala Leu
290 295 300
Asn Met Leu Ala Asp Gly Arg Gln Ser Lys Cys His Tyr Pro Leu Asp
305 310 315 320
Asp Ala Gly Arg Pro Thr Leu
325
<210>63
<211>334
<212>PRT
<213>大肠杆菌
<400>63
Met Ser Thr Gln Glu Ala Thr Leu Gln Gln Pro Leu Leu Gln Ala Ile
1 5 10 15
Asp Leu Lys Lys His Tyr Pro Val Lys Lys Gly Met Phe Ala Pro Glu
20 25 30
Arg Leu Val Lys Ala Leu Asp Gly Val Ser Phe Asn Leu Glu Arg Gly
35 40 45
Lys Thr Leu Ala Val Val Gly Glu Ser Gly Cys Gly Lys Ser Thr Leu
50 55 60
Gly Arg Leu Leu Thr Met Ile Glu Met Pro Thr Gly Gly Glu Leu Tyr
65 70 75 80
Tyr Gln Gly Gln Asp Leu Leu Lys His Asp Pro Gln Ala Gln Lys Leu
85 90 95
Arg Arg Gln Lys Ile Gln Ile Val Phe Gln Asn Pro Tyr Gly Ser Leu
100 105 110
Asn Pro Arg Lys Lys Val Gly Gln Ile Leu Glu Glu Pro Leu Leu Ile
115 120 125
Asn Thr Ser Leu Ser Lys Glu Gln Arg Arg Glu Lys Ala Leu Ser Met
130 135 140
Met Ala Lys Val Gly Leu Lys Thr Glu His Tyr Asp Arg Tyr Pro His
145 150 155 160
Met Phe Ser Gly Gly Gln Arg Gln Arg Ile Ala Ile Ala Arg Gly Leu
165 170 175
Met Leu Asp Pro Asp Val Val Ile Ala Asp Glu Pro Val Ser Ala Leu
180 185 190
Asp Val Ser Val Arg Ala Gln Val Leu Asn Leu Met Met Asp Leu Gln
195 200 205
Gln Glu Leu Gly Leu Ser Tyr Val Phe Ile Ser His Asp Leu Ser Val
210 215 220
Val Glu His Ile Ala Asp Glu Val Met Val Met Tyr Leu Gly Arg Cys
225 230 235 240
Val Glu Lys Gly Thr Lys Asp Gln Ile Phe Asn Asn Pro Arg His Pro
245 250 255
Tyr Thr Gln Ala Leu Leu Ser Ala Thr Pro Ara Leu Asn Pro Asp Asp
260 265 270
Arg Arg Glu Arg Ile Lys Leu Ser Gly Glu Leu Pro Ser Pro Leu Asn
275 280 285
Pro Pro Pro Gly Cys Ala Phe Asn Ala Arg Cys Arg Arg Arg Phe Gly
290 295 300
Pro Cys Thr Gln Leu Gln Pro Gln Leu Lys Asp Tyr Gly Gly Gln Leu
305 310 315 320
Val Ala Cys Phe Ala Val Asp Gln Asp Glu Asn Pro Gln Arg
325 330
<210>64
<211>34
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>64
gaagttccta tactttctag agaataggaa cttc 34
<210>65
<211>1509
<212>DNA
<213>大肠杆菌
<400>65
atg gag ttt agt gta aaa agc ggt agc ccg gag aaa cag cgg agt gcc 48
Met Glu Phe Ser Val Lys Ser Gly Ser Pro Glu Lys Gln Arg Ser Ala
1 5 10 15
tgc atc gtc gtg ggc gtc ttc gaa cca cgt cgc ctt tct ccg att gca 96
Cys Ile Val Val Gly Val Phe Glu Pro Arg Arg Leu Ser Pro Ile Ala
20 25 30
gaa cag ctc gat aaa atc agc gat ggg tac atc agc gcc ctg cta cgt 144
Glu Gln Leu Asp Lys Ile Ser Asp Gly Tyr Ile Ser Ala Leu Leu Arg
35 40 45
cgg ggc gaa ctg gaa gga aaa ccg ggg cag aca ttg ttg ctg cac cat 192
Arg Gly Glu Leu Glu Gly Lys Pro Gly Gln Thr Leu Leu Leu His His
50 55 60
gtt ccg aat gta ctt tcc gag cga att ctc ctt att ggt tgc ggc aaa 240
Val Pro Asn Val Leu Ser Glu Arg Ile Leu Leu Ile Gly Cys Gly Lys
65 70 75 80
gaa cgt gag ctg gat gag cgt cag tac aag cag gtt att cag aaa acc 288
Glu Arg Glu Leu Asp Glu Arg Gln Tyr Lys Gln Val Ile Gln Lys Thr
85 90 95
att aat acg ctg aat gat act ggc tca atg gaa gcg gtc tgc ttt ctg 336
Ile Asn Thr Leu Asn Asp Thr Gly Ser Met Glu Ala Val Cys Phe Leu
100 105 110
act gag ctg cac gtt aaa ggc cgt aac aac tac tgg aaa gtg cgt cag 384
Thr Glu Leu His Val Lys Gly Arg Asn Asn Tyr Trp Lys Val Arg Gln
115 120 125
gct gtc gag acg gca aaa gag acg ctc tac agt ttc gat cag ctg aaa 432
Ala Val Glu Thr Ala Lys Glu Thr Leu Tyr Ser Phe Asp Gln Leu Lys
130 135 140
acg aac aag agc gaa ccg cgt cgt ccg ctg cgt aag atg gtg ttc aac 480
Thr Asn Lys Ser Glu Pro Arg Arg Pro Leu Arg Lys Met Val Phe Asn
145 150 155 160
gtg ccg acc cgc cgt gaa ctg acc agc ggt gag cgc gcg atc cag cac 528
Val Pro Thr Arg Arg Glu Leu Thr Ser Gly Glu Arg Ala Ile Gln His
165 170 175
ggt ctg gcg att gcc gcc ggg att aaa gca gca aaa gat ctc ggc aat 576
Gly Leu Ala Ile Ala Ala Gly Ile Lys Ala Ala Lys Asp Leu Gly Asn
180 185 190
atg ccg ccg aat atc tgt aac gcc gct tac ctc gct tca caa gcg cgc 624
Met Pro Pro Asn Ile Cys Asn Ala Ala Tyr Leu Ala Ser Gln Ala Arg
195 200 205
cag ctg gct gac agc tac agc aag aat gtc atc acc cgc gtt atc ggc 672
Gln Leu Ala Asp Ser Tyr Ser Lys Asn Val Ile Thr Arg Val Ile Gly
210 215 220
gaa cag cag atg aaa gag ctg ggg atg cat tcc tat ctg gcg gtc ggt 720
Glu Gln Gln Met Lys Glu Leu Gly Met His Ser Tyr Leu Ala Val Gly
225 230 235 240
cag ggt tcg caa aac gaa tcg ctg atg tcg gtg att gag tac aaa ggc 768
Gln Gly Ser Gln Asn Glu Ser Leu Met Ser Val Ile Glu Tyr Lys Gly
245 250 255
aac gcg tcg gaa gat gca cgc cca atc gtg ctg gtg ggt aaa ggt tta 816
Asn Ala Scr Glu Asp Ala Arg Pro Ile Val Leu Val Gly Lys Gly Leu
260 265 270
acc ttc gac tcc ggc ggt atc tcg atc aag cct tca gaa ggc atg gat 864
Thr Phe Asp Ser Gly Gly Ile Ser Ile Lys Pro Ser Glu Gly Met Asp
275 280 285
gag atg aag tac gat atg tgc ggt gcg gca gcg gtt tac ggc gtg atg 912
Glu Met Lys Tyr Asp Met Cys Gly Ala Ala Ala Val Tyr Gly Val Met
290 295 300
cgg atg gtc gcg gag cta caa ctg ccg att aac gtt atc ggc gtg ttg 960
Arg Met Val Ala Glu Leu Gln Leu Pro Ile Asn Val Ile Gly Val Leu
305 310 315 320
gca ggc tgc gaa aac atg cct ggc gga cga gcc tat cgt ccg ggc gat 1008
Ala Gly Cys Glu Asn Met Pro Gly Gly Arg Ala Tyr Arg Pro Gly Asp
325 330 335
gtg tta acc acc atg tcc ggt caa acc gtt gaa gtg ctg aac acc gac 1056
Val Leu Thr Thr Met Ser Gly Gln Thr Val Glu Val Leu Asn Thr Asp
340 345 350
gct gaa ggc cgc ctg gta ctg tgc gac gtg tta act tac gtt gag cgt 1104
Ala Glu Gly Arg Leu Val Leu Cys Asp Val Leu Thr Tyr Val Glu Arg
355 360 365
ttt gag ccg gaa gcg gtg att gac gtg gcg acg ctg acc ggt gcc tgc 1152
Phe Glu Pro Glu Ala Val Ile Asp Val Ala Thr Leu Thr Gly Ala Cys
370 375 380
gtg atc gcg ctg ggt cat cat att act ggt ctg atg gcg aac cat aat 1200
Val Ile Ala Leu Gly His His Ile Thr Gly Leu Met Ala Asn His Asn
385 390 395 400
ccg ctg gcc cat gaa ctg att gcc gcg tct gaa caa tcc ggt gac cgc 1248
Pro Leu Ala His Glu Leu Ile Ala Ala Ser Glu Gln Ser Gly Asp Arg
405 410 415
gca tgg cgc tta ccg ctg ggt gac gag tat cag gaa caa ctg gag tcc 1296
Ala Trp Arg Leu Pro Leu Gly Asp Glu Tyr Gln Glu Gln Leu Glu Ser
420 425 430
aat ttt gcc gat atg gcg aac att ggc ggt cgt cct ggt ggg gcg att 1344
Asn Phe Ala Asp Met Ala Asn Ile Gly Gly Arg Pro Gly Gly Ala Ile
435 440 445
acc gca ggt tgc ttc ctg tca cgc ttt acc cgt aag tac aac tgg gcg 1392
Thr Ala Gly Cys Phe Leu Ser Arg Phe Thr Arg Lys Tyr Asn Trp Ala
450 455 460
cac ctg gat atc gcc ggt acc gcc tgg cgt tct ggt aaa gca aaa ggc 1440
His Leu Asp Ile Ala Gly Thr Ala Trp Arg Ser Gly Lys Ala Lys Gly
465 470 475 480
gcc acc ggt cgt ccg gta gcg ttg ctg gca cag ttc ctg tta aac cgc 1488
Ala Thr Gly Arg Pro Val Ala Leu Leu Ala Gln Phe Leu Leu Asn Arg
485 490 495
gct ggg ttt aac ggc gaa gag 1509
Ala Gly Phe Asn Gly Glu Glu
500
<210>66
<211>1281
<212>DNA
<213>大肠杆菌
<400>66
atg aca gaa gcg atg aag att acc ctc tct acc caa cct gcc gac gcg 48
Met Thr Glu Ala Met Lys Ile Thr Leu Ser Thr Gln Pro Ala Asp Ala
1 5 10 15
cgc tgg gga gaa aaa gca act tac agc att aat aat gac ggc att acc 96
Arg Trp Gly Glu Lys Ala Thr Tyr Ser Ile Asn Asn Asp Gly Ile Thr
20 25 30
ctg cat ttg aac ggg gca gac gat ctg ggg ctg atc cag cgt gcg gcg 144
Leu His Leu Asn Gly Ala Asp Asp Leu Gly Leu Ile Gln Arg Ala Ala
35 40 45
cgc aag att gac ggt ctg ggc atc aag cat gtt cag tta agc ggt gaa 192
Arg Lys Ile Asp Gly Leu Gly Ile Lys His Val Gln Leu Ser Gly Glu
50 55 60
ggc tgg gat gcg gat cgc tgc tgg gca ttc tgg caa ggt tac aaa gcc 240
Gly Trp Asp Ala Asp Arg Cys Trp Ala Phe Trp Gln Gly Tyr Lys Ala
65 70 75 80
ccg aaa ggc acg cgt aaa gtg gtg tgg ccg gat ctg gac gat gcc cag 288
Pro Lys Gly Thr Arg Lys Val Val Trp Pro Asp Leu Asp Asp Ala Gln
85 90 95
cgc cag gaa ctg gat aac cgc ctg atg atc atc gac tgg gtg cgt gac 336
Arg Gln Glu Leu Asp Asn Arg Leu Met Ile Ile Asp Trp Val Arg Asp
100 105 110
acc atc aac gca ccg gca gaa gaa ttg gga cca tcg caa ctg gca cag 384
Thr Ile Asn Ala Pro Ala Glu Glu Leu Gly Pro Ser Gln Leu Ala Gln
115 120 125
cgt gct gtt gat ctg atc agc aac gtc gcg ggc gat cgt gtg act tat 432
Arg Ala Val Asp Leu Ile Ser Asn Val Ala Gly Asp Arg Val Thr Tyr
130 135 140
cgg atc acc aaa ggc gaa gat ctg cgt gag caa ggt tat atg ggg ctg 480
Arg Ile Thr Lys Gly Glu Asp Leu Arg Glu Gln Gly Tyr Met Gly Leu
145 150 155 160
cac aca gtc gga cgc ggt tca gaa cgt tct ccg gta ttg ctg gcg ctg 528
His Thr Val Gly Arg Gly Ser Glu Arg Ser Pro Val Leu Leu Ala Leu
165 170 175
gat tac aac cca act ggc gat aaa gaa gcg cca gtg tac gcg tgc ctg 576
Asp Tyr Asn Pro Thr Gly Asp Lys Glu Ala Pro Val Tyr Ala Cys Leu
180 185 190
gta ggt aaa ggt atc act ttt gac tcc ggc ggc tac agc atc aaa cag 624
Val Gly Lys Gly Ile Thr Phe Asp Ser Gly Gly Tyr Ser Ile Lys Gln
195 200 205
act gcg ttt atg gac tcg atg aag tcg gac atg ggc ggc gcg gca acg 672
Thr Ala Phe Met Asp Ser Met Lys Ser Asp Met Gly Gly Ala Ala Thr
210 215 220
gtt acc ggg gcg ctg gca ttt gcc att acg cgc gga ctg aac aag cgc 720
Val Thr Gly Ala Leu Ala Phe Ala Ile Thr Arg Gly Leu Asn Lys Arg
225 230 235 240
gtg aag ctg ttc ctc tgc tgt gcg gat aac ctg att agc ggc aat gcg 768
Val Lys Leu Phe Leu Cys Cys Ala Asp Asn Leu Ile Ser Gly Asn Ala
245 250 255
ttc aag ctg ggc gat atc atc acc tat cgc aac ggt aaa aaa gtt gaa 816
Phe Lys Leu Gly Asp Ile Ile Thr Tyr Arg Asn Gly Lys Lys Val Glu
260 265 270
gtg atg aac act gat gcc gaa ggg cgt ctg gtg ctt gcc gat ggt ctg 864
Val Met Asn Thr Asp Ala Glu Gly Arg Leu Val Leu Ala Asp Gly Leu
275 280 285
att gat gcc agt gcg cag aaa ccg gaa atg atc att gat gcg gcg acc 912
Ile Asp Ala Ser Ala Gln Lys Pro Glu Met Ile Ile Asp Ala Ala Thr
290 295 300
ctc acc ggg gcg gcg aaa act gcg ctg ggt aat gat tat cac gcg ctg 960
Leu Thr Gly Ala Ala Lys Thr Ala Leu Gly Asn Asp Tyr His Ala Leu
305 310 315 320
ttc agt ttt gac gat gcg ctg gcc ggt cgc ttg ctg gcg agt gcc gcg 1008
Phe Ser Phe Asp Asp Ala Leu Ala Gly Arg Leu Leu Ala Ser Ala Ala
325 330 335
cag gag aac gaa ccg ttc tgg cgt ctg ccg ctg gcg gag ttc cac cgc 1056
Gln Glu Asn Glu Pro Phe Trp Arg Leu Pro Leu Ala Glu Phe His Arg
340 345 350
agc cag ctg ccg tct aac ttt gcc gaa ctg aac aat acc gga agc gcg 1104
Ser Gln Leu Pro Ser Asn Phe Ala Glu Leu Asn Asn Thr Gly Ser Ala
355 360 365
gcg tat ccg gca ggc gcg agc acg gcg gcg ggc ttc ctg tcg cac ttt 1152
Ala Tyr Pro Ala Gly Ala Ser Thr Ala Ala Gly Phe Leu Ser His Phe
370 375 380
gtt gag aac tat cag caa ggc tgg ctg cat atc gac tgc tcg gcg act 1200
Val Glu Asn Tyr Gln Gln Gly Trp Leu His Ile Asp Cys Ser Ala Thr
385 390 395 400
tac cgt aaa gcg ccg gtt gaa cag tgg tct gcg ggc gct acg gga ctt 1248
Tyr Arg Lys Ala Pro Val Glu Gln Trp Ser Ala Gly Ala Thr Gly Leu
405 410 415
ggt gtg cgc acg ata gct aat ctg tta acg gcg 1281
Gly Val Arg Thr Ile Ala Asn Leu Leu Thr Ala
420 425
<210>67
<211>1455
<212>DNA
<213>大肠杆菌
<400>67
gtg tct gaa ctg tct caa tta tct cca cag ccg ctg tgg gat att ttt 48
Val Ser Glu Leu Ser Gln Leu Ser Pro Gln Pro Leu Trp Asp Ile Phe
1 5 10 15
gcc aaa atc tgt tct att cct cac ccg tcc tat cat gaa gag caa ctc 96
Ala Lys Ile Cys Ser Ile Pro His Pro Ser Tyr His Glu Glu Gln Leu
20 25 30
gct gaa tac att gtt ggt tgg gca aaa gag aaa ggt ttc cat gtc gaa 144
Ala Glu Tyr Ile Val Gly Trp Ala Lys Glu Lys Gly Phe His Val Glu
35 40 45
cgc gat cag gta ggt aat atc ctg att cgt aaa cct gct acc gca ggt 192
Arg Asp Gln Val Gly Asn Ile Leu Ile Arg Lys Pro Ala Thr Ala Gly
50 55 60
atg gaa aat cgt aaa ccg gtc gtc tta cag gcc cac ctc gat atg gtg 240
Met Glu Asn Arg Lys Pro Val Val Leu Gln Ala His Leu Asp Met Val
65 70 75 80
ccg cag aaa aat aac gac acc gtg cat gac ttc acg aaa gat cct atc 288
Pro Gln Lys Asn Asn Asp Thr Val His Asp Phe Thr Lys Asp Pro Ilc
85 90 95
cag cct tat att gat ggc gaa tgg gtt aaa gcg cgc ggc acc acg ctg 336
Gln Pro Tyr Ile Asp Gly Glu Trp Val Lys Ala Arg Gly Thr Thr Leu
100 105 110
ggt gcg gat aac ggc att ggt atg gcc tct gcg ctg gcg gtt ctg gct 384
Gly Ala Asp Asn Gly Ile Gly Met Ala Ser Ala Leu Ala Val Leu Ala
115 120 125
gac gaa aac gtg gtt cac ggc ccg ctg gaa gtg ctg ctg acc atg acc 432
Asp Glu Asn Val Val His Gly Pro Leu Glu Val Leu Leu Thr Met Thr
130 135 140
gaa gaa gcc ggt atg gac ggt gcg ttc ggc tta cag ggc aac tgg ttg 480
Glu Glu Ala Gly Met Asp Gly Ala Phe Gly Leu Gln Gly Asn Trp Leu
145 150 155 160
cag gct gat att ctg att aac acc gac tcc gaa gaa gaa ggt gaa atc 528
Gln Ala Asp Ile Leu Ile Asn Thr Asp Ser Glu Glu Glu Gly Glu Ile
165 170 175
tac atg ggt tgt gcg ggg ggt atc gac ttc acc tcc aac ctg cat tta 576
Tyr Met Gly Cys Ala Gly Gly Ile Asp Phe Thr Ser Asn Leu His Leu
180 185 190
gat cgt gaa gcg gtt cca gct ggt ttt gaa acc ttc aag tta acc tta 624
Asp Arg Glu Ala Val Pro Ala Gly Phe Glu Thr Phe Lys Leu Thr Leu
195 200 205
aaa ggt ctg aaa ggc ggt cac tcc ggc ggg gaa atc cac gtt ggg ctg 672
Lys Gly Leu Lys Gly Gly His Ser Gly Gly Glu Ile His Val Gly Leu
210 215 220
ggt aat gcc aac aaa ctg ctg gtg cgc ttc ctg gcg ggt cat gcg gaa 720
Gly Asn Ala Asn Lys Leu Leu Val Arg Phe Leu Ala Gly His Ala Glu
225 230 235 240
gaa ctg gat ctg cgc ctt atc gat ttc aac ggc ggc aca ctg cgt aac 768
Glu Leu Asp Leu Arg Leu Ile Asp Phe Asn Gly Gly Thr Leu Arg Asn
245 250 255
gcc atc ccg cgt gaa gcc ttt gcg acc att gct gtc gca gct gat aaa 816
Ala Ile Pro Arg Glu Ala Phe Ala Thr Ile Ala Val Ala Ala Asp Lys
260 265 270
gtc gac gtc ctg aaa tct ctg gtg aat acc tat cag gag atc ctg aaa 864
Val Asp Val Leu Lys Ser Leu Val Asn Thr Tyr Gln Glu Ile Leu Lys
275 280 285
aac gag ctg gca gaa aaa gag aaa aat ctg gcc ttg ttg ctg gac tct 912
Asn Glu Leu Ala Glu Lys Glu Lys Asn Leu Ala Leu Leu Leu Asp Ser
290 295 300
gta gcg aac gat aaa gct gcc ctg att gcg aaa tct cgc gat acc ttt 960
Val Ala Asn Asp Lys Ala Ala Leu Ile Ala Lys Ser Arg Asp Thr Phe
305 310 315 320
att cgt ctg ctg aac gcc acc ccg aac ggt gtg att cgt aac tcc gat 1008
Ile Arg Leu Leu Asn Ala Thr Pro Asn Gly Val Ile Arg Asn Ser Asp
325 330 335
gta gcc aaa ggt gtg gtt gaa acc tcc ctg aac gtc ggt gtg gtg acc 1056
Val Ala Lys Gly Val Val Glu Thr Ser Leu Asn Val Gly Val Val Thr
340 345 350
atg act gac aat aac gta gaa att cac tgc ctg atc cgt tca ctg atc 1104
Met Thr Asp Asn Ash Val Glu Ile His Cys Leu Ile Arg Ser Leu Ile
355 360 365
gac agc ggt aaa gac tac gtg gtg agc atg ctg gat tcg ctg ggt aaa 1152
Asp Ser Gly Lys Asp Tyr Val Val Ser Met Leu Asp Ser Leu Gly Lys
370 375 380
ctg gct ggc gcg aaa acc gaa gcg aaa ggc gca tat cct ggc tgg cag 1200
Leu Ala Gly Ala Lys Thr Glu Ala Lys Gly Ala Tyr Pro Gly Trp Gln
385 390 395 400
ccg gac gct aat tct ccg gtg atg cat ctg gta cgt gaa acc tat cag 1248
Pro Asp Ala Asn Ser Pro Val Met His Leu Val Arg Glu Thr Tyr Gln
405 410 415
cgc ctg ttc aac aag acg ccg aac atc cag att atc cac gcg ggc ctg 1296
Arg Leu Phe Asn Lys Thr Pro Asn Ile Gln Ile Ile His Ala Gly Leu
420 425 430
gaa tgt ggt ctg ttc aaa aaa ccg tat ccg gaa atg gac atg gtt tct 1344
Glu Cys Gly Leu Phe Lys Lys Pro Tyr Pro Glu Met Asp Met Val Ser
435 440 445
atc ggg cca act atc acc ggt cca cac tct ccg gat gag caa gtt cac 1392
Ile Gly Pro Thr Ile Thr Gly Pro His Ser Pro Asp Glu Gln Val His
450 455 460
atc gaa agc gta ggt cat tac tgg aca ctg ctg act gaa ctg ctg aaa 1440
Ile Glu Ser Val Gly His Tyr Trp Thr Leu Leu Thr Glu Leu Leu Lys
465 470 475 480
gaa att ccg gcg aag 1455
Glu Ile Pro Ala Lys
485
<210>68
<211>2610
<212>DNA
<213>大肠杆菌
<400>68
atg act caa cag cca caa gcc aaa tac cgt cac gat tat cgt gcg ccg 48
Met Thr Gln Gln Pro Gln Ala Lys Tyr Arg His Asp Tyr Arg Ala Pro
1 5 10 15
gat tac cag att act gat att gac ttg acc ttt gac ctc gac gcg caa 96
Asp Tyr Gln Ile Thr Asp Ile Asp Leu Thr Phe Asp Leu Asp Ala Gln
20 25 30
aag acg gtc gtt acc gcg gtc agc cag gct gtc cgt cat ggt gca tca 144
Lys Thr Val Val Thr Ala Val Ser Gln Ala Val Arg His Gly Ala Ser
35 40 45
gat gct ccc ctt cgt ctc aac ggc gaa gac ctc aaa ctg gtt tct gtt 192
Asp Ala Pro Leu Arg Leu Asn Gly Glu Asp Leu Lys Leu Val Ser Val
50 55 60
cat att aat gat gag ccg tgg acc gcc tgg aaa gaa gaa gag ggc gca 240
His Ile Asn Asp Glu Pro Trp Thr Ala Trp Lys Glu Glu Glu Gly Ala
65 70 75 80
ctg gtt atc agt aat ttg ccg gag cgt ttt acg ctt aag atc att aat 288
Leu Val Ile Ser Asn Leu Pro Glu Arg Phe Thr Leu Lys Ile Ile Asn
85 90 95
gaa ata agc ccg gcg gcg aat acc gcg ctg gaa ggg ctt tat cag tca 336
Glu Ile Ser Pro Ala Ala Asn Thr Ala Leu Glu Gly Leu Tyr Gln Ser
100 105 110
ggc gat gcg ctt tgc acc cag tgt gaa gcc gaa ggt ttc cgc cat att 384
Gly Asp Ala Leu Cys Thr Gln Cys Glu Ala Glu Gly Phe Arg His Ile
115 120 125
acg tat tat ctc gac cgc ccg gac gtg ctg gcg cgt ttt acc acc aaa 432
Thr Tyr Tyr Leu Asp Arg Pro Asp Val Leu Ala Arg Phe Thr Thr Lys
130 135 140
att att gcc gat aaa atc aaa tat ccc ttc ctg ctt tcc aat ggt aac 480
Ile Ile Ala Asp Lys Ile Lys Tyr Pro Phe Leu Leu Ser Asn Gly Asn
145 150 155 160
cgc gtt gcg caa ggc gaa ctg gaa aac gga cgc cat tgg gta cag tgg 528
Arg Val Ala Gln Gly Glu Leu Glu Asn Gly Arg His Trp Val Gln Trp
165 170 175
cag gac ccg ttc ccg aaa ccg tgc tac ctg ttt gcg ctg gtg gca ggc 576
Gln Asp Pro Phe Pro Lys Pro Cys Tyr Leu Phe Ala Leu Val Ala Gly
180 185 190
gac ttt gat gta ctg cgc gat acc ttt acc acg cgt tct ggt cgc gaa 624
Asp Phe Asp Val Leu Arg Asp Thr Phe Thr Thr Arg Ser Gly Arg Glu
195 200 205
gta gca ctg gag ctg tac gtc gat cgc ggc aac ctt gat cgc gcg ccg 672
Val Ala Leu Glu Leu Tyr Val Asp Arg Gly Asn Leu Asp Arg Ala Pro
210 215 220
tgg gcg atg acc tcg ctg aaa aac tcc atg aaa tgg gat gaa gaa cgc 720
Trp Ala Met Thr Ser Leu Lys Asn Ser Met Lys Trp Asp Glu Glu Arg
225 230 235 240
ttt ggc ctg gag tat gac ctc gac atc tat atg atc gtc gcg gtg gat 768
Phe Gly Leu Glu Tyr Asp Leu Asp Ile Tyr Met Ile Val Ala Val Asp
245 250 255
ttc ttc aat atg ggc gca atg gag aat aag ggg ctg aat atc ttt aac 816
Phe Phe Asn Met Gly Ala Met Glu Asn Lys Gly Leu Asn Ile Phe Asn
260 265 270
tcc aaa tat gtg ctg gcc cgc acc gac acc gcc acc gac aaa gat tac 864
Ser Lys Tyr Val Leu Ala Arg Thr Asp Thr Ala Thr Asp Lys Asp Tyr
275 280 285
ctc gat att gaa cgc gtt atc ggc cat gaa tat ttc cat aac tgg acc 912
Leu Asp Ile Glu Arg Val Ile Gly His Glu Tyr Phe His Asn Trp Thr
290 295 300
ggt aac cga gtg acc tgt cgc gac tgg ttc cag ctc agc ctg aaa gaa 960
Gly Asn Arg Val Thr Cys Arg Asp Trp Phe Gln Leu Ser Leu Lys Glu
305 310 315 320
ggt tta acc gtc ttc cgc gat cag gag ttc agc tct gac ctt ggt tcc 1008
Gly Leu Thr Val Phe Arg Asp Gln Glu Phe Ser Ser Asp Leu Gly Ser
325 330 335
cgc gca gtt aac cgc atc aat aat gta cgc acc atg cgc gga ttg cag 1056
Arg Ala Val Asn Arg Ile Asn Asn Val Arg Thr Met Arg Gly Leu Gln
340 345 350
ttt gca gaa gac gcc agc ccg atg gcg cac ccg atc cgc ccg gat atg 1104
Phe Ala Glu Asp Ala Ser Pro Met Ala His Pro Ile Arg Pro Asp Met
355 360 365
gtc att gag atg aac aac ttc tac acc ctg acc gtt tac gag aag ggc 1152
Val Ile Glu Met Asn Asn Phe Tyr Thr Leu Thr Val Tyr Glu Lys Gly
370 375 380
gcg gaa gtg att cgc atg atc cac acc ctg ctt ggc gaa gaa aac ttc 1200
Ala Glu Val Ile Arg Met Ile His Thr Leu Leu Gly Glu Glu Asn Phe
385 390 395 400
cag aaa ggg atg cag ctt tat ttc gag cgt cat gat ggt agt gca gcg 1248
Gln Lys Gly Met Gln Leu Tyr Phe Glu Arg His Asp Gly Ser Ala Ala
405 410 415
acc tgt gac gac ttt gtg cag gcg atg gaa gat gcg tcg aat gtc gat 1296
Thr Cys Asp Asp Phe Val Gln Ala Met Glu Asp Ala Ser Asn Val Asp
420 425 430
ctc tcc cat ttc cgc cgt tgg tac agc cag tcc ggt aca ccg att gtg 1344
Leu Ser His Phe Arg Arg Trp Tyr Ser Gln Ser Gly Thr Pro Ile Val
435 440 445
acc gtc aaa gac gac tac aat ccg gaa acc gag cag tac acc ctg acc 1392
Thr Val Lys Asp Asp Tyr Asn Pro Glu Thr Glu Gln Tyr Thr Leu Thr
450 455 460
atc agc cag cgc acg cca gcc acg ccg gat cag gca gaa aaa cag ccg 1440
Ile Ser Gln Arg Thr Pro Ala Thr Pro Asp Gln Ala Glu Lys Gln Pro
465 470 475 480
ctg cat att ccg ttt gcc atc gaa ctg tat gat aac gaa ggc aaa gtg 1488
Leu His Ile Pro Phe Ala Ile Glu Leu Tyr Asp Asn Glu Gly Lys Val
485 490 495
atc ccg ttg cag aaa ggc ggt cat ccg gtg aat tcc gtg ctg aac gtc 1536
Ile Pro Leu Gln Lys Gly Gly His Pro Val Asn Ser Val Leu Asn Val
500 505 510
act cag gcg gaa cag acc ttt gtc ttt gat aat gtc tac ttc cag ccg 1584
Thr Gln Ala Glu Gln Thr Phe Val Phe Asp Asn Val Tyr Phe Gln Pro
515 520 525
gtg cct gcg ctg ctg tgc gaa ttc tct gcg cca gtg aaa ctg gaa tat 1632
Val Pro Ala Leu Leu Cys Glu Phe Ser Ala Pro Val Lys Leu Glu Tyr
530 535 540
aag tgg agc gat cag caa ctg acc ttc ctg atg cgt cat gcg cgt aat 1680
Lys Trp Ser Asp Gln Gln Leu Thr Phe Leu Met Arg His Ala Arg Asn
545 550 555 560
gat ttc tcc cgc tgg gat gcg gcg caa agt ttg ctg gca acc tac atc 1728
Asp Phe Ser Arg Trp Asp Ala Ala Gln Ser Leu Leu Ala Thr Tyr Ile
565 570 575
aag ctg aac gtc gcg cgt cat cag caa ggt cag ccg ctg tct ctg ccg 1776
Lys Leu Asn Val Ala Arg His Gln Gln Gly Gln Pro Leu Ser Leu Pro
580 585 590
gtg cat gtg gct gat gct ttc cgc gcg gta ctg ctt gat gag aag att 1824
Val His Val Ala Asp Ala Phe Arg Ala Val Leu Leu Asp Glu Lys Ile
595 600 605
gat cca gcg ctg gcg gca gaa atc ctg acg ctg cct tct gtc aat gaa 1872
Asp Pro Ala Leu Ala Ala Glu Ile Leu Thr Leu Pro Ser Val Asn Glu
610 615 620
atg gct gaa ttg ttc gat atc atc gac ccg att gct att gcc gaa gta 1920
Met Ala Glu Leu Phe Asp Ile Ile Asp Pro Ile Ala Ile Ala Glu Val
625 630 635 640
cgc gaa gca ctc act cgt act ctg gcg act gaa ctg gcg gat gag cta 1968
Arg Glu Ala Leu Thr Arg Thr Leu Ala Thr Glu Leu Ala Asp Glu Leu
645 650 655
ctg gct att tac aac gcg aat tac cag agc gag tac cgt gtt gag cat 2016
Leu Ala Ile Tyr Asn Ala Asn Tyr Gln Ser Glu Tyr Arg Val Glu His
660 665 670
gaa gat att gca aaa cgc act ctg cgt aat gcc tgc ctg cgt ttc ctc 2064
Glu Asp Ile Ala Lys Arg Thr Leu Arg Asn Ala Cys Leu Arg Phe Leu
675 680 685
gct ttt ggt gaa acg cat ctg gct gat gtg ctg gtg agc aag cag ttc 2112
Ala Phe Gly Glu Thr His Leu Ala Asp Val Leu Val Ser Lys Gln Phe
690 695 700
cac gaa gca aac aat atg act gat gcg ctg gcg gcg ctt tct gcg gcg 2160
His Glu Ala Asn Asn Met Thr Asp Ala Leu Ala Ala Leu Ser Ala Ala
705 710 715 720
gtt gcc gca cag ctg cct tgc cgt gac gcg ctg atg cag gag tac gac 2208
Val Ala Ala Gln Leu Pro Cys Arg Asp Ala Leu Met Gln Glu Tyr Asp
725 730 735
gac aag tgg cat cag aac ggt ctg gtg atg gat aaa tgg ttt atc ctg 2256
Asp Lys Trp His Gln Asn Gly Leu Val Met Asp Lys Trp Phe Ile Leu
740 745 750
caa gcc acc agc ccg gcg gcg aat gtg ctg gag acg gtg cgc ggc ctg 2304
Gln Ala Thr Ser Pro Ala Ala Asn Val Leu Glu Thr Val Arg Gly Leu
755 760 765
ttg cag cat cgc tca ttt acc atg agc aac ccg aac cgt att cgt tcg 2352
Leu Gln His Arg Ser Phe Thr Met Ser Asn Pro Asn Arg Ile Arg Ser
770 775 780
ttg att ggc gcg ttt gcg ggc agc aat ccg gca gcg ttc cat gcc gaa 2400
Leu Ile Gly Ala Phe Ala Gly Ser Asn Pro Ala Ala Phe His Ala Glu
785 790 795 800
gat ggc agc ggt tac ctg ttc ctg gtg gaa atg ctt acc gac ctc aac 2448
Asp Gly Ser Gly Tyr Leu Phe Leu Val Glu Met Leu Thr Asp Leu Asn
805 810 815
agc cgt aac ccg cag gtg gct tca cgt ctg att gaa ccg ctg att cgc 2496
Ser Arg Asn Pro Gln Val Ala Ser Arg Leu Ile Glu Pro Leu Ile Arg
820 825 830
ctg aaa cgt tac gat gcc aaa cgt cag gag aaa atg cgc gcg gcg ctg 2544
Leu Lys Arg Tyr Asp Ala Lys Arg Gln Glu Lys Met Arg Ala Ala Leu
835 840 845
gaa cag ttg aaa ggg ctg gaa aat ctc tct ggc gat ctg tac gag aag 2592
Glu Gln Leu Lys Gly Leu Glu Asn Leu Ser Gly Asp Leu Tyr Glu Lys
850 855 860
ata act aaa gca ctg gct 2610
Ile Thr Lys Ala Leu Ala
865 870
<210>69
<211>1605
<212>DNA
<213>大肠杆菌
<400>69
atg cgt att tcc ttg aaa aag tca ggg atg ctg aag ctt ggt ctc agc 48
Met Arg Ile Ser Leu Lys Lys Ser Gly Met Leu Lys Leu Gly Leu Ser
1 5 10 15
ctg gtg gct atg acc gtc gca gca agt gtt cag gct aaa act ctg gtt 96
Leu Val Ala Met Thr Val Ala Ala Ser Val Gln Ala Lys Thr Leu Val
20 25 30
tat tgc tca gaa gga tct ccg gaa ggg ttt aac ccg cag ctg ttt acc 144
Tyr Cys Ser Glu Gly Ser Pro Glu Gly Phe Ash Pro Gln Leu Phe Thr
35 40 45
tcc ggc acc acc tat gac gcc tct tcc gtc ccg ctt tat aac cgt ctg 192
Ser Gly Thr Thr Tyr Asp Ala Ser Ser Val Pro Leu Tyr Asn Arg Leu
50 55 60
gtt gaa ttt aaa atc ggc acc acc gaa gtg atc ccg ggc ctc gct gaa 240
Val Glu Phe Lys Ile Gly Thr Thr Glu Val Ile Pro Gly Leu Ala Glu
65 70 75 80
aag tgg gaa gtc agc gaa gac ggt aaa acc tat acc ttc cat ctg cgt 288
Lys Trp Glu Val Ser Glu Asp Gly Lys Thr Tyr Thr Phe His Leu Arg
85 90 95
aaa ggt gtg aag tgg cac gac aat aaa gaa ttc aaa ccg acg cgt gaa 336
Lys Gly Val Lys Trp His Asp Asn Lys Glu Phe Lys Pro Thr Arg Glu
100 105 110
ctg aac gcc gat gat gtg gtg ttc tcg ttc gat cgt cag aaa aac gcg 384
Leu Asn Ala Asp Asp Val Val Phe Ser Phe Asp Arg Gln Lys Asn Ala
115 120 125
caa aac ccg tac cat aaa gtt tct ggc ggc agc tac gaa tac ttc gaa 432
Gln Asn Pro Tyr His Lys Val Ser Gly Gly Ser Tyr Glu Tyr Phe Glu
130 135 140
ggc atg ggc ttg cca gag ctg atc agt gaa gtg aaa aag gtg gac gac 480
Gly Met Gly Leu Pro Glu Leu Ile Ser Glu Val Lys Lys Val Asp Asp
145 150 155 160
aac acc gtt cag ttt gtg ctg act cgc ccg gaa gcg ccg ttc ctc gct 528
Asn Thr Val Gln Phe Val Leu Thr Arg Pro Glu Ala Pro Phe Leu Ala
165 170 175
gac ctg gca atg gac ttc gcc tct att ctg tca aaa gaa tat gct gat 576
Asp Leu Ala Met Asp Phe Ala Ser Ile Leu Ser Lys Glu Tyr Ala Asp
180 185 190
gcg atg atg aaa gcc ggt aca ccg gaa aaa ctg gac ctc aac cca atc 624
Ala Met Met Lys Ala Gly Thr Pro Glu Lys Leu Asp Leu Asn Pro Ile
195 200 205
gga acc ggt ccg ttc cag tta cag cag tat caa aaa gat tcc cgt atc 672
Gly Thr Gly Pro Phe Gln Leu Gln Gln Tyr Gln Lys Asp Ser Arg Ile
210 215 220
cgc tac aaa gcg ttt gat ggc tac tgg ggc acc aaa ccg cag atc gat 720
Arg Tyr Lys Ala Phe Asp Gly Tyr Trp Gly Thr Lys Pro Gln Ile Asp
225 230 235 240
acg ctg gtt ttc tct att acc cct gac gct tcc gtg cgt tac gcg aaa 768
Thr Leu Val Phe Ser Ile Thr Pro Asp Ala Ser Val Arg Tyr Ala Lys
245 250 255
ttg cag aag aat gaa tgc cag gtg atg ccg tac ccg aac ccg gca gat 816
Leu Gln Lys Asn Glu Cys Gln Val Met Pro Tyr Pro Asn Pro Ala Asp
260 265 270
atc gct cgc atg aag cag gat aaa tcc atc aat ctg atg gaa atg ccg 864
Ile Ala Arg Met Lys Gln Asp Lys Ser Ile Asn Leu Met Glu Met Pro
275 280 285
ggg ctg aac gtc ggt tat ctc tcg tat aac gtg cag aaa aaa cca ctc 912
Gly Leu Asn Val Gly Tyr Leu Ser Tyr Asn Val Gln Lys Lys Pro Leu
290 295 300
gat gac gtg aaa gtt cgc cag gct ctg acc tac gcg gtg aac aaa gac 960
Asp Asp Val Lys Val Arg Gln Ala Leu Thr Tyr Ala Val Asn Lys Asp
305 310 315 320
gcg atc atc aaa gcg gtt tat cag ggc gcg ggc gta tca gcg aaa aac 1008
Ala Ile Ile Lys Ala Val Tyr Gln Gly Ala Gly Val Ser Ala Lys Asn
325 330 335
ctg atc ccg cca acc atg tgg ggc tat aac gac gac gtt cag gac tac 1056
Leu Ile Pro Pro Thr Met Trp Gly Tyr Asn Asp Asp Val Gln Asp Tyr
340 345 350
acc tac gat cct gaa aaa gcg aaa gcc ttg ctg aaa gaa gcg ggt ctg 1104
Thr Tyr Asp Pro Glu Lys Ala Lys Ala Leu Leu Lys Glu Ala Gly Leu
355 360 365
gaa aaa ggt ttc tcc atc gac ctg tgg gcg atg ccg gta caa cgt ccg 1152
Glu Lys Gly Phe Ser Ile Asp Leu Trp Ala Met Pro Val Gln Arg Pro
370 375 380
tat aac ccg aac gct cgc cgc atg gcg gag atg att cag gca gac tgg 1200
Tyr Asn Pro Asn Ala Arg Arg Met Ala Glu Met Ile Gln Ala Asp Trp
385 390 395 400
gcg aaa gtc ggc gtg cag gcc aaa att gtc acc tac gaa tgg ggt gag 1248
Ala Lys Val Gly Val Gln Ala Lys Ile Val Thr Tyr Glu Trp Gly Glu
405 410 415
tac ctc aag cgt gcg aaa gat ggc gag cac cag acg gta atg atg ggc 1296
Tyr Leu Lys Arg Ala Lys Asp Gly Glu His Gln Thr Val Met Met Gly
420 425 430
tgg act ggc gat aac ggg gat ccg gat aac ttc ttc gcc acc ctg ttc 1344
Trp Thr Gly Asp Asn Gly Asp Pro Asp Asn Phe Phe Ala Thr Leu Phe
435 440 445
agc tgc gcc gcc tct gaa caa ggc tcc aac tac tca aaa tgg tgc tac 1392
Ser Cys Ala Ala Ser Glu Gln Gly Ser Asn Tyr Ser Lys Trp Cys Tyr
450 455 460
aaa ccg ttt gaa gat ctg att caa ccg gcg cgt gct acc gac gac cac 1440
Lys Pro Phe Glu Asp Leu Ile Gln Pro Ala Arg Ala Thr Asp Asp His
465 470 475 480
aat aaa cgc gtt gaa ctg tac aaa caa gcg cag gtg gtg atg cac gat 1488
Asn Lys Arg Val Glu Leu Tyr Lys Gln Ala Gln Val Val Met His Asp
485 490 495
cag gct ccg gca ctg atc atc gct cac tcc acc gtg ttt gaa ccg gta 1536
Gln Ala Pro Ala Leu Ile Ile Ala His Ser Thr Val Phe Glu Pro Val
500 505 510
cgt aaa gaa gtt aaa ggc tat gtg gtt gat cca tta ggc aaa cat cac 1584
Arg Lys Glu Val Lys Gly Tyr Val Val Asp Pro Leu Gly Lys His His
515 520 525
ttc gaa aac gtc tct atc gaa 1605
Phe Glu Asn Val Ser Ile Glu
530 535
<210>70
<211>1017
<212>DNA
<213>大肠杆菌
<400>70
atg ttg cag ttt att ctc cga cgt ttg gga ctc gtc atc ccc acg ttt 48
Met Leu Gln Phe Ile Leu Arg Arg Leu Gly Leu Val Ile Pro Thr Phe
1 5 10 15
atc ggt att acc ctt ctc aca ttt gcc ttt gtc cac atg atc ccg ggc 96
Ile Gly Ile Thr Leu Leu Thr Phe Ala Phe Val His Met Ile Pro Gly
20 25 30
gat ccg gtg atg atc atg gcg ggc gaa cgt ggg atc tcc cca gag cgt 144
Asp Pro Val Met Ile Met Ala Gly Glu Arg Gly Ile Ser Pro Glu Arg
35 40 45
cac gcg cag ctg ctg gct gaa ctc ggc tta gat aaa ccg atg tgg cag 192
His Ala Gln Leu Leu Ala Glu Leu Gly Leu Asp Lys Pro Met Trp Gln
50 55 60
cag tat ctc cat tac att tgg ggc gtt atg cat ggc gat cta ggc att 240
Gln Tyr Leu His Tyr Ile Trp Gly Val Met His Gly Asp Leu Gly Ile
65 70 75 80
tca atg aaa agc cgc atc ccg gtt tgg gaa gag ttc gtg ccg cgc ttc 288
Ser Met Lys Ser Arg Ile Pro Val Trp Glu Glu Phe Val Pro Arg Phe
85 90 95
cag gcc acg ctg gaa ctt ggc gtc tgc gcg atg att ttt gct acg gca 336
Gln Ala Thr Leu Glu Leu Gly Val Cys Ala Met Ile Phe Ala Thr Ala
100 105 110
gtc ggt att ccg gtc ggc gtg ctg gct gcg gtt aaa cgc ggt tcc att 384
Val Gly Ile Pro Val Gly Val Leu Ala Ala Val Lys Arg Gly Ser Ile
115 120 125
ttc gat cac aca gcg gtt ggc ctg gcg ctg aca ggt tat tca atg cct 432
Phe Asp His Thr Ala Val Gly Leu Ala Leu Thr Gly Tyr Ser Met Pro
130 135 140
atc ttc tgg tgg ggc atg atg ctg atc atg ctg gtt tcg gtg cac tgg 480
Ile Phe Trp Trp Gly Met Met Leu Ile Met Leu Val Ser Val His Trp
145 150 155 160
aac ctg acg ccc gtc tcc ggt cgc gtg agc gat atg gtg ttc ctc gat 528
Asn Leu Thr Pro Val Ser Gly Arg Val Ser Asp Met Val Phe Leu Asp
165 170 175
gac tcc aat ccg tta acc ggt ttt atg cta atc gac acc gcc atc tgg 576
Asp Ser Asn Pro Leu Thr Gly Phe Met Leu Ile Asp Thr Ala Ile Trp
180 185 190
ggt gaa gac ggc aac ttt atc gat gcc gtc gcc cat atg atc ttg cct 624
Gly Glu Asp Gly Asn Phe Ile Asp Ala Val Ala His Met Ile Leu Pro
195 200 205
gcc att gtg ctg ggt act att ccg ctg gcg gtc att gtg cgt atg aca 672
Ala Ile Val Leu Gly Thr Ile Pro Leu Ala Val Ile Val Arg Met Thr
210 215 220
cgc tcc tcg atg ctg gaa gtg ctg ggc gag gat tac atc cgc acc gcg 720
Arg Ser Ser Met Leu Glu Val Leu Gly Glu Asp Tyr Ile Arg Thr Ala
225 230 235 240
cgc gcc aaa ggg cta acc cgc atg cgg gtg att atc gtc cat gcg ctg 768
Arg Ala Lys Gly Leu Thr Arg Met Arg Val Ile Ile Val His Ala Leu
245 250 255
cgt aac gcg atg ctg ccg gtg gtg acc gtt atc ggc ctg cag gtg gga 816
Arg Asn Ala Met Leu Pro Val Val Thr Val Ile Gly Leu Gln Val Gly
260 265 270
aca ttg ctg gcg ggg gcg att ctg acc gaa acc atc ttc tcg tgg ccc 864
Thr Leu Leu Ala Gly Ala Ile Leu Thr Glu Thr Ile Phe Ser Trp Pro
275 280 285
ggt ctg gga cgc tgg ttg att gac gca ctg caa cgc cgc gac tat ccg 912
Gly Leu Gly Arg Trp Leu Ile Asp Ala Leu Gln Arg Arg Asp Tyr Pro
290 295 300
gta gtg cag ggc ggc gta ttg ctg gtg gcg acg atg att atc ctc gtc 960
Val Val Gln Gly Gly Val Leu Leu Val Ala Thr Met Ile Ile Leu Val
305 310 315 320
aac ttg ctg gtc gat ctg ctg tac ggc gtg gtg aac ccg cgt att cgt 1008
Asn Leu Leu Val Asp Leu Leu Tyr Gly Val Val Asn Pro Arg Ile Arg
325 330 335
cat aag aag 1017
His Lys Lys
<210>71
<211>900
<212>DNA
<213>大肠杆菌
<400>71
atg tca cag gtt act gaa aat aaa gtg att agc gca ccg gtg ccg atg 48
Met Ser Gln Val Thr Glu Asn Lys Val Ile Ser Ala Pro Val Pro Met
1 5 10 15
acc ccg tta cag gag ttc tgg cac tat ttt aaa cgc aac aaa ggc gcg 96
Thr Pro Leu Gln Glu Phe Trp His Tyr Phe Lys Arg Asn Lys Gly Ala
20 25 30
gtc gtc ggg ctg gtt tac gtc gtc atc gtg ctg ttc atc gcg atc ttt 144
Val Val Gly Leu Val Tyr Val Val Ile Val Leu Phe Ile Ala Ile Phe
35 40 45
gcc aac tgg att gca ccc tat aac ccg gcg gaa cag ttc cgc gat gca 192
Ala Asn Trp Ile Ala Pro Pyr Asn Pro Ala Glu Gln Phe Arg Asp Ala
50 55 60
ctg ctc gcc ccg cca gcc tgg cag gaa ggc ggc agc atg gcg cac ttg 240
Leu Leu Ala Pro Pro Ala Trp Gln Glu Gly Gly Ser Met Ala His Leu
65 70 75 80
ctg ggc acc gat gac gta ggc cgt gat gtg ctg tcg cgc ctg atg tac 288
Leu Gly Thr Asp Asp Val Gly Arg Asp Val Leu Ser Arg Leu Met Tyr
85 90 95
ggt gcg cgc ctg tcg ctg ctg gtt ggc tgt ctg gta gtt gtg tta tcg 336
Gly Ala Arg Leu Ser Leu Leu Val Gly Cys Leu Val Val Val Leu Ser
100 105 110
ctg att atg ggc gtt att ctc ggc ctg atc gcc ggt tac ttt ggc ggc 384
Leu Ile Met Gly Val Ile Leu Gly Leu Ile Ala Gly Tyr Phe Gly Gly
115 120 125
ctg gtc gat aac atc att atg cgc gtg gtc gat atc atg ctg gcg ctg 432
Leu Val Asp Asn Ile Ile Met Arg Val Val Asp Ile Met Leu Ala Leu
130 135 140
cca agt ctg ctg ctg gcg ctg gtg ctg gtg gca att ttc ggc ccg tcg 480
Pro Ser Leu Leu Leu Ala Leu Val Leu Val Ala Ile Phe Gly Pro Ser
145 150 155 160
att ggt aac gcc gcg ctg gca ctg acc ttc gtt gcc ttg ccg cac tat 528
Ile Gly Asn Ala Ala Leu Ala Leu Thr Phe Val Ala Leu Pro His Tyr
165 170 175
gtg cgc tta acc cgc gcc gcc gtg ctg gtg gaa gtt aac cgc gat tac 576
Val Arg Leu Thr Arg Ala Ala Val Leu Val Glu Val Asn Arg Asp Tyr
180 185 190
gtc acc gcg tct cgc gtg gcg ggt gcc ggg gcg atg cgt cag atg ttt 624
Val Thr Ala Ser Arg Val Ala Gly Ala Gly Ala Met Arg Gln Met Phe
195 200 205
att aac atc ttc ccg aac tgc ctt gcg ccg ctg att gtt cag gcg tcg 672
Ile Asn Ile Phe Pro Asn Cys Leu Ala Pro Leu Ile Val Gln Ala Ser
210 215 220
ctc ggt ttc tct aac gcc att ctc gat atg gct gct ctt ggt ttc ctc 720
Leu Gly Phe Ser Asn Ala Ile Leu Asp Met Ala Ala Leu Gly Phe Leu
225 230 235 240
ggc atg ggg gca cag ccg cca acg cct gag tgg ggc acc atg ctc tcc 768
Gly Met Gly Ala Gln Pro Pro Thr Pro Glu Trp Gly Thr Met Leu Ser
245 250 255
gac gtg ttg cag ttc gcg caa agc gcc tgg tgg gtc gtg acc ttc ccg 816
Asp Val Leu Gln Phe Ala Gln Ser Ala Trp Trp Val Val Thr Phe Pro
260 265 270
ggt ctg gcg atc ctg ctg acg gtg ctg gca ttt aac ctg atg ggt gac 864
Gly Leu Ala Ile Leu Leu Thr Val Leu Ala Phe Asn Leu Met Gly Asp
275 280 285
ggt ctg cgt gac gcg ctc gat ccc aaa ctg aag cag 900
Gly Leu Arg Asp Ala Leu Asp Pro Lys Leu Lys Gln
290 295 300
<210>72
<211>981
<212>DNA
<213>大肠杆菌
<400>72
atg gcg tta tta aat gta gat aaa tta tcg gtg cat ttc ggc gac gaa 48
Met Ala Leu Leu Asn Val Asp Lys Leu Ser Val His Phe Gly Asp Glu
1 5 10 15
agc gcg ccg ttc cgc gcc gta gac cgc atc agc tac agc gta aaa cag 96
Ser Ala Pro Phe Arg Ala Val Asp Arg Ile Ser Tyr Ser Val Lys Gln
20 25 30
ggc gaa gtg gtc ggg att gtg ggt gag tcc ggc tcc ggt aag tcg gtc 144
Gly Glu Val Val Gly Ile Val Gly Glu Ser Gly Ser Gly Lys Ser Val
35 40 45
agt tca ctg gcg att atg ggg ctg att gat tat ccg ggc cgc gta atg 192
Ser Ser Leu Ala Ile Met Gly Leu Ile Asp Tyr Pro Gly Arg Val Met
50 55 60
gca gaa aaa ctg gag ttt aac ggc cag gat ttg cag cgt atc tca gaa 240
Ala Glu Lys Leu Glu Phe Asn Gly Gln Asp Leu Gln Arg Ile Ser Glu
65 70 75 80
aaa gag cgc cgc aac ctg gtg ggt gcc gaa gtg gcg atg atc ttc cag 288
Lys Glu Arg Arg Asn Leu Val Gly Ala Glu Val Ala Met Ile Phe Gln
85 90 95
gac ccg atg acc agc ctt aac ccg tgc tac acc gtg ggt ttc cag att 336
Asp Pro Met Thr Ser Leu Asn Pro Cys Tyr Thr Val Gly Phe Gln Ile
100 105 110
atg gaa gcg att aag gtg cat cag ggc ggc aac aaa agt acc cgc cgt 384
Met Glu Ala Ile Lys Val His Gln Gly Gly Asn Lys Ser Thr Arg Arg
115 120 125
cag cga gcg att gac ctg ctg aat cag gtc ggt att ccc gat ccg gca 432
Gln Arg Ala Ile Asp Leu Leu Asn Gln Val Gly Ile Pro Asp Pro Ala
130 135 140
tcg cgt ctg gat gtt tac ccg cat cag ctt tcc ggc ggc atg agc cag 480
Ser Arg Leu Asp Val Tyr Pro His Gln Leu Ser Gly Gly Met Ser Gln
145 150 155 160
cgc gtg atg atc gcc atg gcg att gcc tgt cgg cca aaa ctg ctg att 528
Arg Val Met Ile Ala Met Ala Ile Ala Cys Arg Pro Lys Leu Leu Ile
165 170 175
gcc gat gaa ccg acc acc gcg ctg gac gtg acc att cag gcg caa atc 576
Ala Asp Glu Pro Thr Thr Ala Leu Asp Val Thr Ile Gln Ala Gln Ile
180 185 190
atc gaa cta ctg ctg gag cta cag cag aaa gag aac atg gcg ctg gtg 624
Ile Glu Leu Leu Leu Glu Leu Gln Gln Lys Glu Asn Met Ala Leu Val
195 200 205
tta att acc cat gac ctg gcg ctg gtg gcg gaa gcg gca cat aaa atc 672
Leu Ile Thr His Asp Leu Ala Leu Val Ala Glu Ala Ala His Lys Ile
210 215 220
atc gtg atg tat gca ggc cag gtg gtg gaa acc ggt gat gcg cac gcc 720
Ile Val Met Tyr Ala Gly Gln Val Val Glu Thr Gly Asp Ala His Ala
225 230 235 240
atc ttc cat gcg ccg cgt cac ccg tat act cag gca ttg ctg cgt gcg 768
Ile Phe His Ala Pro Arg His Pro Tyr Thr Gln Ala Leu Leu Arg Ala
245 250 255
ctg cca gaa ttt gct cag gac aaa gaa cgt ctg gcg tcg ttg cca ggt 816
Leu Pro Glu Phe Ala Gln Asp Lys Glu Arg Leu Ala Ser Leu Pro Gly
260 265 270
gtc gtt ccc ggc aag tac gac cgc ccg aac ggc tgc ctg ctt aac ccg 864
Val Val Pro Gly Lys Tyr Asp Arg Pro Asn Gly Cys Leu Leu Asn Pro
275 280 285
cgc tgc ccc tat gcc act gac aga tgt cgc gct gaa gaa ccg gcg ctg 912
Arg Cys Pro Tyr Ala Thr Asp Arg Cys Arg Ala Glu Glu Pro Ala Leu
290 295 300
aat atg ctc gct gac ggg cgt cag tcc aaa tgc cat tac cca ctt gat 960
Asn Met Leu Ala Asp Gly Arg Gln Ser Lys Cys His Tyr Pro Leu Asp
305 310 315 320
gat gcc ggg agg ccg aca cta 981
Asp Ala Gly Arg Pro Thr Leu
325
<210>73
<211>1002
<212>DNA
<213>大肠杆菌
<400>73
atg agt acg caa gag gcc acc ctg caa caa ccg ctg ttg cag gct atc 48
Met Ser Thr Gln Glu Ala Thr Leu Gln Gln Pro Leu Leu Gln Ala Ile
1 5 10 15
gac ctg aaa aaa cat tat ccg gtg aag aaa ggc atg ttc gcg ccg gaa 96
Asp Leu Lys Lys His Tyr Pro Val Lys Lys Gly Met Phe Ala Pro Glu
20 25 30
cgt ctg gtt aaa gcg ctg gat ggc gtt tcg ttt aac ctt gaa cgt ggc 144
Arg Leu Val Lys Ala Leu Asp Gly Val Ser Phe Asn Leu Glu Arg Gly
35 40 45
aaa acg ctg gca gta gtg ggc gaa tct ggc tgc ggt aaa tcg acc ctc 192
Lys Thr Leu Ala Val Val Gly Glu Ser Gly Cys Gly Lys Ser Thr Leu
50 55 60
ggt cgg ttg ctg acg atg att gaa atg ccc acc ggt ggc gag ctg tat 240
Gly Arg Leu Leu Thr Met Ile Glu Met Pro Thr Gly Gly Glu Leu Tyr
65 70 75 80
tac cag ggg cag gat ctg ctt aag cac gat ccg cag gcg cag aag ctg 288
Tyr Gln Gly Gln Asp Leu Leu Lys His Asp Pro Gln Ala Gln Lys Leu
85 90 95
cgt cgg cag aaa atc cag atc gtc ttc cag aac cct tac ggt tcg ctg 336
Arg Arg Gln Lys Ile Gln Ile Val Phe Gln Asn Pro Tyr Gly Ser Leu
100 105 110
aat ccg cgt aaa aaa gtc ggg caa att ctt gaa gag ccg ctg ctg atc 384
Asn Pro Arg Lys Lys Val Gly Gln Ile Leu Glu Glu Pro Leu Leu Ile
115 120 125
aac acc agc tta agc aaa gaa cag cgt cgg gaa aaa gcc ctg tcg atg 432
Asn Thr Ser Leu Ser Lys Glu Gln Arg Arg Glu Lys Ala Leu Ser Met
130 135 140
atg gcg aaa gtc ggc ctg aaa acc gag cac tat gac cgc tat ccg cat 480
Met Ala Lys Val Gly Leu Lys Thr Glu His Tyr Asp Arg Tyr Pro His
145 150 155 160
atg ttc tcc ggc ggt cag cgt cag cgt atc gcc atc gcc cgt ggt ctg 528
Met Phe Ser Gly Gly Gln Arg Gln Arg Ile Ala Ile Ala Arg Gly Leu
165 170 175
atg ctc gac ccg gat gtg gtg att gcc gat gaa ccg gtt tcc gcg ctg 576
Met Lcu Asp Pro Asp Val Val Ile Ala Asp Glu Pro Val Ser Ala Leu
180 185 190
gat gtt tca gtg cgc gcg cag gtg ctg aat ctg atg atg gat ttg cag 624
Asp Val Ser Val Arg Ala Gln Val Leu Asn Leu Met Met Asp Leu Gln
195 200 205
cag gag ttg ggg ctg tct tat gtc ttt atc tcc cac gac ctg tcg gtg 672
Gln Glu Leu Gly Leu Ser Tyr Val Phe Ile Ser His Asp Leu Ser Val
210 215 220
gtg gag cac att gct gat gaa gtg atg gtg atg tac ctg ggc cgc tgc 720
Val Glu His Ile Ala Asp Glu Val Met Val Met Tyr Leu Gly Arg Cys
225 230 235 240
gtg gag aag gga acg aaa gac caa atc ttc aat aac ccg cgc cat ccg 768
Val Glu Lys Gly Thr Lys Asp Gln Ile Phe Asn Asn Pro Arg His Pro
245 250 255
tac act cag gcg cta ctt tcc gcg acg ccg cgc ctg aac ccg gac gat 816
Tyr Thr Gln Ala Leu Leu Ser Ala Thr Pro Arg Leu Asn Pro Asp Asp
260 265 270
cgc cgc gag cgc atc aag ctc agc ggt gaa cta cca agc cca ctg aat 864
Arg Arg Glu Arg Ile Lys Leu Ser Gly Glu Leu Pro Ser Pro Leu Asn
275 280 285
cca ccg ccg ggt tgc gcc ttc aac gcc cgc tgt cgt cgg cgc ttc ggc 912
Pro Pro Pro Gly Cys Ala Phe Asn Ala Arg Cys Arg Arg Arg Phe Gly
290 295 300
ccc tgc acc cag ttg cag ccg cag cta aaa gac tac ggc ggt caa ctg 960
Pro Cys Thr Gln Leu Gln Pro Gln Leu Lys Asp Tyr Gly Gly Gln Leu
305 310 315 320
gta gct tgt ttt gct gtt gat cag gat gaa aat ccg cag cgt 1002
Val Ala Cys Phe Ala Val Asp Gln Asp Glu Asn Pro Gln Arg
325 330
<210>74
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>74
ctaaccctgt gacctgcaat actgttttgc gggtgagtgt aggctggagct gcttc 56
<210>75
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>75
gaaactgccg gaaggcgatt aaacgccatc cggcagcata tgaatatcct ccttag 56
<210>76
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>76
ttacgcaaca ggaatagact gaacaccaga ctctatgtgt aggctggagc tgcttc 56
<210>77
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>77
agaaaacagg ggtaaattcc ccgaatggcg gcgctacata tgaatatcct ccttag 56
<210>78
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>78
atggagttta gtgtaaaaag cggtagcccg gagaaagtgt aggctggagc tgcttc 56
<210>79
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>79
ttactcttcg ccgttaaacc cagcgcggtt taacagcata tgaatatcct ccttag 56
<210>80
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>80
atgacagaag cgatgaagat taccctctct acccaagtgt aggctggagc tgcttc 56
<210>81
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>81
ttacgccgtt aacagattag ctatcgtgcg cacacccata tgaatatcct ccttag 56
<210>82
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>82
gcatccccac ctcataacgt tgacccgacc gggcaagtgt aggctggagc tgcttc 56
<210>83
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>83
ctgtacggca ttttgctatg cttgtcgcca ctgttgcata tgaatatcct ccttag 56
<210>84
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>84
gtgtctgaac tgtctcaatt a 21
<210>85
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>85
cggaatttct ttcagcagtt c 21
<210>86
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>86
atgactcaac agccacaagc c 21
<210>87
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>87
tgctttagtt atcttctcgt a 21
<210>88
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>88
agtgcctgca tcgtcgtggg c 21
<210>89
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>89
ggcgcctttt gctttaccag a 21
<210>90
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>90
gacgcgcgct ggggagaaaa a 21
<210>91
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>91
cgtagcgccc gcagaccact g 21
<210>92
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>92
atgcgtattt ccttgaaaaa g 21
<210>93
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>93
ttattcgata gagacgtttt c 21
<210>94
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>94
tacactcgag attaaagagg agaaattaa 29
<210>95
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>95
ttaggatcct catactggca gcacatactt 30
<210>96
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>96
caagaattct catgtttgac agct 24
<210>97
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>97
taactcgaga ttcccttttt acgtgaac 28
<210>98
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>98
ttaaccatgg agagaaaaac agtattg 27
<210>99
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>99
atatggatcc tactggcagc acatactttg 30
<210>100
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>100
taccatgggt caggaaaagc tata 24
<210>101
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>101
atggatcctt attcaggttg ttcgagtga 29
<210>102
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>102
ggattcatat ggccgaagac cgcgcgatg 29
<210>103
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>103
acgcgtcgac ccaaggctca tccctgacg 29
<210>104
<211>39
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>104
ggattcatat gcttgaacgc tgtattaccg atgtaaagc 39
<210>105
<211>36
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>105
acgcgtcgac cgatctcatc ttaatccaac ttcacc 36
<210>106
<211>34
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>106
ggattcatat gaaaaaggcc aaggaaaatc ccgc 34
<210>107
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>107
cccaagcttg cgagaaggcc tagccttcc 29
<210>108
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>108
catgccatgg gcttcctccc gatttccg 28
<210>109
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>109
acgcgtcgac gcgggcaacc gtcacaagcg 30
<210>110
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>110
ggattcatat gttcgaatct gccgaaatcg gc 32
<210>111
<211>34
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>111
cccaagcttc cttcggctat ttcttgtgct tggc 34
<210>112
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>112
ggattcatat ggcactcgac gaagcaccg 29
<210>113
<211>31
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>113
cgcggatccg tcggaatcac ctgagaaaac c 31
<210>114
<211>37
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>114
ggattcatat gagtaactcg aaagacgagg tagaacg 37
<210>115
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>115
acgcgtcgac gagatgtcag tatttcgcag gaacg 35
<210>116
<211>2064
<212>DNA
<213>Eschierichia coli W3110
<400>116
atg ggt cag gaa aag cta tac atc gaa aaa gag ctc agt tgg tta tcg 48
Met Gly Gln Glu Lys Leu Tyr Ile Glu Lys Glu Leu Ser Trp Leu Ser
1 5 10 15
ttc aat gaa cgc gtg ctt cag gaa gcg gcg gac aaa tct aac ccg ctg 96
Phe Asn Glu Arg Val Leu Gln Glu Ala Ala Asp Lys Ser Asn Pro Leu
20 25 30
att gaa agg atg cgt ttc ctg ggg atc tat tcc aat aac ctt gat gag 144
Ile Glu Arg Met Arg Phe Leu Gly Ile Tyr Ser Asn Asn Leu Asp Glu
35 40 45
ttc tat aaa gtc cgc ttc gct gaa ctg aag cga cgc atc att att agc 192
Phe Tyr Lys Val Arg Phe Ala Glu Leu Lys Arg Arg Ile Ile Ile Ser
50 55 60
gaa gaa caa ggc tcc aac tct cat tcc cgc cat tta ctg ggc aaa att 240
Glu Glu Gln Gly Ser Asn Ser His Ser Arg His Leu Leu Gly Lys Ile
65 70 75 80
cag tcc cgg gtg ctg aaa gcc gat cag gaa ttc gac ggc ctc tac aac 288
Gln Ser Arg Val Leu Lys Ala Asp Gln Glu Phe Asp Gly Leu Tyr Asn
85 90 95
gag cta ttg ctg gag atg gcg cgc aac cag atc ttc ctg att aat gaa 336
Glu Leu Leu Leu Glu Met Ala Arg Asn Gln Ile Phe Leu Ile Asn Glu
100 105 110
cgc cag ctc tcc gtc aat caa caa aac tgg ctg cgt cat tat ttt aag 384
Arg Gln Leu Ser Val Asn Gln Gln Asn Trp Leu Arg His Tyr Phe Lys
115 120 125
cag tat ctg cgt cag cac att acg ccg att tta atc aat cct gac act 432
Gln Tyr Leu Arg Gln His Ile Thr Pro Ile Leu Ile Asn Pro Asp Thr
130 135 140
gac tta gtg cag ttc ctg aaa gat gat tac acc tat ctg gcg gtg gaa 480
Asp Leu Val Gln Phe Leu Lys Asp Asp Tyr Thr Tyr Leu Ala Val Glu
145 150 155 160
att atc cgt ggc gat acc atc cgt tac gcg ctg ctg gag atc cca tca 528
Ile Ile Arg Gly Asp Thr Ile Arg Tyr Ala Leu Leu Glu Ile Pro Ser
165 170 175
gat aaa gtg ccg cgc ttt gtg aat tta ccg cca gaa gcg ccg cgt cga 576
Asp Lys Val Pro Arg Phe Val Asn Leu Pro Pro Glu Ala Pro Arg Arg
180 185 190
cgc aag ccg atg att ctt ctg gat aac att ctg cgt tac tgc ctt gat 624
Arg Lys Pro Met Ile Leu Leu Asp Asn Ile Leu Arg Tyr Cys Leu Asp
195 200 205
gat att ttc aaa ggc ttc ttt gat tat gac gcg ctg aat gcc tat tca 672
Asp Ile Phe Lys Gly Phe Phe Asp Tyr Asp Ala Leu Asn Ala Tyr Ser
210 215 220
atg aag atg acc cgc gat gcc gaa tac gat tta gtg cat gag atg gaa 720
Met Lys Met Thr Arg Asp Ala Glu Tyr Asp Leu Val His Glu Met Glu
225 230 235 240
gcc agc ctg atg gag ttg atg tct tcc agt ctc aag cag cgt tta act 768
Ala Ser Leu Met Glu Leu Met Ser Ser Ser Leu Lys Gln Arg Leu Thr
245 250 255
gct gag ccg gtg cgt ttt gtt tat cag cgc gat atg ccc aat gcg ctg 816
Ala Glu Pro Val Arg Phe Val Tyr Gln Arg Asp Met Pro Asn Ala Leu
260 265 270
gtt gaa gtg tta cgc gaa aaa ctg act att tcc cgc tac gac tcc atc 864
Val Glu Val Leu Arg Glu Lys Leu Thr Ile Ser Arg Tyr Asp Ser Ile
275 280 285
gtc ccc ggc ggt cgt tat cat aat ttt aaa gac ttt att aat ttc ccc 912
Val Pro Gly Gly Arg Tyr His Asn Phe Lys Asp Phe Ile Asn Phe Pro
290 295 300
aat gtc ggc aaa gcc aat ctg gtg aac aaa cca ctg ccg cgt tta cgc 960
Asn Val Gly Lys Ala Asn Leu Val Asn Lys Pro Leu Pro Arg Leu Arg
305 310 315 320
cat att tgg ttt gat aaa gcc cag ttc cgc aat ggt ttt gat gcc att 1008
His Ile Trp Phe Asp Lys Ala Gln Phe Arg Asn Gly Phe Asp Ala Ile
325 330 335
cgc gaa cgc gat gtg ttg ctc tat tat cct tat cac acc ttt gag cat 1056
Arg Glu Arg Asp Val Leu Leu Tyr Tyr Pro Tyr His Thr Phe Glu His
340 345 350
gtg ctg gaa ctg ctg cgt cag gct tcg ttc gac ccg agc gta ctg gcg 1104
Val Leu Glu Leu Leu Arg Gln Ala Ser Phe Asp Pro Ser Val Leu Ala
355 360 365
att aaa att aac att tac cgc gtg gcg aaa gat tca cgc atc atc gac 1152
Ile Lys Ile Asn Ile Tyr Arg Val Ala Lys Asp Ser Arg Ile Ile Asp
370 375 380
tcg atg atc cac gcc gca cat aac ggt aag aaa gtc acc gtg gtg gtt 1200
Ser Met Ile His Ala Ala His Asn Gly Lys Lys Val Thr Val Val Val
385 390 395 400
gag tta cag gcg cgt ttc gac gaa gaa gcc aac att cac tgg gcg aag 1248
Glu Leu Gln Ala Arg Phe Asp Glu Glu Ala Asn Ile His Trp Ala Lys
405 410 415
cgc ctg acc gaa gca ggc gtg cac gtt atc ttc tct gcg ccg ggg ctg 1296
Arg Leu Thr Glu Ala Gly Val His Val Ile Phe Ser Ala Pro Gly Leu
420 425 430
aaa att cac gcc aaa ctg ttc ctg att tca cgt aaa gaa aac ggt gaa 1344
Lys Ile His Ala Lys Leu Phe Leu Ile Ser Arg Lys Glu Asn Gly Glu
435 440 445
gtg gtg cgt tat gca cac atc ggg acc ggg aac ttt aac gaa aaa acc 1392
Val Val Arg Tyr Ala His Ile Gly Thr Gly Asn Phe Asn Glu Lys Thr
450 455 460
gcg cgt ctt tat act gac tat tcg ttg ctg acc gcc gat gcg cgc atc 1440
Ala Arg Leu Tyr Thr Asp Tyr Ser Leu Leu Thr Ala Asp Ala Arg Ile
465 470 475 480
acc aac gaa gta cgg cgg gta ttt aac ttt att gaa aac cca tac cgt 1488
Thr Asn Glu Val Arg Arg Val Phe Asn Phe Ile Glu Asn Pro Tyr Arg
485 490 495
ccg gtg aca ttt gat tat tta atg gta tcg ccg caa aac tcc cgc cgc 1536
Pro Val Thr Phe Asp Tyr Leu Met Val Ser Pro Gln Asn Ser Arg Arg
500 505 510
cta ttg tat gaa atg gtg gac cgc gag atc gcc aac gcg cag caa ggg 1584
Leu Leu Tyr Glu Met Val Asp Arg Glu Ile Ala Asn Ala Gln Gln Gly
515 520 525
ctg ccc agt ggt atc acc ctg aag cta aat aac ctt gtc gat aaa ggc 1632
Leu Pro Ser Gly Ile Thr Leu Lys Leu Asn Asn Leu Val Asp Lys Gly
530 535 540
ctg gtt gat cgt ctg tat gcg gcc tcc agc tcc ggc gta ccg gtt aat 1680
Leu Val Asp Arg Leu Tyr Ala Ala Ser Ser Ser Gly Val Pro Val Asn
545 550 555 560
ctg ctg gtt cgc gga atg tgt tcg ctg atc ccc aat ctg gaa ggc att 1728
Leu Leu Val Arg Gly Met Cys Ser Leu Ile Pro Asn Leu Glu Gly Ile
565 570 575
agc gac aac att cgt gcc atc agt att gtt gac cgt tac ctt gaa cat 1776
Ser Asp Asn Ile Arg Ala Ile Ser Ile Val Asp Arg Tyr Leu Glu His
580 585 590
gac cgg gtt tat att ttt gaa aat ggc ggc gat aaa aag gtc tac ctt 1824
Asp Arg Val Tyr Ile Phe Glu Asn Gly Gly Asp Lys Lys Val Tyr Leu
595 600 605
tct tcc gcc gac tgg atg acg cgc aat att gat tat cgt att gaa gtg 1872
Ser Ser Ala Asp Trp Met Thr Arg Asn Ile Asp Tyr Arg Ile Glu Val
610 615 620
gcg acg ccg ctg ctc gat ccg cgc ctg aag cag cgg gta ctg gac atc 1920
Ala Thr Pro Leu Leu Asp Pro Arg Leu Lys Gln Arg Val Leu Asp Ile
625 630 635 640
atc gac ata ttg ttc agc gat acg gtc aaa gca cgt tat atc gat aaa 1968
Ile Asp Ile Leu Phe Ser Asp Thr Val Lys Ala Arg Tyr Ile Asp Lys
645 650 655
gaa ctc agt aat cgc tac gtt ccc cgc ggc aat cgc cgc aaa gta cgg 2016
Glu Leu Ser Asn Arg Tyr Val Pro Arg Gly Asn Arg Arg Lys Val Arg
660 665 670
gcg cag ttg gcg att tat gac tac atc aaa tca ctc gaa caa cct gaa 2064
Ala Gln Leu Ala Ile Tyr Asp Tyr Ile Lys Ser Leu Glu Gln Pro Glu
675 680 685
<210>117
<211>1008
<212>DNA
<213>类球红细菌(Rhodobacter sphaeroides ATCC17023)
<400>117
atg gcc gaa gac cgc gcg atg ccc gtg atg ccg cct gcc gca gac gcg 48
Met Ala Glu Asp Arg Ala Met Pro Val Met Pro Pro Ala Ala Asp Ala
1 5 10 15
gcc gag gcg gtg cct gcc gcc ccc acg gcc ctg ccg gaa gag ggg ccc 96
Ala Glu Ala Val Pro Ala Ala Pro Thr Ala Leu Pro Glu Glu Gly Pro
20 25 30
gca ggg ccc gag gcc cct ctt cag acg ctg cac gga ccg cgc cat ttc 144
Ala Gly Pro Glu Ala Pro Leu Gln Thr Leu His Gly Pro Arg His Phe
35 40 45
ccg gcc gtg gat gcg aat gcg ata cgg cag gcc ttc gag ggc ggg cat 192
Pro Ala Val Asp Ala Asn Ala Ile Arg Gln Ala Phe Glu Gly Gly His
50 55 60
tat ccc tat ccg cgc cgg ttg ggc cgc gtg gtc tac gag gcc gag aaa 240
Tyr Pro Tyr Pro Arg Arg Leu Gly Arg Val Val Tyr Glu Ala Glu Lys
65 70 75 80
gcc aga ttg cag gcc gaa ctg ctg aag gtg cag atc tgg gcg cag gag 288
Ala Arg Leu Gln Ala Glu Leu Leu Lys Val Gln Ile Trp Ala Gln Glu
85 90 95
acc ggg cag aag ttc gtc atc ctg atg gaa ggg cgc gac gcc gcc ggc 336
Thr Gly Gln Lys Phe Val Ile Leu Met Glu Gly Arg Asp Ala Ala Gly
100 105 110
aag ggt ggc acg atc aag cgc ttc atg gag cat ctc aat ccg cgc tat 384
Lys Gly Gly Thr Ile Lys Arg Phe Met Glu His Leu Asn Pro Arg Tyr
115 120 125
gcc cgc gtc gtg gcc ctg acc aag ccc ggc gag cgc gag cgc ggc caa 432
Ala Arg Val Val Ala Leu Thr Lys Pro Gly Glu Arg Glu Arg Gly Gln
130 135 140
tgg ttc ttt cag cgc tat atc gaa cat ctg ccg acc gcg ggc gag atc 480
Trp Phe Phe Gln Arg Tyr Ile Glu His Leu Pro Thr Ala Gly Glu Ile
145 150 155 160
gtc ttt ttc gac cgc agc tgg tat aac cgc gcg ggc gtc gag cgg gtg 528
Val Phe Phe Asp Arg Ser Trp Tyr Asn Arg Ala Gly Val Glu Arg Val
165 170 175
atg ggg ttc tgc acc ccc tcg gaa tat ctc gaa ttc atg cgc cag gcg 576
Met Gly Phe Cys Thr Pro Ser Glu Tyr Leu Glu Phe Met Arg Gln Ala
180 185 190
ccc gag ctc gag cgg atg ctg gtc cgc tcg ggg atc cgg ctc tac aaa 624
Pro Glu Leu Glu Arg Met Leu Val Arg Ser Gly Ile Arg Leu Tyr Lys
195 200 205
tac tgg ttc tcg gtg acg cgc gac gaa cag cgc gcc cgc ttc ctc gcc 672
Tyr Trp Phe Ser Val Thr Arg Asp Glu Gln Arg Ala Arg Phe Leu Ala
210 215 220
cgc gag acc gat ccc ctg aaa cgc tgg aag ctc tcg ccc atc gac aag 720
Arg Glu Thr Asp Pro Leu Lys Arg Trp Lys Leu Ser Pro Ile Asp Lys
225 230 235 240
gcg agc ctc gac aag tgg gac gat tat acc gag gcg aag gag gcg atg 768
Ala Ser Leu Asp Lys Trp Asp Asp Tyr Thr Glu Ala Lys Glu Ala Met
245 250 255
ttc ttc tac acc gac acg gcc gat gcg ccc tgg acc atc gtc aag tcc 816
Phe Phe Tyr Thr Asp Thr Ala Asp Ala Pro Trp Thr Ile Val Lys Ser
260 265 270
aac gac aag aag cgc gcg cgg ctg aac tgc atg cgg cac ttc ctg tcg 864
Asn Asp Lys Lys Arg Ala Arg Leu Asn Cys Met Arg His Phe Leu Ser
275 280 285
agc ctc gac tat ccg ggc aag gac ccg gag gtg gtg ggc gtg ccc gat 912
Set Leu Asp Tyr Pro Gly Lys Asp Pro Glu Val Val Gly Val Pro Asp
290 295 300
ccg ctg atc gtg gga cgt gcg gcg cag gtg atc ggc acg gcg gcc gac 960
Pro Leu Ile Val Gly Arg Ala Ala Gln Val Ile Gly Thr Ala Ala Asp
305 310 315 320
atc ctc gac agc gcc acg ccg ccc gcg ctg cgc aag ccg cgt cag gga 1008
Ile Leu Asp Ser Ala Thr Pro Pro Ala Leu Arg Lys Pro Arg Gln Gly
325 330 335
<210>118
<211>1632
<212>DNA
<213>橙色绿屈挠菌ATCC29366(橙色绿屈挠菌ATCC29366)
<400>118
atg ctt gaa cgc tgt att acc gat gta aag ctc agc aag gaa gag tac 48
Met Leu Glu Arg Cys Ile Thr Asp Val Lys Leu Ser Lys Glu Glu Tyr
1 5 10 15
acg caa ctg gct ccg ggg ttg cag gcg cgg ctc ttt gat ctc gaa caa 96
Thr Gln Leu Ala Pro Gly Leu Gln Ala Arg Leu Phe Asp Leu Glu Gln
20 25 30
atg ctg ctg gaa gcg cgc att ccg acc atc ttt gta ttt gaa ggc tgg 144
Met Leu Leu Glu Ala Arg Ile Pro Thr Ile Phe Val Phe Glu Gly Trp
35 40 45
gcc ggc acc gcc aaa gcc cgc aca att gca acc ctg acc cgg cgc ctt 192
Ala Gly Thr Ala Lys Ala Arg Thr Ile Ala Thr Leu Thr Arg Arg Leu
50 55 60
gat ccg cgt ggc ttt cgg gtg cat tcg att acc cca ccg cgt acc tat 240
Asp Pro Arg Gly Phe Arg Val His Ser Ile Thr Pro Pro Arg Thr Tyr
65 70 75 80
gag caa caa tat ccc tgg ttg tac cgt ttc tgg ctc aag ata ccc agc 288
Glu Gln Gln Tyr Pro Trp Leu Tyr Arg Phe Trp Leu Lys Ile Pro Ser
85 90 95
tac ggt cag atg agc ttc ttt gat cgc tcg tgg tac cgt gag ttg ctg 336
Tyr Gly Gln Met Ser Phe Phe Asp Arg Ser Trp Tyr Arg Glu Leu Leu
100 105 110
gcg gcc tat act acc ggt ggc agc cgt gat gaa tgg cgc acg cat tgc 384
Ala Ala Tyr Thr Thr Gly Gly Ser Arg Asp Glu Trp Arg Thr His Cys
115 120 125
gaa gat gcc gtc att ttc gag cgg caa ctg gcc gat gat ggt gcg ctc 432
Glu Asp Ala Val Ile Phe Glu Arg Gln Leu Ala Asp Asp Gly Ala Leu
130 135 140
att ctc aag ttc tgg tta cat atc acg aaa aag cag cag gca cgg cgc 480
Ile Leu Lys Phe Trp Leu His Ile Thr Lys Lys Gln Gln Ala Arg Arg
145 150 155 160
ttt gcg aaa tta ctg gcc gat ccg ctg aat gcc tgg cgg gtg acc gag 528
Phe Ala Lys Leu Leu Ala Asp Pro Leu Asn Ala Trp Arg Val Thr Glu
165 170 175
gaa gat ctc tgg cag cac cgt cat tac aaa aag gtc tat ctg gcc gtc 576
Glu Asp Leu Trp Gln His Arg His Tyr Lys Lys Val Tyr Leu Ala Val
180 185 190
gaa gag atg ctc tcg cgc acc gac acc gca ttt gca ccc tgg cac att 624
Glu Glu Met Leu Ser Arg Thr Asp Thr Ala Phe Ala Pro Trp His Ile
195 200 205
att ccg gct gcc gac aag cgt tac gcc cgg ctc acc gtc ttg caa att 672
Ile Pro Ala Ala Asp Lys Arg Tyr Ala Arg Leu Thr Val Leu Gln Ile
210 215 220
att gtc ggg gcg ctg gag agt cga ttg gga att acc gcc agt gat cgt 720
Ile Val Gly Ala Leu Glu Ser Arg Leu Gly Tle Thr Ala Ser Asp Arg
225 230 235 240
gag gcc agt ctt gat gat agt ggt ctg gcg ttg cgg cgc tac tat ctc 768
Glu Ala Ser Leu Asp Asp Ser Gly Leu Ala Leu Arg Arg Tyr Tyr Leu
245 250 255
gat ttg cgc acg ccg gtt gtc gct aca ccg cgt gca gca ccg gta gat 816
Asp Leu Arg Thr Pro Val Val Ala Thr Pro Arg Ala Ala Pro Val Asp
260 265 270
gca ggc aat tcc tct acc atg act ctg caa cag gct gaa cca atc acg 864
Ala Gly Asn Ser Ser Thr Met Thr Leu Gln Gln Ala Glu Pro Ile Thr
275 280 285
acc ccg gtg gtc gtg acg ccg gtc gcg cca ctg tta cgg gca gcc agc 912
Thr Pro Val Val Val Thr Pro Val Ala Pro Leu Leu Arg Ala Ala Ser
290 295 300
ccc tta cag cgc gtt gat ttg agt ttg cgt ctt gat gat gat acc tac 960
Pro Leu Gln Arg Val Asp Leu Ser Leu Arg Leu Asp Asp Asp Thr Tyr
305 310 315 320
cac cgg gaa ttg aaa cgg ttg cag gcc agg atg tat ctg ctc ggc ctg 1008
His Arg Glu Leu Lys Arg Leu Gln Ala Arg Met Tyr Leu Leu Gly Leu
325 330 335
cag gtg tac cat cag aag cga ccg gtc gtg ttt gtg ttt gaa ggc tgg 1056
Gln Val Tyr His Gln Lys Arg Pro Val Val Phe Val Phe Glu Gly Trp
340 345 350
gat gca gcg ggt aag ggg ggc gcc att cag cgc ctg acg gcg gag ctt 1104
Asp Ala Ala Gly Lys Gly Gly Ala Ile Gln Arg Leu Thr Ala Glu Leu
355 360 365
gat ccg cgt gcc tat acc gtg cac gcg att gcc gcc ccc gcc ggc gat 1152
Asp Pro Arg Ala Tyr Thr Val His Ala Ile Ala Ala Pro Ala Gly Asp
370 375 380
gat aaa gct cgc cac tac ctg tac cgc ttc tgg cgg cgg ttg ccg ccg 1200
Asp Lys Ala Arg His Tyr Leu Tyr Arg Phe Trp Arg Arg Leu Pro Pro
385 390 395 400
cgt ggt cag ttt gcg atc ttc gac cgc tcg tgg tac ggt cgc gtg tta 1248
Arg Gly Gln Phe Ala Ile Phe Asp Arg Ser Trp Tyr Gly Arg Val Leu
405 410 415
gtt gaa cgg gtg gaa ggg ttt gcc cgc ccc gac gaa tgg cgt cgt gcc 1296
Val Glu Arg Val Glu Gly Phe Ala Arg Pro Asp Glu Trp Arg Arg Ala
420 425 430
tac gcc gag att aat cag ttt gaa cgc cag ttg gtt gat ttt ggc gcg 1344
Tyr Ala Glu Ile Asn Gln Phe Glu Arg Gln Leu Val Asp Phe Gly Ala
435 440 445
att att gcc aaa ttc tgg ctg cac atc agc ccc gaa gag caa ttg cgc 1392
Ile Ile Ala Lys Phe Trp Leu His Ile Ser Pro Glu Glu Gln Leu Arg
450 455 460
cgt ttt gaa gaa cgg cag cal glg ccg lac aaa gcc tgg aaa ttg acc 1440
Arg Phe Glu Glu Arg Gln His Val Pro Tyr Lys Ala Trp Lys Leu Thr
465 470 475 480
gat gaa gac tgg cgc aat cgc gaa aag tgg ccg gca tat ctt gaa gca 1488
Asp Glu Asp Trp Arg Asn Arg Glu Lys Trp Pro Ala Tyr Leu Glu Ala
485 490 495
gcc gat gag atg ctg ctt cgc acc agt acg ccc tat gcg ccg tgg acg 1536
Ala Asp Glu Met Leu Leu Arg Thr Ser Thr Pro Tyr Ala Pro Trp Thr
500 505 510
att gtc gag gca gaa gat aaa aag tat gcc cgg att aag att ttg cgc 1584
Ile Val Glu Ala Glu Asp Lys Lys Tyr Ala Arg Ile Lys Ile Leu Arg
515 520 525
act gcg gtt gag gtg ttg gaa gcg gaa ttg ggg ccg gtg aag ttg gat 1632
Thr Ala Val Glu Val Leu Glu Ala Glu Leu Gly Pro Val Lys Leu Asp
530 535 540
<210>119
<211>906
<212>DNA
<213>Mesorhixobium loti MAFF303099
<400>119
atg aaa aag gcc aag gaa aat ccc gca acg cca acg tca ggt ccg ctg 48
Met Lys Lys Ala Lys Glu Asn Pro Ala Thr Pro Thr Ser Gly Pro Leu
1 5 10 15
aag atc agg atc ggg ggc aag gag cgg gag ttc gac atc gag aat ccc 96
Lys Ile Arg Ile Gly Gly Lys Glu Arg Glu Phe Asp Ile Glu Asn Pro
20 25 30
gag ctc ccg gac tgg gtc gag gac aac aaa ctg acc gcg ggc ggc tac 144
Glu Leu Pro Asp Trp Val Glu Asp Asn Lys Leu Thr Ala Gly Gly Tyr
35 40 45
ccc tac gac aag aag atg aac agc gat gag tat gac gag acg ctc gag 192
Pro Tyr Asp Lys Lys Met Asn Ser Asp Glu Tyr Asp Glu Thr Leu Glu
50 55 60
aaa ttg cag atc gag ctg gtc aag gcg cag gca tgg ctg cag gcg acc 240
Lys Leu Gln Ile Glu Leu Val Lys Ala Gln Ala Trp Leu Gln Ala Thr
65 70 75 80
ggc aaa cgg gtg atg gcg ttg ttc gag ggc cgc gac gcc gcc ggc aag 288
Gly Lys Arg Val Met Ala Leu Phe Glu Gly Arg Asp Ala Ala Gly Lys
85 90 95
ggc gga acg atc ttc gtg gtg cgc cag tat ctc aat ccg cgc acg gcg 336
Gly Gly Thr Ile Phe Val Val Arg Gln Tyr Leu Asn Pro Arg Thr Ala
100 105 110
cgc aac gtg gcg ctg acc aag ccg acc ccc act gaa ctg ggg caa tgg 384
Arg Asn Val Ala Leu Thr Lys Pro Thr Pro Thr Glu Leu Gly Gln Trp
115 120 125
tac tac cag cgt tat gtc gac cat ttc ccg acg gcg ggc gaa ttc gtc 432
Tyr Tyr Gln Arg Tyr Val Asp His Phe Pro Thr Ala Gly Glu Phe Val
130 135 140
acc ttc gac cgc tcc tgg tac aac cgc gcc ggc gtc gag ccg gtg atg 480
Thr Phe Asp Arg Ser Trp Tyr Asn Arg Ala Gly Val Glu Pro Val Met
145 150 155 160
ggc ttc tgc acg ccc gaa cag cat gag aaa ttt ctc gat gag acg ccg 528
Gly Phe Cys Thr Pro Glu Gln His Glu Lys Phe Leu Asp Glu Thr Pro
165 170 175
cat ttc gaa cgg atg atc gtc aac gac gat atc cac ttc ttc aaa ttc 576
His Phe Glu Arg Met Ile Val Asn Asp Asp Ile His Phe Phe Lys Phe
180 185 190
tgg ctc aac atc ggc cgg gaa acg cag ctc gag cgc ttt cac gat cgc 624
Trp Leu Asn Ile Gly Arg Glu Thr Gln Leu Glu Arg Phe His Asp Arg
195 200 205
cgc tac agc ccg ctg aag agc tgg aag ttc tcg ccc atc gat gtc gcc 672
Arg Tyr Ser Pro Leu Lys Ser Trp Lys Phe Ser Pro Ile Asp Val Ala
210 215 220
ggc atc acc aaa tgg gac gat tac acc aag gca cgc gac agc atg ttc 720
Gly Ile Thr Lys Trp Asp Asp Tyr Thr Lys Ala Arg Asp Ser Met Phe
225 230 235 240
aag cgc acc cac aag gag ttc gcg cca tgg atc atc gtg cgg gcc aat 768
Lys Arg Thr His Lys Glu Phe Ala Pro Trp Ile Ile Val Arg Ala Asn
245 250 255
gac aag cgc cgc gcg cgg ctg gcg gtg atg cgg cgt atc ctg ttg tcg 816
Asp Lys Arg Arg Ala Arg Leu Ala Val Met Arg Arg Ile Leu Leu Ser
260 265 270
ctg ccc tat gag ggg cgc gat ctc gat atc gtc ggc aag gaa gac aag 864
Leu Pro Tyr Glu Gly Arg Asp Leu Asp Ile Val Gly Lys Glu Asp Lys
275 280 285
aag atc atc ggc gaa ggg ccg tca ttc ctc ggc aag gaa ggc 906
Lys Ile Ile Gly Glu Gly Pro Ser Phe Leu Gly Lys Glu Gly
290 295 300
<210>120
<211>1020
<212>DNA
<213>天蓝色链霉菌ATCC BAA-471(Streptomyces coelicolor ATCC BAA-471)
<400>120
atg ggc ttc ctc ccg att tcc gag gtt tcc gga gta ccc ggc cgg gag 48
Met Gly Phe Leu Pro Ile Ser Glu Val Ser Gly Val Pro Gly Arg Glu
1 5 10 15
cac tct tca cac gag gcc ccg tgg gag tcc acg acg acc gac acg cct 96
His Ser Ser His Glu Ala Pro Trp Glu Ser Thr Thr Thr Asp Thr Pro
20 25 30
ttc cgg ccg tcg gga agc cga ccg ggt acc ggt acg cga tca aca cgc 144
Phe Arg Pro Ser Gly Ser Arg Pro Gly Thr Gly Thr Arg Ser Thr Arg
35 40 45
ata tgc gcc gct cgt gcc cga aca gta ccg tgc aga cac gga acg cat 192
Ile Cys Ala Ala Arg Ala Arg Thr Val Pro Cys Arg His Gly Thr His
50 55 60
cgg aac tcg gtg gag gca gga ggc cgc atg gca ggc acg gaa ctc cgc 240
Arg Asn Ser Val Glu Ala Gly Gly Arg Met Ala Gly Thr Glu Leu Arg
65 70 75 80
aaa atc tca ggc aag gtg tac gag aag gag ttg cgg cgc ctg cag att 288
Lys Ile Ser Gly Lys Val Tyr Glu Lys Glu Leu Arg Arg Leu Gln Ile
85 90 95
gaa ttg gtg aac ctt cag gaa tgg gtt ctg acc gag aag aag cgc gtt 336
Glu Leu Val Asn Leu Gln Glu Trp Val Leu Thr Glu Lys Lys Arg Val
100 105 110
gcc gtg gtg ttc gaa gga cgg gac gcg gcc gga aag ggc ggc acc atc 384
Ala Val Val Phe Glu Gly Arg Asp Ala Ala Gly Lys Gly Gly Thr Ile
115 120 125
aag cgg ctc acg gaa cac ctc aac ccg cgg gtg acg cgg atc gtg gcg 432
Lys Arg Leu Thr Glu His Leu Asn Pro Arg Val Thr Arg Ile Val Ala
130 135 140
ctg ccc aga ccg acc gaa cga gaa cgg aca cag tgg tat ttc caa cgg 480
Leu Pro Arg Pro Thr Glu Arg Glu Arg Thr Gln Trp Tyr Phe Gln Arg
145 150 155 160
tac gtg gag cag ctt ccg gcg ggc ggc gag atc gtt ctc ttc gat cgc 528
Tyr Val Glu Gln Leu Pro Ala Gly Gly Glu Ile Val Leu Phe Asp Arg
165 170 175
agc tgg tac aac cgg gcc ggg gtc gaa cac gtc atg ggg ttc tgc acc 576
Ser Trp Tyr Asn Arg Ala Gly Val Glu His Val Met Gly Phe Cys Thr
180 185 190
gac gac gaa tac cga cga ttc ctg cgt cat tgc cct gtc ttc gaa cga 624
Asp Asp Glu Tyr Arg Arg Phe Leu Arg His Cys Pro Val Phe Glu Arg
195 200 205
atg ctt gtc gag gac ggg ctc ctg ctg cgc aag tac tgg ttc tcg gtg 672
Met Leu Val Glu Asp Gly Leu Leu Leu Arg Lys Tyr Trp Phe Ser Val
210 215 220
agt gac gtg gag cag cag gag cgc ttt cga cgc cgc ctc cag gac ccg 720
Ser Asp Val Glu Gln Gln Glu Arg Phe Arg Arg Arg Leu Gln Asp Pro
225 230 235 240
ctg aaa cgc tgg aaa ctc tcc acg atg gac ctg gag tcg atc act cgg 768
Leu Lys Arg Trp Lys Leu Ser Thr Met Asp Leu Glu Ser Ile Thr Arg
245 250 255
tgg gaa gcc tat tcc cgc gcc aag gac gag atg atg gcc gcc acg gac 816
Trp Glu Ala Tyr Ser Arg Ala Lys Asp Glu Met Met Ala Ala Thr Asp
260 265 270
acc ccc gag tcc ccg tgg tac gtg gtg gag agc gac gac aaa cgc cgg 864
Thr Pro Glu Ser Pro Trp Tyr Val Val Glu Ser Asp Asp Lys Arg Arg
275 280 285
gcg cgg ctc aac atg atc gcc cac ctc ttg gac tcc ctc ccc cat cac 912
Ala Arg Leu Asn Met Ile Ala His Leu Leu Asp Ser Leu Pro His His
290 295 300
cgc gtg cca ccg cct tca ctc agg ttg ccg gaa cgc ccc ccg ccg acg 960
Arg Val Pro Pro Pro Ser Leu Arg Leu Pro Glu Arg Pro Pro Pro Thr
305 310 315 320
ggt tac acg cgg tcg ccc cgg gac cgg cag acg tac gtc ccg gac cac 1008
Gly Tyr Thr Arg Ser Pro Arg Asp Arg Gln Thr Tyr Val Pro Asp His
325 330 335
gcg gct cgc ttg 1020
Ala Ala Arg Leu
340
<210>121
<211>1491
<212>DNA
<213>恶臭假单胞菌KT2440(Pseudomonas putida KT2440)
<400>121
atg ttc gaa tct gcc gaa atc ggc cac agc atc gac aag gag gct tac 48
Met Phe Glu Ser Ala Glu Ile Gly His Ser Ile Asp Lys Glu Ala Tyr
1 5 10 15
gac gcc gag gta ccc gct tta cgc gag gcc ctg ctc gaa gcc cag tac 96
Asp Ala Glu Val Pro Ala Leu Arg Glu Ala Leu Leu Glu Ala Gln Tyr
20 25 30
gaa ctc aag cag cag gcg cgt ttt ccg gtg atc gtg ctg atc aac ggc 144
Glu Leu Lys Gln Gln Ala Arg Phe Pro Val Ile Val Leu Ile Asn Gly
35 40 45
att gaa ggc gcc ggc aag ggt gag acg gta aaa ctg ctc aac gag tgg 192
Ile Glu Gly Ala Gly Lys Gly Glu Thr Val Lys Leu Leu Asn Glu Trp
50 55 60
atg gac ccg cgc atg atc gat gtg ctc acc ttc gac cag cag acc gac 240
Met Asp Pro Arg Met Ile Asp Val Leu Thr Phe Asp Gln Gln Thr Asp
65 70 75 80
gaa gag ctg gcc cgc ccg ccc gcc tgg cgc tat tgg cgg gcc ttg ccg 288
Glu Glu Leu Ala Arg Pro Pro Ala Trp Arg Tyr Trp Arg Ala Leu Pro
85 90 95
ccc aag ggg cga atg ggc gtt ttc ttt ggc aac tgg tac agc cag atg 336
Pro Lys Gly Arg Met Gly Val Phe Phe Gly Asn Trp Tyr Ser Gln Met
100 105 110
ctg cag ggg cgg gtg cac ggg gtg ttc aag gat gcc gtg ctc gat cag 384
Leu Gln Gly Arg Val His Gly Val Phe Lys Asp Ala Val Leu Asp Gln
115 120 125
gcc att acc ggt gcc gaa cgc ctg gag gag atg ctg tgc gat gaa ggt 432
Ala Ile Thr Gly Ala Glu Arg Leu Glu Glu Met Leu Cys Asp Glu Gly
130 135 140
gcg ctg atc atc aag ttc tgg ttc cac ctg tcc aag aag cag atg aag 480
Ala Leu Ile Ile Lys Phe Trp Phe His Leu Ser Lys Lys Gln Met Lys
145 150 155 160
gca cgg ctg aaa tcg ctc aag gac gac ccg ctg cac agc tgg aag atc 528
Ala Arg Leu Lys Ser Leu Lys Asp Asp Pro Leu His Ser Trp Lys Ile
165 170 175
agc ccg ctg gat tgg cag cag tcg caa acc tac gac cgt ttc gtg cgc 576
Ser Pro Leu Asp Trp Gln Gln Ser Gln Thr Tyr Asp Arg Phe Val Arg
180 185 190
ttt ggc gag cgc gtg ctg cgc cgc acc agc cgt gac tat gcg cca tgg 624
Phe Gly Glu Arg Val Leu Arg Arg Thr Ser Arg Asp Tyr Ala Pro Trp
195 200 205
cac atc atc gaa ggg gta gac ccg aat tac cgc agc ctg gcg gtg ggg 672
His Ile Ile Glu Gly Val Asp Pro Asn Tyr Arg Ser Leu Ala Val Gly
210 215 220
cgc att ctg ctg gaa agc ctg caa gcc gcg ctg gcc cac aat ccc aag 720
Arg Ile Leu Leu Glu Ser Leu Gln Ala Ala Leu Ala His Asn Pro Lys
225 230 235 240
ggc aag cac cag ggc aac gtg gct cca ttg ggc cgc agc atc gac gac 768
Gly Lys His Gln Gly Asn Val Ala Pro Leu Gly Arg Ser Ile Asp Asp
245 250 255
cgc agc ctg ctt ggc gcc ctg gac atg acc ttg cgc ctg gac aag gcc 816
Arg Ser Leu Leu Gly Ala Leu Asp Met Thr Leu Arg Leu Asp Lys Ala
260 265 270
gac tat cag gaa cag ttg atc acc gaa cag gcg cgt ctg gcc ggc ctg 864
Asp Tyr Gln Glu Gln Leu Ile Thr Glu Gln Ala Arg Leu Ala Gly Leu
275 280 285
ctg cgt gac aag cgc atg cgc cgg cac gcc ctg gtg gcg gtg ttc gaa 912
Leu Arg Asp Lys Arg Met Arg Arg His Ala Leu Val Ala Val Phe Glu
290 295 300
ggc aac gac gcc gcc ggc aag ggg ggc gcc atc cgc cgc gtg gcg gcg 960
Gly Asn Asp Ala Ala Gly Lys Gly Gly Ala Ile Arg Arg Val Ala Ala
305 310 315 320
gcg ctg gac ccg cgt cag tac cgt atc gta ccg att gcc gcg ccg acc 1008
Ala Leu Asp Pro Arg Gln Tyr Arg Ile Val Pro Ile Ala Ala Pro Thr
325 330 335
gaa gaa gag cgc gcc cag ccg tac ctg tgg cgg ttc tgg cgg cac atc 1056
Glu Glu Glu Arg Ala Gln Pro Tyr Leu Trp Arg Phe Trp Arg His Ile
340 345 350
ccg gca cgc ggc aag ttc acc atc ttc gac cgt tcc tgg tat ggc cgg 1104
Pro Ala Arg Gly Lys Phe Thr Ile Phe Asp Arg Ser Trp Tyr Gly Arg
355 360 365
gtg ctg gtg gag cgg gtg gaa ggc ttc tgc agc ccc gct gac tgg atg 1152
Val Leu Val Glu Arg Val Glu Gly Phe Cys Ser Pro Ala Asp Trp Met
370 375 380
cgt gcc tat agc gag atc aac gac ttt gaa gag cag ttg gtg gat gcc 1200
Arg Ala Tyr Ser Glu Ile Asn Asp Phe Glu Glu Gln Leu Val Asp Ala
385 390 395 400
ggc gtg gtg gtg gtc aag ttc tgg ctg gcg atc gac cag cag acc caa 1248
Gly Val Val Val Val Lys Phe Trp Leu Ala Ile Asp Gln Gln Thr Gln
405 410 415
ctg gag cgc ttc gaa gag cgt gag cag att ccg ttc aaa cgc tac aag 1296
Leu Glu Arg Phe Glu Glu Arg Glu Gln Ile Pro Phe Lys Arg Tyr Lys
420 425 430
atc acc gag gat gac tgg cgc aac cgc gac aag tgg gac gaa tac tcc 1344
Ile Thr Glu Asp Asp Trp Arg Asn Arg Asp Lys Trp Asp Glu Tyr Ser
435 440 445
cag gcg gtg ggc gac atg gtc gac cgc acc agc agc gag att gcc cct 1392
Gln Ala Val Gly Asp Met Val Asp Arg Thr Ser Ser Glu Ile Ala Pro
450 455 460
tgg acg etg gtg gag gcc aat gac aag cgc tgg gcg cgg gtg aag gtg 1440
Trp Thr Leu Val Glu Ala Asn Asp Lys Arg Trp Ala Arg Val Lys Val
465 470 475 480
gtg cgc aca atc aac cag gcg ctt gag gcg gcg ttt gcc aag cac aag 1488
Val Arg Thr Ile Asn Gln Ala Leu Glu Ala Ala Phe Ala Lys His Lys
485 490 495
aaa 1491
Lys
<210>122
<211>900
<212>DNA
<213>苜蓿中华根瘤菌ATCC51124(Sinorhizobium meliloti ATCC51124)
<400>122
atg gca ctc gac gaa gca ccg gcc gaa gca agg ccg ggg agc cgg gcg 48
Met Ala Leu Asp Glu Ala Pro Ala Glu Ala Arg Pro Gly Ser Arg Ala
1 5 10 15
gtc gaa ctg gag atc gac ggc aga agc cgc atc ttc gac atc gac gat 96
Val Glu Leu Glu Ile Asp Gly Arg Ser Arg Ile Phe Asp Ile Asp Asp
20 25 30
ccg gac ctg ccg aaa tgg atc gac gag gag gcc ttc cgc tcc gac gat 144
Pro Asp Leu Pro Lys Trp Ile Asp Glu Glu Ala Phe Arg Ser Asp Asp
35 40 45
tac ccc tac aag aaa aaa ctc gat cgg gag gaa tac gaa gaa acg ctg 192
Tyr Pro Tyr Lys Lys Lys Leu Asp Arg Glu Glu Tyr Glu Glu Thr Leu
50 55 60
acg aag ctg cag atc gaa ctg gtc aag gtc cag ttc tgg atg cag gcg 240
Thr Lys Leu Gln Ile Glu Leu Val Lys Val Gln Phe Trp Met Gln Ala
65 70 75 80
acc ggc aag cgc gtg atg gcg gtc ttc gag gga cgc gac gct gcc ggc 288
Thr Gly Lys Arg Val Met Ala Val Phe Glu Gly Arg Asp Ala Ala Gly
85 90 95
aag ggt ggt gcg atc cac gcg acg acg gcc aat atg aac ccc cgc tcc 336
Lys Gly Gly Ala Ile His Ala Thr Thr Ala Asn Met Asn Pro Arg Ser
100 105 110
gcg cgc gtc gtc gca ctg acg aaa ccg acg gag acc gaa cgg ggc cag 384
Ala Arg Val Val Ala Leu Thr Lys Pro Thr Glu Thr Glu Arg Gly Gln
115 120 125
tgg tac ttc cag cgc tat gtc gca acc ttc ccg acc gcc ggc gag ttc 432
Trp Tyr Phe Gln Arg Tyr Val Ala Thr Phe Pro Thr Ala Gly Glu Phe
130 135 140
gtc ctt ttc gac cgc tcc tgg tac aac cgc gcc ggt gtc gaa ccg gtc 480
Val Leu Phe Asp Arg Ser Trp Tyr Asn Arg Ala Gly Val Glu Pro Val
145 150 155 160
atg ggc ttt tgc acc ccc gac cag tac gag caa ttc ctt aaa gag gcg 528
Met Gly Phe Cys Thr Pro Asp Gln Tyr Glu Gln Phe Leu Lys Glu Ala
165 170 175
ccc cgc ttc gag gag atg atc gcg aac gag ggc atc cat ctc ttc aag 576
Pro Arg Phe Glu Glu Met Ile Ala Asn Glu Gly Ile His Leu Phe Lys
180 185 190
ttt tgg atc aat atc ggc cgg gaa atg caa ctg aag cgc ttc cat gac 624
Phe Trp Ile Asn Ile Gly Arg Glu Met Gln Leu Lys Arg Phe His Asp
195 200 205
cgg cgc cac gat ccg ttg aag atc tgg aag ctt tcg ccg atg gac atc 672
Arg Arg His Asp Pro Leu Lys Ile Trp Lys Leu Ser Pro Met Asp Ile
210 215 220
gcg gcg ctg agc aag tgg gac gac tac acc gga aaa cgc gac cgt atg 720
Ala Ala Leu Ser Lys Trp Asp Asp Tyr Thr Gly Lys Arg Asp Arg Met
225 230 235 240
ctg aag gaa acg cac acg gag cac ggg cca tgg gcg gtc atc cgc ggc 768
Leu Lys Glu Thr His Thr Glu His Gly Pro Trp Ala Val Ile Arg Gly
245 250 255
aac gac aag cgc cgc tcg cgg atc aac gtg atc cgc cac atg ctg acg 816
Asn Asp Lys Arg Arg Ser Arg Ile Asn Val Ile Arg His Met Leu Thr
260 265 270
aag ctc gac tat gac ggc aag gac gag gcg gcg atc gga gag gtc gac 864
Lys Leu Asp Tyr Asp Gly Lys Asp Glu Ala Ala Ile Gly Glu Val Asp
275 280 285
gaa aag atc ctc ggc tcc ggc ccc ggt ttt ctc agg 900
Glu Lys Ile Leu Gly Ser Gly Pro Gly Phe Leu Arg
290 295 300
<210>123
<211>918
<212>DNA
<213>苜蓿中华根瘤菌ATCC51124
<400>123
atg agt aac tcg aaa gac gag gta gaa cgc atc gat tgg ctc gaa gcg 48
Met Ser Asn Ser Lys Asp Glu Val Glu Arg Ile Asp Trp Leu Glu Ala
1 5 10 15
gag ctt gct gac aca atc gac gag gat tac gag ctt gag ctt tca gaa 96
Glu Leu Ala Asp Thr Ile Asp Glu Asp Tyr Glu Leu Glu Leu Ser Glu
20 25 30
ccg acc tta tcc gag aaa atc cgc gag att tac cgt aaa gcg cat cct 144
Pro Thr Leu Ser Glu Lys Ile Arg Glu Ile Tyr Arg Lys Ala His Pro
35 40 45
ccg gcg ctt ccc cgc atg gat tat ttc cgc gcg ctc ctg gcc ttg cag 192
Pro Ala Leu Pro Arg Met Asp Tyr Phe Arg Ala Leu Leu Ala Leu Gln
50 55 60
gcg gag cta atc aag ctg cag gac tgg gtc gtc tac cac aag cag aag 240
Ala Glu Leu Ile Lys Leu Gln Asp Trp Val Val Tyr His Lys Gln Lys
65 70 75 80
gtc gtt gtg atc ttc gag gga cgc gac gcg gct gga aag ggc ggc gtc 288
Val Val Val Ile Phe Glu Gly Arg Asp Ala Ala Gly Lys Gly Gly Val
85 90 95
atc aag cgc atc acc cag cga ctc aat ccg cgc atc gtt aga acg gtg 336
Ile Lys Arg Ile Thr Gln Arg Leu Asn Pro Arg Ile Val Arg Thr Val
100 105 110
gcg ctg ccg gcg ccg tcc gat cgc gaa aag acc caa tgg tat ttc cag 384
Ala Leu Pro Ala Pro Ser Asp Arg Glu Lys Thr Gln Trp Tyr Phe Gln
115 120 125
cgt tac gta cca cat ctg ccg gcg ggc ggc gaa atc gtc ctc ttc gac 432
Arg Tyr Val Pro His Leu Pro Ala Gly Gly Glu Ile Val Leu Phe Asp
130 135 140
cgc tcc tgg tac aat cgc tgc ggc gtc gaa cgc gtc atg ggc ttt gcg 480
Arg Ser Trp Tyr Asn Arg Cys Gly Val Glu Arg Val Met Gly Phe Ala
145 150 155 160
acc gag gag gag gtc gag cag ttc ttc gac gac gtg ccg gaa ttc gaa 528
Thr Glu Glu Glu Val Glu Gln Phe Phe Asp Asp Val Pro Glu Phe Glu
165 170 175
cgc atg ctg gtg cgc tcc ggc gtt cgg ctg gtt aag tac tgg ttc tcg 576
Arg Met Leu Val Arg Ser Gly Val Arg Leu Val Lys Tyr Trp Phe Ser
180 185 190
atc acc gac gag gaa cag cag ctg cgc ttt ctg acg cgc atc cac gac 624
Ile Thr Asp Glu Glu Gln Gln Leu Arg Phe Leu Thr Arg Ile His Asp
195 200 205
ccg ttg aaa cag tgg aag ctc tcg ccg atg gac ctg caa tcg cgc gtc 672
Pro Leu Lys Gln Trp Lys Leu Ser Pro Met Asp Leu Gln Ser Arg Val
210 215 220
cgt tgg gaa gcg tac acc aag gcc aag gaa gag acc ttc gcc cgt acc 720
Arg Trp Glu Ala Tyr Thr Lys Ala Lys Glu Glu Thr Phe Ala Arg Thr
225 230 235 240
aac att cgc gaa gcg cca tgg cat atc gtc gag gcc aac gac aag aag 768
Asn Ilc Arg Glu Ala Pro Trp His Ile Val Glu Ala Asn Asp Lys Lys
245 250 255
cgg gcc cgg ctc aac tgc atc gac cat ctc ttg aag caa atc ccc tat 816
Arg Ala Arg Leu Asn Cys Ile Asp His Leu Leu Lys Gln Ile Pro Tyr
260 265 270
gag gat gtg ccg cac gag gat atc acc ttg ccg gag cgc att ttc aat 864
Glu Asp Val Pro His Glu Asp Ile Thr Leu Pro Glu Arg Ile Phe Asn
275 280 285
ccc aac tac gag cgg aag gtc ctg cct ccg gag ctt tac gtt cct gcg 912
Pro Asn Tyr Glu Arg Lys Val Leu Pro Pro Glu Leu Tyr Val Pro Ala
290 295 300
aaa tac 918
Lys Tyr
305
<210>124
<211>688
<212>DNA
<213>Eschierichia coli W3110
<400>124
Met Gly Gln Glu Lys Leu Tyr Ile Glu Lys Glu Leu Ser Trp Leu Ser
1 5 10 15
Phe Asn Glu Arg Val Leu Gln Glu Ala Ala Asp Lys Ser Asn Pro Leu
20 25 30
Ile Glu Arg Met Arg Phe Leu Gly Ile Tyr Ser Asn Asn Leu Asp Glu
35 40 45
Phe Tyr Lys Val Arg Phe Ala Glu Leu Lys Arg Arg Ile Ile Ile Ser
50 55 60
Glu Glu Gln Gly Ser Asn Ser His Ser Arg His Leu Leu Gly Lys Ile
65 70 75 80
Gln Ser Arg Val Leu Lys Ala Asp Gln Glu Phe Asp Gly Leu Tyr Asn
85 90 95
Glu Leu Leu Leu Glu Met Ala Arg Asn Gln Ile Phe Leu Ile Asn Glu
100 105 110
Arg Gln Leu Ser Val Asn Gln Gln Asn Trp Leu Arg His Tyr Phe Lys
115 120 125
Gln Tyr Leu Arg Gln His Ile Thr Pro Ile Leu Ile Asn Pro Asp Thr
130 135 140
Asp Leu Val Gln Phe Leu Lys Asp Asp Tyr Thr Tyr Leu Ala Val Glu
145 150 155 160
Ile Ile Arg Gly Asp Thr Ile Arg Tyr Ala Leu Leu Glu Ile Pro Ser
165 170 175
Asp Lys Val Pro Arg Phe Val Asn Leu Pro Pro Glu Ala Pro Arg Arg
180 185 190
Arg Lys Pro Met Ile Leu Leu Asp Asn Ile Leu Arg Tyr Cys Leu Asp
195 200 205
Asp Ile Phe Lys Gly Phe Phe Asp Tyr Asp Ala Leu Asn Ala Tyr Ser
210 215 220
Met Lys Met Thr Arg Asp Ala Glu Tyr Asp Leu Val His Glu Met Glu
225 230 235 240
Ala Ser Leu Met Glu Leu Met Ser Ser Ser Leu Lys Gln Arg Leu Thr
245 250 255
Ala Glu Pro Val Arg Phe Val Tyr Gln Arg Asp Met Pro Asn Ala Leu
260 265 270
Val Glu Val Leu Arg Glu Lys Leu Thr Ile Ser Arg Tyr Asp Ser Ile
275 280 285
Val Pro Gly Gly Arg Tyr His Asn Phe Lys Asp Phe Ile Asn Phe Pro
290 295 300
Asn Val Gly Lys Ala Asn Leu Val Asn Lys Pro Leu Pro Arg Leu Arg
305 310 315 320
His Ile Trp Phe Asp Lys Ala Gln Phe Arg Asn Gly Phe Asp Ala Ile
325 330 335
Arg Glu Arg Asp Val Leu Leu Tyr Tyr Pro Tyr His Thr Phe Glu His
340 345 350
Val Leu Glu Leu Leu Arg Gln Ala Ser Phe Asp Pro Ser Val Leu Ala
355 360 365
Ile Lys Ile Asn Ile Tyr Arg Val Ala Lys Asp Ser Arg Ile Ile Asp
370 375 380
Ser Met Ile His Ala Ala His Asn Gly Lys Lys Val Thr Val Val Val
385 390 395 400
Glu Leu Gln Ala Arg Phe Asp Glu Glu Ala Asn Ile His Trp Ala Lys
405 410 415
Arg Leu Thr Glu Ala Gly Val His Val Ile Phe Ser Ala Pro Gly Leu
420 425 430
Lys Ile His Ala Lys Leu Phe Leu Ile Ser Arg Lys Glu Asn Gly Glu
435 440 445
Val Val Arg Tyr Ala His Ile Gly Thr Gly Asn Phe Asn Glu Lys Thr
450 455 460
Ala Arg Leu Tyr Thr Asp Tyr Ser Leu Leu Thr Ala Asp Ala Arg Ile
465 470 475 480
Thr Asn Glu Val Arg Arg Val Phe Asn Phe Ile Glu Asn Pro Tyr Arg
485 490 495
Pro Val Thr Phe Asp Tyr Leu Met Val Ser Pro Gln Asn Ser Arg Arg
500 505 510
Leu Leu Tyr Glu Met Val Asp Arg Glu Ile Ala Asn Ala Gln Gln Gly
515 520 525
Leu Pro Ser Gly Ile Thr Leu Lys Leu Asn Asn Leu Val Asp Lys Gly
530 535 540
Leu Val Asp Arg Leu Tyr Ala Ala Ser Ser Ser Gly Val Pro Val Asn
545 550 555 560
Leu Leu Val Arg Gly Met Cys Ser Leu Ile Pro Asn Leu Glu Gly Ile
565 570 575
Ser Asp Asn Ile Arg Ala Ile Ser Ile Val Asp Arg Tyr Leu Glu His
580 585 590
Asp Arg Val Tyr Ile Phe Glu Asn Gly Gly Asp Lys Lys Val Tyr Leu
595 600 605
Ser Ser Ala Asp Trp Met Thr Arg Asn Ile Asp Tyr Arg Ile Glu Val
610 615 620
Ala Thr Pro Leu Leu Asp Pro Arg Leu Lys Gln Arg Val Leu Asp Ile
625 630 635 640
Ile Asp Ile Leu Phe Ser Asp Thr Val Lys Ala Arg Tyr Ile Asp Lys
645 650 655
Glu Leu Ser Asn Arg Tyr Val Pro Arg Gly Asn Arg Arg Lys Val Arg
660 665 670
Ala Gln Leu Ala Ile Tyr Asp Tyr Ile Lys Ser Leu Glu Gln Pro Glu
675 680 685
<210>125
<211>336
<212>PRT
<213>类球红细菌ATCC17023
<400>125
Met Ala Glu Asp Arg Ala Met Pro Val Met Pro Pro Ala Ala Asp Ala
1 5 10 15
Ala Glu Ala Val Pro Ala Ala Pro Thr Ala Leu Pro Glu Glu Gly Pro
20 25 30
Ala Gly Pro Glu Ala Pro Leu Gln Thr Leu His Gly Pro Arg His Phe
35 40 45
Pro Ala Val Asp Ala Asn Ala Ile Arg Gln Ala Phe Glu Gly Gly His
50 55 60
Tyr Pro Tyr Pro Arg Arg Leu Gly Arg Val Val Tyr Glu Ala Glu Lys
65 70 75 80
Ala Arg Leu Gln Ala Glu Leu Leu Lys Val Gln Ile Trp Ala Gln Glu
85 90 95
Thr Gly Gln Lys Phe Val Ile Leu Met Glu Gly Arg Asp Ala Ala Gly
100 105 110
Lys Gly Gly Thr Ile Lys Arg Phe Met Glu His Leu Asn Pro Arg Tyr
115 120 125
Ala Arg Val Val Ala Leu Thr Lys Pro Gly Glu Arg Glu Arg Gly Gln
130 135 140
Trp Phe Phe Gln Arg Tyr Ile Glu His Leu Pro Thr Ala Gly Glu Ile
145 150 155 160
Val Phe Phe Asp Arg Ser Trp Tyr Asn Arg Ala Gly Val Glu Arg Val
165 170 175
Met Gly Phe Cys Thr Pro Ser Glu Tyr Leu Glu Phe Met Arg Gln Ala
180 185 190
Pro Glu Leu Glu Arg Met Leu Val Arg Ser Gly Ile Arg Leu Tyr Lys
195 200 205
Tyr Trp Phe Ser Val Thr Arg Asp Glu Gln Arg Ala Arg Phe Leu Ala
210 215 220
Arg Glu Thr Asp Pro Leu Lys Arg Trp Lys Leu Ser Pro Ile Asp Lys
225 230 235 240
Ala Ser Leu Asp Lys Trp Asp Asp Tyr Thr Glu Ala Lys Glu Ala Met
245 250 255
Phe Phe Tyr Thr Asp Thr Ala Asp Ala Pro Trp Thr Ile Val Lys Ser
260 265 270
Asn Asp Lys Lys Arg Ala Arg Leu Asn Cys Met Arg His Phe Leu Ser
275 280 285
Ser Leu Asp Tyr Pro Gly Lys Asp Pro Glu Val Val Gly Val Pro Asp
290 295 300
Pro Leu Ile Val Gly Arg Ala Ala Gln Val Ile Gly Thr Ala Ala Asp
305 310 315 320
Ile Leu Asp Ser Ala Thr Pro Pro Ala Leu Arg Lys Pro Arg Gln Gly
325 330 335
<210>126
<211>544
<212>PRT
<213>橙色绿屈挠菌ATCC29366
<400>126
Met Leu Glu Arg Cys Ile Thr Asp Val Lys Leu Ser Lys Glu Glu Tyr
1 5 10 15
Thr Gln Leu Ala Pro Gly Leu Gln Ala Arg Leu Phe Asp Leu Glu Gln
20 25 30
Met Leu Leu Glu Ala Arg Ile Pro Thr Ile Phe Val Phe Glu Gly Trp
35 40 45
Ala Gly Thr Ala Lys Ala Arg Thr Ile Ala Thr Leu Thr Arg Arg Leu
50 55 60
Asp Pro Arg Gly Phe Arg Val His Ser Ile Thr Pro Pro Arg Thr Tyr
65 70 75 80
Glu Gln Gln Tyr Pro Trp Leu Tyr Arg Phe Trp Leu Lys Ile Pro Ser
85 90 95
Tyr Gly Gln Met Ser Phe Phe Asp Arg Ser Trp Tyr Arg Glu Leu Leu
100 105 110
Ala Ala Tyr Thr Thr Gly Gly Ser Arg Asp Glu Trp Arg Thr His Cys
115 120 125
Glu Asp Ala Val Ile Phe Glu Arg Gln Leu Ala Asp Asp Gly Ala Leu
130 135 140
Ile Leu Lys Phe Trp Leu His Ile Thr Lys Lys Gln Gln Ala Arg Arg
145 150 155 160
Phe Ala Lys Leu Leu Ala Asp Pro Leu Asn Ala Trp Arg Val Thr Glu
165 170 175
Glu Asp Leu Trp Gln His Arg His Tyr Lys Lys Val Tyr Leu Ala Val
180 185 190
Glu Glu Met Leu Ser Arg Thr Asp Thr Ala Phe Ala Pro Trp His Ile
195 200 205
Ile Pro Ala Ala Asp Lys Arg Tyr Ala Arg Leu Thr Val Leu Gln Ile
210 215 220
Ile Val Gly Ala Leu Glu Ser Arg Leu Gly Ile Thr Ala Ser Asp Arg
225 230 235 240
Glu Ala Ser Leu Asp Asp Ser Gly Leu Ala Leu Arg Arg Tyr Tyr Leu
245 250 255
Asp Leu Arg Thr Pro Val Val Ala Thr Pro Arg Ala Ala Pro Val Asp
260 265 270
Ala Gly Asn Ser Ser Thr Met Thr Leu Gln Gln Ala Glu Pro Ile Thr
275 280 285
Thr Pro Val Val Val Thr Pro Val Ala Pro Leu Leu Arg Ala Ala Ser
290 295 300
Pro Leu Gln Arg Val Asp Leu Ser Leu Arg Leu Asp Asp Asp Thr Tyr
305 310 315 320
His Arg Glu Leu Lys Arg Leu Gln Ala Arg Met Tyr Leu Leu Gly Leu
325 330 335
Gln Val Tyr His Gln Lys Arg Pro Val Val Phe Val Phe Glu Gly Trp
340 345 350
Asp Ala Ala Gly Lys Gly Gly Ala Ile Gln Arg Leu Thr Ala Glu Leu
355 360 365
Asp Pro Arg Ala Tyr Thr Val His Ala Ile Ala Ala Pro Ala Gly Asp
370 375 380
Asp Lys Ala Arg His Tyr Leu Tyr Arg Phe Trp Arg Arg Leu Pro Pro
385 390 395 400
Arg Gly Gln Phe Ala Ile Phe Asp Arg Ser Trp Tyr Gly Arg Val Leu
405 410 415
Val Glu Arg Val Glu Gly Phe Ala Arg Pro Asp Glu Trp Arg Arg Ala
420 425 430
Tyr Ala Glu Ile Asn Gln Phe Glu Arg Gln Leu Val Asp Phe Gly Ala
435 440 445
Ile Ile Ala Lys Phe Trp Leu His Ile Ser Pro Glu Glu Gln Leu Arg
450 455 460
Arg Phe Glu Glu Arg Gln His Val Pro Tyr Lys Ala Trp Lys Leu Thr
465 470 475 480
Asp Glu Asp Trp Arg Asn Arg Glu Lys Trp Pro Ala Tyr Leu Glu Ala
485 490 495
Ala Asp Glu Met Leu Leu Arg Thr Ser Thr Pro Tyr Ala Pro Trp Thr
500 505 510
Ile Val Glu Ala Glu Asp Lys Lys Tyr Ala Arg Ile Lys Ile Leu Arg
515 520 525
Thr Ala Val Glu Val Leu Glu Ala Glu Leu Gly Pro Val Lys Leu Asp
530 535 540
<210>127
<211>302
<212>PRT
<213>Mesorhixobium loti MAFF303099
<400>127
Met Lys Lys Ala Lys Glu Asn Pro Ala Thr Pro Thr Ser Gly Pro Leu
1 5 10 15
Lys Ile Arg Ile Gly Gly Lys Glu Arg Glu Phe Asp Ile Glu Asn Pro
20 25 30
Glu Leu Pro Asp Trp Val Glu Asp Asn Lys Leu Thr Ala Gly Gly Tyr
35 40 45
Pro Tyr Asp Lys Lys Met Asn Ser Asp Glu Tyr Asp Glu Thr Leu Glu
50 55 60
Lys Leu Gln Ile Glu Leu Val Lys Ala Gln Ala Trp Leu Gln Ala Thr
65 70 75 80
Gly Lys Arg Val Met Ala Leu Phe Glu Gly Arg Asp Ala Ala Gly Lys
85 90 95
Gly Gly Thr Ile Phc Val Val Arg Gln Tyr Leu Asn Pro Arg Thr Ala
100 105 110
Arg Asn Val Ala Leu Thr Lys Pro Thr Pro Thr Glu Leu Gly Gln Trp
115 120 125
Tyr Tyr Gln Arg Tyr Val Asp His Phe Pro Thr Ala Gly Glu Phe Val
130 135 140
Thr Phe Asp Arg Ser Trp Tyr Asn Arg Ala Gly Val Glu Pro Val Met
145 150 155 160
Gly Phe Cys Thr Pro Glu Gln His Glu Lys Phe Leu Asp Glu Thr Pro
165 170 175
His Phe Glu Arg Met Ile Val Asn Asp Asp Ile His Phe Phe Lys Phe
180 185 190
Trp Leu Asn Ile Gly Arg Glu Thr Gln Leu Glu Arg Phe His Asp Arg
195 200 205
Arg Tyr Ser Pro Leu Lys Ser Trp Lys Phe Ser Pro Ile Asp Val Ala
210 215 220
Gly Ile Thr Lys Trp Asp Asp Tyr Thr Lys Ala Arg Asp Ser Met Phe
225 230 235 240
Lys Arg Thr His Lys Glu Phe Ala Pro Trp Ile Ile Val Arg Ala Asn
245 250 255
Asp Lys Arg Arg Ala Arg Leu Ala Val Met Arg Arg Ile Leu Leu Ser
260 265 270
Leu Pro Tyr Glu Gly Arg Asp Leu Asp Ile Val Gly Lys Glu Asp Lys
275 280 285
Lys Ile Ile Gly Glu Gly Pro Ser Phe Leu Gly Lys Glu Gly
290 295 300
<210>128
<211>340
<212>PRT
<213>Streptomyces coelicolor ATCC BAA-471
<400>128
Met Gly Phe Leu Pro Ile Ser Glu Val Ser Gly Val Pro Gly Arg Glu
1 5 10 15
His Ser Ser His Glu Ala Pro Trp Glu Ser Thr Thr Thr Asp Thr Pro
20 25 30
Phe Arg Pro Ser Gly Ser Arg Pro Gly Thr Gly Thr Arg Ser Thr Arg
35 40 45
Ile Cys Ala Ala Arg Ala Arg Thr Val Pro Cys Arg His Gly Thr His
50 55 60
Arg Asn Ser Val Glu Ala Gly Gly Arg Met Ala Gly Thr Glu Leu Arg
65 70 75 80
Lys Ile Ser Gly Lys Val Tyr Glu Lys Glu Leu Arg Arg Leu Gln Ile
85 90 95
Glu Leu Val Asn Leu Gln Glu Trp Val Leu Thr Glu Lys Lys Arg Val
100 105 110
Ala Val Val Phe Glu Gly Arg Asp Ala Ala Gly Lys Gly Gly Thr Ile
115 120 125
Lys Arg Leu Thr Glu His Leu Asn Pro Arg Val Thr Arg Ile Val Ala
130 135 140
Leu Pro Arg Pro Thr Glu Arg Glu Arg Thr Gln Trp Tyr Phe Gln Arg
145 150 155 160
Tyr Val Glu Gln Leu Pro Ala Gly Gly Glu Ile Val Leu Phe Asp Arg
165 170 175
Ser Trp Tyr Asn Arg Ala Gly Val Glu His Val Met Gly Phe Cys Thr
180 185 190
Asp Asp Glu Tyr Arg Arg Phe Leu Arg His Cys Pro Val Phe Glu Arg
195 200 205
Met Leu Val Glu Asp Gly Leu Leu Leu Arg Lys Tyr Trp Phe Ser Val
210 215 220
Ser Asp Val Glu Gln Gln Glu Arg Phe Arg Arg Arg Leu Gln Asp Pro
225 230 235 240
Leu Lys Arg Trp Lys Leu Ser Thr Met Asp Leu Glu Ser Ile Thr Arg
245 250 255
Trp Glu Ala Tyr Ser Arg Ala Lys Asp Glu Met Met Ala Ala Thr Asp
260 265 270
Thr Pro Glu Ser Pro Trp Tyr Val Val Glu Ser Asp Asp Lys Arg Arg
275 280 285
Ala Arg Leu Asn Met Ile Ala His Leu Leu Asp Ser Leu Pro His His
290 295 300
Arg Val Pro Pro Pro Ser Leu Arg Leu Pro Glu Arg Pro Pro Pro Thr
305 310 315 320
Gly Tyr Thr Arg Ser Pro Arg Asp Arg Gln Thr Tyr Val Pro Asp His
325 330 335
Ala Ala Arg Leu
340
<210>129
<211>497
<212>PRT
<213>恶臭假单胞菌KT2440
<400>129
Met Phe Glu Ser Ala Glu Ile Gly His Ser Ile Asp Lys Glu Ala Tyr
1 5 10 15
Asp Ala Glu Val Pro Ala Leu Arg Glu Ala Leu Leu Glu Ala Gln Tyr
20 25 30
Glu Leu Lys Gln Gln Ala Arg Phe Pro Val Ile Val Leu Ile Asn Gly
35 40 45
Ile Glu Gly Ala Gly Lys Gly Glu Thr Val Lys Leu Leu Asn Glu Trp
50 55 60
Met Asp Pro Arg Met Ile Asp Val Leu Thr Phe Asp Gln Gln Thr Asp
65 70 75 80
Glu Glu Leu Ala Arg Pro Pro Ala Trp Arg Tyr Trp Arg Ala Leu Pro
85 90 95
Pro Lys Gly Arg Met Gly Val Phe Phe Gly Asn Trp Tyr Ser Gln Met
100 105 110
Leu Gln Gly Arg Val His Gly Val Phe Lys Asp Ala Val Leu Asp Gln
115 120 125
Ala Ile Thr Gly Ala Glu Arg Leu Glu Glu Met Leu Cys Asp Glu Gly
130 135 140
Ala Leu Ile Ile Lys Phe Trp Phe His Leu Ser Lys Lys Gln Met Lys
145 150 155 160
Ala Arg Leu Lys Ser Leu Lys Asp Asp Pro Leu His Ser Trp Lys Ile
165 170 175
Ser Pro Leu Asp Trp Gln Gln Ser Gln Thr Tyr Asp Arg Phe Val Arg
180 185 190
Phe Gly Glu Arg Va Leu Arg Arg Thr Ser Arg Asp Tyr Ala Pro Trp
195 200 205
His Ile Ile Glu Gly Val Asp Pro Asn Tyr Arg Ser Leu Ala Val Gly
210 215 220
Arg Ile Leu Leu Glu Ser Leu Gln Ala Ala Leu Ala His Asn Pro Lys
225 230 235 240
Gly Lys His Gln Gly Asn Val Ala Pro Leu Gly Arg Ser Ile Asp Asp
245 250 255
Arg Ser Leu Leu Gly Ala Leu Asp Met Thr Leu Arg Leu Asp Lys Ala
260 265 270
Asp Tyr Gln Glu Gln Leu Ile Thr Glu Gln Ala Arg Leu Ala Gly Leu
275 280 285
Leu Arg Asp Lys Arg Met Arg Arg His Ala Leu Val Ala Val Phe Glu
290 295 300
Gly Asn Asp Ala Ala Gly Lys Gly Gly Ala Ile Arg Arg Val Ala Ala
305 310 315 320
Ala Leu Asp Pro Arg Gln Tyr Arg Ile Val Pro Ile Ala Ala Pro Thr
325 330 335
Glu Glu Glu Arg Ala Gln Pro Tyr Leu Trp Arg Phe Trp Arg His Ile
340 345 350
Pro Ala Arg Gly Lys Phe Thr Ile Phe Asp Arg Ser Trp Tyr Gly Arg
355 360 365
Val Leu Val Glu Arg Val Glu Gly Phe Cys Ser Pro Ala Asp Trp Met
370 375 380
Arg Ala Tyr Ser Glu IIe Asn Asp Phe Glu Glu Gln Leu Val Asp Ala
385 390 395 400
Gly Val Val Val Val Lys Phe Trp Leu Ala Ile Asp Gln Gln Thr Gln
405 410 415
Leu Glu Arg Phe Glu Glu Arg Glu Gln Ile Pro Phe Lys Arg Tyr Lys
420 425 430
Ile Thr Glu Asp Asp Trp Arg Asn Arg Asp Lys Trp Asp Glu Tyr Ser
435 440 445
Gln Ala Val Gly Asp Met Val Asp Arg Thr Ser Ser Glu Ile Ala Pro
450 455 460
Trp Thr Leu Val Glu Ala Asn Asp Lys Arg Trp Ala Arg Val Lys Val
465 470 475 480
Val Arg Thr Ile Asn Gln Ala Leu Glu Ala Ala Phe Ala Lys His Lys
485 490 495
Lys
<210>130
<211>330
<212>PRT
<213>苜蓿中华根瘤菌ATCC51124
<400>130
Met Ala Leu Asp Glu Ala Pro Ala Glu Ala Arg Pro Gly Ser Arg Ala
1 5 10 15
Val Glu Leu Glu Ile Asp Gly Arg Ser Arg Ile Phe Asp Ile Asp Asp
20 25 30
Pro Asp Leu Pro Lys Trp Ile Asp Glu Glu Ala Phe Arg Ser Asp Asp
35 40 45
Tyr Pro Tyr Lys Lys Lys Leu Asp Arg Glu Glu Tyr Glu Glu Thr Leu
50 55 60
Thr Lys Leu Gln Ile Glu Leu Val Lys Val Gln Phe Trp Met Gln Ala
65 70 75 80
Thr Gly Lys Arg Val Met Ala Val Phe Glu Gly Arg Asp Ala Ala Gly
85 90 95
Lys Gly Gly Ala Ile His Ala Thr Thr Ala Asn Met Asn Pro Arg Ser
100 105 110
Ala Arg Val Val Ala Leu Thr Lys Pro Thr Glu Thr Glu Arg Gly Gln
115 120 125
Trp Tyr Phe Gln Arg Tyr Val Ala Thr Phe Pro Thr Ala Gly Glu Phe
130 135 140
Val Leu Phe Asp Arg Ser Trp Tyr Asn Arg Ala Gly Val Glu Pro Val
145 150 155 160
Met Gly Phe Cys Thr Pro Asp Gln Tyr Glu Gln Phe Leu Lys Glu Ala
165 170 175
Pro Arg Phe Glu Glu Met Ile Ala Asn Glu Gly Ile His Leu Phe Lys
180 185 190
Phe Trp Ile Asn Ile Gly Arg Glu Met Gln Leu Lys Arg Phe His Asp
195 200 205
Arg Arg His Asp Pro Leu Lys Ile Trp Lys Leu Ser Pro Met Asp Ile
210 215 220
Ala Ala Leu Ser Lys Trp Asp Asp Tyr Thr Gly Lys Arg Asp Arg Met
225 230 235 240
Leu Lys Glu Thr His Thr Glu His Gly Pro Trp Ala Val Ile Arg Gly
245 250 255
Asn Asp Lys Arg Arg Ser Arg Ile Asn Val Ile Arg His Met Leu Thr
260 265 270
Lys Leu Asp Tyr Asp Gly Lys Asp Glu Ala Ala Ile Gly Glu Val Asp
275 280 285
Glu Lys Ile Leu Gly Ser Gly Pro Gly Phe Leu Arg
290 295 330
<210>131
<211>306
<212>PRT
<213>苜蓿中华根瘤菌ATCC51124
<400>131
Met Ser Asn Ser Lys Asp Glu Val Glu Arg Ile Asp Trp Leu Glu Ala
1 5 10 15
Glu Leu Ala Asp Thr Ile Asp Glu Asp Tyr Glu Leu Glu Leu Ser Glu
20 25 30
Pro Thr Leu Ser Glu Lys Ile Arg Glu Ile Tyr Arg Lys Ala His Pro
35 40 45
Pro Ala Leu Pro Arg Met Asp Tyr Phe Arg Ala Leu Leu Ala Leu Gln
50 55 60
Ala Glu Leu Ile Lys Leu Gln Asp Trp Val Val Tyr His Lys Gln Lys
65 70 75 80
Val Val Val Ile Phe Glu Gly Arg Asp Ala Ala Gly Lys Gly Gly Val
85 90 95
Ile Lys Arg Ile Thr Gln Arg Leu Asn Pro Arg Ile Val Arg Thr Val
100 105 110
Ala Leu Pro Ala Pro Ser Asp Arg Glu Lys Thr Gln Trp Tyr Phe Gln
115 120 125
Arg Tyr Val Pro His Leu Pro Ala Gly Gly Glu Ile Val Leu Phe Asp
130 135 140
Arg Ser Trp Tyr Asn Arg Cys Gly Val Glu Arg Val Met Gly Phe Ala
145 150 155 160
Thr Glu Glu Glu Val Glu Gln Phe Phe Asp Asp Val Pro Glu Phe Glu
165 170 175
Arg Met Leu Val Arg Ser Gly Val Arg Leu Val Lys Tyr Trp Phe Ser
180 185 190
Ile Thr Asp Glu Glu Gln Gln Leu Arg Phe Leu Thr Arg Ile His Asp
195 200 205
Pro Leu Lys Gln Trp Lys Leu Ser Pro Met Asp Leu Gln Ser Arg Val
210 215 220
Arg Trp Glu Ala Tyr Thr Lys Ala Lys Glu Glu Thr Phe Ala Arg Thr
225 230 235 240
Asn Ile Arg Glu Ala Pro Trp His Ile Val Glu Ala Asn Asp Lys Lys
245 250 255
Arg Ala Arg Leu Asn Cys Ile Asp His Leu Leu Lys Gln Ile Pro Tyr
260 265 270
Glu Asp Val Pro His Glu Asp Ile Thr Leu Pro Glu Arg Ile Phe Asn
275 280 285
Pro Asn Tyr Glu Arg Lys Val Leu Pro Pro Glu Leu Tyr Val Pro Ala
290 295 300
Lys Tyr
305
Claims (16)
1.二肽或二肽衍生物I的制造方法,其特征是使i)磷酸供体、ii)选自腺苷-5’-一磷酸(以下,略为AMP)、腺苷-5’-二磷酸(以下,略为ADP)和腺苷-5’-三磷酸(以下,略为ATP)中的物质、iii)具有多磷酸激酶活性的蛋白质或具有生产该蛋白质能力的细胞的培养物或该培养物的处理物、iv)具有ATP依赖性的、由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质或具有生产该蛋白质的能力的细胞的培养物或该培养物的处理物、和v)1种以上的氨基酸或氨基酸衍生物在水性介质中共存,使二肽或二肽衍生物[以下,称为二肽或二肽衍生物I]在该水性介质中生成、蓄积,从该水性介质回收该二肽或二肽衍生物I,其中:
(1)具有多磷酸激酶活性的蛋白质是下述[1]的蛋白质:
[1]由序列号124~131中的任一个表示氨基酸序列构成的蛋白质,
(2)具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽的活性的蛋白质是选自以下[3]~[4]、[6]和[8]中的蛋白质:
[3]由序列号1~13中的任一个表示的氨基酸序列构成的蛋白质,
[4]由与序列号1~13中的任一个表示的氨基酸序列具有95%以上同源性的氨基酸序列构成,而且具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽的活性的蛋白质,
[6]由序列号47或48表示的氨基酸序列构成的蛋白质,
[8]由序列号53表示的氨基酸序列构成的蛋白质,
(3)1种以上的氨基酸或氨基酸衍生物是选自L-丙氨酸、甘氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-谷氨酰胺、L-α-氨基丁酸和β-丙氨酸中的一种氨基酸或其衍生物,与选自L-丙氨酸、L-谷氨酰胺、L-谷氨酸、甘氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、β-丙氨酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸中的一种氨基酸或其衍生物的组合。
2.二肽或二肽衍生物II的制造方法,其特征是使i)磷酸供体、ii)选自腺苷-5’-一磷酸(以下,略为AMP)、腺苷-5’-二磷酸(以下,略为ADP)和腺苷-5’-三磷酸(以下,略为ATP)中的物质、iii)具有多磷酸激酶活性的蛋白质或具有生产该蛋白质能力的细胞的培养物或该培养物的处理物、iv)具有ATP依赖性的、由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质或具有生产该蛋白质的能力的细胞的培养物或该培养物的处理物、和v)1种以上的氨基酸或氨基酸衍生物在水性介质中共存,使二肽或二肽衍生物I在该水性介质中生成、蓄积,直接进行修饰或从该水性介质回收该二肽或二肽衍生物I后对该二肽或二肽衍生物I进行修饰,使二肽或二肽衍生物[以下,称为二肽或二肽衍生物II]生成,回收该二肽或二肽衍生物II,其中:
(1)具有多磷酸激酶活性的蛋白质是下述[1]的蛋白质:
[1]由序列号124~131中的任一个表示氨基酸序列构成的蛋白质,
(2)具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽的活性的蛋白质是选自以下[3]~[4]、[6]和[8]中的蛋白质:
[3]序列号1~13中的任一个表示的氨基酸序列构成的蛋白质,
[4]由与序列号1~13中的任一个表示的氨基酸序列具有95%以上同源性的氨基酸序列构成,而且具有ATP依赖性的、由氨基酸和氨基酸衍生物生成二肽的活性的蛋白质,
[6]由序列号47或48表示的氨基酸序列构成的蛋白质,
[8]由序列号53表示的氨基酸序列构成的蛋白质,
(3)1种以上的氨基酸或氨基酸衍生物是选自L-丙氨酸、甘氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-谷氨酰胺、L-α-氨基丁酸和β-丙氨酸中的一种氨基酸或其衍生物,与选自L-丙氨酸、L-谷氨酰胺、L-谷氨酸、甘氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、β-丙氨酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸中的一种氨基酸或其衍生物的组合。
3.权利要求1或2中的任一项所述的制造方法,其中具有生产ATP依赖性的、由氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质能力的细胞是具有选自以下的[1]、[2]、[4]和[6]中的DNA的细胞:
[1]由序列号14~26和46中的任一个表示的碱基序列构成的DNA,
[2]与序列号14~26和46中的任一个表示的碱基序列具有95%以上的同源性,而且编码具有ATP依赖性的、由氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质的DNA,
[4]由序列号49或50表示的碱基序列构成的DNA,
[6]由序列号54表示的碱基序列构成的DNA。
4.权利要求1~3中的任一项所述的制造方法,其中具有生产具有多磷酸激酶活性的蛋白质能力的细胞是具有以下的[1]所述的DNA的细胞:
[1]由序列号116~123中的任一个表示的碱基序列构成的DNA。
5.权利要求1~4中任一项所述的制造方法,其中所述氨基酸衍生物选自:β-氯-L-丙氨酸、β-氰基-L-丙氨酸、β-环戊基-DL-丙氨酸、β-环丙基丙氨酸、β-环己基丙氨酸、4-氯苯丙氨酸、4-氟苯丙氨酸、p-硝基苯丙氨酸、p-氨基苯丙氨酸、苯丙氨酸酰胺、L-犬尿氨酸、谷氨酸-γ-甲酯、谷氨酸-γ-乙酯、谷氨酸-γ-t丁酯、谷氨酸-γ-苄酯、天冬氨酸-β-甲酯、天冬氨酸-β-t丁酯、天冬氨酸-β-苄酯、乙酰赖氨酸、Boc-赖氨酸。
6.权利要求2~5中任一项所述的制造方法,其中所述二肽衍生物II是N-[2-(乙酰氨基)丙酰基]苯丙氨酸或1-{2-[N-(2-(乙酰氨基)丙酰基)氨基]-3-苯丙酰}哌啶。
7.权利要求1~5中的任一项所述的制造方法,其中二肽或二肽衍生物I或二肽或二肽衍生物II是从选自L-丙氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-谷氨酰胺、L-α-氨基丁酸、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸的L-氨基酸、甘氨酸、和β-丙氨酸选出的相同或不同的氨基酸通过肽键形成的二肽或二肽衍生物。
8.权利要求1~7中的任一项所述的制造方法,其中细胞是微生物的细胞。
9.权利要求8所述的制造方法,其中微生物是原核生物。
10.权利要求9所述的制造方法,其中原核生物是1种以上的肽酶和1种以上的具有肽转运活性的蛋白质(以下,也称为肽转运蛋白质)的活性低下或丧失的微生物。
11.权利要求9所述的制造方法,其中原核生物是3种以上的肽酶的活性低下或丧失的微生物。
12.权利要求10或11所述的制造方法,其中肽酶是由序列号55~58任一项所示的氨基酸序列构成的蛋白质。
13.权利要求10或12所述的制造方法,其中肽转运蛋白质是由序列号59~63中的任一个表示的氨基酸序列构成的蛋白质。
14.权利要求9~13中的任一项所述的制造方法,其中原核生物是属于埃希氏菌(Escherichia)属、芽孢杆菌(Bacillus)属或棒杆菌(Corynebacterium)属的微生物。
15.权利要求14所述的制造方法,其中属于埃希氏菌属、芽孢杆菌属或棒杆菌属的微生物是大肠杆菌(Escherichia coli)、谷氨酸棒杆菌(Corynebacterium glutamicum)、产氨棒杆菌(Corymebacterium ammoniagenes)、乳酸发酵棒杆菌(Corynebacterium lactofermentum)、黄色短杆菌(Brevibacterium flavum)、Corynebacterium efficiens、枯草芽孢杆菌(Bacillus subtilis)或巨大芽孢杆菌(Bacillus megaterium)。
16.权利要求1~15中的任一项所述的制造方法,其中培养物的处理物是从培养物的热处理物、培养物的浓缩物、培养物的干燥物、对培养物进行离心分离得到的细胞、该细胞的热处理物、该细胞的干燥物、该细胞的冷冻干燥物、该细胞的表面活性剂处理物、该细胞的超声波处理物、该细胞的机械性磨碎处理物、该细胞的溶剂处理物、该细胞的酶处理物、该细胞的蛋白质分级物、该细胞的固定化物和从该细胞提取得到的酶标准品中选出的处理物,而且具有ATP依赖性的、由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性或多磷酸激酶活性的处理物。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP189007/2004 | 2004-06-25 | ||
| JP2004189007 | 2004-06-25 | ||
| PCT/JP2005/011639 WO2006001382A1 (ja) | 2004-06-25 | 2005-06-24 | ジペプチドまたはジペプチド誘導体の製造法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN1973037A CN1973037A (zh) | 2007-05-30 |
| CN1973037B true CN1973037B (zh) | 2011-10-19 |
Family
ID=35169745
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN2005800207400A Expired - Lifetime CN1973037B (zh) | 2004-06-25 | 2005-06-24 | 二肽或二肽衍生物的制造方法 |
Country Status (7)
| Country | Link |
|---|---|
| US (2) | US8257943B2 (zh) |
| EP (1) | EP1616963B1 (zh) |
| JP (1) | JP5424531B2 (zh) |
| CN (1) | CN1973037B (zh) |
| AT (1) | ATE449183T1 (zh) |
| DE (1) | DE602005017707D1 (zh) |
| WO (1) | WO2006001382A1 (zh) |
Families Citing this family (38)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1760152A4 (en) * | 2004-04-21 | 2007-08-08 | Kyowa Hakko Kogyo Kk | PROCESS FOR DIPEPTIDE PRODUCTION |
| WO2006104186A1 (ja) * | 2005-03-29 | 2006-10-05 | Kyowa Hakko Kogyo Co., Ltd. | ジペプチドの結晶およびその製造法 |
| US8673590B2 (en) | 2007-04-06 | 2014-03-18 | Kyowa Hakko Bio Co., Ltd. | Method for producing dipeptide |
| JP5475643B2 (ja) * | 2007-05-04 | 2014-04-16 | マリーナ バイオテック,インコーポレイテッド | アミノ酸脂質およびその使用 |
| WO2009139392A1 (ja) * | 2008-05-12 | 2009-11-19 | 味の素株式会社 | β-アラニルアミノ酸またはその誘導体の製造方法 |
| US9637746B2 (en) | 2008-12-15 | 2017-05-02 | Greenlight Biosciences, Inc. | Methods for control of flux in metabolic pathways |
| EP2379728A4 (en) * | 2008-12-22 | 2016-04-13 | Greenlight Biosciences Inc | COMPOSITIONS AND METHODS FOR THE PRODUCTION OF A COMPOUND |
| CN102782146B (zh) * | 2010-03-01 | 2015-07-08 | 三井化学株式会社 | 1,5-戊二异氰酸酯的制造方法 |
| WO2011140516A2 (en) | 2010-05-07 | 2011-11-10 | Greenlight Biosciences, Inc. | Methods for control of flux in metabolic pathways through enzyme relocation |
| KR101698436B1 (ko) * | 2010-08-11 | 2017-01-20 | (주)아모레퍼시픽 | 데아닌 유도체, 이의 제조방법 및 이를 함유하는 항여드름용 피부 외용제 조성물 |
| WO2012030980A1 (en) | 2010-08-31 | 2012-03-08 | Greenlight Biosciences, Inc. | Methods for control of flux in metabolic pathways through protease manipulation |
| SG2014014377A (en) | 2011-09-09 | 2014-05-29 | Greenlight Biosciences Inc | Cell-free preparation of carbapenems |
| JP5951953B2 (ja) * | 2011-10-07 | 2016-07-13 | 協和発酵バイオ株式会社 | 新規ジペプチド合成酵素およびそれを用いたジペプチドの製造法 |
| DE102012024435A1 (de) | 2012-12-14 | 2014-07-10 | Forschungszentrum Jülich GmbH | Verfahren zur Identifizierung einer Zelle mit gegenüber ihrem Wildtyp erhöhten intrazellulären Konzentration eines bestimmten Metaboliten, wobei die Veränderung der Zelle durch Rekombi-neering erreicht wird, sowie ein Verfahren zur Herstellung einer gegenüber ihrem Wildtyp genetisch veränderten Produktionszelle mit optimierter Produktion eines bestimmten Metaboliten, ein Verfahren zur Herstellung dieses Metaboliten, sowie dafür geeignete Nukleinsäuren |
| EP2935598A1 (en) | 2012-12-21 | 2015-10-28 | Greenlight Biosciences Inc. | Cell-free system for converting methane into fuel, pyruvate or isobutanol |
| AU2014306074B2 (en) | 2013-08-05 | 2018-08-30 | Greenlight Biosciences, Inc. | Engineered proteins with a protease cleavage site |
| CA2980172A1 (en) | 2015-03-30 | 2016-10-06 | Greenlight Biosciences, Inc. | Cell-free production of ribonucleic acid |
| KR101813759B1 (ko) | 2015-06-24 | 2018-01-02 | 씨제이제일제당 (주) | 퓨트레신 또는 오르니틴 생산 미생물 및 이를 이용한 퓨트레신 또는 오르니틴 생산방법 |
| CN106893748B (zh) * | 2015-12-21 | 2020-11-17 | 中国科学院天津工业生物技术研究所 | 一种l-茶氨酸的合成方法 |
| CN105624238B (zh) * | 2016-01-12 | 2021-05-04 | 北京化工大学 | 一种理性设计的酶用于再生atp的方法 |
| AR107900A1 (es) * | 2016-03-16 | 2018-06-28 | Aist | Un gen de síntesis de tentoxina, un método para producir tentoxina o dihidrotentoxina usando el gen, y un transformante que lo comprende |
| RU2018138975A (ru) | 2016-04-06 | 2020-05-12 | Гринлайт Байосайенсис, Инк. | Бесклеточная продукция рибонуклеиновой кислоты |
| CN106083992B (zh) * | 2016-06-17 | 2019-08-20 | 四川松麒医药科技有限公司 | 一种肌肽衍生物的制备方法、产品及应用 |
| KR20190100386A (ko) | 2017-01-06 | 2019-08-28 | 그린라이트 바이오사이언시스, 아이엔씨. | 당의 무세포 생산 |
| EP3620527A4 (en) * | 2017-05-01 | 2020-05-20 | Kaneka Corporation | METHOD FOR PRODUCING A SUBSTANCE USING ATP |
| CN117887788A (zh) * | 2017-09-29 | 2024-04-16 | 三菱化学株式会社 | 烟酰胺单核苷酸的制造方法 |
| SG11202003192UA (en) | 2017-10-11 | 2020-05-28 | Greenlight Biosciences Inc | Methods and compositions for nucleoside triphosphate and ribonucleic acid production |
| CN108531465B (zh) * | 2018-04-04 | 2022-05-17 | 南京农业大学 | 一种环二肽合成酶及其应用 |
| JP2020022433A (ja) * | 2018-08-01 | 2020-02-13 | 東海物産株式会社 | イミダゾールジペプチドの製造方法 |
| CN109280631B (zh) * | 2018-10-24 | 2021-07-09 | 哈尔滨商业大学 | 一株磺胺二甲基嘧啶降解菌s-2及其应用 |
| CN110373370B (zh) * | 2019-07-16 | 2022-11-18 | 大连医诺生物股份有限公司 | 一种耦合atp再生系统的催化体系及其在生产谷胱甘肽过程中的应用 |
| CN110387379B (zh) * | 2019-07-16 | 2022-11-22 | 大连医诺生物股份有限公司 | 一种用于生产谷胱甘肽的重组大肠杆菌的混合培养工艺及其应用 |
| CN112680371A (zh) * | 2019-10-18 | 2021-04-20 | 广东利世康低碳科技有限公司 | 一种水解餐厨垃圾中蛋白成分的产朊假丝酵母双基因共表达菌株及其构建方法 |
| CN113025592B (zh) * | 2021-04-28 | 2022-06-24 | 上海邦林生物科技有限公司 | 一种高性能多聚磷酸激酶突变体及其应用 |
| CN113651756B (zh) * | 2021-06-30 | 2023-08-15 | 北京大学深圳研究生院 | 一种遗传编码的光交联非天然氨基酸盐及其制备方法与应用 |
| CN118043464A (zh) | 2021-09-30 | 2024-05-14 | 味之素株式会社 | 修饰酶和使用了所述修饰酶的咪唑二肽的制造方法 |
| CN114703161B (zh) * | 2022-03-30 | 2024-07-02 | 新泰市佳禾生物科技有限公司 | 聚磷酸盐激酶1突变体及其生产菌的构建与应用 |
| CN117721165B (zh) * | 2024-02-08 | 2024-05-03 | 天津凯莱英生物科技有限公司 | Atp再生体系和多肽的合成方法 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000003009A2 (de) * | 1998-07-10 | 2000-01-20 | Institut für Pflanzengenetik und Kulturpflanzenforschung | Gene zur biosynthese von anticapsin und bacilysin, ihre isolierung und verwendung |
| WO2000058478A1 (en) * | 1999-03-29 | 2000-10-05 | Holland Sweetener Company V.O.F. | MICROBIOLOGICAL PRODUCTION METHOD FOR α-L-ASPARTYL-L-PHENYLALANINE |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3131322B2 (ja) | 1991-12-17 | 2001-01-31 | 協和醗酵工業株式会社 | 新規α2→3シアリルトランスフェラーゼ |
| WO1994023021A1 (fr) | 1993-03-29 | 1994-10-13 | Kyowa Hakko Kogyo Co., Ltd. | α-1,3-FUCOSYLTRANSFERASE |
| CA2365594A1 (en) * | 1999-03-29 | 2000-10-05 | Holland Sweetener Company V.O.F. | Microbiological production method for .alpha.-l-aspartyl-l-phenylalanine |
| FR2841260B1 (fr) * | 2002-06-21 | 2004-10-22 | Commissariat Energie Atomique | Polynucleotides et polypeptides codes par lesdits polynucleotides impliques dans la synthese de derives des dicetopiperazines |
| CN100400660C (zh) * | 2002-12-26 | 2008-07-09 | 协和发酵工业株式会社 | 生产二肽的方法 |
| WO2004076477A1 (en) * | 2003-02-26 | 2004-09-10 | Holland Sweetener Company | MICROBIOLOGICAL PRODUCTION METHOD FOR α-L-ASPARTYL-L-PHENYLALANINE |
| US20050106703A1 (en) * | 2003-11-05 | 2005-05-19 | Kyowa Hakko Kogyo Co., Ltd. | Microorganisms producing dipeptides and process for producing dipeptides using the microorganisms |
| US20050148048A1 (en) * | 2003-11-27 | 2005-07-07 | Kyowa Hakko Kogyo Co., Ltd. | Process for producing dipeptides |
| ES2347875T3 (es) * | 2004-06-25 | 2010-11-22 | Kyowa Hakko Bio Co., Ltd. | Procedimiento para la produccion de dipeptidos. |
-
2005
- 2005-06-24 CN CN2005800207400A patent/CN1973037B/zh not_active Expired - Lifetime
- 2005-06-24 WO PCT/JP2005/011639 patent/WO2006001382A1/ja not_active Ceased
- 2005-06-24 DE DE602005017707T patent/DE602005017707D1/de not_active Expired - Lifetime
- 2005-06-24 AT AT05013733T patent/ATE449183T1/de not_active IP Right Cessation
- 2005-06-24 JP JP2006528633A patent/JP5424531B2/ja not_active Expired - Lifetime
- 2005-06-24 US US11/165,226 patent/US8257943B2/en not_active Expired - Lifetime
- 2005-06-24 EP EP05013733A patent/EP1616963B1/en not_active Expired - Lifetime
-
2012
- 2012-03-27 US US13/430,937 patent/US8709752B2/en not_active Expired - Lifetime
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000003009A2 (de) * | 1998-07-10 | 2000-01-20 | Institut für Pflanzengenetik und Kulturpflanzenforschung | Gene zur biosynthese von anticapsin und bacilysin, ihre isolierung und verwendung |
| WO2000058478A1 (en) * | 1999-03-29 | 2000-10-05 | Holland Sweetener Company V.O.F. | MICROBIOLOGICAL PRODUCTION METHOD FOR α-L-ASPARTYL-L-PHENYLALANINE |
Non-Patent Citations (3)
| Title |
|---|
| Murata Kousaku et al..Polyphosphate Kinase:Distribution,Some Properties and ItsApplication as an ATP Regeneration System.Agricultural and Biological Chemistry52 6.1988,52(6),1471-1477. * |
| MurataKousakuetal..PolyphosphateKinase:Distribution Some Properties and ItsApplication as an ATP Regeneration System.Agricultural and Biological Chemistry52 6.1988 |
| Yazgan Ayten et al..Bacilysin biosynthesis by a partially-purified enzyme fractionfrom bacillus subtilis.Enzyme and Microbial Technology29.2001,29400-406. * |
Also Published As
| Publication number | Publication date |
|---|---|
| JPWO2006001382A1 (ja) | 2008-04-17 |
| CN1973037A (zh) | 2007-05-30 |
| US20050287627A1 (en) | 2005-12-29 |
| EP1616963A3 (en) | 2006-05-31 |
| ATE449183T1 (de) | 2009-12-15 |
| EP1616963A2 (en) | 2006-01-18 |
| WO2006001382A1 (ja) | 2006-01-05 |
| US8257943B2 (en) | 2012-09-04 |
| US8709752B2 (en) | 2014-04-29 |
| JP5424531B2 (ja) | 2014-02-26 |
| EP1616963B1 (en) | 2009-11-18 |
| US20120258490A1 (en) | 2012-10-11 |
| DE602005017707D1 (de) | 2009-12-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN1973037B (zh) | 二肽或二肽衍生物的制造方法 | |
| US8039236B2 (en) | Process for producing dipeptides | |
| CN1973042B (zh) | 二肽的制造方法 | |
| US20100120126A1 (en) | Microorganisms producing dipeptides and process for producing dipeptide using the microorganisms | |
| JP5424530B2 (ja) | ジペプチドまたはジペプチド誘導体の製造法 | |
| DE602004008201T2 (de) | Verfahren zur Herstellung von Dipeptiden | |
| US20070243581A1 (en) | Process for Producing Dipeptides | |
| JPWO2009028253A1 (ja) | ペプチドの製造法 | |
| HK1101826A (zh) | 二肽或二肽衍生物的制备方法 | |
| HK1099047A (zh) | 二肽的制备方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| ASS | Succession or assignment of patent right |
Owner name: XIEHE FERMENTATION BIOCHEMICAL CO., LTD. Free format text: FORMER OWNER: KYOWA HAKKO KOGYO CO., LTD. Effective date: 20090508 |
|
| C41 | Transfer of patent application or patent right or utility model | ||
| TA01 | Transfer of patent application right |
Effective date of registration: 20090508 Address after: Tokyo, Japan Applicant after: KYOWA HAKKO BIO Co.,Ltd. Address before: Tokyo, Japan Applicant before: KYOWA HAKKO KOGYO Co.,Ltd. |
|
| C14 | Grant of patent or utility model | ||
| GR01 | Patent grant | ||
| CX01 | Expiry of patent term |
Granted publication date: 20111019 |
|
| CX01 | Expiry of patent term |