CN115161366A - 生产寡核苷酸的新颖方法 - Google Patents
生产寡核苷酸的新颖方法 Download PDFInfo
- Publication number
- CN115161366A CN115161366A CN202210531352.4A CN202210531352A CN115161366A CN 115161366 A CN115161366 A CN 115161366A CN 202210531352 A CN202210531352 A CN 202210531352A CN 115161366 A CN115161366 A CN 115161366A
- Authority
- CN
- China
- Prior art keywords
- leu
- lys
- glu
- ile
- gly
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H1/00—Processes for the preparation of sugar derivatives
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6811—Selection methods for production or design of target specific oligonucleotides or binding molecules
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y605/00—Ligases forming phosphoric ester bonds (6.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y605/00—Ligases forming phosphoric ester bonds (6.5)
- C12Y605/01—Ligases forming phosphoric ester bonds (6.5) forming phosphoric ester bonds (6.5.1)
- C12Y605/01001—DNA ligase (ATP) (6.5.1.1)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/315—Phosphorothioates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/34—Spatial arrangement of the modifications
- C12N2310/341—Gapmers, i.e. of the type ===---===
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/352—Nature of the modification linked to the nucleic acid via a carbon atom
- C12N2310/3525—MOE, methoxyethoxy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/106—Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N2030/022—Column chromatography characterised by the kind of separation mechanism
- G01N2030/027—Liquid chromatography
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- General Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Saccharide Compounds (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明涉及生产寡核苷酸的新颖方法,其适合用于生产化学修饰的寡核苷酸,诸如在治疗中使用的那些。本文中公开了新颖的生产寡核苷酸的方法,其适合用于生产化学修饰的寡核苷酸,诸如用于用在治疗中的那些,所述方法包括:a)提供与所述产物的序列互补的模板寡核苷酸(I),所述模板具有允许它与所述产物分离的性质;b)提供寡核苷酸的集合(II);c)在允许退火的条件下使(I)和(II)接触;d)改变所述条件以分离任何杂质,包括使退火的模板和杂质寡核苷酸链变性和分离所述杂质;和e)改变所述条件以分离所述产物,包括使退火的模板和产物寡核苷酸链变性和分离所述产物。
Description
本申请是国际申请日为2017年7月7日、国际申请号为PCT/EP2017/067049、进入中国国家阶段的申请号为201780043407.4、发明名称为“生产寡核苷酸的新颖方法”的PCT申请的分案申请。
技术领域
本发明涉及生产寡核苷酸的新颖方法,其适合用于生产化学修饰的寡核苷酸,诸如在治疗中使用的那些。
发明背景
寡核苷酸的化学合成和经由亚磷酰胺化学修饰的寡核苷酸是充分确定的,且几十年来已经成为合成这些确定序列生物聚合物的候选方法。所述合成方法经常作为固相合成来运行,其中依次添加各种核苷酸,每种核苷酸的添加需要几个化学步骤的循环来在后续步骤的准备中添加和去保护生长中的寡核苷酸(“寡物”)。在核苷酸的连续添加结束时,将所述寡物从固相支持物释放,发生进一步去保护,然后将粗制的寡核苷酸通过柱色谱法进一步纯化。
尽管该方法可以被视作常规的且可以是自动化的,但是该方法存在几个缺点,特别当目标是大规模制备寡核苷酸时,如寡核苷酸治疗剂所需要的。这些缺点包括、但不限于:
1) 在色谱法的应用中固有的实际限制,使它不适合用于纯化大量寡核苷酸。色谱法的大规模应用是昂贵的,且由于对柱大小和性能的限制而难以实现。
2) 错误的数目随着合成的寡核苷酸的长度而积累。因此,当前方法的线性连续性质导致收率的几何下降。例如,如果核苷酸添加的每个循环的收率是99%,那么20聚体的收率将是83%。
3) 使用合成寡核苷酸合成仪和下游纯化和分离设备的规模限制:目前,在单个批次中可以生产的产物的最大量是在10kg量级。
因此,需要减少(或理想地消除)柱色谱法和以非完全连续的方式执行合成以便增加收率。
DNA聚合酶经常被用于合成用在分子生物学和类似应用中的寡核苷酸。但是,因为相对短的寡核苷酸长度和在具有不同脱氧核糖或核糖修饰的核苷酸之间区分的需要,DNA聚合酶不适合用于合成治疗性寡核苷酸。例如,治疗性寡核苷酸经常是在20-25个核苷酸的范围内。DNA聚合酶需要至少7或8个核苷酸、且最佳地18-22个核苷酸作为每个方向的引物,所以如果引物在大小上类似于期望的产物,在设法合成治疗性寡物中所获甚少。并且,DNA聚合酶需要所有核苷酸存在于反应物中,并且它依赖于沃森-克里克碱基配对来比对新来的核苷酸。因而,不能在脱氧核糖或核糖修饰的任何排序之间区分,诸如被gapmer需要的那些,并且结果将是在给定位置处的脱氧核糖或核糖修饰的混合物。
发明概述
本发明提供了一种用于生产具有至少一个经修饰的核苷酸残基的单链寡核苷酸产物的方法,所述方法包括:
a)提供与所述产物的序列互补的模板寡核苷酸(I),所述模板具有允许它与所述产物分离的性质;
b)提供寡核苷酸的集合(II);
c)在允许退火的条件下使(I)和(II)接触;
d)改变所述条件以分离任何杂质,包括使退火的模板和杂质寡核苷酸链变性和分离所述杂质;和
e)改变所述条件以分离所述产物,包括使退火的模板和产物寡核苷酸链变性和分离所述产物。
这样的方法可以用于从杂质分离单链寡核苷酸产物,例如作为纯化方法。
本发明进一步提供了一种用于生产具有至少一个经修饰的核苷酸残基的单链寡核苷酸产物的方法,所述方法包括:
a)提供与所述产物的序列互补的模板寡核苷酸(I),所述模板具有允许它与所述产物分离的性质;
b)提供寡核苷酸的集合(II),其含有是产物序列的区段的寡核苷酸,其中至少一个区段含有至少一个经修饰的核苷酸残基;
c)在允许退火的条件下使(I)和(II)接触;
d)连接所述区段寡核苷酸以形成所述产物;
e)改变所述条件以分离任何杂质,包括使退火的模板和杂质寡核苷酸链变性和分离所述杂质;和
f)改变所述条件以分离所述产物,包括使退火的模板和产物寡核苷酸链变性和分离所述产物。
这样的方法可以用于产生单链寡核苷酸产物并将它从杂质分离,例如作为制备和纯化方法。
本发明还包括通过这样的方法制备的经修饰的寡核苷酸和用于在这样的方法中使用的连接酶。
附图说明
图1是本发明的方法的示意图,包括改变所述条件以除去杂质的步骤,例如洗涤步骤。
图2是本发明的方法的示意图,包括接合/连接区段寡核苷酸以形成产物和改变所述条件以除去杂质的步骤。
图3 是多种模板构型的示意图。
图4是在流系统中实施的本发明的方法的基本示意图。
图5是在流系统中实施的本发明的方法的详细示意图:a)连接化学段,b)连接纯化段,和c)交替连接化学段,和d)交替纯化段。N.B. 段a)和b) (可替换地c)和d))可以在单个步骤中执行,例如在a)中的收集容器= 来自b)中的连接步骤的输出。
图6是在本发明的方法中可以产生的杂质的例子。
图7的色谱图显示了使用市售NEB T4连接酶(SEQ ID NO:3)和未修饰的DNA (实施例1)的连接反应的结果。
图8的色谱图显示了使用PERLOZA结合的T4连接酶(SEQ ID NO:4)和未修饰的DNA(实施例1)的连接反应的结果。
图9的色谱图显示了使用PERLOZA结合的T4连接酶(根据实施例2表达)和2’-OMe修饰的寡核苷酸片段的连接反应的结果。
图10是实施例4的HPLC迹线:上迹线(a) - 无连接酶对照。下迹线(b) - 克隆A4。产物和模板在该HPLC方法中共洗脱。可以在10.3和11.2分钟的克隆A4迹线中见到两种中间连接片段(区段)。
图11是在实施例13中使用的“三-模板hub’”的示意图,其包含被称作“hub’”的支持材料和三个模板序列。
图12是在实施例13中使用的半连续连接装备(rig)的示意图。
图13是在实施例14中使用的盲端过滤装备的示意图。
图14是在实施例14中使用的横向流过滤装备的示意图。
图15的色谱图显示了来自在实施例14中在60℃使用10 kDa MWCO NADIR膜的盲端过滤实验的结果。图a)是在2个渗滤体积以后渗余物溶液的色谱图,所述渗余物溶液保留在过滤单元中且主要含有三-模板hub;且色谱图b)属于在2个渗滤体积以后的渗透物,即富含产物的溶液。
图16的色谱图显示了来自在实施例14中在50℃和3.0巴压强使用5 kDa MWCOSnyder膜的横向流过滤实验的结果。图a)是在20个渗滤体积以后渗余物溶液的色谱图,其主要含有三-模板hub和产物;且图b)是在20个渗滤体积以后渗透物的色谱图,其主要含有区段寡核苷酸。
图17的色谱图显示了来自在实施例14中在80℃和3.1巴压强使用5 kDaMWCOSnyder膜的横向流过滤实验的结果。图17显示了a)在20个渗滤体积以后渗余物溶液的色谱图,其仅含有三-模板hub;且图b)是在2个渗滤体积以后渗透物溶液的色谱图,其仅含有产物。
发明详述
定义
本文中使用的术语“寡核苷酸”或简写的“寡物”是指核苷酸残基的聚合物,所述核苷酸残基是脱氧核糖核苷酸(其中得到的寡核苷酸是DNA)、核糖核苷酸(其中得到的寡核苷酸是RNA)或其混合物。寡核苷酸可以完全由在自然界中发现的核苷酸残基组成,或可以含有至少一个已经被修饰的核苷酸、或至少一个在核苷酸之间的连接。寡核苷酸可以是单链的或双链的。本发明的寡核苷酸可以缀合至另一种分子,例如N-乙酰基半乳糖胺(GalNAc)或其多聚体(GalNAc簇)。
本文中使用的术语“治疗性寡核苷酸”是指具有治疗用途的寡核苷酸。这样的寡核苷酸通常含有一个或多个经修饰的核苷酸残基或连接。治疗性寡核苷酸经由几种不同机制之一起作用,所述机制包括、但不限于反义、剪接-交换或外显子跳跃、免疫刺激和RNA干扰(RNAi),例如经由微RNA (miRNA)和小干扰RNA (siRNA)。一种治疗性寡核苷酸可以是适体。治疗性寡核苷酸经常、但不总是具有确定的序列。
本文中使用的术语“模板”是指这样的寡核苷酸:其序列与靶标(或产物)寡核苷酸的序列具有100%互补性。
除非另外指出,否则本文中使用的术语“互补的”是指100%互补的。
本文中使用的术语“产物”是指具有特定序列的期望的寡核苷酸,在本文中也被称作“靶寡核苷酸”。
本文中使用的术语“集合(pool)”表示一组寡核苷酸,其可能在序列上不同,可能短于或长于靶序列,且可能不具有与靶序列相同的序列。寡核苷酸的集合可以是寡核苷酸合成(例如经由亚磷酰胺化学的固相化学合成)的产物,所述寡核苷酸合成与或不与纯化一起使用。寡核苷酸的集合可以由靶序列的区段组成。每个区段本身可以作为该区段的集合存在,且可以是寡核苷酸合成(例如经由亚磷酰胺化学的固相化学合成)的产物。
本文中使用的术语“退火”是指互补寡核苷酸以序列特异性的方式杂交。“允许退火的条件”将依赖于杂交的互补寡核苷酸的Tm,且将是本领域技术人员容易明白的。例如,退火温度可以低于杂交的寡核苷酸的Tm。可替换地,退火温度可以接近杂交的寡核苷酸的Tm,例如±1、2或3℃。一般而言,退火温度不高于杂交的寡核苷酸的Tm以上10℃。允许退火的具体条件如在实施例部分中所述。
如本文中使用的,与双链寡核苷酸有关的术语“变性”用于指互补链不再退火。变性作为改变条件的结果而发生,且有时在本文中被称作分离寡核苷酸链。这样的链分离可以例如通过升高温度、改变pH或改变缓冲溶液的盐浓度来完成。使双链寡核苷酸(“双链体”)变性会产生单链寡核苷酸,其将是从模板“释放”的产物或杂质。
本文中使用的术语“杂质”是指不具有期望的产物序列的寡核苷酸。这些寡核苷酸可以包括短于产物(例如短1、2、3、4、5个或更多个核苷酸残基)或长于产物(例如长1、2、3、4、5个或更多个核苷酸残基)的寡核苷酸。在生产方法包括在区段之间形成连接的步骤的情况下,杂质包括当一个或多个连接未能形成时所剩下的寡核苷酸。杂质也包括其中已经掺入错误核苷酸的寡核苷酸,因而当与模板对比时产生错配。杂质可以具有一个或多个上述特征。图6显示了一些可能存在的杂质。
本文中使用的术语“区段”是较长寡核苷酸的较小部分,尤其是产物或靶寡核苷酸的较小部分。对于给定的产物,当所有其区段与它的模板退火并连接在一起时,形成所述产物。
本文中使用的术语“酶促连接”是指,酶促地形成两个邻近核苷酸之间的连接。该连接可以是天然存在的磷酸二酯键(PO)或经修饰的连接,包括、但不限于,硫代磷酸酯(PS)或氨基磷酸酯(PA)。
本文中使用的术语“连接酶”是指这样的酶:其催化两个寡核苷酸分子的连接,即共价连接,例如通过在一个寡核苷酸(或区段)的3’末端与相同或另一个寡核苷酸(或区段)的5’末端之间形成磷酸二酯键。这些酶经常被称作DNA连接酶或RNA连接酶并利用辅因子:ATP (真核、病毒和古细菌(archael)DNA连接酶)或NAD (原核DNA连接酶)。尽管它们存在于所有生物中,DNA连接酶表现出氨基酸序列、分子大小和性能的宽泛多样性(Nucleic AcidsResearch, 2000, 第28卷, 第21期, 4051-4058)。它们通常是由国际生物化学与分子生物学联合会(International Union of Biochemistry and Molecular Biology)定义的酶类别EC 6.5的成员,即用于形成磷酸酯键的连接酶。在本发明范围内包括能够将一个未修饰的寡核苷酸连接至另一个未修饰的寡核苷酸的连接酶,能够将一个未修饰的寡核苷酸连接至一种经修饰的寡核苷酸(即将一种经修饰的5’寡核苷酸连接至一个未修饰的3’寡核苷酸,和将一个未修饰的5’寡核苷酸连接至一种经修饰的3’寡核苷酸)的连接酶,以及能够将一种经修饰的寡核苷酸连接至另一种经修饰的寡核苷酸的连接酶。
本文中使用的“热稳定的连接酶”是在升高的温度(即高于人体温,即高于37℃)有活性的连接酶。热稳定的连接酶可以在例如40℃- 65℃、或40℃- 90℃等有活性。
本文中使用的术语“经修饰的核苷酸残基”或“经修饰的寡核苷酸”是指这样的核苷酸残基或寡核苷酸:其含有不同于天然存在的核苷酸残基或寡核苷酸的化学性质的至少一个方面。这样的修饰可以存在于核苷酸残基的任何部分,例如糖、碱基或磷酸酯。在下面公开了核苷酸的修饰的例子。
本文中使用的术语“经修饰的连接酶”是指与天然存在的“野生型”连接酶相差一个或多个氨基酸残基的连接酶。这样的连接酶在自然界中不存在。这样的连接酶在本发明的新颖方法中是有用的。在下面公开了经修饰的连接酶的例子。术语“经修饰的连接酶”和“突变体连接酶”可互换使用。
本文中使用的术语“gapmer”是指这样的寡核苷酸:其具有侧接两个外部“翼区段”的内部“缺口区段”,其中所述缺口区段由多个支持RNA酶H切割的核苷酸组成,且每个翼区段由一个或多个在化学上不同于缺口区段内的核苷酸的核苷酸组成。
本文中使用的术语“支持材料”是指这样的高分子量化合物或材料:其增加模板的分子量,由此当从反应混合物分离杂质和产物时允许它被保留。
本文中使用的查询核酸序列和目标核酸序列之间的“同一性百分比”是,在执行逐对BLASTN比对以后,当目标核酸序列与查询核酸序列具有100%查询覆盖度时,通过BLASTN算法计算的表达为百分比的“同一性”值。使用在国家生物技术学会中心(National Centerfor Biotechnology Institute)的网站上可得到的BLASTN算法的默认设置,将低复杂性区域的过滤器关闭,执行在查询核酸序列和目标核酸序列之间的这样的逐对BLASTN比对。重要的是,通过在本文的一个或多个权利要求中鉴别出的核酸序列可以描述查询核酸序列。查询序列可以与目标序列具有100%同一性,或它可以相对于目标序列包括多达某个整数数目的核苷酸改变,使得%同一性小于100%。例如,查询序列与目标序列具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性。
发明内容
在本发明的一个方面,提供了一种用于生产具有至少一个经修饰的核苷酸残基的单链寡核苷酸产物的方法,所述方法包括:
a)提供与所述产物的序列互补的模板寡核苷酸(I),所述模板具有允许它与所述产物分离的性质;
b)提供寡核苷酸的集合(II);
c)在允许退火的条件下使(I)和(II)接触;
d)改变所述条件以分离任何杂质,包括使退火的模板和杂质寡核苷酸链变性和分离所述杂质;和
e)改变所述条件以分离所述产物,包括使退火的模板和产物寡核苷酸链变性和分离所述产物。
这样的方法可以用于从杂质(例如通过经由亚磷酰胺化学的化学合成、例如经由亚磷酰胺化学的固相化学合成而产生的寡核苷酸集合)中纯化产物。
在本发明的另一个实施方案中提供了一种方法,其包括:
a)提供与所述产物的序列互补的模板寡核苷酸(I),所述模板具有允许它与所述产物分离的性质;
b)提供寡核苷酸的集合(II),其含有是所述靶序列的区段的短寡核苷酸,其中至少一个区段含有至少一个经修饰的核苷酸残基;
c)在允许退火的条件下使(I)和(II)接触;
d)连接所述区段寡核苷酸;
e)改变所述条件以分离任何杂质,包括使退火的模板和杂质寡核苷酸链变性和分离所述杂质;和
f)改变所述条件以分离所述产物,包括使退火的模板和产物寡核苷酸链变性和分离所述产物。
在本发明的一个实施方案中,在反应容器中基本上不存在核苷酸。在本发明的一个实施方案中,在反应容器中不存在核苷酸。具体地,所述反应容器不包含核苷酸的集合,即所述反应物基本上不含有、优选地不含有核苷酸。
本发明的另一个实施方案提供了前文描述的方法,其中所述变性源自温度增加。
本发明的一个实施方案提供了前文公开的方法,其中所述区段寡核苷酸通过酶促连接而连接。在另一个实施方案中,所述酶促连接由连接酶完成。
本发明的另一个实施方案提供了前文公开的方法,其中所述区段寡核苷酸通过化学连接而连接。在另一个实施方案中,所述化学连接是点击化学反应。在本发明的一个实施方案中,区段寡核苷酸的化学连接发生在如Kalinowski等人在ChemBioChem 2016, 17,1150–1155详述的产生氨基磷酸酯键的模板化反应中。
本发明的另一个实施方案提供了前文公开的方法,其中所述区段寡核苷酸是3-15个核苷酸长。在本发明的另一个实施方案中,所述区段是5-10个核苷酸长。在本发明的另一个实施方案中,所述区段是5-8个核苷酸长。在本发明的另一个实施方案中,所述区段是5、6、7或8个核苷酸长。在一个特定实施方案中,存在三个区段寡核苷酸:7个核苷酸长的5’区段,6个核苷酸长的中央区段,和7个核苷酸长的3’区段,它们当连接在一起时形成20个核苷酸长的寡核苷酸(“20-聚体”)。在一个特定实施方案中,存在三个区段寡核苷酸:6个核苷酸长的5’区段,8个核苷酸长的中央区段,和6个核苷酸长的3’区段,它们当连接在一起时形成20个核苷酸长的寡核苷酸(“20-聚体”)。在一个特定实施方案中,存在三个区段寡核苷酸:5个核苷酸长的5’区段,10个核苷酸长的中央区段,和5个核苷酸长的3’区段,它们当连接在一起时形成20个核苷酸长的寡核苷酸(“20-聚体”)。在一个特定实施方案中,存在四个区段寡核苷酸:5个核苷酸长的5’区段,5个核苷酸长的5’-中央区段,5个核苷酸长的中央-3’区段,和5个核苷酸长的3’区段,它们当连接在一起时形成20个核苷酸长的寡核苷酸(“20-聚体”)。
本发明的一个实施方案提供了前文描述的方法,其中所述产物是10-200个核苷酸长。在本发明的另一个实施方案中,所述产物是15-30个核苷酸长。在本发明的一个实施方案中,所述产物是21、22、23、24、25、26、27、28、29或30个核苷酸长。在本发明的一个实施方案中,所述产物是20个核苷酸长,一种“20-聚体”。在本发明的一个实施方案中,所述产物是21个核苷酸长,一种“21-聚体”。在本发明的一个实施方案中,所述产物是22个核苷酸长,一种“22-聚体”。在本发明的一个实施方案中,所述产物是23个核苷酸长,一种“23-聚体”。在本发明的一个实施方案中,所述产物是24个核苷酸长,一种“24-聚体”。在本发明的一个实施方案中,所述产物是25个核苷酸长,一种“25-聚体”。在本发明的一个实施方案中,所述产物是26个核苷酸长,一种“26-聚体”。在本发明的一个实施方案中,所述产物是27个核苷酸长,一种“27-聚体”。在本发明的一个实施方案中,所述产物是28个核苷酸长,一种“28-聚体”。在本发明的一个实施方案中,所述产物是29个核苷酸长,一种“29-聚体”。在本发明的一个实施方案中,所述产物是30个核苷酸长,一种“30-聚体”。
在本发明的一个实施方案中,所述方法是一种用于生产治疗性寡核苷酸的方法。在本发明的一个实施方案中,所述方法是一种用于生产单链治疗性寡核苷酸的方法。在本发明的一个实施方案中,所述方法是一种用于生产双链治疗性寡核苷酸的方法。
本发明的另一个实施方案提供了前文公开的方法,其中所述允许模板与产物分离的性质是,所述模板附着于支持材料。在本发明的另一个实施方案中,所述支持材料是可溶性支持材料。在本发明的另一个实施方案中,所述可溶性支持材料选自:聚乙二醇、可溶性的有机聚合物、DNA、蛋白、树枝状聚合物、多糖、寡糖和碳水化合物。在本发明的一个实施方案中,所述支持材料是聚乙二醇(PEG)。在本发明的另一个实施方案中,所述支持材料是不溶性支持材料。在本发明的另一个实施方案中,所述支持材料是固体支持材料。在另一个实施方案中,所述固体支持材料选自:玻璃珠、聚合物珠子、纤维支持物、膜、抗生蛋白链菌素包被的珠子和纤维素。在一个实施方案中,所述固体支持材料是抗生蛋白链菌素包被的珠子。在另一个实施方案中,所述固体支持材料是反应容器本身的部分,例如反应壁。
本发明的一个实施方案提供了前文公开的方法,其中所述模板的多个重复拷贝经由单个附着点以连续方式附着于所述支持材料。所述模板的多个重复拷贝可以被接头隔开,例如如在图3中所示。所述模板的多个重复拷贝可以是直接重复序列,例如它们没有被接头隔开。
本发明的另一个实施方案提供了前文公开的方法,其中所述允许模板与产物分离的性质是所述模板的分子量。例如,所述模板序列的重复拷贝可以存在于单个寡核苷酸上,具有或没有接头序列。
本发明的另一个实施方案提供了前文公开的方法,其中将所述模板、或所述模板和支持材料再循环用于在将来反应中使用,例如如下面详述的。本发明的另一个实施方案提供了前文公开的方法,其中使用连续或半连续流水作业实施所述反应,例如如在图4或图5中所示。
在本发明的一个实施方案中,所述方法用于大规模制备寡核苷酸,尤其是治疗性寡核苷酸。在本发明的上下文中,寡核苷酸的大规模制备是指在大于或等于1升的规模的制备,例如在1 L或更大的反应器中实施所述方法。可替换地或另外,在本发明的上下文中,寡核苷酸的大规模制备是指在在克规模的产物制备,尤其是大于或等于10克产物的生产。在本发明的一个实施方案中,生产的寡核苷酸产物的量是在克规模。在本发明的一个实施方案中,生产的产物的量大于或等于:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100克。在本发明的一个实施方案中,生产的寡核苷酸产物的量大于或等于:150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950克。在本发明的一个实施方案中,生产的寡核苷酸产物的量是500克或更大。在本发明的一个实施方案中,生产的寡核苷酸产物是在千克规模。在本发明的一个实施方案中,生产的寡核苷酸产物的量是1 kg或更多。在本发明的一个实施方案中,生产的寡核苷酸产物的量大于或等于:1、2、3、4、5、6、7、8、9、10 kg。在本发明的一个实施方案中,生产的寡核苷酸产物的量大于或等于:15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100 kg。
在本发明的一个实施方案中,生产的产物的量是在10克和100 kg之间。在本发明的一个实施方案中,生产的产物的量是在10克和50 kg之间。在本发明的一个实施方案中,生产的产物的量是在100克和100 kg之间。在本发明的一个实施方案中,生产的产物的量是在100克和50 kg之间。在本发明的一个实施方案中,生产的产物的量是在500克和100 kg之间。在本发明的一个实施方案中,生产的产物的量是在500克和50 kg之间。在本发明的一个实施方案中,生产的产物的量是在1 kg和50 kg之间。在本发明的一个实施方案中,生产的产物的量是在10 kg和50 kg之间。
在本发明的一个实施方案中,寡核苷酸制备在大于或等于2、3、4、5、6、7、8、9、10升的规模发生,例如在2、3、4、5、6、7、8、9或10 L反应器中。在本发明的一个实施方案中,寡核苷酸制备在大于或等于20、25、30、35、40、45、50、55、60、65 70、75、80、85、90、95、100升的规模发生,例如在20、25、30、35、40、45、50、55、60、65 70、75、80、85、90、95、100 L反应器中。在本发明的一个实施方案中,寡核苷酸制备在大于或等于150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000升的规模发生,例如在150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000 L反应器中。
在本发明的一个实施方案中,所述反应器体积是约10,000 L、约5000 L、约2000L、约1000 L、约500 L、约125 L、约50 L、约20 L、约10 L或约5 L。
在本发明的一个实施方案中,所述反应器体积是在5-10,000 L之间,在10-5000 L之间,在20-2000 L之间,或在50-1000 L之间。
与基于RNA或DNA的寡核苷酸相比,根据本发明的一种寡核苷酸可以具有至少一个主链修饰、和/或至少一个糖修饰和/或至少一个碱基修饰。
本发明的一个实施方案提供了前文公开的方法,其中所述产物包含至少1个经修饰的核苷酸残基。在另一个实施方案中,所述修饰是在所述糖部分的2’位置。
在本发明的方法中使用的寡核苷酸可以包括糖修饰,即核糖基部分的一种经修饰形式,诸如2'-O-修饰的RNA诸如2'-O-烷基或2'-O-(取代的)烷基例如2'-O-甲基、2'-O-(2-氰基乙基)、2'-O-(2-甲氧基)乙基(2'-MOE)、2'-O-(2-硫甲基)乙基、2'-O-丁酰基、2'-O-炔丙基、2'-O-烯丙基、2'-O-(3-氨基)丙基、2'-O-(3-(二甲基氨基)丙基)、2'-O-(2-氨基)乙基、2'-O-(2-(二甲基氨基)乙基);2'-脱氧(DNA);2'-O-(卤代烷氧基)甲基(Arai K. 等人.Bioorg. Med. Chem. 2011, 21, 6285)例如2'-O-(2-氯乙氧基)甲基(MCEM), 2'-O-(2,2-二氯乙氧基)甲基(DCEM);2'-O- 烷氧基羰基例如2'-O-[2-(甲氧基羰基)乙基] (MOCE),2'-O-[2-(N-甲基氨甲酰基)乙基] (MCE), 2'-O-[2-(N, N-二甲基氨甲酰基)乙基](DCME);2'-卤代例如2'-F、FANA (2'-F阿拉伯糖基核酸);碳环糖(carbasugar)和氮杂糖(azasugar)修饰; 3'-O-烷基例如3'-O-甲基、3'-O-丁酰基、3'-0-炔丙基;和它们的衍生物。
在本发明的一个实施方案中,所述糖修饰选自:2’-氟(2’-F)、2’-O-甲基(2’-OMe)、2’-O-甲氧基乙基(2’-MOE)和2’-氨基。在另一个实施方案中,所述修饰是2’-MOE。
其它糖修饰包括“桥连的”或“二环的”核酸(BNA),例如锁核酸(LNA)、木-LNA、α-L-LNA、β-D-LNA、cEt (2'-O、4'-C约束的乙基) LNA、cMOEt (2'-O、4'-C约束的甲氧基乙基)LNA、亚乙基-桥连核酸(ENA)、三环DNA;解锁核酸(UNA);环己烯基核酸(CeNA)、altriol核酸(ANA)、己糖醇核酸(HNA)、氟代HNA (F-HNA)、吡喃糖基-RNA (p-RNA)、3'-脱氧吡喃糖基-DNA (p-DNA);吗啉代(例如在PMO、PPMO、PMOPlus、PMO-X中);和它们的衍生物。
在本发明的方法中使用的寡核苷酸可以包括其它修饰,诸如肽-碱基核酸(PNA)、硼修饰的PNA、基于吡咯烷的氧基-肽核酸(POPNA)、基于乙二醇或丙三醇的核酸(GNA)、基于苏糖的核酸(TNA)、无环的基于苏氨醇的核酸(aTNA)、具有集成的碱基和主链的寡核苷酸(ONIB)、吡咯烷-酰胺寡核苷酸(POMs);和它们的衍生物。
在本发明的一个实施方案中,所述经修饰的寡核苷酸包含磷酰二胺吗啉代寡聚体(PMO)、锁核酸(LNA)、肽核酸(PNA)、桥连核酸(BNA)诸如(S)-cEt-BNA或SPIEGELMER。
在另一个实施方案中,所述修饰是在所述核苷碱基中。碱基修饰包括天然嘌呤和嘧啶碱基(例如腺嘌呤、尿嘧啶、鸟嘌呤、胞嘧啶和胸腺嘧啶)的修饰形式,诸如肌苷、次黄嘌呤、乳清酸、agmatidine、lysidine、2-硫嘧啶(例如2-硫尿嘧啶、2-硫胸腺嘧啶)、G-夹及其衍生物、5-取代的嘧啶(例如5-甲基胞嘧啶、5-甲基尿嘧啶、5-卤代尿嘧啶、5-丙炔基尿嘧啶、5-丙炔基胞嘧啶、5-氨基甲基尿嘧啶、5-羟基甲基尿嘧啶、5-氨基甲基胞嘧啶、5-羟基甲基胞嘧啶、Super T)、2,6-二氨基嘌呤、7-脱氮鸟嘌呤、7-脱氮腺嘌呤、7-氮杂-2,6-二氨基嘌呤、8-氮杂-7-脱氮鸟嘌呤、8-氮杂-7-脱氮腺嘌呤、8-氮杂-7-脱氮-2、6-二氨基嘌呤、Super G、Super A和N4-乙基胞嘧啶或其衍生物;N2-环戊基鸟嘌呤(cPent-G)、N2-环戊基-2-氨基嘌呤(cPent-AP)和N2-丙基-2-氨基嘌呤(Pr-AP)或其衍生物;和简并或通用碱基,如2,6-二氟甲苯或缺乏碱基如脱碱基位点(例如1-脱氧核糖、1,2-二脱氧核糖、1-脱氧-2-O-甲基核糖;或吡咯烷衍生物,其中环氧已经被氮替代(氮杂核糖))。Super A、Super G和SuperT的衍生物的例子可以参见US6683173。证实了cPent-G、cPent-AP和Pr-AP当掺入siRNA中时会减轻免疫刺激效应(Peacock H. 等人. J. Am. Chem. Soc. (2011), 133, 9200)。
在本发明的一个实施方案中,所述核苷碱基修饰选自:5-甲基嘧啶、7-脱氮鸟苷和脱碱基核苷酸。在一个实施方案中,所述修饰是5-甲基胞嘧啶。
在本发明的方法中使用的寡核苷酸可以包括主链修饰,例如存在于RNA中的磷酸二酯的一种经修饰形式,诸如硫代磷酸酯(PS)、二硫代磷酸酯(PS2)、膦酰基乙酸酯(PACE)、膦酰基乙酰胺(PACA)、硫代膦酰基乙酸酯、硫代膦酰基乙酰胺、硫代磷酸酯前药、H-膦酸酯、膦酸甲酯、硫代膦酸甲酯、磷酸甲酯、硫代磷酸甲酯、磷酸乙酯、硫代磷酸乙酯、硼代磷酸酯、硼代硫代磷酸酯、硼代磷酸甲酯、硼代硫代磷酸甲酯、硼代膦酸甲酯、硼代硫代膦酸甲酯和它们的衍生物。另一种修饰包括亚磷酰胺、氨基磷酸酯、N3'→P5' 氨基磷酸酯、磷酰二胺、硫代磷酰二胺、氨基磺酸酯、二亚甲基亚砜、磺酸酯、三唑、草酰基、氨基甲酸酯、亚甲基亚氨基(MMI)和硫代乙酰氨基核酸(TANA);和它们的衍生物。
在另一个实施方案中,所述修饰是在所述主链中且选自:硫代磷酸酯(PS)、氨基磷酸酯(PA)和磷酰二胺。在本发明的一个实施方案中,所述经修饰的寡核苷酸是磷酰二胺吗啉代寡聚体(PMO)。PMO具有含磷酰二胺连接的亚甲基吗啉环主链。在本发明的一个实施方案中,所述产物具有硫代磷酸酯(PS)主链。
在本发明的一个实施方案中,所述寡核苷酸包含如上公开的两种或更多种修饰的组合。本领域技术人员会明白,存在许多合成的寡核苷酸衍生物。
在本发明的一个实施方案中,所述产物是gapmer。在本发明的一个实施方案中,所述gapmer的5’和3’翼包含2’-MOE修饰的核苷酸或由其组成。在本发明的一个实施方案中,所述gapmer的缺口区段包含在所述糖部分的2’位含有氢的核苷酸(即是DNA-样的)或由其组成。在本发明的一个实施方案中,所述gapmer的5’和3’翼由2’MOE修饰的核苷酸组成,且所述gapmer的缺口区段由在所述糖部分的2’位含有氢的核苷酸(即脱氧核苷酸)组成。在本发明的一个实施方案中,所述gapmer的5’和3’翼由2’MOE修饰的核苷酸组成,且所述gapmer的缺口区段由在所述糖部分的2’位含有氢的核苷酸(即脱氧核苷酸)组成,且在所有核苷酸之间的连接是硫代磷酸酯键。
本发明的一个实施方案提供了前文描述的方法,其中得到的产物是大于90%纯的。在另一个实施方案中,所述产物是大于95%纯的。在另一个实施方案中,所述产物是大于96%纯的。在另一个实施方案中,所述产物是大于97%纯的。在另一个实施方案中,所述产物是大于98%纯的。在另一个实施方案中,所述产物是大于99%纯的。使用任意合适的方法,例如高效液相色谱法(HPLC)或质谱法(MS),尤其是液相色谱法-MS (LC-MS)、HPLC-MS或毛细管电泳质谱法(CEMS),可以确定寡核苷酸的纯度。
本发明的另一个实施方案提供了一种用于生产双链寡核苷酸的方法,其中通过任意前述实施方案的方法生产2种互补的单链寡核苷酸,并然后在允许退火的条件下混合。在一个实施方案中,所述产物是siRNA。
本发明的一个实施方案提供了通过前文描述的方法生产的寡核苷酸。在本发明的一个实施方案中,生产的寡核苷酸是RNA。在本发明的一个实施方案中,生产的寡核苷酸是DNA。在本发明的一个实施方案中,生产的寡核苷酸包含RNA和DNA。在本发明的另一个实施方案中,生产的寡核苷酸是经修饰的寡核苷酸。在本发明的一个实施方案中,生产的寡核苷酸是反义寡核苷酸。在本发明的一个实施方案中,生产的寡核苷酸是适体。在本发明的一个实施方案中,生产的寡核苷酸是miRNA。在本发明的一个实施方案中,所述产物是治疗性寡核苷酸。
本文公开的发明利用寡核苷酸结合的性质来提供改进的它们的生产方法。通过给模板寡核苷酸提供与靶序列的100%互补性和控制反应条件使得产物可以在特定条件下被释放和分离,可以得到具有高纯度的产物。
从模板释放产物(或杂质),即使产物(或杂质):模板双链体变性和分离所述产物
(或杂质)
从模板释放产物(或其中所述方法包括杂质释放的额外步骤,任何杂质)要求破坏模板寡核苷酸链和产物(或杂质)之间的沃森-克里克碱基配对。然后可以将产物(或杂质)从模板分离。这可以作为两个单独步骤发生,或作为一个组合的步骤发生。
如果在柱反应器中实施所述方法的话,释放和分离产物(或杂质)可以作为一个步骤发生。在改变pH或盐浓度或者含有破坏碱基配对的化学试剂(诸如甲酰胺或尿素)的缓冲液中运行,将造成寡核苷酸链的变性,且将在所述缓冲液中洗脱所述产物(或杂质)。
当在其它反应容器中实施所述方法时,所述产物(或杂质)的释放和分离可以作为两步方法发生。首先,将沃森-克里克碱基对破坏以分离链,然后从所述反应容器取出所述产物(或杂质)。当释放和分离所述产物作为两步方法实施时,通过改变缓冲液条件(pH、盐)或掺入化学破坏试剂(甲酰胺、尿素)可以实现沃森-克里克碱基对的破坏。可替换地,升高温度也将造成两条链的解离。然后可以通过方法从所述反应容器取出产物(或杂质),所述方法包括基于分子量的分离、基于电荷的分离、基于疏水性的分离、基于特定序列的分离或这些方法的组合。
当在连续或半连续流反应器中实施所述方法时,所述产物(或杂质)的释放和分离可以是在一个步骤或两个步骤中。例如,通过增加温度以造成两条链的解离和在用于升高温度的反应器的相同部分中基于分子量来分离释放的链,可以实施在一个步骤中释放和分离所述产物(或杂质)。通过在反应器的一个部分中增加温度以造成两条链的解离和在反应器的不同部分中基于分子量来分离释放的链,可以实施在两个步骤中释放和分离所述产物(或杂质)。
从模板特异性地释放和分离杂质,但是将产物保留在模板上
当在链延伸过程中将错误核苷酸掺入寡核苷酸链中时,或当链延伸反应过早终止时,产生杂质。当反应包括连接区段寡核苷酸的步骤和一个或多个连接步骤没有发生时,也产生杂质。在图6中图示了可以产生的杂质的种类。
沃森-克里克碱基配对的性质可以用于在产物释放之前特异性地释放与模板结合的任何杂质。每种双链寡核苷酸将在特定条件下解离,且与具有100%互补性的序列相比,那些条件对于不具有100%互补性的序列而言是不同的。确定这样的条件是在技术人员的能力范围(remit)内。
使寡核苷酸变性的一种常见方式是升高温度。当一半的碱基对发生解离时(即当50%的双链体处于单链状态时)的温度被称作解链温度Tm。确定解链温度的最可靠和准确的方式是凭经验。但是,这是麻烦的且通常不是必要的。几个公式可以用于计算Tm值(NucleicAcids Research 1987, 15 (13): 5069-5083; PNAS 1986, 83 (11): 3746-3750;Biopolymers 1997, 44 (3): 217-239),且可以在线找到众多解链温度计算器,其主机归试剂供应商和大学。已知的是,对于给定的寡核苷酸序列,具有所有硫代磷酸酯键的变体将在比具有所有磷酸二酯键的变体更低的温度解链。增加寡核苷酸中的硫代磷酸酯键的数目倾向于降低所述寡核苷酸对它的预期靶标的Tm。
为了从反应混合物特异性地分离杂质,首先计算产物:模板双链体的解链温度。然后,将反应容器加热至第一温度,例如低于产物:模板双链体的解链温度的温度,例如比解链温度低1、2、3、4、5、6、7、8、9或10摄氏度。这将造成不是来自模板的产物的寡核苷酸(即不是与模板100%互补)的变性。然后可以使用上面公开的方法之一(例如基于分子量的分离、基于电荷的分离、基于疏水性的分离、基于特定序列的分离或这些方法的组合)从反应容器除去这些。然后,将反应容器升高至第二个更高的温度,例如高于计算的解链温度,例如比解链温度高1、2、3、4、5、6、7、8、9或10摄氏度,以造成来自所述模板的产物的变性。然后可以使用上面公开的方法之一(例如基于分子量的分离、基于电荷的分离、基于疏水性的分离、基于特定序列的分离或这些方法的组合)从所述反应容器取出产物。
当破坏试剂是造成pH、盐浓度的变化的试剂或化学破坏试剂时,可以使用一种类似的方法。使破坏试剂的浓度增加,直到刚好低于产物可以解离时的浓度,以造成不是来自模板的产物的寡核苷酸的变性。然后可以使用上面公开的方法之一从反应容器除去这些杂质。然后将破坏试剂的浓度增加至使产物从模板解离的浓度以上。然后可以使用上面公开的方法之一从所述反应容器取出产物。
从方法(诸如上面公开的方法)得到的产物具有高的纯度,不需要其它纯化步骤。例如,得到的产物是大于95%纯的。
模板的性能
所述模板需要当取出产物时允许它保留在反应容器中的性能,以防止它变成产物中的杂质。换而言之,所述模板具有允许它与产物分离的性能。在本发明的一个实施方案中,通过将所述模板偶联至支持材料,实现该保留。该偶联产生具有高分子量的模板-支持物复合物,且因此当取出杂质和产物(例如通过过滤)时可以保留在反应容器中。可以将所述模板偶联至固体支持材料诸如聚合物珠子、纤维支持物、膜、抗生蛋白链菌素包被的珠子和纤维素。还可以将所述模板偶联至可溶性支持材料诸如聚乙二醇、可溶性的有机聚合物、DNA、蛋白、树枝状聚合物、多糖、寡糖和碳水化合物。
每种支持材料可以具有多个可以附着模板的点,且每个附着点可以具有多个附着的模板,例如以图3中所示的方式。
在不附着于支持材料的情况下,所述模板本身可以具有高分子量,例如,它可以是具有模板的多个拷贝的分子,例如以图3所示的方式被接头隔开。
将模板保留在反应容器中的能力也允许通过回收或通过用在连续或半连续流水作业中将模板再循环用于将来的反应。
将模板与产物(或杂质)分离的方法
如上公开的模板的性能允许分离模板和产物,或分离与产物和杂质结合的模板。可以使用基于分子量的分离、基于电荷的分离、基于疏水性的分离、基于特定序列的分离或这些方法的组合。
在所述模板附着于固体支持物的情况下,通过在适当的条件下洗涤固体支持物而实现模板与产物的分离或杂质与结合至模板的产物的分离。在模板偶联至可溶性支持物或本身由重复模板序列组成的情况下,借助于基于分子量的分离可以实现模板与产物的分离或模板结合的产物与杂质的分离。这可以通过使用技术诸如超过滤或纳米过滤实现,其中选择过滤材料,使得较大的分子被过滤器保留且较小的分子穿过。在杂质与模板产物复合物的单个分离步骤或产物与模板的分离不够有效的情况下,可以采用多个连续过滤步骤来增加分离效率和如此产生满足期望的纯度的产物。
合乎需要的是,提供分离这样的寡核苷酸的方法,其在工业生产规模上是有效的和适用的。“Therapeutic oligonucleotides: The state of the art in purificationtechnologies”Sanghvi等人. Current Opinion in Drug Discovery (2004)第7卷第8期综述了用于寡核苷酸纯化的方法。
WO-A-01/55160公开了如下纯化寡核苷酸:与污染物形成亚胺键,然后用色谱法或其它技术除去亚胺连接的杂质。“Size Fractionation of DNA Fragments Ranging from20 to 30000 Base Pairs by Liquid/Liquid chromatography”Muller等人. Eur. J.Biochem (1982) 128-238公开了在其上面已经沉积了PEG/葡聚糖相的微晶纤维素的固体柱用于分离核苷酸序列的应用。“Separation and identification of oligonucleotidesby hydrophilic interaction chromatography.”Easter等人. The Analyst (2010);135(10)公开了使用HPLC的变体分离寡核苷酸,其采用固体硅胶支持相。“Fractionationof oligonucleotides of yeast soluble ribonucleic acids by countercurrentdistribution”Doctor等人. Biochemistry (1965) 4(1) 49-54公开了用干燥的DEAE-纤维素填充的干燥固体柱的应用。“Oligonucleotide composition of a yeast lysinetransfer ribonucleic acid”Madison等人; Biochemistry, 1974, 13(3)公开了固相色谱法用于分离核苷酸序列的应用。
液体-液相色谱法是一种已知的分离方法。“Countercurrent ChromatographyThe Support-Free Liquid Stationary Phase”Billardello, B.; Berthod, A; Wilson& Wilson's Comprehensive Analytical Chemistry 38; Berthod, A., 编; ElsevierScience B.V.: Amsterdam (2002)第177-200页提供了液体-液相色谱法的有用的一般描述。各种液体-液相色谱法技术是已知的。一种技术是液体-液体反流色谱法(在本文中称作“CCC”)。另一种已知的技术是离心分配色谱法(在本文中称作“CPC”)。
以上公开的方法和在WO 2013/030263中描述的那些方法可以用于分离产物寡核苷酸,例如与模板和/或杂质分离。
用作起始原料的寡核苷酸
用作本发明的方法的起始原料的寡核苷酸在本文中被描述为是“集合”且在上面提供了其定义。所述集合是寡核苷酸的非同质集合。形成集合的寡核苷酸已经通过其它寡核苷酸生产方法来生产,且因此可以含有高程度的杂质。因此,当将该寡核苷酸集合应用于本发明的方法时,如本文中所述的特异性地除去杂质的能力会导致纯化步骤发生。
所述集合可以含有意图与模板寡核苷酸相同长度的寡核苷酸(尽管将含有不同长度的杂质以及错误地掺入的残基)。所述集合还可以由产物寡核苷酸的区段组成,所述区段当在模板上组装时连接在一起。每个区段将是含有不同长度的杂质和错误地掺入的残基的非同质集合。
连接酶
在本发明的一个方面,提供了一种连接酶。在本发明的一个实施方案中,所述连接酶是ATP依赖性连接酶。ATP依赖性连接酶是在从30至>100kDa的大小范围内。在本发明的一个实施方案中,所述连接酶是NAD依赖性连接酶。NAD依赖性酶是高度同源的且是70-80 kDa的单体蛋白。在本发明的一个实施方案中,所述连接酶是热稳定的连接酶。一种热稳定的连接酶可以源自嗜热细菌。
在本发明的一个实施方案中,所述连接酶是经修饰的连接酶。例如,经修饰的连接酶包括经修饰的T4 DNA连接酶、经修饰的肠杆菌噬菌体CC31连接酶、经修饰的志贺氏菌噬菌体Shf125875连接酶和经修饰的小球藻连接酶。
在一个实施方案中,在SEQ ID NO:3的氨基酸位置368或氨基酸位置371处修饰野生型T4 DNA连接酶。
在一个实施方案中,所述突变体连接酶包含SEQ ID NO:3或由SEQ ID NO:3组成,其中在位置368处的氨基酸是R或K。
在一个实施方案中,所述突变体连接酶包含SEQ ID NO:3或由SEQ ID NO:3组成,其中在位置371处的氨基酸是以下氨基酸中的任一个:L、K、Q、V、P、R。
在一个实施方案中,在上面关于T4 DNA连接酶公开的对应残基在肠杆菌噬菌体CC31连接酶、志贺氏菌噬菌体Shf125875连接酶和小球藻连接酶中的任一个中发生突变。DNA连接酶的保守区公开在Chem. Rev. 2006, 106, 687-699和Nucleic Acids Research,2000, 第28卷, 第21期, 4051-4058中。在一个实施方案中,在接头区域中修饰所述连接酶。
在本发明的一个实施方案中,所述连接酶包含SEQ ID NO:23或与其具有至少90%序列同一性的连接酶或者由SEQ ID NO:23或与其具有至少90%序列同一性的连接酶组成,不包括野生型连接酶例如肠杆菌噬菌体CC31连接酶。
在本发明的一个实施方案中,所述连接酶包含下述氨基酸序列中的任一个或由其组成:SEQ ID NO:10-28。
在本发明的一个实施方案中,所述连接酶被固定化例如在珠子上。
在本发明的一个方面,提供了包含SEQ ID NO:6或SEQ ID NO:8所述的氨基酸序列的连接酶用于将5’区段(其含有一个或多个经修饰的糖部分)连接至3’区段的用途,其中在3’区段内的所有糖部分是未修饰的。在本发明的一个实施方案中,提供了包含SEQ ID NO:6或SEQ ID NO:8所述的氨基酸序列的连接酶用于将5’区段(其含有一个或多个具有2’-OMe修饰的糖部分)连接至3’区段的用途,其中在3’区段内的所有糖部分是未修饰的。在一个实施方案中,在5’区段中的所有糖部分含有2’-OMe修饰。在一个实施方案中,所述5’区段含有5个具有2’-OMe修饰的糖部分。
本发明包括下述项目:
1. 一种用于生产单链寡核苷酸产物的方法,所述方法包括:
a)提供与产物的序列互补的模板寡核苷酸(I),所述模板具有允许它与所述产物分离的性质;
b)提供寡核苷酸的集合(II);
c)在允许退火的条件下使(I)和(II)接触;和
d)改变所述条件以取出所述产物。
2. 根据项目1所述的方法,所述方法包括:
a)提供与产物的序列互补的模板寡核苷酸(I),所述模板具有允许它与所述产物分离的性质;
b)提供寡核苷酸的集合(II);
c)在允许退火的条件下使(I)和(II)接触;
d)改变所述条件以除去杂质;和
e)改变所述条件以取出所述产物。
3. 根据项目1或2所述的方法,所述方法包括:
a)提供与产物的序列互补的模板寡核苷酸(I),所述模板具有允许它与所述产物分离的性质;
b)提供寡核苷酸的集合(II),其含有是产物序列的区段的寡核苷酸;
c)在允许退火的条件下使(I)和(II)接触;
d)连接所述区段寡核苷酸以形成所述产物;
e)改变所述条件以除去杂质;和
f)改变所述条件以取出所述产物。
4. 根据任意前述项目所述的方法,其中所述方法发生在反应容器中,且其中改变所述条件以取出产物包括分离退火的寡核苷酸链的步骤和从所述反应容器取出产物的步骤。
5. 根据项目2-4中的任一项所述的方法,其中所述方法发生在反应容器中,且其中改变所述条件以除去杂质包括分离退火的寡核苷酸链的步骤和从所述反应容器除去杂质的步骤。
6. 根据项目4或5所述的方法,其中所述链分离源自温度增加。
7. 根据项目6所述的方法,所述方法包括两个增加温度i)以分离退火的杂质和ii)以分离退火的产物的步骤。
8. 根据项目3-7所述的方法,其中所述区段寡核苷酸通过酶促连接而连接。
9. 根据项目8所述的方法,其中所述酶是连接酶。
10. 根据项目3-9中的任一项所述的方法,其中所述区段是3-15个核苷酸长。
11. 根据任意前述项目所述的方法,其中所述产物是10-200个核苷酸长。
12. 根据项目11所述的方法,其中所述产物是20-25个核苷酸长。
13. 根据项目12所述的方法,其包含三个区段寡核苷酸:7个核苷酸长的5’区段,6个核苷酸长的中央区段和7个核苷酸长的3’区段。
14. 根据项目12所述的方法,其包含三个区段寡核苷酸:6个核苷酸长的5’区段,8个核苷酸长的中央区段和6个核苷酸长的3’区段。
15. 根据项目12所述的方法,其包含三个区段寡核苷酸:5个核苷酸长的5’区段,10个核苷酸长的中央区段和5个核苷酸长的3’区段。
16. 根据任意前述项目所述的方法,其中所述允许模板与产物分离的性质是,所述模板附着于支持材料。
17. 根据项目16所述的方法,其中所述支持材料是可溶性支持材料。
18. 根据项目17所述的方法,其中所述支持材料是聚乙二醇。
19. 根据项目11 - 18中的任一项所述的方法,其中所述模板的多个重复拷贝经由单个附着点以连续方式附着于所述支持材料。
20. 根据项目1- 15中的任一项所述的方法,其中所述允许模板与产物分离的性质是所述模板的分子量。
21. 根据任意前述项目所述的方法,其中将所述模板、或所述模板和支持材料再循环用于在将来的反应中使用。
22. 根据任意前述项目所述的方法,其中使用连续流水作业实施所述反应。
23. 根据任意前述项目所述的方法,其中所述产物含有至少一个经修饰的核苷酸残基。
24. 根据项目23所述的方法,其中至少一个区段含有至少一个经修饰的核苷酸残基。
25. 根据项目23或项目24所述的方法,其中所述修饰是在所述糖部分的2’位置。
26. 根据项目25所述的方法,其中所述修饰选自2’-F、2’-OMe、2’-MOE和2’-氨基。
27. 根据项目24所述的方法,其中所述寡核苷酸包含PMO、LNA、PNA、BNA或SpiegelmerTM。
28. 根据项目23或项目24所述的方法,其中所述修饰是在所述核苷碱基中。
29. 根据项目28所述的方法,其中所述修饰选自5-甲基嘧啶、7-脱氮鸟苷和脱碱基核苷酸。
30. 根据项目23或项目24所述的方法,其中所述修饰是在所述主链中。
31. 根据项目30所述的方法,其中所述修饰选自硫代磷酸酯、氨基磷酸酯和磷酰二胺。
32. 根据任意前述项目所述的方法,其中得到的产物是至少90%纯的。
33. 根据项目32所述的方法,其中所述产物是至少95%纯的。
34. 一种用于生产双链寡核苷酸的方法,其中通过任意前述项目的方法生产2种互补的单链寡核苷酸,并然后在允许退火的条件下混合。
35. 在上述项目中的任一项中要求保护的方法,其中所述方法是用于生产治疗性寡核苷酸。
36. 通过项目1-35中的任一项的方法生产的寡核苷酸。
37. 根据权利要求36所述的寡核苷酸,其中所述寡核苷酸是通过项目23-35中的任一项的方法生产的经修饰的寡核苷酸。
38. 根据项目37所述的寡核苷酸,其中所述寡核苷酸是gapmer。
39. 一种连接酶,其包含在SEQ ID NO:3中所述的氨基酸序列,其中在位置368处的氨基酸被R或K替换;和/或在位置371处的氨基酸被L、K、Q、V、P或R替换。
40. 一种连接酶,其包含在下述SEQ ID NO:10-28中的任一个中所述的氨基酸序列。
41. 包含SEQ ID NO:6或SEQ ID NO:8所述的氨基酸序列的连接酶用于将5’区段(其含有一个或多个具有2’-OMe修饰的糖部分)连接至3’区段的用途,其中在3’区段内的所有糖部分是未修饰的。
实施例
缩写
OMe O-甲基
MOE O-甲氧基乙基(DNA主链)或甲氧基乙基(RNA主链)
CBD 纤维素结合结构域
HPLC 高效液相色谱法
PBS 磷酸盐缓冲盐水
HAA 己基乙酸铵
SDS PAGE 十二烷基硫酸钠聚丙烯酰胺凝胶电泳
LCMS 液相色谱法质谱法
PO 磷酸二酯
DTT 二硫苏糖醇。
实施例1: 使用野生型T4 DNA连接酶的寡核苷酸(DNA)区段组装和连接
1.1 开始和控制序列的化学合成
为了证实多个短寡核苷酸(“区段”)可以在互补模板链上以正确的次序组装并连接以产生期望的终产物(“靶标”),使用标准方法化学地合成在表1中详述的区段、靶标和模板序列。
1.2 HPLC分析
使用在0.2 ml/min运行的Agilent ZORBAX Eclipse Plus XDB-C18柱(4.6 x 150mm, 5 μm dp. Agilent P/N 993967-902)进行HPLC分析,同时在258 nm监测吸光度。将柱维持在60℃。注射20µl样品,并在20分钟中运行20-31%缓冲液B的梯度,然后增加至80%缓冲液B保持5分钟。
缓冲液A: 75 ml 1 M HAA, 300 ml异丙醇, 200 ml乙腈, 4425 ml水
缓冲液B: 650 ml异丙醇, 350 ml乙腈。
表1
| 名称 | 序列 | %HPLC纯度 | 量(mg) |
| 5’区段 | 5'-GGC CAA-3' | 100.0 | 21.6 |
| 中央区段 | 5’-(p)ACC TCG GC-3' | 96.9 | 58.1 |
| 3’区段 | 5'-(p)T TAC CT-3' | 98.8 | 39.8 |
| 靶标 | 5'-GGC CAA ACC TCG GCT TAC CT-3' (SEQ ID NO:1) | 98.4 | 101.7 |
| 生物素化的模板 | 5’-生物素TT TAG GTA AGC CGA GGT TTG GCC-3’(SEQ ID NO:2) | 96.9 | 130.7 |
1.3 使用市售T4 DNA连接酶(SEQ ID NO:3)的寡核苷酸组装和连接方法
在模板上组装5’区段、中央区段和3’区段:将每种区段和模板以1 mg/ml的浓度溶解在水中并然后如下混合。
5’区段 2µl
中央区段 2µl
3’区段 2µl
生物素化的模板 2µl
H2O 36µl。
将组合的寡核苷酸溶液在94℃温育5分钟并冷却至37℃,然后在37℃温育另外5分钟以允许所述区段与模板退火。然后加入2µl (等同于2µg) T4 DNA连接酶(NEB)和4µl 1 xT4 DNA连接缓冲液(NEB),并将反应物(总反应体积50µl)在室温温育1小时。此后,加入40µl抗生蛋白链菌素包被的磁珠,并将悬浮液在室温温育10分钟以允许生物素化的模板结合抗生蛋白链菌素珠子。将抗生蛋白链菌素珠子用2 x 100µl PBS洗涤以除去未结合的区段。通过HPLC分析洗液。然后将反应混合物在94℃温育10分钟以与模板分离结合的连接产物(或任何结合的区段),然后在冰上快速冷却以‘解链’DNA和停止寡核苷酸产物(或区段)与模板的重新退火。然后通过HPLC进行连接反应的分析。
1.4 使用自制(in-house)T4 DNA连接酶珠子浆的寡核苷酸组装和连接方法
1.4.1 珠子浆产生
使用标准的克隆、表达和提取方法生产在N-端与纤维素结合结构域(CBD)融合的T4连接酶(SEQ ID NO:4)。该T4连接酶氨基酸序列与市售T4连接酶序列(SEQ ID NO:3)的差别在于,N-端甲硫氨酸(M)已经被甘氨酸和丝氨酸(GS)替换。如此做以辅助CBD融合蛋白的产生和表达。在BL21 A1细胞(INVITROGEN)中表达CBD-T4连接酶融合蛋白。收获上清液并加入600µl PERLOZA 100 (PERLOZA)珠子中,并在26℃摇动1小时。然后收集PERLOZA纤维素珠子,并用2 ml缓冲液(50 mM Tris pH 8.0, 200 mM NaCl, 0.1%吐温20, 10%甘油)洗涤,随后用5 ml PBS洗涤,并最后重新悬浮在200µl PBS (10 mM PO4 3-, 137 mM NaCl, 2.7 mMKCl pH 7.4)中。为了分析蛋白表达,将15µl PERLOZA珠子浆与5µl SDS加载缓冲液混合并在80℃温育10分钟,然后根据标准方案在SDS PAGE梯度凝胶(4 - 20%)上运行。
1.4.2 使用珠子浆的寡核苷酸组装和连接
对于与PERLOZA珠子结合的T4连接酶,如下修改在上面1.3中的组装和连接方法。在最初的区段混合物中,将36µl H2O减少至8µl H2O。退火以后,将2µl市售T4 DNA连接酶用20µl PERLOZA珠子浆替换。在加入抗生蛋白链菌素磁珠之前,将PERLOZA珠子离心并取出上清液。将抗生蛋白链菌素磁珠加入上清液并在室温温育10分钟以允许生物素化的模板结合抗生蛋白链菌素珠子。
1.5 结果和结论
产物、模板和所有三区段寡核苷酸在对照色谱图中明显地分解。
连接酶反应的HPLC分析表明,一些未连接的寡核苷酸区段得到保留,但是市售T4DNA连接酶(NEB)能够催化三个区段的连接以产生期望的产物寡核苷酸(图7)。PERLOZA珠子结合的T4 DNA连接酶看起来在连接寡核苷酸区段中不太有效,寡核苷酸区段出现在对照洗液样品和反应样品中(图8)。但是,难以确保与市售酶相比在珠子上是否添加相同量的酶,所以连接效率的直接对比是不可能的。
实施例2: 使用野生型T4 DNA连接酶的2’-OMe核糖修饰的寡核苷酸区段组装和连接
2.1 在每个区段中在每个核苷酸位置处的2’OMe
为了确定T4 DNA连接酶是否能够连接在核糖环的2’位置处具有修饰的寡核苷酸区段,合成了具有与实施例1相同的序列的寡核苷酸区段,但是核糖环的2’位置被OMe基团取代,且胸苷被如下所示的尿苷替换。
表2
| 名称 | 序列 | %HPLC纯度 | 量(mg) |
| 5’区段2’-OMe | 5'-GGC CAA-3' | 21 | 97.8 |
| 中央区段2’-OMe | 5’-(p)ACC UCG GC-3' | 15.5 | 97.7 |
| 3’区段2’-OMe | 5'-(p)U UAC CU-3' | 21.2 | 98.1 |
| 靶标2’-OMe | 5'-GGC CAA ACC UCG GCU UAC CU-3' (SEQ ID NO:5) | 88 | 96.9 |
(p) = 磷酸酯。
用与PERLOZA珠子结合的市售NEB连接酶和T4连接酶CBD融合体,使用实施例1的方法进行组装、连接和HPLC分析。在市售T4 DNA连接酶(NEB)实验的反应混合物中使用的水的量是26µl,而不是36µl,使得最终的反应体积是40µl。在自制T4 DNA连接酶珠子浆实验的反应混合物中使用的水的量是23µl,且使用的珠子的量是5µl,使得最终的反应体积也是40µl。平行地进行使用未修饰的DNA(而不是2’-OMe DNA)的对照实验。
来自对照实验的结果是根据实施例1。对于2’-OMe实验,使用HPLC没有检测到产物,从而指示T4 DNA连接酶不能完全连接2’-OMe修饰的寡核苷酸区段,不论是否使用与PERLOZA珠子结合的市售T4 DNA连接酶或自制T4 DNA连接酶CBD融合体。
2.2 在单个区段中在每个核苷酸位置处的2’-OMe
使用1 mg/ml的每种寡核苷酸的溶液,建立如在表3中详述的反应。
表3
| 实验1(无连接酶对照) | 实验2(单个2’-OMe区段- 3’) | 实验3(单个2’-OMe区段- 5’) | 实验4(所有2’-OMe) | 实验5(所有未修饰的) | 体积(µl) |
| 模板 | 模板 | 模板 | 模板 | 模板 | 2 |
| 5’区段 | 5’区段 | 2’-OMe取代的5’区段 | 2’-OMe取代的5’区段 | 5’区段 | 2 |
| 3’区段 | 2’-OMe取代的3’区段 | 3’区段 | 2’-OMe取代的3’区段 | 3’区段 | 2 |
| 中央区段 | 中央区段 | 中央区段 | 2’-OMe取代的中央区段 | 中央区段 | 2 |
| H<sub>2</sub>O | H<sub>2</sub>O | H<sub>2</sub>O | H<sub>2</sub>O | H<sub>2</sub>O | 直到共40 |
用市售NEB连接酶和自制PERLOZA结合的T4 DNA连接酶,使用实施例1的方法进行组装和连接。
将反应物在94℃温育5分钟,随后在37℃温育5分钟以允许退火。将4µl 1x NEB T4DNA连接缓冲液与5µl (大约2µg)自制T4 DNA连接酶或2µl (大约2µg)市售T4 DNA连接酶(除了实验1以外,它是无连接酶对照)一起加入每个反应物,并允许连接反应在室温进行2小时。然后将抗生蛋白链菌素磁珠加入每个反应物,并将反应物加热至94℃,然后如在实施例1中所述在冰上快速冷却以与起始原料和产物分离模板。
将处理过的反应物分成两半:如关于实施例1 (部分1.2)所述通过HPLC分析一半。保留另一半样品用于质谱法以证实HPLC结果。
未修饰的寡核苷酸区段的连接(实验5)按预期进行以产生全长产物。如在图9中所示,当5’区段被2’-OMe取代时看到少量连接(实验3),但是当3’区段被2’-OMe取代时没有看到连接(实验2)。根据2.1,当所有三个区段被2’-OMe取代时,没有看到显著产物(实验4)。
2.3 结论
野生型T4 DNA连接酶在连接2’-OMe取代的寡核苷酸区段中是差的,但是与3’区段相比对5’寡核苷酸区段的修饰稍微不太敏感。
实施例3:使用野生型和突变体连接酶的2’-OMe核糖修饰的寡核苷酸区段组装和连接
3.1 材料
使用标准的克隆、表达和提取方法,生产野生型肠杆菌噬菌体连接酶CC31 (SEQID NO:6)、野生型志贺氏菌噬菌体Shf125875连接酶(SEQ ID NO:8)和SEQ ID NO:10-19的10种突变体T4连接酶(各自在N-端处融合至CBD)。如在1.4.1中公开的,为了产生和表达CBD融合蛋白,在每种情况下用甘氨酸和丝氨酸(GS)替换N-端甲硫氨酸(M) (例如肠杆菌噬菌体连接酶CC31的SEQ ID NO:7和志贺氏菌噬菌体Shf125875连接酶的SEQ ID NO:9)。
通过标准固相方法合成下述寡核苷酸。
表4
| 名称 | 序列 | %HPLC纯度 | 量(mg) |
| 5’区段* | 5’-(OMe)G(OMe)G(OMe)C(OMe)C(OMe)AA-3’ | 99.35 | 24.7 |
| 中央区段 | 5’-(p)ACC TCG GC-3’ | 96.9 | 58.1 |
| 3’区段 | 5’-(p)TTA CCT-3’ | 97.88 | 29.5 |
| 生物素化的模板 | 5’-生物素TT TAG GTA AGC CGA GGT TTG GCC-3’(SEQ ID NO:2) | 96.9 | 130.7 |
N.B. OMe指示在核糖环上的2’甲氧基取代
(p) = 磷酸酯
* 应当指出,前5个核苷酸是2’-OMe修饰的(GGCCA),但是最终的A不是。
3.2 使用连接酶珠子浆的寡核苷酸组装和连接方法
3.2.1 珠子浆产生
如在1.4中所述使与CBD融合的连接酶结合至PERLOZA珠子以产生珠子浆。
3.2.2 使用珠子浆的寡核苷酸组装和连接
在96孔板中用下面的组分制备连接反应物至50µL的终体积:
2µL ~1mg/mL 5’(2’-OMe)区段
2µL ~1mg/mL中央区段
2µL ~1mg/mL 3’区段
2µL ~1mg/mL模板
5µL NEB T4 DNA连接酶缓冲液
22µL H2O
15µL PERLOZA结合的珠子浆。
在加入PERLOZA珠子浆之前将反应物在室温温育15分钟以允许区段与模板退火。加入PERLOZA珠子浆,并将反应物在室温温育1小时。1小时温育以后,将溶液转移进ACOPREPadvance 350滤板(PN 8082),并将滤板放在ABGENE superplate (Thermo Scientific, #AB-2800)的上面并在4,000 rpm离心10分钟以除去PERLOZA珠子浆。然后使用在实施例1(部分1.2)中描述的方法通过HPLC分析溶液。
对于每种连接酶,将每次寡核苷酸组装和连接重复6次。
3.3 结果和结论
野生型肠杆菌噬菌体CC31连接酶(SEQ ID NO:6)和野生型志贺氏菌噬菌体Shf125875连接酶(SEQ ID NO:8)能够将2’OMe取代的5’区段(其含有5个2’-OMe核苷碱基和1个脱氧核苷碱基)连接至仅含有未修饰的DNA的区段。另外,尽管野生型T4 DNA连接酶(SEQID NO:3和4)难以执行该反应,如在实施例2中所示和在这里再次证实的,但是许多在位置368和371处的突变会赋予将2’-OMe取代的5’区段(其含有5个2’OMe核苷碱基和1个脱氧核苷碱基)连接至在连接酶上仅含有未修饰的DNA的区段的能力(SEQ ID NO:10-19)。
实施例4:使用突变体DNA连接酶的2’MOE核糖修饰的和5-甲基嘧啶修饰的寡核苷酸区段组装和连接
4.1 材料
通过标准的基于固相的方法合成如下面表5所述的经修饰的寡核苷酸区段。
表5
| 区段 | 序列 | 分子量 | 质量(mg) | %纯度 |
| 中央区段 | 5’-(p)dCdCdTdCdGdG-3’ | 2044.122 | 39 | 98.96 |
| MOE 3'-区段 | 5’-(p)dCdTmTmAmCmCmT-3' | 2699.679 | 52 | 97.79 |
| MOE 5'-区段 | 5'-mGmGmCmCmAdAdA-3’ | 2644.771 | 48 | 99.13 |
(p) = 磷酸酯,mX = MOE碱基,dX = DNA碱基
所有5-甲基嘧啶。
使用标准的克隆、表达和提取方法将基于野生型肠杆菌噬菌体CC31连接酶、野生型T4连接酶和野生型志贺氏菌噬菌体Shf125875连接酶的突变体DNA连接酶(SEQ ID NO:20-28)各自在N-端融合至纤维素结合结构域(CBD)。如在1.4中所述将与CBD融合的连接酶结合至PERLOZA珠子以产生珠子浆。为了从PERLOZA珠子释放连接酶,将2µl TEV蛋白酶加入浆并在4℃温育过夜。将切割的蛋白(现在缺乏纤维素结合结构域)通过在4000 rpm离心10min进行收集。
4.2 方法
如下建立反应:
中央区段 最终20µM
MOE 3’区段 最终20µM
MOE 5’区段 最终20µM
模板 最终20µM
NEB T4 DNA连接酶缓冲液 5µl
突变体DNA连接酶 15µl
H2O 以制备最终的反应体积50µl。
在加入DNA连接酶之前将所有组分混合和涡旋。将反应物在35℃温育1小时。1小时以后,通过在PCR区块中在95℃加热5分钟,停止反应。
根据在实施例1 (部分1.2)中使用的HPLC方案,通过HPLC和LCMS分析样品以证实产物身份。包括市售NEB T4 DNA连接酶的对照和阴性对照(H2O替代任何连接酶)。
4.3 结果和结论
图10显示了对照反应和由SEQ ID NO:23 (克隆A4 - 突变体肠杆菌噬菌体CC31连接酶)催化的反应的HPLC迹线。产物和模板使用该HPLC方法共洗脱,所以产物作为产物+ 模板峰的峰面积的增加而出现。在突变体连接酶迹线(b)中,不仅产物+ 模板峰增加,而且两个新峰出现在10.3和11.2分钟。这些峰对应于中央区段与MOE 5’区段或MOE 3’区段的连接。并且,输入区段峰实质上小于对照,与产物和中间体峰增加一致。NEB市售T4连接酶迹线(a)表明模板+ 产物的峰面积的轻微增加,少量中间连接产物以及输入寡核苷酸区段的伴随减少。但是,突变体连接酶(SEQ ID NO:23)表明实质上更大的产物+ 模板峰面积和输入寡核苷酸区段的峰面积的伴随减少。因而,就2’MOE取代的区段而言,突变体连接酶(SEQ IDNO:23)是比市售T4 DNA连接酶远远更有效的连接酶。对于其它突变体连接酶(SEQ ID NO:20、21、24-28),表明了类似的改善。
实施例5:不同的核苷酸配对在连接位点处的影响
5.1 材料
使用标准的克隆、表达和提取方法,生产了在N-端与纤维素结合结构域(CBD)融合的突变体肠杆菌噬菌体CC31连接酶(SEQ ID NO:23)。将提取的CBD-突变体肠杆菌噬菌体CC31连接酶融合蛋白加给25 ml PERLOZA 100 (PERLOZA)纤维素珠子并在20℃摇动1小时。然后收集PERLOZA珠子,并用250 ml缓冲液(50 mM Tris pH 8.0, 200 mM NaCl, 0.1%吐温20, 10%甘油)洗涤,随后用250 ml PBS洗涤,最后重新悬浮在10 ml PBS (10 mM PO4 3-,137mM NaCl, 2.7 mM KCl pH 7.4)中。为了分析蛋白表达,将15µl PERLOZA珠子浆与5µl SDS加载缓冲液混合并在80℃温育10分钟,然后根据标准方案在SDS PAGE梯度凝胶(4 - 20%)上运行。为了从珠子释放连接酶,加入70µl TEV蛋白酶并在摇动下在4℃温育过夜。通过用80 ml PBS洗涤消化过的珠子来收集连接酶。然后使用Amicon 30 Kd MCO过滤器将连接酶浓缩至1.2 ml。
通过标准固相方法合成了下述生物素化的DNA模板寡核苷酸(表6)和DNA区段寡核苷酸(表7)。请注意,粗体的核苷酸是存在于连接位点处的核苷酸(即在连接反应中连接在一起的那些核苷酸- 表7;和与经由连接反应连接在一起的那些互补的那些核苷酸- 表6)。
表6:
表7
(p) = 磷酸酯。
N.B. 请注意,不同于以前的实施例,在该实施例中的连接反应包括将两个区段连接在一起:5’-区段和3’-区段,即不存在中央区段。
5.2 方法
如下建立反应:
表8
对于每50µL反应:
3’区段(1 mM储备物,最终20µM) 1µl
5’区段(1 mM储备物,最终20µM) 1µl
模板(1 mM储备物,最终20µM) 1µl
NEB DNA连接酶缓冲液(对于T4连接酶) 5µl
突变体CC31 DNA连接酶(0.45 mM储备物,最终90µM) 10µl
H2O 补至50µl。
将每种反应混合物在35℃温育30分钟和1小时。通过在95℃加热5分钟,终止每种反应。进行HPLC分析。
5.3 结果和结论
在HPLC分析中,所有反应在1小时温育后产生产物峰。因此,所述连接方法对于在要连接的接头处的所有核苷酸组合都工作。提高产物收率的优化是可能的,但并非必需的,因为结果是明确的,且显然所述反应对于在要连接的接头处的所有核苷酸组合都工作。
实施例6:不同的修饰在连接位点处的影响
6.1 材料
如在5.1中所述生产突变体肠杆菌噬菌体CC31连接酶(SEQ ID NO:23),并购买小球藻病毒DNA连接酶(SEQ ID NO:29,作为SplintR连接酶商购可得,NEB)。
通过标准固相方法合成了下述生物素化的模板寡核苷酸和区段寡核苷酸(表9)。
表9
| 名称 | 序列(连接部修饰为粗体) |
| 模板 | 5’-生物素TTTAGGTAAGCCGAGGTTTGGCC-3’ (SEQ ID NO:2) |
| 5’区段(WT) | 5’-GGCCAAA-3’ |
| 5’区段(Mo1) | 5’-GGCCAA(OMe)A-3’ |
| 5’区段(Mo2) | 5’-GGCCAA(F)A-3’ |
| 中央区段(WT) | 5’-(p)CCTCGG-3’ |
| 中央区段(Mo4A) | 5’-(p)(OMe)CCTCGG-3’ |
| 中央区段(Mo5A) | 5’-(p)(F)CCTCGG-3’ |
| 中央区段(Mo7) | 5’(p)(Me)CCTCGG-3’ |
| 3’区段(WT) | 5’-(p)CTTACCT-3’ |
| 3’区段(Mo8) | 5’-(p)(Me)CTTACCT3’ |
OMe指示在核糖环上的2’甲氧基取代
F指示在核糖环上的2’氟取代
所有剩余的糖残基是脱氧核糖残基
Me指示5-甲基胞嘧啶。
6.2 方法
如下建立反应:
表10
对于每50µL反应:
3’-区段(1 mM,储备物,最终20µM) 1µl
中央区段(1 mM,储备物,最终20µM) 1µl
5’-区段(1 mM,储备物,最终20µM) 1µl
模板(1 mM,储备物,最终20µM) 1µl
H2O 补至50µl。
对于突变体肠杆菌噬菌体CC31连接酶(SEQ ID NO:23)
DNA连接酶缓冲液(50 mM Tris-HCl, 1 mM DTT) 5µl
突变体CC31 DNA连接酶(0.45 mM) 10µl
MnCl2 (50 mM) 5µl
ATP (10 mM) 10µl。
然而对于小球藻病毒DNA连接酶(SEQ ID NO:29,作为SplintR连接酶商购可得,NEB)
NEB DNA连接酶缓冲液(对于小球藻) 5µl
小球藻病毒DNA连接酶 2µl。
将每种反应混合物在20℃温育1小时。通过在95℃加热10分钟,终止每个反应。使用实施例1的方法进行HPLC分析。
6.3 结果和结论
在HPLC分析中,所有反应产生产物峰。因此,所述连接方法对于在要连接的接头处测试的所有修饰组合都工作。提高产物收率的优化是可能的,但并非必需的,因为结果是明确的,且显然所述反应对于在要连接的接头处测试的所有修饰组合都工作。
实施例7:使用不同数目的区段构建较大寡核苷酸的能力
7.1 材料
如在5.1中所述生产突变体肠杆菌噬菌体CC31连接酶(SEQ ID NO:23)。
通过标准固相方法合成下述生物素化的模板DNA寡核苷酸和DNA区段寡核苷酸(表11)。
表11
| 名称 | 序列 |
| 模板 | 5’-生物素TTTGGTGCGAAGCAGAAGGTAAGCCGAGGTTTGGCC-3’ (SEQ ID NO:47) |
| 5’区段(1) | 5’-GGCCAAA-3’ |
| 中央区段(2) | 5’-(p)CCTCGG-3’ |
| 中央区段/3’区段(5) | 5’-(p)TCTGCT-3’ |
| 中央区段(3) | 5’-(p)CTTACCT-3’ |
| 3’区段(4) | 5’-(p)TCGCACC-3’ |
(p) = 磷酸酯,
7.2 方法
如下建立反应:
表12
| 5' 区段 | 中央区段 | 3' 区段 | 区段的总数 |
| 1 | 2和3 | 5 | 4 |
| 1 | 2, 3和5 | 4 | 5 |
在磷酸盐缓冲盐水(pH = 7.04)中以100µl的总体积运行反应并如下建立:-
模板(最终20µM)
每个区段 (最终20µM)
MgCl2 (最终10 mM)
ATP (最终100µM)
突变体CC31 DNA连接酶(最终25µM)。
将每种反应物在28℃温育过夜,然后通过在94℃加热1分钟进行终止。通过HPLC质谱法分析产物。
7.3 结果和结论
使用4个区段的反应产生了27个碱基对长度的完全连接的产物。使用5个区段的反应产生了33个碱基对长度的产物。在两种情况下,观察到的产物的质量与期望的序列的预期一致。综上所述,显然可能组装多个区段以产生期望长度的寡核苷酸和由适当的互补模板序列定义的序列。
实施例8:5-10-5区段的组装和连接以形成gapmer,其中5’和3’区段包含:(i) 2’-OMe核糖糖修饰,(ii)硫代磷酸酯键,或(iii) 2’-OMe核糖糖修饰和硫代磷酸酯键;且其中所述中央区段是未修饰的DNA。
8.1 材料
如在5.1中所述生产突变体肠杆菌噬菌体CC31连接酶(SEQ ID NO:23)。通过标准固相方法合成下述生物素化的模板DNA寡核苷酸和区段寡核苷酸(表13)。
表13
| 名称 | 序列 |
| 模板 | 5’-生物素TTTGGTGCGAAGCAGACTGAGGC-3’ (SEQ ID NO:30) |
| 3’区段(3OMe) | 5’-(p)(OMe)G(OMe)C(OMe)C(OMe)T(OMe)C-3’ |
| 3’区段(3PS+OMe) | 5’-(p)(OMe)G*(OMe)C*(OMe)C*(OMe)T*(OMe)C-3’ |
| 3’区段(3PS) | 5’-(p)G*C*C*T*C-3’ |
| 中央区段(D) | 5’-(p)AGTCTGCTTC-3’ |
| 5’区段(5OMe) | 5’-(OMe)G(OMe)C(OMe)A(OMe)C(OMe)C-3’ |
| 5’区段(5PS+OMe) | 5’-(OMe)G*(OMe)C*(OMe)A*(OMe)C*(OMe)C-3’ |
| 5’区段(5PS) | 5’-G*C*A*C*C-3’ |
OMe指示在核糖环上的2’甲氧基取代
所有剩余的糖残基是脱氧核糖残基
*硫代磷酸酯。
8.2 方法
如下建立反应:
表14
| 反应 | 3' 区段 | 中央区段 | 5' 区段 |
| 1 | 3PS | D | 5PS |
| 2 | 3OMe | D | 5OMe |
| 3 | 3PS+OMe | D | 5PS+OMe |
以100µl终体积在磷酸盐缓冲盐水中用下述组分建立反应1、2和3中的每一个:-
3’区段 最终20µM
中央区段 最终20µM
5’区段 最终20µM
模板 最终20µM
MgCl2 最终10 mM
ATP 最终50µM
酶 最终25µM。
将每种反应混合物在20℃温育过夜。通过在95℃加热10分钟,终止每个反应。进行HPLC质谱法分析。
8.3 结果和结论
在所有三个反应中产生了与所有三个片段的成功连接对应的产物寡核苷酸。因此,突变体肠杆菌噬菌体CC31连接酶(SEQ ID NO:23)能够将3个区段连接在一起以形成‘gapmer’,其中5’和3’‘翼’具有硫代磷酸酯主链,而中央区域具有磷酸二酯主链,且在gapmer中的所有糖残基是脱氧核糖残基。肠杆菌噬菌体CC31连接酶(SEQ ID NO:23)也能够将3个区段连接在一起以形成‘gapmer’,其中5’和3’‘翼’具有2’-甲氧基核糖(2’-OMe)残基,而中央区域具有脱氧核糖残基,且所有连接是磷酸二酯键。最后,肠杆菌噬菌体CC31连接酶(SEQ ID NO:23)能够将3个区段连接在一起以形成‘gapmer’,其中5’和3’‘翼’具有组合的修饰(硫代磷酸酯主链和2’-甲氧基核糖残基),而中央区域具有脱氧核糖残基和磷酸二酯键。
实施例9:包含锁核酸(LNA)的区段的组装和连接
9.1 材料
如在5.1中所述生产突变体肠杆菌噬菌体CC31连接酶(SEQ ID NO:23)。如在13.1中所述生产突变体金黄色葡萄球菌NAD依赖性连接酶(NAD-14)。
通过标准固相方法合成了下述生物素化的模板DNA寡核苷酸和区段寡核苷酸(表15)。
表15
| 名称 | 序列 |
| 模板 | 5’-生物素TTTGGTGCGAAGCAGACTGAGGC-3’ (SEQ ID NO:30) |
| 5’-区段 | 5’- GCCTCAG-3’ |
| LNA 5’-区段(寡物1) | 5’-GCCTCA(LNA)G-3’ |
| 中央区段 | 5’-(p)TCTGCT-3’ |
| LNA中央区段(寡物2) | 5’-(p) (LNA)TCTGCT-3’ |
(p) = 磷酸酯
LNA = 锁核酸
9.2 方法
如下建立反应:
反应体积100µl
模板 最终20µM
酶 最终25µM
所有寡核苷酸区段 最终20µM。
使用不同的酶(突变体肠杆菌噬菌体CC31连接酶(SEQ ID NO:23)或NAD-14)、二价阳离子(Mg2+或Mn2+)和在表16中所述的寡核苷酸区段的组合,建立反应。
表16
| 酶 | SEQ ID NO:23 | SEQ ID NO:23 | NAD-14 | NAD-14 |
| 二价阳离子 | 10 mM MgCl<sub>2</sub> | 10 mM MnCl<sub>2</sub> | 10 mM MgCl<sub>2</sub> | 10 mM MnCl<sub>2</sub> |
| 辅因子 | 100µM ATP | 100µM ATP | 100µM NAD | 100µM NAD |
| 缓冲液 | PBS, pH = 7.04 | PBS, pH = 7.04 | 50 mM KH<sub>2</sub>PO<sub>4</sub>, pH 7.5 | 50 mM KH<sub>2</sub>PO<sub>4</sub>, pH 7.5 |
| 5’区段+ 中央区段 | 产物 | 产物 | 产物 | 产物 |
| 寡物1 + 中央区段 | 产物 | 产物 | 产物 | 产物 |
| 5’区段+ 寡物2 | 产物 | 产物 | 产物 | 产物 |
| 寡物1 + 寡物2 | 无产物 | 无产物 | 无产物 | 无产物 |
将每种反应混合物在28℃温育过夜。通过在94℃加热1分钟,终止每个反应。进行HPLC质谱法分析。
9.3结果和结论
在对照反应中生产产物寡核苷酸(仅未修饰的寡核苷酸),且其中将单个锁核酸包括在一个区段中在连接连接部处,不论它是否是在所述连接部的3’或5’侧。当将锁核酸包括在两侧时(寡物1 + 寡物2),没有检测到产物。数据对于两种酶是类似的,且不论是否使用Mg2+或Mn2+。
可以进行酶突变和/或选择筛选以鉴别能够连接在连接部的3’和5’侧具有锁核酸的区段的酶。
实施例10:在有Mg2+或Mn2+存在下使用肠杆菌噬菌体CC31连接酶的变体组装和连接3个区段(7-6-7)以形成gapmer,其中5’和3’区段包含2’MOE核糖糖修饰,且所有连接是硫代磷酸酯键。
10.1 硫代磷酸酯键形成
为了确定突变体肠杆菌噬菌体CC31连接酶(SEQ ID NO:23)是否能够连接具有硫代磷酸酯主链、2’MOE核糖糖修饰和5-甲基化的嘧啶碱基的经修饰的寡核苷酸区段,使用在表15中所示的寡核苷酸区段执行反应。在有Mg2+和Mn2+ 离子存在下执行反应。
10.2 材料
使用如下所示的标准方法化学合成寡核苷酸:
表17
| 名称 | 序列 |
| 5’区段2’-MOE PS | 5'-mG*mG*mC*mC*mA*dA*dA-3’ |
| 中央区段PS | 5’-(p)*dC*dC*dT*dC*dG*dG -3' |
| 3’区段2’-MOE PS | 5'-(p)*dC*dT*mU*mA*mC*mC*mU-3' |
| 生物素化的模板 | 5’-生物素dT dT dT dA dG dG dT dA dA dG dC dC dG dA dG dG dT dT dT dG dG dC dC-3’(SEQ ID NO:2) |
(p)* = 5’-硫代磷酸酯,* = 硫代磷酸酯键,mX = MOE碱基,dX = DNA碱基
所有区段和产物具有5-甲基嘧啶(除了模板以外)
认为mT和m (Me)U是等同的。
N.B. 当与表17中所示的生物素化的模板杂交时,通过连接表17中的区段所产生的靶2’MOE PS分子是:
5'-mG*mG*mC*mC*mA*dA*dA*dC*dC*dT*dC*dG*dG*dC*dT*mU*mA*mC*mC*mU-3'(SEQ ID NO:1)
如在实施例5.1中所述制备经纯化的突变体肠杆菌噬菌体CC31连接酶(SEQ IDNO:23)。进行HPLC分析。
10.3 使用肠杆菌噬菌体CC31连接酶变体(SEQ ID NO:23)的寡核苷酸组装和连接
方法
如下制备反应物:
MgCl2反应
MnCl2反应
最终的反应物含有20µM每种区段和模板、5 mM MgCl2或5 mM MnCl2、1mM ATP、50mM Tris-HCl、10 mM DTT(pH 7.5)和4.9µM连接酶。制备不含酶的另外的反应并用作阴性对照。将反应物在25℃温育16小时,并然后通过加热至95℃保持5分钟来淬灭。将沉淀的蛋白通过离心进行澄清,并通过HPLC分析样品。
10.4 结果和结论
产物、模板和区段寡核苷酸在对照色谱图中明显地分解且没有观察到连接。在有5mM MgCl2存在下执行的连接酶反应导致从5’区段和中央区段的连接形成的中间产物的形成,但是没有检测到全长产物。在有MnCl2存在下执行的连接酶反应产生了全长产物和中间体(5’区段+ 中央区段中间体)。两种连接酶反应表明,未连接的寡核苷酸区段被保留。但是,为了使产物收率最大化,方案的优化是可能的。
实施例11:在有天然Mg2+存在下使用野生型小球藻病毒DNA连接酶组装和连接三个区段(7-6-7)以形成gapmer,其中5’和3’区段包含2’MOE核糖糖修饰,且所有连接是硫代磷酸酯键
11.1 材料
为了确定小球藻病毒DNA连接酶(SEQ ID NO:29,作为SplintR连接酶商购可得,NEB)是否能够连接具有硫代磷酸酯主链、2’MOE核糖糖修饰和5-甲基化的嘧啶碱基的经修饰的寡核苷酸区段,使用在实施例10.2表17中所示的寡核苷酸区段执行反应。在25℃、30℃和37℃执行反应以研究温度对酶活性的影响。
11.2 使用市售小球藻病毒DNA连接酶(SEQ ID NO:29)的寡核苷酸组装和连接方
法
如下面详述的,将每种寡核苷酸区段和模板溶解在不含核酸酶的水中:
如下制备反应物:
最终的反应物含有20µM每种区段和模板、50 mM Tris-HCl、10 mM MgCl2、1 mMATP、10 mM DTT(pH 7.5)和2.5 U/µl连接酶。在25℃、30℃和37℃温育反应物。制备不含酶的另外的反应并用作阴性对照。在16小时温育以后,通过加热至95℃保持10分钟,淬灭反应。将沉淀的蛋白通过离心进行澄清,并通过HPLC分析样品。
11.3结果和结论
产物、模板和区段寡核苷酸在对照色谱图中明显地分解且没有观察到连接。连接酶反应的HPLC分析表明,未连接的寡核苷酸区段被保留,但是小球藻病毒DNA连接酶能够成功地连接所述区段。所述连接酶的活性随着温度升高而增加。在25℃,小球藻病毒DNA连接酶能够成功地连接5’区段和中央区段,但是没有观察到全长产物。在30℃和37℃,除了从5’区段和中央区段形成的中间体以外,检测到全长产物。
实施例12:针对连接三个区段(7-6-7)以形成gapmer的活性筛选一组15种ATP和NAD连接酶,其中5’和3’区段包含2’MOE核糖糖修饰,且所有连接是硫代磷酸酯键
12.1 材料
将在表18和19中描述的野生型ATP和NAD依赖性连接酶各自在N-端融合至CBD。使用标准的克隆、表达和提取方法合成基因,克隆进pET28a中并在大肠杆菌BL21(DE3)中表达。
经以下修改如在1.4中所述使CBD-连接酶融合体结合至PERLOZA珠子。从BL21(DE3)细胞(NEB)的单个集落培养CBD-连接酶融合蛋白,并在50 mL表达培养物中培养。将细胞通过离心收获,重新悬浮在5-10 mL Tris-HCl (50 mM, pH 7.5)中并通过声处理裂解。将裂解物通过离心澄清,并将1 mL PERLOZA 100 (PERLOZA)珠子(50%浆,用50 mM Tris-HCl pH 7.5预平衡)加入上清液,将其在20℃摇动1小时。然后将PERLOZA纤维素珠子收集,并用30 ml缓冲液(50 mM Tris pH 8.0, 200 mM NaCl, 0.1%吐温20, 10%甘油)洗涤,随后用10 ml Tris-HCl (50 mM, pH 7.5)洗涤,并最后重新悬浮在1 mL Tris-HCl (50 mM, pH7.5)中。为了分析蛋白表达,将20µl PERLOZA珠子浆与20µl SDS加载缓冲液混合并在95℃温育5分钟,然后根据标准方案在SDS PAGE梯度凝胶(4 - 20%)上运行。
12.2 2’MOE和硫代磷酸酯修饰的寡核苷酸组装和连接方法
使用在实施例10.2表17中所示的具有硫代磷酸酯主链、2’MOE核糖糖修饰和5-甲基化的嘧啶碱基的经修饰的寡核苷酸区段。如下面详述的,将每种寡核苷酸区段和模板溶解在不含核酸酶的水中:
如下制备ATP测定混合物:
如下制备NAD测定混合物:
将每种固定化的蛋白(40µl, 50%PERLOZA珠子浆)移入PCR试管中。将珠子通过离心沉淀,并将上清液通过抽吸除去。将测定混合物(40µl)加入每种反应物(最终的反应物含有20µM每种区段和模板、50 mM Tris-HCl、10 mM MgCl2、1 mM ATP或100µM NAD、10 mM DTT(pH 7.5)和40µl在PERLOZA珠子上的连接酶)。不含蛋白的反应用作阴性对照。将反应物在30℃温育18小时,并然后通过加热至95℃保持10分钟进行淬灭。将沉淀的蛋白通过离心进行澄清,并通过HPLC分析样品。
12.3结果和结论
产物、模板和区段寡核苷酸在对照色谱图中明显地分解且没有观察到连接。连接酶反应的HPLC分析表明,所有蛋白催化5’区段和中央区段的成功连接以形成中间产物,但是仅一些连接酶催化所有三个区段的连接以产生如表20所述的全长产物。来自金黄色葡萄球菌的NAD依赖性连接酶(SaNAD, SEQ ID NO:61)产生了最多的全长产物。提高产物收率的优化是可能的且在技术人员的技能内。
表20
* 相对于模板从HPLC峰面积计算转化率,所述模板在反应中没有消耗且用作内部标准品。转化率=产物面积/(模板+产物面积)*100。
实施例13: 半连续连接反应
13.1 材料
使用标准的克隆、表达和提取方法生产在N-端与CBD融合的突变体金黄色葡萄球菌连接酶(NAD-14)。然后使CBD-NAD-14突变体连接酶结合至PERLOZA珠子:将50 ml蛋白裂解物加给7.5 ml PERLOZA珠子,在室温温育1小时,并然后将珠子收集在玻璃柱(BioRadEcono-Column 10cm长度, 2.5cm直径#7372512)中。将珠子用200 ml缓冲液Y (50mMTris8, 500mM NaCl, 0.1%吐温20, 10%甘油)洗涤,然后用200 ml缓冲液Z (50mM Tris8,200mM NaCl, 0.1%吐温20, 10%甘油)和200ml PBS洗涤。在珠子上的突变体NAD-14连接酶的估计浓度是69µM连接酶/ml珠子。
通过标准固相方法合成了下述模板DNA寡核苷酸和区段寡核苷酸(表21)。
表21
| 区段 | 序列 | 分子量 | %HPLC纯度 |
| 模板3 | 5’TTTGGTGCGAAGCAGACTGAGGC-3’ (SEQ ID NO:30) | ||
| 中央区段 | 5’-(p)dTdCdTdGdCdT-3’ | 1865.4 | 97.5 |
| MOE 3'-区段 | 5’-(p)dTdCmGmCmAmCmC-3’ | 2546.7 | 98.0 |
| MOE 5'-区段 | 5'-mGmCmCmUmCdAdG-3’ | 2492.7 | 98.3 |
(p) = 磷酸酯,mX = MOE碱基,dX = DNA碱基
所有5-甲基嘧啶
所有连接是磷酸二酯键。
生产了“三-模板hub’”(大约24 kDa),其包含被称作“hub’”的支持材料和三个模板序列(图11)。每个模板拷贝在它自己的单独附着点处共价地连接至“hub”。“三-模板hub”分子是比靶标(产物)寡核苷酸更高的分子量(与模板序列100%互补),由此当从反应混合物分离杂质和产物时允许它被保留。应当指出,在该特定情况下,模板序列是SEQ ID NO:30,且将三个拷贝附着于hub。在下述实施例中,也生产了三-模板hub,但是具有不同的模板序列。因此,随着模板序列在实施例之间变化,所以三-模板hub也变化。
制备了下述反应混合物(总体积5 ml):
250µl 1 M KH2PO4, pH 7.5 (最终50 mM)
108µl 0.07011 M中央区段 (最终1.5 mM)
137µl 0.05481 M 3’-区段 (最终1.5 mM)
168µl 0.04461 M 5’-区段 (最终1.5 mM)
750µl 0.00387M Hub (模板) (最终0.55 mM)
350µl 50mM NAD+ (最终3.5 mM)
1000µl 50mM MgCl2 (最终10 mM)
2237µl 无核酸酶的H2O。
13.2 方法
如在图12中所示建立半连续系统。
将4 ml PERLOZA珠子和固定化的突变体NAD-14连接酶填充进Pharmacia XK16柱(B)中。使用柱水隔室,使用水浴和蠕动泵(C)保持柱温在30℃。通过使120 ml (30x柱体积)的含有50mM KH2PO4的缓冲液(在pH7.5)在1 ml/min运行120分钟,使珠子平衡。使用AKTA探测泵A1 (A)建立穿过Pharmacia XK16柱的流。
在柱平衡以后,将5 ml反应混合物(通过涡旋混合均匀)加载到柱上,收集在蓄池试管(D)中并使用AKTA探测泵A1穿过柱再循环。将反应混合物在连续循环模式在1 ml/min的流速在所述系统中再循环16小时。在30分钟、60分钟、90分钟、4小时、5小时、6小时、7小时、14小时和16小时以后收集样品用于HPLC分析。
13.3 结果和结论
表22
| 样品 | 5’-区段(%) | 中央区段(%) | 3’-区段(%) | 5’+ 中央中间体(%) | 产物(%) |
| 30 min | 7.80 | 11.00 | 24.00 | 39.40 | 4.40 |
| 60 min | 3.30 | 4.50 | 18.80 | 41.50 | 18.90 |
| 90 min | 2.10 | 2.80 | 15.10 | 33.80 | 34.40 |
| 4 h | 1.80 | 2.40 | 9.60 | 19.20 | 56.80 |
| 5 h | 1.72 | 2.40 | 8.30 | 15.70 | 61.50 |
| 6 h | 1.69 | 2.50 | 8.60 | 15.90 | 69.40 |
| 7 h | 1.70 | 2.40 | 8.30 | 14.80 | 70.90 |
| 14 h | 2.00 | 2.70 | 1.60 | 5.40 | 88.10 |
| 16 h | 0.80 | 1.90 | 1.70 | 3.30 | 89.50 |
将每个区段、中间体和产物的百分比表达为相对于三-模板hub峰面积的峰面积分数。
综上所述,半连续流反应起作用,且在16小时以后,反应几乎结束。
实施例14:通过过滤分离不同大小的寡核苷酸:a)分离20-聚体寡核苷酸(SEQ IDNO:1)和包含三个非互补的20-聚体寡核苷酸的hub (SEQ ID NO:30);(b)从区段6-聚体和8-聚体寡核苷酸(参见表1)以及包含三个互补20-聚体寡核苷酸的hub (SEQ ID NO:2)分离20-聚体寡核苷酸(SEQ ID NO:1)。
14.1 材料
通过标准固相方法合成了所有使用的寡核苷酸。
使用如在13.1中所述的三-模板hub (图11)。
如在表23和24中所示,使用多种具有不同分子量截止值且来自不同生产商的过滤器。
14.2 方法
14.2.1 用于筛选聚合物膜的盲端过滤设置和方案:(方案1)
如在图13中所示建立盲端过滤装备,其包含置于水浴中的MET盲端过滤单元,所述水浴安置在磁力搅拌器和加热板上。从氮气流提供所述单元内的压强。
首先将要测试的膜的试样(14 cm2)切割至适当大小并放在所述单元中。首先将所述膜用HPLC级水(200 ml)调节,并然后用PBS缓冲液(200 ml)调节。然后将所述单元泄压,将剩余的PBS溶液除去并用含有寡核苷酸的溶液(40 ml寡核苷酸在PBS中,1 g/L浓度)替换。将所述单元放在热搅拌板上并将所述溶液加热至期望的温度,同时使用磁力搅拌进行搅拌。将压强应用于所述单元(达到大约3.0巴;在每种情况下记录实际压强)。停止或继续溶液的搅拌,并收集渗透物溶液(大约20 ml)和通过HPLC进行分析。记录流量。然后将系统泄压以允许渗余物溶液的取样和HPLC分析。然后将更多的PBS缓冲液(20 ml)加入过滤单元并将前面的操作重复3次。最后用PBS缓冲液洗涤所述膜。
在没有任何稀释下通过HPLC分析所有样品。
14.2.2用于筛选聚合物膜的横向流过滤设置和方案:(方案2)
如在图14中所示建立横向流过滤装备。由圆锥形烧瓶组成的进料容器(1)含有要纯化的寡核苷酸溶液。使用HPLC泵(2)将所述溶液泵送至横向流过滤单元(4),同时使用加热板(3)维持所述单元内的温度。使用齿轮泵(6)使所述单元内的溶液再循环。压强表(5)在实验过程中使压强可读出。从取样阀(7)取渗余物溶液的样品,并从渗透物收集容器(8)对渗透物溶液取样。
首先将要测试的膜的试样切割至适当大小并放在所述单元中。将所述系统用PBS溶液(100 ml)洗涤。将所述溶液的温度调至期望的设定点。将含有在PBS中的寡核苷酸产物的溶液(7.5 ml,在1 g/L)进料进所述系统中。然后使用HPLC泵在与渗透物溶液的流速匹配的流速(通常,3 ml/min)将PBS溶液泵入所述系统。使用压强表记录压强。每5个渗滤体积将渗余物溶液取样用于HPLC分析。每个渗滤体积将渗透物溶液取样用于HPLC分析。在20个渗滤体积以后停止实验。
在使用具有5 kDa分子量截止值的Snyder膜(批号120915R2)和SEQ ID NO:46和SEQ ID NO:30的实验的情况下,如下修改上述方法。首先将要测试的膜的试样切割至适当大小并放在所述单元中。将所述系统用磷酸钾溶液(100 ml, 50mM, pH 7.5)洗涤。将溶液的温度调至期望的设定点。将含有在磷酸钾中的寡核苷酸产物的溶液(大约1 g/L)加入乙二胺四乙酸(EDTA) (230µL,500mM溶液)。然后将所述溶液进料进所述系统。然后使用HPLC泵在与渗透物溶液的流速匹配的流速(通常4 ml/min)将磷酸钾缓冲液泵入所述系统。使用压强表记录压强。每5个渗滤体积将渗余物溶液取样用于HPLC分析。每个渗滤体积将渗透物溶液取样用于HPLC分析。在15个渗滤体积以后停止实验。
14.3 结果
表23:按照方案1 (14.2.1)的盲端过滤实验的结果
MWCO = 分子量截止值。
在60℃使用10 kDa MWCO NADIR膜的实验中,证实了产物序列(SEQ ID NO:1)和非互补的三-模板hub (包含SEQ ID NO:30)之间的明显分离。图15显示了a)在2个渗滤体积以后渗余物溶液的色谱图,其被保留在过滤单元中且主要含有三-模板hub;和b)在2个渗滤体积以后富含产物的渗透物溶液的色谱图。
在50℃和3.0巴压强使用5 kDa MWCO Snyder膜的实验中,证实了区段序列(参见表1)和互补三-模板hub (包含SEQ ID NO:2)和产物(SEQ ID NO:1)之间的明显分离。图16显示了a)在20个渗滤体积以后渗余物溶液的色谱图,其主要含有三-模板hub和产物;和b)在20个渗滤体积以后渗透物的色谱图,其主要含有区段寡核苷酸。
在80℃和3.1巴压强使用5 kDa MWCO Snyder膜的实验中,证实了互补三-模板hub(包含SEQ ID NO:2)和产物(SEQ ID NO:1)之间的明显分离。图17显示了a)在20个渗滤体积以后渗余物溶液的色谱图,其仅含有三-模板hub;和b)在2个渗滤体积以后渗透物溶液的色谱图,其仅含有产物。
14.4 结论
使用过滤可以分离不同长度和分子量的寡核苷酸。如上所示,膜的类型和条件(诸如温度)会影响分离水平。对于给定的不同长度/分子量的寡核苷酸的集合,可以选择合适的膜和条件以允许所需的分离。例如,我们已经证实,如在表1中所示的区段寡核苷酸(6和8个核苷酸长度的短聚体)可以与产物寡核苷酸(具有SEQ ID NO:1的20-聚体寡核苷酸)和三-模板hub (包含3个SEQ ID NO:2的20-聚体,其附着于固体支持物)分离,且所述产物寡核苷酸和三-模板hub又可以彼此分离。
总结论
我们已经证实,如下可能在溶液中合成寡核苷酸,包括具有许多治疗上有关的化学修饰的寡核苷酸:在互补模板上组装短寡核苷酸区段,将所述区段连接在一起和在有效的方法中使产物寡核苷酸与杂质和它的互补模板分离,所述有效的方法是可放大的且适合用于大规模治疗性寡核苷酸制备。
通过在溶液中合成寡核苷酸,我们已经避免了由固相方法产生的放大约束。在使用DNA的固有性质来特异性地识别互补序列和以反映互补序列的保真度和互补序列的长度的亲和力结合互补序列中,我们已经能够生产高纯度的寡核苷酸,不需要色谱法。这会提高生产方法的效率和所述方法的可放大性。通过在分离方法中回收处于未改变状态的模板,我们能够重复使用所述模板用于将来的合成轮,且所以已经避免必须为每当量的形成的产物寡核苷酸制备1当量的模板的经济后果。
最后,尽管已知野生型连接酶会有效地连接正常DNA,我们已经证实,对DNA的修饰会导致降低的连接效率,且对DNA的多个修饰在它们的降低连接效率的影响方面是累加性的,这在某些情况下可以使DNA连接酶完全无效。我们已经证实,通过DNA连接酶的适当突变和进化,可以恢复连接效率,且适当地修饰的DNA连接酶是用于合成含有多个修饰的寡核苷酸的有效催化剂。
序列表
| SEQ ID NO | 序列标识符 |
| 1 | 实施例1期望的产物寡核苷酸序列(“靶标”) |
| 2 | 实施例1-4、6、10和11模板寡核苷酸序列 |
| 3 | 野生型T4 DNA连接酶蛋白序列 |
| 4 | 野生型T4 DNA连接酶蛋白序列(当与CBD融合时) |
| 5 | 实施例2靶序列 |
| 6 | 野生型肠杆菌噬菌体CC31 DNA连接酶蛋白序列 |
| 7 | 野生型肠杆菌噬菌体CC31 DNA连接酶蛋白序列(当与CBD融合时) |
| 8 | 野生型志贺氏菌噬菌体Shf125875 DNA连接酶蛋白序列 |
| 9 | 野生型志贺氏菌噬菌体Shf125875 DNA连接酶蛋白序列(当与CBD融合时) |
| 10 | 突变体连接酶(T4主链)蛋白序列 |
| 11 | 突变体连接酶(T4主链)蛋白序列 |
| 12 | 突变体连接酶(T4主链)蛋白序列 |
| 13 | 突变体连接酶(T4主链)蛋白序列 |
| 14 | 突变体连接酶(T4主链)蛋白序列 |
| 15 | 突变体连接酶(T4主链)蛋白序列 |
| 16 | 突变体连接酶(T4主链)蛋白序列 |
| 17 | 突变体连接酶(T4主链)蛋白序列 |
| 18 | 突变体连接酶(T4主链)蛋白序列 |
| 19 | 突变体连接酶(T4主链)蛋白序列 |
| 20 | 突变体连接酶(T4主链)蛋白序列 |
| 21 | 突变体连接酶(T4主链)蛋白序列 |
| 22 | 突变体连接酶(T4主链)蛋白序列 |
| 23 | 突变体连接酶(肠杆菌噬菌体CC31主链- 克隆A4)蛋白序列 |
| 24 | 突变体连接酶(肠杆菌噬菌体CC31主链)蛋白序列 |
| 25 | 突变体连接酶(肠杆菌噬菌体CC31主链)蛋白序列 |
| 26 | 突变体连接酶(肠杆菌噬菌体CC31主链)蛋白序列 |
| 27 | 突变体连接酶(肠杆菌噬菌体CC31主链)蛋白序列 |
| 28 | 突变体连接酶(志贺氏菌噬菌体Shf125875主链)蛋白序列 |
| 29 | 野生型小球藻连接酶蛋白序列 |
| 30 | 实施例5、8和9模板寡核苷酸序列 |
| 31 | 实施例5模板寡核苷酸序列 |
| 32 | 实施例5模板寡核苷酸序列 |
| 33 | 实施例5模板寡核苷酸序列 |
| 34 | 实施例5模板寡核苷酸序列 |
| 35 | 实施例5模板寡核苷酸序列 |
| 36 | 实施例5模板寡核苷酸序列 |
| 37 | 实施例5模板寡核苷酸序列 |
| 38 | 实施例5模板寡核苷酸序列 |
| 39 | 实施例5模板寡核苷酸序列 |
| 40 | 实施例5模板寡核苷酸序列 |
| 41 | 实施例5模板寡核苷酸序列 |
| 42 | 实施例5模板寡核苷酸序列 |
| 43 | 实施例5模板寡核苷酸序列 |
| 44 | 实施例5模板寡核苷酸序列 |
| 45 | 实施例5模板寡核苷酸序列 |
| 46 | 实施例14“20聚体”寡核苷酸序列 |
| 47 | 实施例7模板寡核苷酸序列 |
| 48 | 绿草履虫小球藻病毒NE-JV-4连接酶 |
| 49 | 绿草履虫小球藻病毒NYs1连接酶 |
| 50 | 绿草履虫小球藻病毒NE-JV-1连接酶 |
| 51 | Acanthocystis turfacea小球藻病毒Canal-1连接酶 |
| 52 | Acanthocystis turfacea小球藻病毒Br0604L连接酶 |
| 53 | Acanthocystis turfacea小球藻病毒NE-JV-2连接酶 |
| 54 | Acanthocystis turfacea小球藻病毒TN603.4.2连接酶 |
| 55 | Acanthocystis turfacea小球藻病毒GM0701.1连接酶 |
| 56 | 聚球藻噬菌体S-CRM01连接酶 |
| 57 | 海洋沉积物宏基因组连接酶 |
| 58 | 结核分枝杆菌(菌株ATCC 25618/H37Rv)连接酶 |
| 59 | 粪肠球菌(菌株ATCC 700802/V583)连接酶 |
| 60 | 流感嗜血菌(菌株ATCC 51907/DSM 11121/KW20/Rd)连接酶 |
| 61 | 金黄色葡萄球菌连接酶 |
| 62 | 肺炎链球菌(菌株P1031)连接酶 |
序列表
<110> 葛兰素史克知识产权开发有限公司(GlaxoSmithKline IntellectualProperty Development Limited)
<120> 生产寡核苷酸的新颖方法
<130> PB66127
<160> 62
<170> PatentIn 3.5版
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 实施例1期望的产物寡核苷酸序列("靶标")
<400> 1
ggccaaacct cggcttacct 20
<210> 2
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例1-4, 6, 10和11模板寡核苷酸序列
<400> 2
tttaggtaag ccgaggtttg gcc 23
<210> 3
<211> 487
<212> PRT
<213> 肠杆菌噬菌体T4
<400> 3
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 4
<211> 488
<212> PRT
<213> 人工序列
<220>
<223> 野生型T4 DNA连接酶蛋白序列(当与CBD融合时)
<400> 4
Gly Ser Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr
1 5 10 15
Lys Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu
20 25 30
Lys Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile
35 40 45
Lys Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu
50 55 60
Thr Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg
65 70 75 80
Lys Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr
85 90 95
Asp Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg
100 105 110
Asp Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro
115 120 125
Gly Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu
130 135 140
Lys Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys
145 150 155 160
Ala Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp
165 170 175
Asp Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp
180 185 190
Leu Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile
195 200 205
His Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln
210 215 220
Val Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro
225 230 235 240
Glu Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr
245 250 255
Ala Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu
260 265 270
Lys Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu
275 280 285
Val Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg
290 295 300
Phe Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu
305 310 315 320
Ile Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr
325 330 335
Lys Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile
340 345 350
Asp Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys
355 360 365
Glu Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg
370 375 380
Lys Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly
385 390 395 400
Lys Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val
405 410 415
Lys Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr
420 425 430
Tyr Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser
435 440 445
Asp Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg
450 455 460
Leu Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly
465 470 475 480
Asp Phe His Glu Val Thr Gly Leu
485
<210> 5
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 实施例2靶标序列
<400> 5
ggccaaaccu cggcuuaccu 20
<210> 6
<211> 482
<212> PRT
<213> 肠杆菌噬菌体CC31
<400> 6
Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp
50 55 60
Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly
65 70 75 80
Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp
85 90 95
Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys
100 105 110
Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro
115 120 125
Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu
130 135 140
Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala
145 150 155 160
Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile
165 170 175
Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln
180 185 190
Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly
195 200 205
Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala
210 215 220
Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala
225 230 235 240
Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn
245 250 255
Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys
260 265 270
Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly
275 280 285
Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu
290 295 300
Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val
305 310 315 320
His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu
325 330 335
Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn
340 345 350
Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu Val Ile Thr Ile Asp
355 360 365
Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala
370 375 380
Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala
385 390 395 400
Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp
405 410 415
Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu
420 425 430
Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr
435 440 445
Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp
450 455 460
Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr
465 470 475 480
Gly Leu
<210> 7
<211> 483
<212> PRT
<213> 人工序列
<220>
<223> 野生型肠杆菌噬菌体CC31 DNA连接酶蛋白序列(当与CBD融合时)
<400> 7
Gly Ser Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr
1 5 10 15
Lys Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu
20 25 30
Lys Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile
35 40 45
Lys Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu
50 55 60
Asp Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr
65 70 75 80
Gly Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser
85 90 95
Asp Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg
100 105 110
Cys Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile
115 120 125
Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile
130 135 140
Glu Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly
145 150 155 160
Ala Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys
165 170 175
Ile Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys
180 185 190
Gln Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly
195 200 205
Gly Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro
210 215 220
Ala Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys
225 230 235 240
Ala Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala
245 250 255
Asn Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met
260 265 270
Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu
275 280 285
Gly Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu
290 295 300
Leu Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile
305 310 315 320
Val His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp
325 330 335
Glu Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu
340 345 350
Asn Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu Val Ile Thr Ile
355 360 365
Asp Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys
370 375 380
Ala Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys
385 390 395 400
Ala Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu
405 410 415
Asp Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val
420 425 430
Leu Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp
435 440 445
Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys
450 455 460
Asp Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val
465 470 475 480
Thr Gly Leu
<210> 8
<211> 497
<212> PRT
<213> 志贺氏菌噬菌体Shf125875
<400> 8
Met Ile Leu Asp Ile Leu Asn Gln Ile Ala Ala Ile Gly Ser Thr Lys
1 5 10 15
Thr Lys Gln Glu Ile Leu Lys Lys Asn Lys Asp Asn Lys Leu Leu Glu
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ala Arg Gly Ile Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Gly Pro Gly Glu Arg Ser Gln Ala Tyr Gly Leu Leu Glu
50 55 60
Leu Asp Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Lys Glu Leu Met Gly Tyr Ile Ala Asp
85 90 95
Gly Lys Pro Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Val Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Gln Leu Gln Pro Gln Met Leu Ala Ser Ala Tyr Asp Glu Lys
130 135 140
Leu Ile Thr Lys Asn Ile Lys Trp Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Asp Asp Gly Val Gln Phe
165 170 175
Phe Ser Arg Ala Gly Asn Glu Tyr His Gly Leu Thr Leu Leu Ala Asp
180 185 190
Glu Leu Met Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Asn Gly
195 200 205
Val Leu Ile Asp Gly Glu Leu Val Tyr His Ser Phe Asp Ile Lys Lys
210 215 220
Ala Val Ser Ser Gly Asn Asp Leu Ser Phe Leu Phe Gly Asp Asn Glu
225 230 235 240
Glu Ser Glu Glu Val Gln Val Ala Asp Arg Ser Thr Ser Asn Gly Leu
245 250 255
Ala Asn Lys Ser Leu Gln Gly Thr Ile Ser Pro Lys Glu Ala Glu Gly
260 265 270
Met Val Leu Gln Ala Trp Asp Tyr Val Pro Leu Asp Glu Val Tyr Ser
275 280 285
Asp Gly Lys Ile Lys Gly Gln Lys Tyr Asp Val Arg Phe Ala Ala Leu
290 295 300
Glu Asn Met Ala Glu Gly Phe Lys Arg Ile Glu Pro Ile Glu Asn Gln
305 310 315 320
Leu Val His Asn Leu Asp Glu Ala Lys Val Val Tyr Lys Lys Tyr Val
325 330 335
Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Arg Asp Ser Tyr Trp
340 345 350
Glu Asn Lys Arg Ser Lys Asn Leu Ile Lys Phe Lys Glu Val Ile Asp
355 360 365
Ile Ala Leu Glu Val Val Gly Tyr Tyr Glu His Ser Lys Asp Pro Asn
370 375 380
Lys Leu Gly Gly Val Glu Leu Val Ser Arg Cys Arg Arg Ile Thr Thr
385 390 395 400
Asp Cys Gly Ser Gly Phe Lys Asp Thr Thr His Lys Thr Val Asp Gly
405 410 415
Val Lys Val Leu Ile Pro Leu Asp Glu Arg His Asp Leu Asp Arg Glu
420 425 430
Arg Leu Met Ala Glu Ala Arg Glu Gly Lys Leu Ile Gly Arg Ile Ala
435 440 445
Asp Cys Glu Cys Asn Gly Trp Val His Ser Lys Gly Arg Glu Gly Thr
450 455 460
Val Gly Ile Phe Leu Pro Ile Ile Lys Gly Phe Arg Phe Asp Lys Thr
465 470 475 480
Glu Ala Asp Ser Phe Glu Asp Val Phe Gly Pro Trp Ser Gln Thr Gly
485 490 495
Leu
<210> 9
<211> 498
<212> PRT
<213> 人工序列
<220>
<223> 野生型志贺氏菌噬菌体Shf125875 DNA连接酶蛋白序列(当与CBD融合时)
<400> 9
Gly Ser Ile Leu Asp Ile Leu Asn Gln Ile Ala Ala Ile Gly Ser Thr
1 5 10 15
Lys Thr Lys Gln Glu Ile Leu Lys Lys Asn Lys Asp Asn Lys Leu Leu
20 25 30
Glu Arg Val Tyr Arg Leu Thr Tyr Ala Arg Gly Ile Gln Tyr Tyr Ile
35 40 45
Lys Lys Trp Pro Gly Pro Gly Glu Arg Ser Gln Ala Tyr Gly Leu Leu
50 55 60
Glu Leu Asp Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg
65 70 75 80
Lys Leu Thr Gly Asn Ala Ala Ile Lys Glu Leu Met Gly Tyr Ile Ala
85 90 95
Asp Gly Lys Pro Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg
100 105 110
Asp Leu Glu Val Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro
115 120 125
Gly Leu Ile Gln Leu Gln Pro Gln Met Leu Ala Ser Ala Tyr Asp Glu
130 135 140
Lys Leu Ile Thr Lys Asn Ile Lys Trp Pro Ala Phe Ala Gln Leu Lys
145 150 155 160
Ala Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Asp Asp Gly Val Gln
165 170 175
Phe Phe Ser Arg Ala Gly Asn Glu Tyr His Gly Leu Thr Leu Leu Ala
180 185 190
Asp Glu Leu Met Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Asn
195 200 205
Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Ser Phe Asp Ile Lys
210 215 220
Lys Ala Val Ser Ser Gly Asn Asp Leu Ser Phe Leu Phe Gly Asp Asn
225 230 235 240
Glu Glu Ser Glu Glu Val Gln Val Ala Asp Arg Ser Thr Ser Asn Gly
245 250 255
Leu Ala Asn Lys Ser Leu Gln Gly Thr Ile Ser Pro Lys Glu Ala Glu
260 265 270
Gly Met Val Leu Gln Ala Trp Asp Tyr Val Pro Leu Asp Glu Val Tyr
275 280 285
Ser Asp Gly Lys Ile Lys Gly Gln Lys Tyr Asp Val Arg Phe Ala Ala
290 295 300
Leu Glu Asn Met Ala Glu Gly Phe Lys Arg Ile Glu Pro Ile Glu Asn
305 310 315 320
Gln Leu Val His Asn Leu Asp Glu Ala Lys Val Val Tyr Lys Lys Tyr
325 330 335
Val Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Arg Asp Ser Tyr
340 345 350
Trp Glu Asn Lys Arg Ser Lys Asn Leu Ile Lys Phe Lys Glu Val Ile
355 360 365
Asp Ile Ala Leu Glu Val Val Gly Tyr Tyr Glu His Ser Lys Asp Pro
370 375 380
Asn Lys Leu Gly Gly Val Glu Leu Val Ser Arg Cys Arg Arg Ile Thr
385 390 395 400
Thr Asp Cys Gly Ser Gly Phe Lys Asp Thr Thr His Lys Thr Val Asp
405 410 415
Gly Val Lys Val Leu Ile Pro Leu Asp Glu Arg His Asp Leu Asp Arg
420 425 430
Glu Arg Leu Met Ala Glu Ala Arg Glu Gly Lys Leu Ile Gly Arg Ile
435 440 445
Ala Asp Cys Glu Cys Asn Gly Trp Val His Ser Lys Gly Arg Glu Gly
450 455 460
Thr Val Gly Ile Phe Leu Pro Ile Ile Lys Gly Phe Arg Phe Asp Lys
465 470 475 480
Thr Glu Ala Asp Ser Phe Glu Asp Val Phe Gly Pro Trp Ser Gln Thr
485 490 495
Gly Leu
<210> 10
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(T4主链)蛋白序列
<400> 10
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Arg
355 360 365
Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 11
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(T4主链)蛋白序列
<400> 11
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Gly
355 360 365
Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 12
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(T4主链)蛋白序列
<400> 12
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Lys
355 360 365
Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 13
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(T4主链)蛋白序列
<400> 13
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Val Ile Leu Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 14
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(T4主链)蛋白序列
<400> 14
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Val Ile Gln Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 15
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(T4主链)蛋白序列
<400> 15
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Val Ile Gln Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 16
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(T4主链)蛋白序列
<400> 16
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Val Ile Val Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 17
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(T4主链)蛋白序列
<400> 17
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Val Ile Arg Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 18
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(T4主链)蛋白序列
<400> 18
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Ala Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 19
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(T4主链)蛋白序列
<400> 19
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Lys Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 20
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(T4主链)蛋白序列
<400> 20
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Arg
355 360 365
Val Ile Val Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 21
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(T4主链)蛋白序列
<400> 21
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Lys
355 360 365
Val Ile Glu Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 22
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(T4主链)蛋白序列
<400> 22
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Lys
355 360 365
Val Ile His Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 23
<211> 482
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(肠杆菌噬菌体CC31主链-克隆A4)蛋白序列
<400> 23
Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp
50 55 60
Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly
65 70 75 80
Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp
85 90 95
Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys
100 105 110
Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro
115 120 125
Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu
130 135 140
Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala
145 150 155 160
Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile
165 170 175
Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln
180 185 190
Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly
195 200 205
Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala
210 215 220
Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala
225 230 235 240
Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn
245 250 255
Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys
260 265 270
Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly
275 280 285
Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu
290 295 300
Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val
305 310 315 320
His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu
325 330 335
Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn
340 345 350
Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Arg Val Ile Val Ile Asp
355 360 365
Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala
370 375 380
Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala
385 390 395 400
Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp
405 410 415
Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu
420 425 430
Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr
435 440 445
Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp
450 455 460
Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr
465 470 475 480
Gly Leu
<210> 24
<211> 482
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(肠杆菌噬菌体CC31主链)蛋白序列
<400> 24
Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp
50 55 60
Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly
65 70 75 80
Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp
85 90 95
Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys
100 105 110
Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro
115 120 125
Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu
130 135 140
Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala
145 150 155 160
Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile
165 170 175
Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln
180 185 190
Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly
195 200 205
Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala
210 215 220
Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala
225 230 235 240
Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn
245 250 255
Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys
260 265 270
Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly
275 280 285
Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu
290 295 300
Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val
305 310 315 320
His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu
325 330 335
Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn
340 345 350
Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Lys Val Ile Lys Ile Asp
355 360 365
Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala
370 375 380
Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala
385 390 395 400
Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp
405 410 415
Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu
420 425 430
Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr
435 440 445
Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp
450 455 460
Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr
465 470 475 480
Gly Leu
<210> 25
<211> 482
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(肠杆菌噬菌体CC31主链)蛋白序列
<400> 25
Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp
50 55 60
Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly
65 70 75 80
Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp
85 90 95
Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys
100 105 110
Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro
115 120 125
Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu
130 135 140
Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala
145 150 155 160
Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile
165 170 175
Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln
180 185 190
Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly
195 200 205
Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala
210 215 220
Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala
225 230 235 240
Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn
245 250 255
Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys
260 265 270
Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly
275 280 285
Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu
290 295 300
Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val
305 310 315 320
His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu
325 330 335
Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn
340 345 350
Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Gly Val Ile Phe Ile Asp
355 360 365
Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala
370 375 380
Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala
385 390 395 400
Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp
405 410 415
Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu
420 425 430
Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr
435 440 445
Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp
450 455 460
Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr
465 470 475 480
Gly Leu
<210> 26
<211> 482
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(肠杆菌噬菌体CC31主链)蛋白序列
<400> 26
Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp
50 55 60
Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly
65 70 75 80
Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp
85 90 95
Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys
100 105 110
Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro
115 120 125
Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu
130 135 140
Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala
145 150 155 160
Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile
165 170 175
Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln
180 185 190
Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly
195 200 205
Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala
210 215 220
Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala
225 230 235 240
Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn
245 250 255
Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys
260 265 270
Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly
275 280 285
Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu
290 295 300
Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val
305 310 315 320
His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu
325 330 335
Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn
340 345 350
Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Gly Val Ile Leu Ile Asp
355 360 365
Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala
370 375 380
Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala
385 390 395 400
Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp
405 410 415
Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu
420 425 430
Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr
435 440 445
Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp
450 455 460
Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr
465 470 475 480
Gly Leu
<210> 27
<211> 482
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(肠杆菌噬菌体CC31主链)蛋白序列
<400> 27
Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp
50 55 60
Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly
65 70 75 80
Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp
85 90 95
Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys
100 105 110
Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro
115 120 125
Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu
130 135 140
Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala
145 150 155 160
Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile
165 170 175
Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln
180 185 190
Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly
195 200 205
Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala
210 215 220
Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala
225 230 235 240
Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn
245 250 255
Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys
260 265 270
Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly
275 280 285
Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu
290 295 300
Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val
305 310 315 320
His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu
325 330 335
Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn
340 345 350
Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Arg Val Ile Phe Ile Asp
355 360 365
Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala
370 375 380
Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala
385 390 395 400
Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp
405 410 415
Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu
420 425 430
Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr
435 440 445
Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp
450 455 460
Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr
465 470 475 480
Gly Leu
<210> 28
<211> 497
<212> PRT
<213> 人工序列
<220>
<223> 突变体连接酶(志贺氏菌噬菌体Shf125875主链)蛋白序列
<400> 28
Met Ile Leu Asp Ile Leu Asn Gln Ile Ala Ala Ile Gly Ser Thr Lys
1 5 10 15
Thr Lys Gln Glu Ile Leu Lys Lys Asn Lys Asp Asn Lys Leu Leu Glu
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ala Arg Gly Ile Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Gly Pro Gly Glu Arg Ser Gln Ala Tyr Gly Leu Leu Glu
50 55 60
Leu Asp Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Lys Glu Leu Met Gly Tyr Ile Ala Asp
85 90 95
Gly Lys Pro Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Val Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Gln Leu Gln Pro Gln Met Leu Ala Ser Ala Tyr Asp Glu Lys
130 135 140
Leu Ile Thr Lys Asn Ile Lys Trp Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Asp Asp Gly Val Gln Phe
165 170 175
Phe Ser Arg Ala Gly Asn Glu Tyr His Gly Leu Thr Leu Leu Ala Asp
180 185 190
Glu Leu Met Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Asn Gly
195 200 205
Val Leu Ile Asp Gly Glu Leu Val Tyr His Ser Phe Asp Ile Lys Lys
210 215 220
Ala Val Ser Ser Gly Asn Asp Leu Ser Phe Leu Phe Gly Asp Asn Glu
225 230 235 240
Glu Ser Glu Glu Val Gln Val Ala Asp Arg Ser Thr Ser Asn Gly Leu
245 250 255
Ala Asn Lys Ser Leu Gln Gly Thr Ile Ser Pro Lys Glu Ala Glu Gly
260 265 270
Met Val Leu Gln Ala Trp Asp Tyr Val Pro Leu Asp Glu Val Tyr Ser
275 280 285
Asp Gly Lys Ile Lys Gly Gln Lys Tyr Asp Val Arg Phe Ala Ala Leu
290 295 300
Glu Asn Met Ala Glu Gly Phe Lys Arg Ile Glu Pro Ile Glu Asn Gln
305 310 315 320
Leu Val His Asn Leu Asp Glu Ala Lys Val Val Tyr Lys Lys Tyr Val
325 330 335
Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Arg Asp Ser Tyr Trp
340 345 350
Glu Asn Lys Arg Ser Lys Asn Leu Ile Lys Phe Lys Arg Val Ile Val
355 360 365
Ile Ala Leu Glu Val Val Gly Tyr Tyr Glu His Ser Lys Asp Pro Asn
370 375 380
Lys Leu Gly Gly Val Glu Leu Val Ser Arg Cys Arg Arg Ile Thr Thr
385 390 395 400
Asp Cys Gly Ser Gly Phe Lys Asp Thr Thr His Lys Thr Val Asp Gly
405 410 415
Val Lys Val Leu Ile Pro Leu Asp Glu Arg His Asp Leu Asp Arg Glu
420 425 430
Arg Leu Met Ala Glu Ala Arg Glu Gly Lys Leu Ile Gly Arg Ile Ala
435 440 445
Asp Cys Glu Cys Asn Gly Trp Val His Ser Lys Gly Arg Glu Gly Thr
450 455 460
Val Gly Ile Phe Leu Pro Ile Ile Lys Gly Phe Arg Phe Asp Lys Thr
465 470 475 480
Glu Ala Asp Ser Phe Glu Asp Val Phe Gly Pro Trp Ser Gln Thr Gly
485 490 495
Leu
<210> 29
<211> 298
<212> PRT
<213> 绿草履虫小球藻病毒PBCV-1
<400> 29
Met Ala Ile Thr Lys Pro Leu Leu Ala Ala Thr Leu Glu Asn Ile Glu
1 5 10 15
Asp Val Gln Phe Pro Cys Leu Ala Thr Pro Lys Ile Asp Gly Ile Arg
20 25 30
Ser Val Lys Gln Thr Gln Met Leu Ser Arg Thr Phe Lys Pro Ile Arg
35 40 45
Asn Ser Val Met Asn Arg Leu Leu Thr Glu Leu Leu Pro Glu Gly Ser
50 55 60
Asp Gly Glu Ile Ser Ile Glu Gly Ala Thr Phe Gln Asp Thr Thr Ser
65 70 75 80
Ala Val Met Thr Gly His Lys Met Tyr Asn Ala Lys Phe Ser Tyr Tyr
85 90 95
Trp Phe Asp Tyr Val Thr Asp Asp Pro Leu Lys Lys Tyr Ile Asp Arg
100 105 110
Val Glu Asp Met Lys Asn Tyr Ile Thr Val His Pro His Ile Leu Glu
115 120 125
His Ala Gln Val Lys Ile Ile Pro Leu Ile Pro Val Glu Ile Asn Asn
130 135 140
Ile Thr Glu Leu Leu Gln Tyr Glu Arg Asp Val Leu Ser Lys Gly Phe
145 150 155 160
Glu Gly Val Met Ile Arg Lys Pro Asp Gly Lys Tyr Lys Phe Gly Arg
165 170 175
Ser Thr Leu Lys Glu Gly Ile Leu Leu Lys Met Lys Gln Phe Lys Asp
180 185 190
Ala Glu Ala Thr Ile Ile Ser Met Thr Ala Leu Phe Lys Asn Thr Asn
195 200 205
Thr Lys Thr Lys Asp Asn Phe Gly Tyr Ser Lys Arg Ser Thr His Lys
210 215 220
Ser Gly Lys Val Glu Glu Asp Val Met Gly Ser Ile Glu Val Asp Tyr
225 230 235 240
Asp Gly Val Val Phe Ser Ile Gly Thr Gly Phe Asp Ala Asp Gln Arg
245 250 255
Arg Asp Phe Trp Gln Asn Lys Glu Ser Tyr Ile Gly Lys Met Val Lys
260 265 270
Phe Lys Tyr Phe Glu Met Gly Ser Lys Asp Cys Pro Arg Phe Pro Val
275 280 285
Phe Ile Gly Ile Arg His Glu Glu Asp Arg
290 295
<210> 30
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5, 8和9模板寡核苷酸序列
<400> 30
tttggtgcga agcagactga ggc 23
<210> 31
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5模板寡核苷酸序列
<400> 31
tttggtgcga agcagagtga ggc 23
<210> 32
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5模板寡核苷酸序列
<400> 32
tttggtgcga agcagattga ggc 23
<210> 33
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5模板寡核苷酸序列
<400> 33
tttggtgcga agcagaatga ggc 23
<210> 34
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5模板寡核苷酸序列
<400> 34
tttggtgcga agcagtctga ggc 23
<210> 35
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5模板寡核苷酸序列
<400> 35
tttggtgcga agcagtgtga ggc 23
<210> 36
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5模板寡核苷酸序列
<400> 36
tttggtgcga agcagtttga ggc 23
<210> 37
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5模板寡核苷酸序列
<400> 37
tttggtgcga agcagtatga ggc 23
<210> 38
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5模板寡核苷酸序列
<400> 38
tttggtgcga agcagcctga ggc 23
<210> 39
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5模板寡核苷酸序列
<400> 39
tttggtgcga agcagcgtga ggc 23
<210> 40
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5模板寡核苷酸序列
<400> 40
tttggtgcga agcagcttga ggc 23
<210> 41
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5模板寡核苷酸序列
<400> 41
tttggtgcga agcagcatga ggc 23
<210> 42
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5模板寡核苷酸序列
<400> 42
tttggtgcga agcaggctga ggc 23
<210> 43
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5模板寡核苷酸序列
<400> 43
tttggtgcga agcagggtga ggc 23
<210> 44
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5模板寡核苷酸序列
<400> 44
tttggtgcga agcaggttga ggc 23
<210> 45
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例5模板寡核苷酸序列
<400> 45
tttggtgcga agcaggatga ggc 23
<210> 46
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 实施例14 "20聚体" 寡核苷酸序列
<400> 46
gccucagtct gcttcgcacc 20
<210> 47
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 实施例7模板寡核苷酸序列
<400> 47
tttggtgcga agcagaaggt aagccgaggt ttggcc 36
<210> 48
<211> 298
<212> PRT
<213> 绿草履虫小球藻病毒NE-JV-4
<400> 48
Met Ala Ile Thr Lys Pro Leu Leu Ala Ala Thr Leu Glu Asn Ile Glu
1 5 10 15
Asp Val Gln Phe Pro Cys Leu Ala Thr Pro Lys Ile Asp Gly Ile Arg
20 25 30
Ser Val Lys Gln Thr Gln Met Leu Ser Arg Thr Phe Lys Pro Ile Arg
35 40 45
Asn Ser Val Met Asn Arg Leu Leu Thr Glu Leu Leu Pro Glu Gly Ser
50 55 60
Asp Gly Glu Ile Ser Ile Glu Gly Ala Thr Phe Gln Asp Thr Thr Ser
65 70 75 80
Ala Val Met Thr Gly His Lys Met Tyr Asn Ala Lys Phe Ser Tyr Tyr
85 90 95
Trp Phe Asp Tyr Val Thr Asp Asp Pro Leu Lys Lys Tyr Ser Asp Arg
100 105 110
Val Glu Asp Met Lys Asn Tyr Ile Thr Ala His Pro His Ile Leu Asp
115 120 125
His Glu Gln Val Lys Ile Ile Pro Leu Ile Pro Val Glu Ile Asn Asn
130 135 140
Ile Thr Glu Leu Leu Gln Tyr Glu Arg Asp Val Leu Ser Lys Gly Phe
145 150 155 160
Glu Gly Val Met Ile Arg Lys Pro Asp Gly Lys Tyr Lys Phe Gly Arg
165 170 175
Ser Thr Leu Lys Glu Gly Ile Leu Leu Lys Met Lys Gln Phe Lys Asp
180 185 190
Ala Glu Ala Thr Ile Ile Ser Met Thr Ala Leu Phe Lys Asn Thr Asn
195 200 205
Thr Lys Thr Lys Asp Asn Phe Gly Tyr Ser Lys Arg Ser Thr His Lys
210 215 220
Asn Gly Lys Val Glu Glu Asp Val Met Gly Ser Ile Glu Val Asp Tyr
225 230 235 240
Asp Gly Val Val Phe Ser Ile Gly Thr Gly Phe Asp Ala Asp Gln Arg
245 250 255
Arg Asp Phe Trp Gln Asn Lys Glu Ser Tyr Ile Gly Lys Met Val Lys
260 265 270
Phe Lys Tyr Phe Glu Met Gly Ser Lys Asp Cys Pro Arg Phe Pro Val
275 280 285
Phe Ile Gly Ile Arg His Glu Glu Asp His
290 295
<210> 49
<211> 298
<212> PRT
<213> 绿草履虫小球藻病毒NYs1
<400> 49
Met Thr Ile Ala Lys Pro Leu Leu Ala Ala Thr Leu Glu Asn Leu Asp
1 5 10 15
Asp Val Lys Phe Pro Cys Leu Val Thr Pro Lys Ile Asp Gly Ile Arg
20 25 30
Ser Leu Lys Gln Gln His Met Leu Ser Arg Thr Phe Lys Pro Ile Arg
35 40 45
Asn Ser Val Met Asn Lys Leu Leu Ser Glu Leu Leu Pro Glu Gly Ala
50 55 60
Asp Gly Glu Ile Cys Ile Glu Asp Ser Thr Phe Gln Ala Thr Thr Ser
65 70 75 80
Ala Val Met Thr Gly His Lys Val Tyr Asp Glu Lys Phe Ser Tyr Tyr
85 90 95
Trp Phe Asp Tyr Val Val Asp Asp Pro Leu Lys Ser Tyr Thr Asp Arg
100 105 110
Val Asn Asp Met Lys Lys Tyr Val Asp Asp His Pro His Ile Leu Glu
115 120 125
His Glu Gln Val Lys Ile Ile Pro Leu Ile Pro Val Glu Ile Asn Asn
130 135 140
Ile Asp Glu Leu Ser Gln Tyr Glu Arg Asp Val Leu Ala Lys Gly Phe
145 150 155 160
Glu Gly Val Met Ile Arg Arg Pro Asp Gly Lys Tyr Lys Phe Gly Arg
165 170 175
Ser Thr Leu Lys Glu Gly Ile Leu Leu Lys Met Lys Gln Phe Lys Asp
180 185 190
Ala Glu Ala Thr Ile Ile Ser Met Ser Pro Arg Leu Lys Asn Thr Asn
195 200 205
Ala Lys Ser Lys Asp Asn Leu Gly Tyr Ser Lys Arg Ser Thr His Lys
210 215 220
Ser Gly Lys Val Glu Glu Glu Thr Met Gly Ser Ile Glu Val Asp Tyr
225 230 235 240
Asp Gly Val Val Phe Ser Ile Gly Thr Gly Phe Asp Asp Glu Gln Arg
245 250 255
Lys His Phe Trp Glu Asn Lys Asp Ser Tyr Ile Gly Lys Leu Leu Lys
260 265 270
Phe Lys Tyr Phe Glu Met Gly Ser Lys Asp Ala Pro Arg Phe Pro Val
275 280 285
Phe Ile Gly Ile Arg His Glu Glu Asp Cys
290 295
<210> 50
<211> 301
<212> PRT
<213> 绿草履虫小球藻病毒NE-JV-1
<400> 50
Met Thr Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Phe Lys Lys Leu
1 5 10 15
Thr Val Ala Asp Val Lys Tyr Pro Val Phe Ala Thr Pro Lys Leu Asp
20 25 30
Gly Ile Arg Ala Leu Lys Ile Asp Gly Ala Phe Val Ser Arg Thr Phe
35 40 45
Lys Pro Ile Arg Asn Arg Ala Ile Ala Asp Ala Leu Gln Asp Leu Leu
50 55 60
Pro Asn Gly Ser Asp Gly Glu Ile Leu Ser Gly Ser Thr Phe Gln Asp
65 70 75 80
Ala Ser Ser Ala Val Met Thr Ala Lys Ala Gly Ile Gly Ala Asn Thr
85 90 95
Ile Phe Tyr Trp Phe Asp Tyr Val Lys Asp Asp Pro Asn Lys Pro Tyr
100 105 110
Leu Asp Arg Met Thr Asp Met Glu Asn Tyr Leu Lys Glu Arg Pro Glu
115 120 125
Ile Leu Asn Asp Asp Arg Ile Lys Ile Val Pro Leu Ile Pro Lys Lys
130 135 140
Ile Glu Thr Lys Asp Glu Leu Asp Thr Phe Glu Lys Ile Cys Leu Asp
145 150 155 160
Gln Gly Phe Glu Gly Val Met Ile Arg Ser Gly Ala Gly Lys Tyr Lys
165 170 175
Phe Gly Arg Ser Thr Glu Lys Glu Gly Ile Leu Ile Lys Ile Lys Gln
180 185 190
Phe Glu Asp Asp Glu Ala Val Val Ile Gly Phe Thr Pro Met Gln Thr
195 200 205
Asn Thr Asn Asp Lys Ser Met Asn Glu Leu Gly Asp Met Lys Arg Ser
210 215 220
Ser His Lys Asp Gly Lys Val Asn Leu Asp Thr Leu Gly Ala Leu Glu
225 230 235 240
Val Asp Trp Asn Gly Ile Thr Phe Ser Ile Gly Thr Gly Phe Asp His
245 250 255
Ala Leu Arg Asp Lys Leu Trp Ser Glu Arg Asp Lys Leu Ile Gly Lys
260 265 270
Ile Val Lys Phe Lys Tyr Phe Ala Gln Gly Val Lys Thr Ala Pro Arg
275 280 285
Phe Pro Val Phe Ile Gly Phe Arg Asp Pro Asp Asp Met
290 295 300
<210> 51
<211> 300
<212> PRT
<213> Acanthocystis turfacea小球藻病毒Canal-1
<400> 51
Met Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Leu Lys Lys Met Ser
1 5 10 15
Val Gly Asp Leu Thr Phe Pro Val Phe Ala Thr Pro Lys Leu Asp Gly
20 25 30
Ile Arg Ala Leu Lys Val Gly Gly Thr Ile Val Ser Arg Thr Phe Lys
35 40 45
Pro Val Arg Asn Ser Ala Ile Ser Glu Val Leu Ala Ser Ile Leu Pro
50 55 60
Asp Gly Ser Asp Gly Glu Ile Leu Ser Gly Lys Thr Phe Gln Glu Ser
65 70 75 80
Thr Ser Thr Val Met Thr Ala Asp Ala Gly Leu Gly Ser Gly Thr Met
85 90 95
Phe Phe Trp Phe Asp Tyr Val Lys Asp Asp Pro Asn Lys Gly Tyr Leu
100 105 110
Asp Arg Ile Ala Asp Met Lys Ser Phe Thr Asp Arg His Pro Glu Ile
115 120 125
Leu Lys Asp Lys Arg Val Thr Ile Val Pro Leu Phe Pro Lys Lys Ile
130 135 140
Asp Thr Thr Glu Glu Leu His Glu Phe Glu Lys Trp Cys Leu Asp Gln
145 150 155 160
Gly Phe Glu Gly Val Met Val Arg Asn Ala Gly Gly Lys Tyr Lys Phe
165 170 175
Gly Arg Ser Thr Glu Lys Glu Gln Ile Leu Val Lys Ile Lys Gln Phe
180 185 190
Glu Asp Asp Glu Ala Val Val Ile Gly Val Ser Ala Leu Gln Thr Asn
195 200 205
Thr Asn Asp Lys Lys Leu Asn Gln Leu Gly Glu Met Arg Arg Thr Ser
210 215 220
His Gln Asp Gly Lys Val Glu Leu Glu Met Leu Gly Ala Leu Asp Val
225 230 235 240
Asp Trp Asn Gly Ile Arg Phe Ser Ile Gly Thr Gly Phe Asp Arg Asp
245 250 255
Thr Arg Val Asp Leu Trp Lys Arg Arg Glu Gly Val Ile Gly Lys Ile
260 265 270
Val Lys Phe Lys Tyr Phe Ser Gln Gly Ile Lys Thr Ala Pro Arg Phe
275 280 285
Pro Val Phe Leu Gly Phe Arg Asp Lys Asp Asp Met
290 295 300
<210> 52
<211> 300
<212> PRT
<213> Acanthocystis turfacea小球藻病毒Br0604L
<400> 52
Met Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Leu Lys Lys Leu Ser
1 5 10 15
Val Asp Asp Leu Thr Phe Pro Val Tyr Ala Thr Pro Lys Leu Asp Gly
20 25 30
Ile Arg Ala Leu Lys Ile Asp Gly Thr Leu Val Ser Arg Thr Phe Lys
35 40 45
Pro Ile Arg Asn Thr Thr Ile Ser Lys Val Leu Thr Ser Leu Leu Pro
50 55 60
Asp Gly Ser Asp Gly Glu Ile Leu Ser Gly Lys Thr Phe Gln Asp Ser
65 70 75 80
Thr Ser Thr Val Met Ser Ala Asp Ala Gly Ile Gly Ser Gly Thr Thr
85 90 95
Phe Phe Trp Phe Asp Tyr Val Lys Asp Asp Pro Asn Lys Gly Tyr Leu
100 105 110
Asp Arg Ile Ala Asp Ile Lys Lys Phe Ile Asp Cys Arg Pro Glu Ile
115 120 125
Leu Lys Asp Ser Arg Val Ile Ile Val Pro Leu Phe Pro Lys Lys Ile
130 135 140
Asp Thr Ala Glu Glu Leu Asn Val Phe Glu Lys Trp Cys Leu Asp Gln
145 150 155 160
Gly Phe Glu Gly Val Met Val Arg Asn Ala Gly Gly Lys Tyr Lys Phe
165 170 175
Gly Arg Ser Thr Glu Lys Glu Gln Ile Leu Val Lys Ile Lys Gln Phe
180 185 190
Glu Asp Asp Glu Ala Val Val Ile Gly Val Ser Ala Leu Gln Thr Asn
195 200 205
Thr Asn Asp Lys Lys Val Asn Glu Leu Gly Glu Met Arg Arg Thr Ser
210 215 220
His Gln Asp Gly Lys Val Asp Leu Asp Met Leu Gly Ala Leu Asp Val
225 230 235 240
Asp Trp Asn Gly Ile Arg Phe Gly Ile Gly Thr Gly Phe Asp Lys Asp
245 250 255
Thr Arg Glu Asp Leu Trp Lys Arg Arg Asp Ser Ile Ile Gly Lys Ile
260 265 270
Val Lys Phe Lys Tyr Phe Ser Gln Gly Val Lys Thr Ala Pro Arg Phe
275 280 285
Pro Val Phe Leu Gly Phe Arg Asp Lys Asn Asp Met
290 295 300
<210> 53
<211> 300
<212> PRT
<213> Acanthocystis turfacea小球藻病毒NE-JV-2
<400> 53
Met Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Leu Lys Lys Leu Ser
1 5 10 15
Val Asp Asp Leu Thr Phe Pro Val Tyr Ala Thr Pro Lys Leu Asp Gly
20 25 30
Ile Arg Ala Leu Lys Ile Asp Gly Thr Ile Val Ser Arg Thr Phe Lys
35 40 45
Pro Ile Arg Asn Thr Thr Ile Ser Asn Val Leu Met Ser Leu Leu Pro
50 55 60
Asp Gly Ser Asp Gly Glu Ile Leu Ser Gly Lys Thr Phe Gln Asp Ser
65 70 75 80
Thr Ser Thr Val Met Ser Ala Asp Ala Gly Ile Gly Ser Gly Thr Thr
85 90 95
Phe Phe Trp Phe Asp Tyr Val Lys Asp Asp Pro Asp Lys Gly Tyr Leu
100 105 110
Asp Arg Ile Ala Asp Met Lys Lys Phe Val Asp Ser His Pro Glu Ile
115 120 125
Leu Lys Asp Arg Arg Val Thr Ile Val Pro Leu Ile Pro Lys Lys Ile
130 135 140
Asp Thr Val Glu Glu Leu Asn Val Phe Glu Gln Trp Cys Leu Asp Gln
145 150 155 160
Gly Phe Glu Gly Val Met Val Arg Asn Ala Gly Gly Lys Tyr Lys Phe
165 170 175
Gly Arg Ser Thr Glu Lys Glu Gln Ile Leu Val Lys Ile Lys Gln Phe
180 185 190
Glu Asp Asp Glu Ala Val Val Ile Gly Val Ser Ala Leu Gln Thr Asn
195 200 205
Val Asn Asp Lys Lys Met Asn Glu Leu Gly Asp Met Arg Arg Thr Ser
210 215 220
His Lys Asp Gly Lys Ile Asp Leu Glu Met Leu Gly Ala Leu Asp Val
225 230 235 240
Glu Trp Asn Gly Ile Arg Phe Gly Ile Gly Thr Gly Phe Asp Lys Asp
245 250 255
Thr Arg Glu Asp Leu Trp Lys Lys Arg Asp Ser Ile Ile Gly Lys Val
260 265 270
Val Lys Phe Lys Tyr Phe Ser Gln Gly Ile Lys Thr Ala Pro Arg Phe
275 280 285
Pro Val Phe Leu Gly Phe Arg Asp Glu Asn Asp Met
290 295 300
<210> 54
<211> 300
<212> PRT
<213> Acanthocystis turfacea小球藻病毒TN603.4.2
<400> 54
Met Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Leu Lys Lys Met Ser
1 5 10 15
Val Asp Asn Leu Thr Phe Pro Val Tyr Ala Thr Pro Lys Leu Asp Gly
20 25 30
Ile Arg Ala Leu Lys Ile Asp Gly Thr Leu Val Ser Arg Thr Phe Lys
35 40 45
Pro Ile Arg Asn Thr Thr Ile Ser Lys Val Leu Ala Ser Leu Leu Pro
50 55 60
Asp Gly Ser Asp Gly Glu Ile Leu Ser Gly Lys Thr Phe Gln Asp Ser
65 70 75 80
Thr Ser Thr Val Met Thr Thr Asp Ala Gly Ile Gly Ser Asp Thr Thr
85 90 95
Phe Phe Trp Phe Asp Tyr Val Lys Asp Asp Pro Asp Lys Gly Tyr Leu
100 105 110
Asp Arg Ile Ala Asp Met Lys Thr Phe Val Asp Gln His Pro Glu Ile
115 120 125
Leu Lys Asp Ser Cys Val Thr Ile Val Pro Leu Phe Pro Lys Lys Ile
130 135 140
Asp Thr Pro Glu Glu Leu His Val Phe Glu Lys Trp Cys Leu Asp Gln
145 150 155 160
Gly Phe Glu Gly Val Met Val Arg Thr Ala Gly Gly Lys Tyr Lys Phe
165 170 175
Gly Arg Ser Thr Glu Lys Glu Gln Ile Leu Val Lys Ile Lys Gln Phe
180 185 190
Glu Asp Asp Glu Ala Val Val Ile Gly Val Ser Ala Leu Gln Thr Asn
195 200 205
Thr Asn Asp Lys Lys Leu Asn Gln Leu Gly Glu Met Arg Arg Thr Ser
210 215 220
His Gln Asp Gly Lys Val Asp Leu Asp Met Leu Gly Ala Leu Asp Val
225 230 235 240
Asp Trp Asn Gly Ile Arg Phe Ser Ile Gly Thr Gly Phe Asp Lys Asp
245 250 255
Thr Arg Glu Asp Leu Trp Lys Gln Arg Asp Ser Ile Val Gly Lys Val
260 265 270
Val Lys Phe Lys Tyr Phe Ser Gln Gly Ile Lys Thr Ala Pro Arg Phe
275 280 285
Pro Val Phe Leu Gly Phe Arg Asp Glu Asn Asp Met
290 295 300
<210> 55
<211> 300
<212> PRT
<213> Acanthocystis turfacea小球藻病毒GM0701.1
<400> 55
Met Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Leu Lys Lys Met Ser
1 5 10 15
Val Asp Asp Leu Thr Phe Pro Val Tyr Thr Thr Pro Lys Leu Asp Gly
20 25 30
Ile Arg Ala Leu Lys Ile Asp Gly Thr Leu Val Ser Arg Thr Phe Lys
35 40 45
Pro Val Arg Asn Ser Ala Ile Ser Glu Val Leu Ala Ser Leu Leu Pro
50 55 60
Asp Gly Ser Asp Gly Glu Ile Leu Ser Gly Lys Thr Phe Gln Asp Ser
65 70 75 80
Thr Ser Thr Val Met Thr Thr Asp Ala Gly Ile Gly Ser Asp Thr Thr
85 90 95
Phe Phe Trp Phe Asp Tyr Val Lys Asp Asp Pro Asn Lys Gly Tyr Leu
100 105 110
Asp Arg Ile Ala Asp Met Lys Thr Phe Ile Asp Gln His Pro Glu Met
115 120 125
Leu Lys Asp Asn His Val Thr Ile Val Pro Leu Ile Pro Lys Lys Ile
130 135 140
Asp Thr Val Glu Glu Leu Asn Ile Phe Glu Lys Trp Cys Leu Asp Gln
145 150 155 160
Gly Phe Glu Gly Val Met Val Arg Asn Ala Gly Gly Lys Tyr Lys Phe
165 170 175
Gly Arg Ser Thr Glu Lys Glu Gln Ile Leu Val Lys Ile Lys Gln Phe
180 185 190
Glu Asp Asp Glu Ala Val Val Ile Gly Val Ser Ala Leu Gln Thr Asn
195 200 205
Thr Asn Asp Lys Lys Leu Asn Gln Leu Gly Glu Met Arg Arg Thr Ser
210 215 220
His Gln Asp Gly Lys Ile Asp Leu Glu Met Leu Gly Ala Leu Asp Val
225 230 235 240
Asp Trp Asn Gly Ile Arg Phe Ser Ile Gly Thr Gly Phe Asp Arg Asp
245 250 255
Thr Arg Val Asp Leu Trp Lys Arg Arg Asp Gly Ile Val Gly Arg Thr
260 265 270
Ile Lys Phe Lys Tyr Phe Gly Gln Gly Ile Lys Thr Ala Pro Arg Phe
275 280 285
Pro Val Phe Leu Gly Phe Arg Asp Lys Asp Asp Met
290 295 300
<210> 56
<211> 287
<212> PRT
<213> 聚球藻噬菌体S-CRM01
<400> 56
Met Leu Ala Gly Asn Phe Asp Pro Lys Lys Ala Lys Phe Pro Tyr Cys
1 5 10 15
Ala Thr Pro Lys Ile Asp Gly Ile Arg Phe Leu Met Val Asn Gly Arg
20 25 30
Ala Leu Ser Arg Thr Phe Lys Pro Ile Arg Asn Glu Tyr Ile Gln Lys
35 40 45
Leu Leu Ser Lys His Leu Pro Asp Gly Ile Asp Gly Glu Leu Thr Cys
50 55 60
Gly Asp Thr Phe Gln Ser Ser Thr Ser Ala Ile Met Arg Ile Ala Gly
65 70 75 80
Glu Pro Asp Phe Lys Ala Trp Ile Phe Asp Tyr Val Asp Pro Asp Ser
85 90 95
Thr Ser Ile Leu Pro Phe Ile Glu Arg Phe Asp Gln Ile Ser Asp Ile
100 105 110
Ile Tyr Asn Gly Pro Ile Pro Phe Lys His Gln Val Leu Gly Gln Ser
115 120 125
Ile Leu Tyr Asn Ile Asp Asp Leu Asn Arg Tyr Glu Glu Ala Cys Leu
130 135 140
Asn Glu Gly Tyr Glu Gly Val Met Leu Arg Asp Pro Tyr Gly Thr Tyr
145 150 155 160
Lys Phe Gly Arg Ser Ser Thr Asn Glu Gly Ile Leu Leu Lys Val Lys
165 170 175
Arg Phe Glu Asp Ala Glu Ala Thr Val Ile Arg Ile Asp Glu Lys Met
180 185 190
Ser Asn Gln Asn Ile Ala Glu Lys Asp Asn Phe Gly Arg Thr Lys Arg
195 200 205
Ser Ser Cys Leu Asp Gly Met Val Pro Met Glu Thr Thr Gly Ala Leu
210 215 220
Phe Val Arg Asn Ser Asp Gly Leu Glu Phe Ser Ile Gly Ser Gly Leu
225 230 235 240
Asn Asp Glu Met Arg Asp Glu Ile Trp Lys Asn Lys Ser Ser Tyr Ile
245 250 255
Gly Lys Leu Val Lys Tyr Lys Tyr Phe Pro Gln Gly Val Lys Asp Leu
260 265 270
Pro Arg His Pro Val Phe Leu Gly Phe Arg Asp Pro Asp Asp Met
275 280 285
<210> 57
<211> 322
<212> PRT
<213> 海洋沉积物宏基因组
<400> 57
Met Asp Ala His Glu Leu Met Lys Leu Asn Glu Tyr Ala Glu Arg Gln
1 5 10 15
Asn Gln Lys Gln Lys Lys Gln Ile Thr Lys Pro Met Leu Ala Ala Ser
20 25 30
Leu Lys Asp Ile Thr Gln Leu Asp Tyr Ser Lys Gly Tyr Leu Ala Thr
35 40 45
Gln Lys Leu Asp Gly Ile Arg Ala Leu Met Ile Asp Gly Lys Leu Val
50 55 60
Ser Arg Thr Phe Lys Pro Ile Arg Asn Asn His Ile Arg Glu Met Leu
65 70 75 80
Glu Asp Val Leu Pro Asp Gly Ala Asp Gly Glu Ile Val Cys Pro Gly
85 90 95
Ala Phe Gln Ala Thr Ser Ser Gly Val Met Ser Ala Asn Gly Glu Pro
100 105 110
Glu Phe Ile Tyr Tyr Met Phe Asp Tyr Val Lys Asp Asp Ile Thr Lys
115 120 125
Glu Tyr Trp Arg Arg Thr Gln Asp Met Val Gln Trp Leu Ile Asn Gln
130 135 140
Gly Pro Thr Arg Thr Pro Gly Leu Ser Lys Leu Lys Leu Leu Val Pro
145 150 155 160
Thr Leu Ile Lys Asn Tyr Asp His Leu Lys Thr Tyr Glu Thr Glu Cys
165 170 175
Ile Asp Lys Gly Phe Glu Gly Val Ile Leu Arg Thr Pro Asp Ser Pro
180 185 190
Tyr Lys Cys Gly Arg Ser Thr Ala Lys Gln Glu Trp Leu Leu Lys Leu
195 200 205
Lys Arg Phe Ala Asp Asp Glu Ala Val Val Ile Gly Phe Thr Glu Lys
210 215 220
Met His Asn Asp Asn Glu Ala Thr Lys Asp Lys Phe Gly His Thr Val
225 230 235 240
Arg Ser Ser His Lys Glu Asn Lys Arg Pro Ala Gly Thr Leu Gly Ser
245 250 255
Leu Ile Val Arg Asp Ile Lys Thr Glu Ile Glu Phe Glu Ile Gly Thr
260 265 270
Gly Phe Asp Asp Glu Leu Arg Gln Lys Ile Trp Asp Ala Arg Pro Glu
275 280 285
Trp Asp Gly Leu Cys Val Lys Tyr Lys His Phe Ala Ile Ser Gly Val
290 295 300
Lys Glu Lys Pro Arg Phe Pro Ser Phe Ile Gly Val Arg Asp Val Glu
305 310 315 320
Asp Met
<210> 58
<211> 691
<212> PRT
<213> 结核分枝杆菌(菌株ATCC 25618/H37Rv)
<400> 58
Met Ser Ser Pro Asp Ala Asp Gln Thr Ala Pro Glu Val Leu Arg Gln
1 5 10 15
Trp Gln Ala Leu Ala Glu Glu Val Arg Glu His Gln Phe Arg Tyr Tyr
20 25 30
Val Arg Asp Ala Pro Ile Ile Ser Asp Ala Glu Phe Asp Glu Leu Leu
35 40 45
Arg Arg Leu Glu Ala Leu Glu Glu Gln His Pro Glu Leu Arg Thr Pro
50 55 60
Asp Ser Pro Thr Gln Leu Val Gly Gly Ala Gly Phe Ala Thr Asp Phe
65 70 75 80
Glu Pro Val Asp His Leu Glu Arg Met Leu Ser Leu Asp Asn Ala Phe
85 90 95
Thr Ala Asp Glu Leu Ala Ala Trp Ala Gly Arg Ile His Ala Glu Val
100 105 110
Gly Asp Ala Ala His Tyr Leu Cys Glu Leu Lys Ile Asp Gly Val Ala
115 120 125
Leu Ser Leu Val Tyr Arg Glu Gly Arg Leu Thr Arg Ala Ser Thr Arg
130 135 140
Gly Asp Gly Arg Thr Gly Glu Asp Val Thr Leu Asn Ala Arg Thr Ile
145 150 155 160
Ala Asp Val Pro Glu Arg Leu Thr Pro Gly Asp Asp Tyr Pro Val Pro
165 170 175
Glu Val Leu Glu Val Arg Gly Glu Val Phe Phe Arg Leu Asp Asp Phe
180 185 190
Gln Ala Leu Asn Ala Ser Leu Val Glu Glu Gly Lys Ala Pro Phe Ala
195 200 205
Asn Pro Arg Asn Ser Ala Ala Gly Ser Leu Arg Gln Lys Asp Pro Ala
210 215 220
Val Thr Ala Arg Arg Arg Leu Arg Met Ile Cys His Gly Leu Gly His
225 230 235 240
Val Glu Gly Phe Arg Pro Ala Thr Leu His Gln Ala Tyr Leu Ala Leu
245 250 255
Arg Ala Trp Gly Leu Pro Val Ser Glu His Thr Thr Leu Ala Thr Asp
260 265 270
Leu Ala Gly Val Arg Glu Arg Ile Asp Tyr Trp Gly Glu His Arg His
275 280 285
Glu Val Asp His Glu Ile Asp Gly Val Val Val Lys Val Asp Glu Val
290 295 300
Ala Leu Gln Arg Arg Leu Gly Ser Thr Ser Arg Ala Pro Arg Trp Ala
305 310 315 320
Ile Ala Tyr Lys Tyr Pro Pro Glu Glu Ala Gln Thr Lys Leu Leu Asp
325 330 335
Ile Arg Val Asn Val Gly Arg Thr Gly Arg Ile Thr Pro Phe Ala Phe
340 345 350
Met Thr Pro Val Lys Val Ala Gly Ser Thr Val Gly Gln Ala Thr Leu
355 360 365
His Asn Ala Ser Glu Ile Lys Arg Lys Gly Val Leu Ile Gly Asp Thr
370 375 380
Val Val Ile Arg Lys Ala Gly Asp Val Ile Pro Glu Val Leu Gly Pro
385 390 395 400
Val Val Glu Leu Arg Asp Gly Ser Glu Arg Glu Phe Ile Met Pro Thr
405 410 415
Thr Cys Pro Glu Cys Gly Ser Pro Leu Ala Pro Glu Lys Glu Gly Asp
420 425 430
Ala Asp Ile Arg Cys Pro Asn Ala Arg Gly Cys Pro Gly Gln Leu Arg
435 440 445
Glu Arg Val Phe His Val Ala Ser Arg Asn Gly Leu Asp Ile Glu Val
450 455 460
Leu Gly Tyr Glu Ala Gly Val Ala Leu Leu Gln Ala Lys Val Ile Ala
465 470 475 480
Asp Glu Gly Glu Leu Phe Ala Leu Thr Glu Arg Asp Leu Leu Arg Thr
485 490 495
Asp Leu Phe Arg Thr Lys Ala Gly Glu Leu Ser Ala Asn Gly Lys Arg
500 505 510
Leu Leu Val Asn Leu Asp Lys Ala Lys Ala Ala Pro Leu Trp Arg Val
515 520 525
Leu Val Ala Leu Ser Ile Arg His Val Gly Pro Thr Ala Ala Arg Ala
530 535 540
Leu Ala Thr Glu Phe Gly Ser Leu Asp Ala Ile Ala Ala Ala Ser Thr
545 550 555 560
Asp Gln Leu Ala Ala Val Glu Gly Val Gly Pro Thr Ile Ala Ala Ala
565 570 575
Val Thr Glu Trp Phe Ala Val Asp Trp His Arg Glu Ile Val Asp Lys
580 585 590
Trp Arg Ala Ala Gly Val Arg Met Val Asp Glu Arg Asp Glu Ser Val
595 600 605
Pro Arg Thr Leu Ala Gly Leu Thr Ile Val Val Thr Gly Ser Leu Thr
610 615 620
Gly Phe Ser Arg Asp Asp Ala Lys Glu Ala Ile Val Ala Arg Gly Gly
625 630 635 640
Lys Ala Ala Gly Ser Val Ser Lys Lys Thr Asn Tyr Val Val Ala Gly
645 650 655
Asp Ser Pro Gly Ser Lys Tyr Asp Lys Ala Val Glu Leu Gly Val Pro
660 665 670
Ile Leu Asp Glu Asp Gly Phe Arg Arg Leu Leu Ala Asp Gly Pro Ala
675 680 685
Ser Arg Thr
690
<210> 59
<211> 676
<212> PRT
<213> 粪肠球菌(菌株ATCC 700802/V583)
<400> 59
Met Glu Gln Gln Pro Leu Thr Leu Thr Ala Ala Thr Thr Arg Ala Gln
1 5 10 15
Glu Leu Arg Lys Gln Leu Asn Gln Tyr Ser His Glu Tyr Tyr Val Lys
20 25 30
Asp Gln Pro Ser Val Glu Asp Tyr Val Tyr Asp Arg Leu Tyr Lys Glu
35 40 45
Leu Val Asp Ile Glu Thr Glu Phe Pro Asp Leu Ile Thr Pro Asp Ser
50 55 60
Pro Thr Gln Arg Val Gly Gly Lys Val Leu Ser Gly Phe Glu Lys Ala
65 70 75 80
Pro His Asp Ile Pro Met Tyr Ser Leu Asn Asp Gly Phe Ser Lys Glu
85 90 95
Asp Ile Phe Ala Phe Asp Glu Arg Val Arg Lys Ala Ile Gly Lys Pro
100 105 110
Val Ala Tyr Cys Cys Glu Leu Lys Ile Asp Gly Leu Ala Ile Ser Leu
115 120 125
Arg Tyr Glu Asn Gly Val Phe Val Arg Gly Ala Thr Arg Gly Asp Gly
130 135 140
Thr Val Gly Glu Asn Ile Thr Glu Asn Leu Arg Thr Val Arg Ser Val
145 150 155 160
Pro Met Arg Leu Thr Glu Pro Ile Ser Val Glu Val Arg Gly Glu Cys
165 170 175
Tyr Met Pro Lys Gln Ser Phe Val Ala Leu Asn Glu Glu Arg Glu Glu
180 185 190
Asn Gly Gln Asp Ile Phe Ala Asn Pro Arg Asn Ala Ala Ala Gly Ser
195 200 205
Leu Arg Gln Leu Asp Thr Lys Ile Val Ala Lys Arg Asn Leu Asn Thr
210 215 220
Phe Leu Tyr Thr Val Ala Asp Phe Gly Pro Met Lys Ala Lys Thr Gln
225 230 235 240
Phe Glu Ala Leu Glu Glu Leu Ser Ala Ile Gly Phe Arg Thr Asn Pro
245 250 255
Glu Arg Gln Leu Cys Gln Ser Ile Asp Glu Val Trp Ala Tyr Ile Glu
260 265 270
Glu Tyr His Glu Lys Arg Ser Thr Leu Pro Tyr Glu Ile Asp Gly Ile
275 280 285
Val Ile Lys Val Asn Glu Phe Ala Leu Gln Asp Glu Leu Gly Phe Thr
290 295 300
Val Lys Ala Pro Arg Trp Ala Ile Ala Tyr Lys Phe Pro Pro Glu Glu
305 310 315 320
Ala Glu Thr Val Val Glu Asp Ile Glu Trp Thr Ile Gly Arg Thr Gly
325 330 335
Val Val Thr Pro Thr Ala Val Met Ala Pro Val Arg Val Ala Gly Thr
340 345 350
Thr Val Ser Arg Ala Ser Leu His Asn Ala Asp Phe Ile Gln Met Lys
355 360 365
Asp Ile Arg Leu Asn Asp His Val Ile Ile Tyr Lys Ala Gly Asp Ile
370 375 380
Ile Pro Glu Val Ala Gln Val Leu Val Glu Lys Arg Ala Ala Asp Ser
385 390 395 400
Gln Pro Tyr Glu Met Pro Thr His Cys Pro Ile Cys His Ser Glu Leu
405 410 415
Val His Leu Asp Glu Glu Val Ala Leu Arg Cys Ile Asn Pro Lys Cys
420 425 430
Pro Ala Gln Ile Lys Glu Gly Leu Asn His Phe Val Ser Arg Asn Ala
435 440 445
Met Asn Ile Asp Gly Leu Gly Pro Arg Val Leu Ala Gln Met Tyr Asp
450 455 460
Lys Gly Leu Val Lys Asp Val Ala Asp Leu Tyr Phe Leu Thr Glu Glu
465 470 475 480
Gln Leu Met Thr Leu Asp Lys Ile Lys Glu Lys Ser Ala Asn Asn Ile
485 490 495
Tyr Thr Ala Ile Gln Gly Ser Lys Glu Asn Ser Val Glu Arg Leu Ile
500 505 510
Phe Gly Leu Gly Ile Arg His Val Gly Ala Lys Ala Ala Lys Ile Leu
515 520 525
Ala Glu His Phe Gly Asp Leu Pro Thr Leu Ser Arg Ala Thr Ala Glu
530 535 540
Glu Ile Val Ala Leu Asp Ser Ile Gly Glu Thr Ile Ala Asp Ser Val
545 550 555 560
Val Thr Tyr Phe Glu Asn Glu Glu Val His Glu Leu Met Ala Glu Leu
565 570 575
Glu Lys Ala Gln Val Asn Leu Thr Tyr Lys Gly Leu Arg Thr Glu Gln
580 585 590
Leu Ala Glu Val Glu Ser Pro Phe Lys Asp Lys Thr Val Val Leu Thr
595 600 605
Gly Lys Leu Ala Gln Tyr Thr Arg Glu Glu Ala Lys Glu Lys Ile Glu
610 615 620
Asn Leu Gly Gly Lys Val Thr Gly Ser Val Ser Lys Lys Thr Asp Ile
625 630 635 640
Val Val Ala Gly Glu Asp Ala Gly Ser Lys Leu Thr Lys Ala Glu Ser
645 650 655
Leu Gly Val Thr Val Trp Asn Glu Gln Glu Met Val Asp Ala Leu Asp
660 665 670
Ala Ser His Phe
675
<210> 60
<211> 670
<212> PRT
<213> 流感嗜血菌(菌株ATCC 51907/DSM 11121/ KW20/Rd)
<400> 60
Met Thr Asn Ile Gln Thr Gln Leu Asp Asn Leu Arg Lys Thr Leu Arg
1 5 10 15
Gln Tyr Glu Tyr Glu Tyr His Val Leu Asp Asn Pro Ser Val Pro Asp
20 25 30
Ser Glu Tyr Asp Arg Leu Phe His Gln Leu Lys Ala Leu Glu Leu Glu
35 40 45
His Pro Glu Phe Leu Thr Ser Asp Ser Pro Thr Gln Arg Val Gly Ala
50 55 60
Lys Pro Leu Ser Gly Phe Ser Gln Ile Arg His Glu Ile Pro Met Leu
65 70 75 80
Ser Leu Asp Asn Ala Phe Ser Asp Ala Glu Phe Asn Ala Phe Val Lys
85 90 95
Arg Ile Glu Asp Arg Leu Ile Leu Leu Pro Lys Pro Leu Thr Phe Cys
100 105 110
Cys Glu Pro Lys Leu Asp Gly Leu Ala Val Ser Ile Leu Tyr Val Asn
115 120 125
Gly Glu Leu Thr Gln Ala Ala Thr Arg Gly Asp Gly Thr Thr Gly Glu
130 135 140
Asp Ile Thr Ala Asn Ile Arg Thr Ile Arg Asn Val Pro Leu Gln Leu
145 150 155 160
Leu Thr Asp Asn Pro Pro Ala Arg Leu Glu Val Arg Gly Glu Val Phe
165 170 175
Met Pro His Ala Gly Phe Glu Arg Leu Asn Lys Tyr Ala Leu Glu His
180 185 190
Asn Glu Lys Thr Phe Ala Asn Pro Arg Asn Ala Ala Ala Gly Ser Leu
195 200 205
Arg Gln Leu Asp Pro Asn Ile Thr Ser Lys Arg Pro Leu Val Leu Asn
210 215 220
Ala Tyr Gly Ile Gly Ile Ala Glu Gly Val Asp Leu Pro Thr Thr His
225 230 235 240
Tyr Ala Arg Leu Gln Trp Leu Lys Ser Ile Gly Ile Pro Val Asn Pro
245 250 255
Glu Ile Arg Leu Cys Asn Gly Ala Asp Glu Val Leu Gly Phe Tyr Arg
260 265 270
Asp Ile Gln Asn Lys Arg Ser Ser Leu Gly Tyr Asp Ile Asp Gly Thr
275 280 285
Val Leu Lys Ile Asn Asp Ile Ala Leu Gln Asn Glu Leu Gly Phe Ile
290 295 300
Ser Lys Ala Pro Arg Trp Ala Ile Ala Tyr Lys Phe Pro Ala Gln Glu
305 310 315 320
Glu Leu Thr Leu Leu Asn Asp Val Glu Phe Gln Val Gly Arg Thr Gly
325 330 335
Ala Ile Thr Pro Val Ala Lys Leu Glu Pro Val Phe Val Ala Gly Val
340 345 350
Thr Val Ser Asn Ala Thr Leu His Asn Gly Asp Glu Ile Glu Arg Leu
355 360 365
Asn Ile Ala Ile Gly Asp Thr Val Val Ile Arg Arg Ala Gly Asp Val
370 375 380
Ile Pro Gln Ile Ile Gly Val Leu His Glu Arg Arg Pro Asp Asn Ala
385 390 395 400
Lys Pro Ile Ile Phe Pro Thr Asn Cys Pro Val Cys Asp Ser Gln Ile
405 410 415
Ile Arg Ile Glu Gly Glu Ala Val Ala Arg Cys Thr Gly Gly Leu Phe
420 425 430
Cys Ala Ala Gln Arg Lys Glu Ala Leu Lys His Phe Val Ser Arg Lys
435 440 445
Ala Met Asp Ile Asp Gly Val Gly Gly Lys Leu Ile Glu Gln Leu Val
450 455 460
Asp Arg Glu Leu Ile His Thr Pro Ala Asp Leu Phe Lys Leu Asp Leu
465 470 475 480
Thr Thr Leu Thr Arg Leu Glu Arg Met Gly Ala Lys Ser Ala Glu Asn
485 490 495
Ala Leu Asn Ser Leu Glu Asn Ala Lys Ser Thr Thr Leu Ala Arg Phe
500 505 510
Ile Phe Ala Leu Gly Ile Arg Glu Val Gly Glu Ala Thr Ala Leu Asn
515 520 525
Leu Ala Asn His Phe Lys Thr Leu Asp Ala Leu Lys Asp Ala Asn Leu
530 535 540
Glu Glu Leu Gln Gln Val Pro Asp Val Gly Glu Val Val Ala Asn Arg
545 550 555 560
Ile Phe Ile Phe Trp Arg Glu Ala His Asn Val Ala Val Val Glu Asp
565 570 575
Leu Ile Ala Gln Gly Val His Trp Glu Thr Val Glu Val Lys Glu Ala
580 585 590
Ser Glu Asn Leu Phe Lys Asp Lys Thr Val Val Leu Thr Gly Thr Leu
595 600 605
Thr Gln Met Gly Arg Asn Glu Ala Lys Ala Leu Leu Gln Gln Leu Gly
610 615 620
Ala Lys Val Ser Gly Ser Val Ser Ser Lys Thr Asp Phe Val Ile Ala
625 630 635 640
Gly Asp Ala Ala Gly Ser Lys Leu Ala Lys Ala Gln Glu Leu Asn Ile
645 650 655
Thr Val Leu Thr Glu Glu Glu Phe Leu Ala Gln Ile Thr Arg
660 665 670
<210> 61
<211> 667
<212> PRT
<213> 金黄色葡萄球菌
<400> 61
Met Ala Asp Leu Ser Ser Arg Val Asn Glu Leu His Asp Leu Leu Asn
1 5 10 15
Gln Tyr Ser Tyr Glu Tyr Tyr Val Glu Asp Asn Pro Ser Val Pro Asp
20 25 30
Ser Glu Tyr Asp Lys Leu Leu His Glu Leu Ile Lys Ile Glu Glu Glu
35 40 45
His Pro Glu Tyr Lys Thr Val Asp Ser Pro Thr Val Arg Val Gly Gly
50 55 60
Glu Ala Gln Ala Ser Phe Asn Lys Val Asn His Asp Thr Pro Met Leu
65 70 75 80
Ser Leu Gly Asn Ala Phe Asn Glu Asp Asp Leu Arg Lys Phe Asp Gln
85 90 95
Arg Ile Arg Glu Gln Ile Gly Asn Val Glu Tyr Met Cys Glu Leu Lys
100 105 110
Ile Asp Gly Leu Ala Val Ser Leu Lys Tyr Val Asp Gly Tyr Phe Val
115 120 125
Gln Gly Leu Thr Arg Gly Asp Gly Thr Thr Gly Glu Asp Ile Thr Glu
130 135 140
Asn Leu Lys Thr Ile His Ala Ile Pro Leu Lys Met Lys Glu Pro Leu
145 150 155 160
Asn Val Glu Val Arg Gly Glu Ala Tyr Met Pro Arg Arg Ser Phe Leu
165 170 175
Arg Leu Asn Glu Glu Lys Glu Lys Asn Asp Glu Gln Leu Phe Ala Asn
180 185 190
Pro Arg Asn Ala Ala Ala Gly Ser Leu Arg Gln Leu Asp Ser Lys Leu
195 200 205
Thr Ala Lys Arg Lys Leu Ser Val Phe Ile Tyr Ser Val Asn Asp Phe
210 215 220
Thr Asp Phe Asn Ala Arg Ser Gln Ser Glu Ala Leu Asp Glu Leu Asp
225 230 235 240
Lys Leu Gly Phe Thr Thr Asn Lys Asn Arg Ala Arg Val Asn Asn Ile
245 250 255
Asp Gly Val Leu Glu Tyr Ile Glu Lys Trp Thr Ser Gln Arg Glu Ser
260 265 270
Leu Pro Tyr Asp Ile Asp Gly Ile Val Ile Lys Val Asn Asp Leu Asp
275 280 285
Gln Gln Asp Glu Met Gly Phe Thr Gln Lys Ser Pro Arg Trp Ala Ile
290 295 300
Ala Tyr Lys Phe Pro Ala Glu Glu Val Val Thr Lys Leu Leu Asp Ile
305 310 315 320
Glu Leu Ser Ile Gly Arg Thr Gly Val Val Thr Pro Thr Ala Ile Leu
325 330 335
Glu Pro Val Lys Val Ala Gly Thr Thr Val Ser Arg Ala Ser Leu His
340 345 350
Asn Glu Asp Leu Ile His Asp Arg Asp Ile Arg Ile Gly Asp Ser Val
355 360 365
Val Val Lys Lys Ala Gly Asp Ile Ile Pro Glu Val Val Arg Ser Ile
370 375 380
Pro Glu Arg Arg Pro Glu Asp Ala Val Thr Tyr His Met Pro Thr His
385 390 395 400
Cys Pro Ser Cys Gly His Glu Leu Val Arg Ile Glu Gly Glu Val Ala
405 410 415
Leu Arg Cys Ile Asn Pro Lys Cys Gln Ala Gln Leu Val Glu Gly Leu
420 425 430
Ile His Phe Val Ser Arg Gln Ala Met Asn Ile Asp Gly Leu Gly Thr
435 440 445
Lys Ile Ile Gln Gln Leu Tyr Gln Ser Glu Leu Ile Lys Asp Val Ala
450 455 460
Asp Ile Phe Tyr Leu Thr Glu Glu Asp Leu Leu Pro Leu Asp Arg Met
465 470 475 480
Gly Gln Lys Lys Val Asp Asn Leu Leu Ala Ala Ile Gln Gln Ala Lys
485 490 495
Asp Asn Ser Leu Glu Asn Leu Leu Phe Gly Leu Gly Ile Arg His Leu
500 505 510
Gly Val Lys Ala Ser Gln Val Leu Ala Glu Lys Tyr Glu Thr Ile Asp
515 520 525
Arg Leu Leu Thr Val Thr Glu Ala Glu Leu Val Glu Ile His Asp Ile
530 535 540
Gly Asp Lys Val Ala Gln Ser Val Val Thr Tyr Leu Glu Asn Glu Asp
545 550 555 560
Ile Arg Ala Leu Ile Gln Lys Leu Lys Asp Lys His Val Asn Met Ile
565 570 575
Tyr Lys Gly Ile Lys Thr Ser Asp Ile Glu Gly His Pro Glu Phe Ser
580 585 590
Gly Lys Thr Ile Val Leu Thr Gly Lys Leu His Gln Met Thr Arg Asn
595 600 605
Glu Ala Ser Lys Trp Leu Ala Ser Gln Gly Ala Lys Val Thr Ser Ser
610 615 620
Val Thr Lys Asn Thr Asp Val Val Ile Ala Gly Glu Asp Ala Gly Ser
625 630 635 640
Lys Leu Thr Lys Ala Gln Ser Leu Gly Ile Glu Ile Trp Thr Glu Gln
645 650 655
Gln Phe Val Asp Lys Gln Asn Glu Leu Asn Ser
660 665
<210> 62
<211> 652
<212> PRT
<213> 肺炎链球菌(菌株P1031)
<400> 62
Met Asn Lys Arg Met Asn Glu Leu Val Ala Leu Leu Asn Arg Tyr Ala
1 5 10 15
Thr Glu Tyr Tyr Thr Ser Asp Asn Pro Ser Val Ser Asp Ser Glu Tyr
20 25 30
Asp Arg Leu Tyr Arg Glu Leu Val Glu Leu Glu Thr Ala Tyr Pro Glu
35 40 45
Gln Val Leu Ala Asp Ser Pro Thr His Arg Val Gly Gly Lys Val Leu
50 55 60
Asp Gly Phe Glu Lys Tyr Ser His Gln Tyr Pro Leu Tyr Ser Leu Gln
65 70 75 80
Asp Ala Phe Ser Arg Glu Glu Leu Asp Ala Phe Asp Ala Arg Val Arg
85 90 95
Lys Glu Val Ala His Pro Thr Tyr Ile Cys Glu Leu Lys Ile Asp Gly
100 105 110
Leu Ser Ile Ser Leu Thr Tyr Glu Lys Gly Ile Leu Val Ala Gly Val
115 120 125
Thr Arg Gly Asp Gly Ser Ile Gly Glu Asn Ile Thr Glu Asn Leu Lys
130 135 140
Arg Val Lys Asp Ile Pro Leu Thr Leu Pro Glu Glu Leu Asp Ile Thr
145 150 155 160
Val Arg Gly Glu Cys Tyr Met Pro Arg Ala Ser Phe Asp Gln Val Asn
165 170 175
Gln Ala Arg Gln Glu Asn Gly Glu Pro Glu Phe Ala Asn Pro Arg Asn
180 185 190
Ala Ala Ala Gly Thr Leu Arg Gln Leu Asp Thr Ala Val Val Ala Lys
195 200 205
Arg Asn Leu Ala Thr Phe Leu Tyr Gln Glu Ala Ser Pro Ser Thr Arg
210 215 220
Asp Ser Gln Glu Lys Gly Leu Lys Tyr Leu Glu Gln Leu Gly Phe Val
225 230 235 240
Val Asn Pro Lys Arg Ile Leu Ala Glu Asn Ile Asp Glu Ile Trp Asn
245 250 255
Phe Ile Gln Glu Val Gly Gln Glu Arg Glu Asn Leu Pro Tyr Asp Ile
260 265 270
Asp Gly Val Val Ile Lys Val Asn Asp Leu Ala Ser Gln Glu Glu Leu
275 280 285
Gly Phe Thr Val Lys Ala Pro Lys Trp Ala Val Ala Tyr Lys Phe Pro
290 295 300
Ala Glu Glu Lys Glu Ala Gln Leu Leu Ser Val Asp Trp Thr Val Gly
305 310 315 320
Arg Thr Gly Val Val Thr Pro Thr Ala Asn Leu Thr Pro Val Gln Leu
325 330 335
Ala Gly Thr Thr Val Ser Arg Ala Thr Leu His Asn Val Asp Tyr Ile
340 345 350
Ala Glu Lys Asp Ile Arg Lys Asp Asp Thr Val Ile Val Tyr Lys Ala
355 360 365
Gly Asp Ile Ile Pro Ala Val Leu Arg Val Val Glu Ser Lys Arg Val
370 375 380
Ser Glu Glu Lys Leu Asp Ile Pro Thr Asn Cys Pro Ser Cys Asn Ser
385 390 395 400
Asp Leu Leu His Phe Glu Asp Glu Val Ala Leu Arg Cys Ile Asn Pro
405 410 415
Arg Cys Pro Ala Gln Ile Met Glu Gly Leu Ile His Phe Ala Ser Arg
420 425 430
Asp Ala Met Asn Ile Thr Gly Leu Gly Pro Ser Ile Val Glu Lys Leu
435 440 445
Phe Ala Ala Asn Leu Val Lys Asp Val Ala Asp Ile Tyr Arg Leu Gln
450 455 460
Glu Glu Asp Phe Leu Leu Leu Glu Gly Val Lys Glu Lys Ser Ala Ala
465 470 475 480
Lys Leu Tyr Gln Ala Ile Gln Ala Ser Lys Glu Asn Ser Ala Glu Lys
485 490 495
Leu Leu Phe Gly Leu Gly Ile Arg His Val Gly Ser Lys Ala Ser Gln
500 505 510
Leu Leu Leu Gln Tyr Phe His Ser Ile Glu Asn Leu Tyr Gln Ala Asp
515 520 525
Ser Glu Glu Val Ala Ser Ile Glu Ser Leu Gly Gly Val Ile Ala Lys
530 535 540
Ser Leu Gln Thr Tyr Phe Ala Thr Glu Gly Ser Glu Ile Leu Leu Arg
545 550 555 560
Glu Leu Lys Glu Thr Gly Val Asn Leu Asp Tyr Lys Gly Gln Thr Val
565 570 575
Val Ala Asp Ala Ala Leu Ser Gly Leu Thr Val Val Leu Thr Gly Lys
580 585 590
Leu Glu Arg Leu Lys Arg Ser Glu Ala Lys Ser Lys Leu Glu Ser Leu
595 600 605
Gly Ala Lys Val Thr Gly Ser Val Ser Lys Lys Thr Asp Leu Val Val
610 615 620
Val Gly Ala Asp Ala Gly Ser Lys Leu Gln Lys Ala Gln Glu Leu Gly
625 630 635 640
Ile Gln Val Arg Asp Glu Ala Trp Leu Glu Ser Leu
645 650
Claims (27)
1.一种用于生产具有至少一个经修饰的核苷酸残基的单链寡核苷酸产物的方法,所述方法包括:
a)提供与产物的序列互补的模板寡核苷酸(I),所述模板具有允许它与所述产物分离的性质;
b)提供寡核苷酸的集合(II);
c)在允许退火的条件下使(I)和(II)接触;
d)改变所述条件以分离任何杂质,包括使退火的模板和杂质寡核苷酸链变性和分离所述杂质;和
e)改变所述条件以分离所述产物,包括使退火的模板和产物寡核苷酸链变性和分离所述产物。
2.根据权利要求1所述的方法,所述方法包括:
a)提供与产物的序列互补的模板寡核苷酸(I),所述模板具有允许它与所述产物分离的性质;
b)提供寡核苷酸的集合(II),其含有是产物序列的区段的寡核苷酸,其中至少一个区段含有至少一个经修饰的核苷酸残基;
c)在允许退火的条件下使(I)和(II)接触;
d)连接所述区段寡核苷酸以形成所述产物;
e)改变所述条件以分离任何杂质,包括使退火的模板和杂质寡核苷酸链变性和分离所述杂质;和
f)改变所述条件以分离所述产物,包括使退火的模板和产物寡核苷酸链变性和分离所述产物。
3.根据权利要求1或权利要求2所述的方法,其中所述变性源自温度增加、改变pH或改变缓冲溶液的盐浓度。
4.根据权利要求1-3中的任一项所述的方法,所述方法包括两个增加温度的步骤:i)使得任何退火的杂质变性和ii)使得退火的产物变性。
5.根据权利要求2-4中的任一项所述的方法,其中通过酶促连接来连接所述区段寡核苷酸,任选地其中所述酶是连接酶。
6.根据权利要求2-5中的任一项所述的方法,其中所述区段是3-15个核苷酸长。
7.根据任何前述权利要求所述的方法,其中所述产物是10-200个核苷酸长,任选地20-30个核苷酸长,任选地20-25个核苷酸长。
8.根据权利要求7所述的方法,其中所述产物是20个核苷酸长,所述产物包含三个区段寡核苷酸:
(i) 7个核苷酸长的5’区段,6个核苷酸长的中央区段和7个核苷酸长的3’区段;
(ii) 6个核苷酸长的5’区段,8个核苷酸长的中央区段和6个核苷酸长的3’区段;或者
(iii) 5个核苷酸长的5’区段,10个核苷酸长的中央区段和5个核苷酸长的3’区段。
9.根据任何前述权利要求所述的方法,其中所述允许模板与产物分离的性质是,所述模板附着于支持材料。
10.根据权利要求9所述的方法,其中所述支持材料是可溶性支持材料,任选地其中所述支持材料选自:聚乙二醇、可溶性的有机聚合物、DNA、蛋白、树枝状聚合物、多糖、寡糖和碳水化合物。
11.根据权利要求9所述的方法,其中所述支持材料是不溶性支持材料,任选地其中所述支持材料选自:玻璃珠、聚合物珠子、纤维支持物、膜、抗生蛋白链菌素包被的珠子、纤维素,或者是反应容器本身的部分,例如反应壁。
12.根据权利要求9 - 11中的任一项所述的方法,其中所述模板的多个重复拷贝经由单个附着点以连续方式附着于所述支持材料。
13.根据权利要求1- 12中的任一项所述的方法,其中所述允许模板与产物分离的性质是所述模板的分子量。
14.根据任何前述权利要求所述的方法,其中将所述模板、或所述模板和支持材料再循环用于在将来的反应中使用。
15.根据任何前述权利要求所述的方法,其中使用连续或半连续流水作业实施所述反应。
16.根据任何前述权利要求所述的方法,其中所述修饰是在所述糖部分的2’位置,任选地选自2’-F、2’-OMe、2’-MOE和2’-氨基,或其中所述寡核苷酸包含PMO、LNA、PNA、BNA或SPIEGELMER。
17.根据任何前述权利要求所述的方法,其中所述修饰是在所述核苷碱基中,任选地其中所述修饰选自5-甲基嘧啶、7-脱氮鸟苷和脱碱基核苷酸。
18.根据任何前述权利要求所述的方法,其中所述修饰是在所述主链中,任选地其中所述修饰选自硫代磷酸酯、氨基磷酸酯和磷酰二胺。
19.根据任何前述权利要求所述的方法,其中得到的产物是至少90%纯的,任选地其中所述产物是至少95%纯的,任选地其中所述产物是至少98%纯的。
20.一种用于生产双链寡核苷酸产物的方法,其中通过根据任意前述权利要求所述的方法生产2种互补的单链寡核苷酸,并然后在允许退火的条件下混合。
21.在任何前述权利要求中要求保护的方法,其中所述方法是用于生产治疗性寡核苷酸。
22.在任何前述权利要求中要求保护的方法,其中在克或千克规模生产所述产物,和/或在1 L或更大的反应器中实施所述方法。
23.通过权利要求1-22中的任一项所述的方法生产的寡核苷酸,任选地其中所述寡核苷酸是gapmer。
24.一种连接酶,其包含如在SEQ ID NO:3中所示的氨基酸序列,其中在位置368处的氨基酸被R或K替换;和/或在位置371处的氨基酸被L、K、Q、V、P或R替换。
25.一种连接酶,其包含如在以下SEQ ID NO:10-28中的任一个中所示的氨基酸序列。
26.包含如在SEQ ID NO:6或SEQ ID NO:8中所示的氨基酸序列的连接酶用于将含有一个或多个经修饰的糖部分的5’区段连接至3’区段的用途,其中在3’区段内的所有糖部分是未修饰的,任选地其中所述5’区段含有一个或多个具有2’-OMe修饰的糖部分。
27.一种从杂质中纯化单链寡核苷酸产物的方法,所述方法包括:
a)提供与所述单链寡核苷酸产物的序列互补的模板寡核苷酸(I),所述模板具有允许它与所述单链寡核苷酸产物分离的性质;
b)提供寡核苷酸的集合(II),其包含所述单链寡核苷酸产物和杂质;
c)在允许退火的条件下使(I)和(II)接触;
d)改变所述条件以分离任何杂质,包括使退火的模板和杂质寡核苷酸链变性和分离所述杂质;
e)改变所述条件以分离所述单链寡核苷酸产物,包括使退火的模板和单链寡核苷酸产物变性和分离所述单链寡核苷酸产物。
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| GBGB1612011.5A GB201612011D0 (en) | 2016-07-11 | 2016-07-11 | Novel processes for the production of oligonucleotides |
| GB1612011.5 | 2016-07-11 | ||
| PCT/EP2017/067049 WO2018011067A2 (en) | 2016-07-11 | 2017-07-07 | Novel processes for the production of oligonucleotides |
| CN201780043407.4A CN109415399B (zh) | 2016-07-11 | 2017-07-07 | 生产寡核苷酸的新颖方法 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201780043407.4A Division CN109415399B (zh) | 2016-07-11 | 2017-07-07 | 生产寡核苷酸的新颖方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN115161366A true CN115161366A (zh) | 2022-10-11 |
| CN115161366B CN115161366B (zh) | 2025-08-05 |
Family
ID=56890843
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201780043407.4A Active CN109415399B (zh) | 2016-07-11 | 2017-07-07 | 生产寡核苷酸的新颖方法 |
| CN202210531352.4A Active CN115161366B (zh) | 2016-07-11 | 2017-07-07 | 生产寡核苷酸的新颖方法 |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201780043407.4A Active CN109415399B (zh) | 2016-07-11 | 2017-07-07 | 生产寡核苷酸的新颖方法 |
Country Status (20)
| Country | Link |
|---|---|
| US (3) | US10640812B2 (zh) |
| EP (2) | EP3481838B1 (zh) |
| JP (3) | JP6752957B2 (zh) |
| KR (3) | KR102356524B1 (zh) |
| CN (2) | CN109415399B (zh) |
| AU (1) | AU2017295602B2 (zh) |
| CA (1) | CA3030079C (zh) |
| CY (1) | CY1123581T1 (zh) |
| DK (1) | DK3481838T3 (zh) |
| ES (1) | ES2831419T3 (zh) |
| GB (2) | GB201612011D0 (zh) |
| HR (1) | HRP20201744T1 (zh) |
| HU (1) | HUE051767T2 (zh) |
| LT (1) | LT3481838T (zh) |
| PT (1) | PT3481838T (zh) |
| RS (1) | RS61262B1 (zh) |
| RU (1) | RU2719641C1 (zh) |
| SI (1) | SI3481838T1 (zh) |
| SM (1) | SMT202000612T1 (zh) |
| WO (1) | WO2018011067A2 (zh) |
Families Citing this family (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB201612011D0 (en) * | 2016-07-11 | 2016-08-24 | Glaxosmithkline Ip Dev Ltd | Novel processes for the production of oligonucleotides |
| CA3062550A1 (en) * | 2017-05-08 | 2018-11-15 | Codexis, Inc. | Engineered ligase variants |
| AU2018292105B2 (en) | 2017-06-30 | 2024-12-12 | Codexis, Inc. | T7 RNA polymerase variants |
| RU2020103727A (ru) | 2017-06-30 | 2021-07-30 | Кодексис, Инк. | Варианты рнк-полимеразы т7 |
| GB201721307D0 (en) * | 2017-12-19 | 2018-01-31 | Glaxosmithkline Ip Dev Ltd | Novel processes for the production of oligonucleotides |
| BR112020017769A2 (pt) | 2018-03-30 | 2021-01-05 | Toray Industries, Inc. | Método e kit para produzir uma molécula de rna de fita simples, e, molécula de oligorna de fita simples. |
| EP3778914A4 (en) * | 2018-03-30 | 2022-01-19 | Sumitomo Chemical Company, Ltd. | Method for producing single-strand rna |
| CN113439085B (zh) | 2019-02-18 | 2025-06-27 | 味之素株式会社 | 包含互补部分的修饰寡核苷酸的制造方法 |
| CA3130431A1 (en) * | 2019-02-20 | 2020-08-27 | Roche Innovation Center Copenhagen A/S | Phosphonoacetate gapmer oligonucleotides |
| US20210205775A1 (en) * | 2020-01-06 | 2021-07-08 | Microsoft Technology Licensing, Llc | Solid-phase polymer synthesis on reusable substrates |
| US11725073B2 (en) | 2020-12-29 | 2023-08-15 | Hongene Biotech Corporation | Compositions and methods for liquid phase oligonucleotide synthesis |
| AU2022256031A1 (en) * | 2021-04-05 | 2023-10-12 | 10X Genomics, Inc. | Recombinant ligase composition and uses thereof |
| US11851454B2 (en) | 2021-12-30 | 2023-12-26 | Hongene Biotech Corporation | Compositions and methods for liquid phase oligonucleotide synthesis |
| US11788082B2 (en) * | 2022-02-22 | 2023-10-17 | Abclonal Science, Inc. | T4 DNA ligase variants with increased thermostability |
| US12416044B2 (en) * | 2022-03-21 | 2025-09-16 | Abclonal Science, Inc. | T4 DNA ligase variants with increased ligation efficiency |
| US20250223620A1 (en) | 2022-04-08 | 2025-07-10 | Glaxosmithkline Intellectual Property Development Limited | Novel processes for the production of polynucleotides including oligonucleotides |
| JP2025521412A (ja) | 2022-06-21 | 2025-07-10 | ホンジーン バイオテック コーポレイション | 液相オリゴヌクレオチド合成のための組成物および方法 |
| WO2024137756A1 (en) | 2022-12-23 | 2024-06-27 | Hongene Biotech Corporation | Compounds and methods for liquid phase oligonucleotide synthesis |
| GB202403099D0 (en) | 2024-03-04 | 2024-04-17 | Glaxosmithkline Ip Dev Ltd | Novel methods for the purification of oligonucleotides |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6004826A (en) * | 1988-07-20 | 1999-12-21 | David Segev | Repair-mediated process for amplifying and detecting nucleic acid sequences |
| WO2001064864A2 (en) * | 2000-02-28 | 2001-09-07 | Maxygen, Inc. | Single-stranded nucleic acid template-mediated recombination and nucleic acid fragment isolation |
| WO2001071037A1 (en) * | 2000-03-23 | 2001-09-27 | Lumigen, Inc. | Methods of detecting polynucleotide kinase and its use as a label |
| WO2009097673A1 (en) * | 2008-02-07 | 2009-08-13 | Bio-Id Diagnostic Inc. | Synthesis of single-stranded dna |
Family Cites Families (34)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8148065B1 (en) | 1988-04-06 | 2012-04-03 | City Of Hope | Ligation amplification of nucleic acid sequences |
| EP0379559B1 (en) | 1988-06-24 | 1996-10-23 | Amgen Inc. | Method and reagents for detecting nucleic acid sequences |
| US5547843A (en) | 1992-07-17 | 1996-08-20 | Associated Universities, Inc. | Method for promoting specific alignment of short oligonucleotides on nucleic acids |
| US5516664A (en) | 1992-12-23 | 1996-05-14 | Hyman; Edward D. | Enzymatic synthesis of repeat regions of oligonucleotides |
| US6110668A (en) | 1996-10-07 | 2000-08-29 | Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. | Gene synthesis method |
| US20030008306A1 (en) | 1998-03-31 | 2003-01-09 | Kenneth Turnbull | Circular polynucleotide templates and methods for oligonucleotide synthesis |
| US6683173B2 (en) | 1998-04-03 | 2004-01-27 | Epoch Biosciences, Inc. | Tm leveling methods |
| US6867294B1 (en) | 1998-07-14 | 2005-03-15 | Isis Pharmaceuticals, Inc. | Gapped oligomers having site specific chiral phosphorothioate internucleoside linkages |
| US5998175A (en) | 1998-07-24 | 1999-12-07 | Lumigen, Inc. | Methods of synthesizing and amplifying polynucleotides by ligation of multiple oligomers |
| AU772995B2 (en) * | 1998-07-24 | 2004-05-13 | Lumigen, Inc. | Methods of synthesizing polynucleotides by ligation of multiple oligomers |
| US7033753B1 (en) * | 1999-01-15 | 2006-04-25 | University Of Rochester | Compositions and methods for nonenzymatic ligation of oligonucleotides and detection of genetic polymorphisms |
| DE60010058T2 (de) | 1999-02-26 | 2005-04-28 | Exact Sciences Corp., Marlborough | Biochemische reinigungsgeräte mit immobilisierten fangsonden und ihre anwendungen |
| US6951722B2 (en) | 1999-03-19 | 2005-10-04 | Takara Bio Inc. | Method for amplifying nucleic acid sequence |
| AU773536B2 (en) * | 1999-03-19 | 2004-05-27 | Takara Bio Inc. | Method for amplifying nucleic acid sequence |
| US6297016B1 (en) | 1999-10-08 | 2001-10-02 | Applera Corporation | Template-dependent ligation with PNA-DNA chimeric probes |
| AU1098001A (en) | 1999-10-19 | 2001-04-30 | Enchira Biotechnology Corporation | Method for directed evolution by random chimeragenesis on transient templates |
| US6586586B1 (en) | 2000-01-31 | 2003-07-01 | Isis Pharmaceuticals, Inc. | Purification of oligonucleotides |
| EP1130113A1 (en) * | 2000-02-15 | 2001-09-05 | Johannes Petrus Schouten | Multiplex ligation dependent amplification assay |
| ATE423221T1 (de) * | 2000-06-13 | 2009-03-15 | Univ Boston | Verwendung von mass-matched nukleotide in der analyse von oligonukleotidmischungen sowie in der hoch-multiplexen nukleinsäuresequenzierung |
| EA005739B1 (ru) * | 2000-08-23 | 2005-06-30 | Такара Био Инк. | Способ амплификации нуклеиновых кислот |
| US7211654B2 (en) | 2001-03-14 | 2007-05-01 | Regents Of The University Of Michigan | Linkers and co-coupling agents for optimization of oligonucleotide synthesis and purification on solid supports |
| US20030228602A1 (en) | 2002-04-01 | 2003-12-11 | Blue Heron Biotechnology, Inc. | Solid phase methods for polynucleotide production |
| GB0213816D0 (en) | 2002-06-14 | 2002-07-24 | Univ Aston | Method of producing DNA and protein libraries |
| US20040110213A1 (en) | 2002-09-30 | 2004-06-10 | Eugeni Namsaraev | Polynucleotide synthesis and labeling by kinetic sampling ligation |
| DE60227525D1 (de) * | 2002-10-18 | 2008-08-21 | Sloning Biotechnology Gmbh | Verfahren zur Herstellung von Nukleinsäuremolekülen |
| US20040248104A1 (en) | 2003-06-05 | 2004-12-09 | Zohar Yakhini | Methods and reagents for profiling quantities of nucleic acids |
| US20060166235A1 (en) * | 2004-12-29 | 2006-07-27 | Applera Corporation | Methods, compositions, and kits for forming labeled polynucleotides |
| WO2009043112A1 (en) | 2007-10-04 | 2009-04-09 | Commonwealth Scientific And Industrial Research Organisation | Nucleic acid amplification |
| GB201012418D0 (en) | 2010-07-23 | 2010-09-08 | Santaris Pharma As | Process |
| GB201115218D0 (en) | 2011-09-02 | 2011-10-19 | Glaxo Group Ltd | Novel process |
| US9551023B2 (en) | 2012-09-14 | 2017-01-24 | Oxford Nanopore Technologies Ltd. | Sample preparation method |
| US10059929B2 (en) | 2014-10-20 | 2018-08-28 | Molecular Assemblies, Inc. | Modified template-independent enzymes for polydeoxynucleotide synthesis |
| CN105506125B (zh) | 2016-01-12 | 2019-01-22 | 上海美吉生物医药科技有限公司 | 一种dna的测序方法及一种二代测序文库 |
| GB201612011D0 (en) | 2016-07-11 | 2016-08-24 | Glaxosmithkline Ip Dev Ltd | Novel processes for the production of oligonucleotides |
-
2016
- 2016-07-11 GB GBGB1612011.5A patent/GB201612011D0/en not_active Ceased
-
2017
- 2017-07-07 KR KR1020217001264A patent/KR102356524B1/ko active Active
- 2017-07-07 CN CN201780043407.4A patent/CN109415399B/zh active Active
- 2017-07-07 CN CN202210531352.4A patent/CN115161366B/zh active Active
- 2017-07-07 EP EP17739936.7A patent/EP3481838B1/en not_active Revoked
- 2017-07-07 LT LTEP17739936.7T patent/LT3481838T/lt unknown
- 2017-07-07 SI SI201730495T patent/SI3481838T1/sl unknown
- 2017-07-07 EP EP20165490.2A patent/EP3702360A1/en active Pending
- 2017-07-07 HU HUE17739936A patent/HUE051767T2/hu unknown
- 2017-07-07 RU RU2019100219A patent/RU2719641C1/ru active
- 2017-07-07 US US15/643,535 patent/US10640812B2/en active Active
- 2017-07-07 DK DK17739936.7T patent/DK3481838T3/da active
- 2017-07-07 KR KR1020197002289A patent/KR102205974B1/ko active Active
- 2017-07-07 ES ES17739936T patent/ES2831419T3/es active Active
- 2017-07-07 HR HRP20201744TT patent/HRP20201744T1/hr unknown
- 2017-07-07 RS RS20201365A patent/RS61262B1/sr unknown
- 2017-07-07 CA CA3030079A patent/CA3030079C/en active Active
- 2017-07-07 JP JP2019500675A patent/JP6752957B2/ja active Active
- 2017-07-07 SM SM20200612T patent/SMT202000612T1/it unknown
- 2017-07-07 KR KR1020227002370A patent/KR102492515B1/ko active Active
- 2017-07-07 AU AU2017295602A patent/AU2017295602B2/en active Active
- 2017-07-07 WO PCT/EP2017/067049 patent/WO2018011067A2/en not_active Ceased
- 2017-07-07 GB GB1710919.0A patent/GB2558335B/en active Active
- 2017-07-07 PT PT177399367T patent/PT3481838T/pt unknown
-
2020
- 2020-03-30 US US16/833,724 patent/US12275983B2/en active Active
- 2020-08-19 JP JP2020138521A patent/JP7050866B2/ja active Active
- 2020-11-11 CY CY20201101067T patent/CY1123581T1/el unknown
-
2022
- 2022-03-29 JP JP2022053096A patent/JP7531537B2/ja active Active
-
2025
- 2025-03-13 US US19/078,540 patent/US20250230488A1/en active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6004826A (en) * | 1988-07-20 | 1999-12-21 | David Segev | Repair-mediated process for amplifying and detecting nucleic acid sequences |
| WO2001064864A2 (en) * | 2000-02-28 | 2001-09-07 | Maxygen, Inc. | Single-stranded nucleic acid template-mediated recombination and nucleic acid fragment isolation |
| US20060068406A1 (en) * | 2000-02-28 | 2006-03-30 | Maxygen, Inc. | Single-stranded nucleic acid template-mediated recombination and nucleic acid fragment isolation |
| WO2001071037A1 (en) * | 2000-03-23 | 2001-09-27 | Lumigen, Inc. | Methods of detecting polynucleotide kinase and its use as a label |
| WO2009097673A1 (en) * | 2008-02-07 | 2009-08-13 | Bio-Id Diagnostic Inc. | Synthesis of single-stranded dna |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7531537B2 (ja) | オリゴヌクレオチドの産生のための新規プロセス | |
| JP7438259B2 (ja) | オリゴヌクレオチドの産生のための新規プロセス | |
| BR112018076725B1 (pt) | Processos para produzir um produto de oligonucleotídeo de fita simples e de fita dupla |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| CB02 | Change of applicant information | ||
| CB02 | Change of applicant information |
Country or region after: Britain Address after: Steve Niki Applicant after: GLAXOSMITHKLINE INTELLECTUAL PROPERTY DEVELOPMENT LTD. Address before: The Middlesex County Applicant before: GLAXOSMITHKLINE INTELLECTUAL PROPERTY DEVELOPMENT LTD. Country or region before: Britain |
|
| GR01 | Patent grant | ||
| GR01 | Patent grant |