[go: up one dir, main page]

CN115916799A - 用于多肽处理和分析的方法、系统和试剂盒 - Google Patents

用于多肽处理和分析的方法、系统和试剂盒 Download PDF

Info

Publication number
CN115916799A
CN115916799A CN202180049655.6A CN202180049655A CN115916799A CN 115916799 A CN115916799 A CN 115916799A CN 202180049655 A CN202180049655 A CN 202180049655A CN 115916799 A CN115916799 A CN 115916799A
Authority
CN
China
Prior art keywords
peptide
amino acid
coupled
reactive group
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180049655.6A
Other languages
English (en)
Inventor
E·V·安斯林
E·马科特
C·J·霍华德二世
J·斯瓦米纳坦
A·M·巴尔多
B·弗洛伊德
B·霍斯福德
L·张
E·F·巴布科克
C·M·辛森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Texas System
Original Assignee
University of Texas System
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Texas System filed Critical University of Texas System
Publication of CN115916799A publication Critical patent/CN115916799A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/04General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length on carriers
    • C07K1/042General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length on carriers characterised by the nature of the carrier
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • G01N33/54306Solid-phase reaction mechanisms
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • G01N33/54353Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals with ligand attached to the carrier via a chemical coupling agent
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • G01N33/582Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with fluorescent label

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本文提供了用于肽分析(包括肽测序)的组合物、系统、方法和试剂盒。本申请的方面提供了可选择性地与氨基酸偶联且选择性地与可检测物质偶联的双官能化试剂。本申请的方面进一步提供了使用这些双官能化试剂对肽进行测序和分析的方法。

Description

用于多肽处理和分析的方法、系统和试剂盒
本申请要求于2020年5月19日提交的美国临时专利申请号63/027,219号的权益,其全部通过引用整体并入本文。
本发明是在国立卫生研究院授予的授权号为R35 GM122480的政府支持下完成的。政府对本发明享有一定的权利。
背景技术
由于遗传变异经常不会表现在可检测的或直接的表型变化中,因此蛋白质组学对于理解生物体和系统水平的生物学和生物化学可能是必不可少的。蛋白质组学已应用于多种临床和生化兴趣领域,包括宽范围的疾病的发病机制、发展、预防和治疗。蛋白鉴定和更广规模的蛋白质组学分析对于药物开发、蛋白发现、生物询问和分类学分类至关重要。但是,许多传统形式的蛋白质组学分析都存在灵敏度低或通量低的问题。例如,组织学经常为鉴定特定蛋白提供准确且灵敏的方法,但其在多重分析或促进高通量分析的能力会受到限制。相反,质谱蛋白分析通常以检测的有限灵敏度和狭窄动态范围为代价而实现高通量蛋白质组学分析。
发明内容
如本文所认识到的,越来越多地施用蛋白质组学策略来理解生命系统生物学产生了对更加有效、高效和准确的蛋白鉴定方法的持续需求。在核酸测序方面已经取得了重大进展,许多下一代技术实现了单分子灵敏度和高通量基因组水平的测量,包括快速和并行的基因组和转录组测序。相比之下,蛋白质组学分析已经滞后,成为许多生物学表征形式的瓶颈。例如,质谱法经常需要事先了解样品组成,可能无法检测来自复杂样品的细胞间的差异,并且经常无法察觉低丰度和低拷贝数蛋白。此外,质谱法检测通常为检测提供有限的动态范围,通常鉴定超过至多四个数量级的蛋白,并因此会错过甚至最简单的蛋白质组(其通常在浓度方面跨越超过十个数量级)的大部分复杂性。
具有覆盖蛋白质组中全部蛋白浓度范围的动态范围的无偏倚蛋白测序方法可以改进基因产物和亚细胞复合物的鉴定和表征。提供用于将标记、报告分子或其组合组装到肽的氨基酸上的技术的光学测序系统、方法和试剂盒可以提高肽的快速单分子测序的效率。
本申请的方法、系统和试剂盒可以使用光学技术推进当前的肽或蛋白测序方法。本申请的方法和系统可以通过提高测序效率和准确度来克服或减轻其它肽测序方法的至少一些缺点。这可以用于例如癌症诊断、神经学诊断和内分泌学诊断。
本申请的一个方面提供了一种包含肽的系统,其中所述肽固定至至少一种支持物;且其中所述肽包含与标记物偶联的氨基酸,其中所述标记物包含:(i)设置为与第二反应性基团偶联的第一反应性基团,所述第二反应性基团与设置为发射信号的报告部分偶联,或(ii)保护基团,所述保护基团设置为防止所述标记物和所述第二反应性基团之间的偶联。
本申请的其它方面提供了一种用于处理或分析肽的系统,其包含:包含与第一反应性基团偶联的氨基酸的肽;和与第二反应性基团的支持物,其中所述第一反应性基团设置为与所述第二反应性基团偶联以固定邻近所述支持物的肽。
在某些实施方案中,所述至少一种支持物是珠子、聚合物基质或阵列。在某些实施方案中,所述阵列是显微镜载玻片。在某些实施方案中,所述肽的N-端与所述至少一种支持物偶联。在某些实施方案中,所述至少一种支持物是珠子。
在某些实施方案中,所述肽的N-端与可切割单元偶联,其中所述可切割单元与所述至少一种支持物偶联。在某些实施方案中,所述可切割单元包含以下中的至少一种:(i)可切割部分,(ii)醛,(iii)至少一种支持物,或(iv)间隔子。在某些实施方案中,其中所述可切割单元包含(i)至(iv)。
在某些实施方案中,所述肽的C-端与所述至少一种支持物偶联。在某些实施方案中,所述至少一种支持物是显微镜载玻片。在某些实施方案中,所述C-端修饰有包含炔烃或叠氮化物的化合物。在某些实施方案中,所述炔烃或所述叠氮化物设置为与所述至少一种支持物偶联。
在某些实施方案中,所述C-端是酸性氨基酸,其中所述C-端包含第一酸性残基和第二酸性残基。在某些实施方案中,所述第一酸性残基是C-端羧酸。在某些实施方案中,所述第二酸性残基是天冬氨酸侧链或谷氨酸侧链。在某些实施方案中,所述第一酸性残基和所述第二酸性残基修饰有包含炔烃或叠氮化物的化合物。在某些实施方案中,所述炔烃或所述叠氮化物设置为与所述至少一种支持物偶联。
在某些实施方案中,所述肽的N-端与所述至少一种支持物的第一支持物偶联,其中所述第一支持物是珠子,且其中所述肽的C-端与所述至少一种支持物中的第二支持物偶联,其中所述第二支持物是显微镜载玻片。
在某些实施方案中,所述报告部分设置为在激发时发射信号。在某些实施方案中,所述信号是可检测信号。在某些实施方案中,所述可检测信号是光学信号。在某些实施方案中,所述报告部分包含荧光染料。在某些实施方案中,所述报告部分包含间隔子。在某些实施方案中,所述保护基团不发射光学可检测信号。
在某些实施方案中,所述氨基酸选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、脯氨酸、天冬酰胺、谷氨酰胺和色氨酸组成的组。在某些实施方案中,所述氨基酸包含翻译后修饰。在某些实施方案中,所述翻译后修饰选自由糖基化、乙酰化、烷基化、生物素化、谷氨酰化、糖基化、异戊二烯化、磷酸化、脂化(lipolation)、磷酸泛酰巯基乙胺化(phosphopantetheinylation)、硫酸化、硒化、酰胺化、泛素化、羟基化、硝化、亚硝酰化、瓜氨酸化、N-端谷氨酰胺环化、N-端谷氨酸环化和SUMO化(SUMOylation)组成的组。
在某些实施方案中,所述肽包含与多个标记物偶联的多个氨基酸。在某些实施方案中,所述多个氨基酸包含与第一标记物偶联的第一氨基酸和与第二标记物偶联的第二氨基酸。在某些实施方案中,所述多个氨基酸包含(i)与多个第一标记物偶联的多个第一氨基酸和(ii)与多个第二标记物偶联的多个第二氨基酸。在某些实施方案中,所述第一标记物仅与所述第一氨基酸偶联,且所述第二标记物仅与所述第二氨基酸偶联。在某些实施方案中,所述多个标记物中的至少一个标记物与所述多个氨基酸的特定氨基酸类型偶联。在某些实施方案中,所述多个标记物中的至少一个标记物设置为与偶联至特定报告部分的特定第二反应性基团反应。
在某些实施方案中,所述肽包含多个氨基酸。在某些实施方案中,所述多个氨基酸中的至少一个氨基酸选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、谷氨酰胺、天冬酰胺和色氨酸组成的组。在某些实施方案中,所述至少一个氨基酸与所述标记物偶联。
在某些实施方案中,所述第一反应性基团选自由叠氮化物、炔烃、烯烃、醛、酮、四嗪、硫醇、二硫醇、环辛烯和降冰片烯组成的组。在某些实施方案中,所述炔烃是具有应变炔烃(strained alkyne)。在某些实施方案中,所述第一反应性基团选自由叠氮化物、烯烃、醛、酮和四嗪组成的组。在某些实施方案中,所述第二反应性基团选自由炔烃、叠氮化物、硫醇、二硫醇、环辛烯、烯烃、醛、酮、四嗪和降冰片烯组成的组。在某些实施方案中,所述第一反应性基团选自由炔烃、硫醇、二硫醇和环辛烯组成的组。在某些实施方案中,所述炔烃是应变炔烃。
本申请的另一个方面提供了一种用于处理或分析肽的方法,所述方法包括:(a)提供所述肽,所述肽包含与标记物偶联的氨基酸,其中所述标记物包含(i)设置为与第二反应性基团偶联的第一反应性基团,所述第二反应性基团偶联至设置为发射信号的报告部分,或(ii)保护基团,所述保护基团设置为防止所述标记物和所述第二反应性基团之间的偶联;(b)使所述肽与包含所述第二反应性基团的混合物接触;(c)在所述肽固定至至少一种支持物的情况下,检测来自所述肽的信号;和(d)使用所述信号或信号变化来鉴定所述肽的所述氨基酸或另外氨基酸。
本申请的另一个方面提供了一种用于标记肽的氨基酸的方法,所述方法包括:提供所述肽,其中所述肽包含与叠氮化物偶联的内部氨基酸和与炔烃偶联的C-端;以及,在使第一报告子与所述内部氨基酸反应的条件下,使所述肽与所述第一报告子接触,其中所述第一报告子包含应变炔烃。在某些实施方案中,在不存在铜(Cu)的情况下,进行所述方法。在某些实施方案中,所述方法进一步包括使不同于所述第一报告子的第二报告子与所述C-端反应,其中所述第二报告子包含非应变炔烃(non-strained alkyne)。在某些实施方案中,在存在铜(Cu)的情况下,进行所述方法。在某些实施方案中,偶联至内部氨基酸的叠氮化物不与偶联至C-端的炔烃反应。
在某些实施方案中,所述方法包括:在(c)之前固定所述肽。在某些实施方案中,在(a)或(b)中,将所述肽固定至所述至少一种支持物。在某些实施方案中,所述方法包括:在(b)之后,固定所述肽。在某些实施方案中,在(a)中,所述标记物包含所述第一反应性基团,且在(b)中,所述第二反应性基团与所述第一反应性基团反应。
在某些实施方案中,以多个肽的形式提供所述肽。在某些实施方案中,所述肽包含所述多个肽中的至少一个肽。在某些实施方案中,所述多个肽被固定至多个支持物。在某些实施方案中,所述多个肽包含第一肽和第二肽。
在某些实施方案中,所述第一肽包含与第一标记物偶联的第一氨基酸且所述第二肽包含与第二标记物偶联的第二氨基酸。在某些实施方案中,所述第一标记物设置为所述第二反应性基团反应且所述第二标记物设置为与和所述第二反应性基团不同的第二反应性基团反应。在某些实施方案中,所述不同的第二反应性基团与第二报告部分偶联,所述第二报告部分设置为发射与所述报告部分不同的信号。
在某些实施方案中,所述肽包含与多个标记物偶联的多个氨基酸。在某些实施方案中,所述多个氨基酸包含与第一标记物偶联的第一氨基酸和与第二标记物偶联的第二氨基酸。在某些实施方案中,所述多个氨基酸包含与多个第一标记物偶联的多个第一氨基酸和与多个第二标记物偶联的多个第二氨基酸。在某些实施方案中,所述第一标记物仅与所述第一氨基酸偶联且所述第二标记物与所述第二氨基酸偶联。在某些实施方案中,所述多个标记物中的至少一个标记物与所述多个氨基酸的特定氨基酸类型偶联。在某些实施方案中,所述多个标记物中的至少一个标记物设置为与偶联至特定报告部分的特定第二反应性基团反应。
在某些实施方案中,所述肽包含多个氨基酸。在某些实施方案中,所述多个氨基酸中的至少一个氨基酸选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、天冬酰胺、谷氨酰胺和色氨酸组成的组。在某些实施方案中,所述至少一个氨基酸与所述标记物偶联。在某些实施方案中,所述多个氨基酸包含至少两种氨基酸类型。在某些实施方案中,并非所有氨基酸类型的多个氨基酸都被标记。
在某些实施方案中,所述至少两种氨基酸类型包含第一氨基酸类型和第二氨基酸类型。在某些实施方案中,所述第一氨基酸类型与第一标记物偶联且其中所述第二氨基酸类型与第二标记物偶联。在某些实施方案中,所述第一标记物和所述第二标记物各自与不同的报告部分偶联。在某些实施方案中,所述至少两种氨基酸类型中的每种氨基酸类型与不同的标记物偶联。在某些实施方案中,所述肽包含至少四种氨基酸类型,其中所述至少四种氨基酸类型中的每种氨基酸类型与不同的标记物偶联。在某些实施方案中,所述多个氨基酸并非全部被标记。
在某些实施方案中,所述方法包括(e),使所述肽经受足以从固定至所述至少一种支持物的所述肽中除去至少一个氨基酸的条件。在某些实施方案中,足以除去至少一个氨基酸的条件包括埃德曼降解试剂或含有有机磷酸酯的试剂。在某些实施方案中,在(e)之后,与所述标记物偶联的氨基酸变成末端氨基酸。在某些实施方案中,从所述肽的N-端除去至少一个氨基酸。
在某些实施方案中,使用所述信号或信号变化来鉴定所述肽的序列的至少一部分。在某些实施方案中,所述方法包括(f),重复(d)和(e)以检测来自固定至所述至少一种支持物的所述肽的至少一个另外信号或信号变化,以及(ii)使用所述信号或信号变化和所述另外信号或信号变化来鉴定固定至所述至少一种支持物的所述肽的序列的至少一部分。
在某些实施方案中,用具有单分子灵敏度的光学检测器检测所述至少一个信号或信号变化。在某些实施方案中,所述至少一个信号或信号变化包含不同频率或频率范围的多个信号。在某些实施方案中,所述至少一个信号或信号变化包含不同强度的多个信号。在某些实施方案中,所述至少一个信号或信号变化是光学信号。
在某些实施方案中,所述报告部分产生所述至少一个信号或信号变化。在某些实施方案中,所述报告部分包含染料,所述染料产生所述至少一个信号或信号变化。在某些实施方案中,所述保护基团包含一个或多个基团,每个基团独立地选自由叠氮化物、烷基、亚烷基、芳基、杂芳基、杂芳基-烷基和芳基-烷基组成的组。
本申请的另一个方面提供了用于处理或分析肽的方法,所述方法包含:(a)提供所述肽,其包含与第一反应性基团偶联的氨基酸,所述第一反应性基团设置为与偶联至支持物的第二反应性基团偶联;(b)使所述肽与所述第二反应性基团接触以允许所述第一反应性基团偶联至所述第二反应性基团,由此将所述肽固定至所述支持物;(c)在所述肽固定至所述支持物的情况下,检测来自与所述肽的氨基酸偶联的标记物的信号;和(d)使用所述信号或其变化来鉴定所述氨基酸。
在某些实施方案中,所述第一反应性基团经由官能团偶联至所述氨基酸。在某些实施方案中,所述官能团偶联至所述氨基酸的反应性侧链。在某些实施方案中,(a)进一步包括使所述氨基酸偶联至与所述第一反应性基团偶联的官能团。在某些实施方案中,所述官能团仅偶联至与第一反应性基团偶联的氨基酸,所述第一反应性基团被设置为偶联至与支持物偶联的第二反应性基团。
在某些实施方案中,所述氨基酸选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、脯氨酸、谷氨酰胺和色氨酸组成的组。在某些实施方案中,所述第一反应性基团选自由叠氮化物、炔烃、烯烃、醛、酮、四嗪、硫醇、二硫醇、酯、环辛烯和降冰片烯或活化的酯组成的组。在某些实施方案中,所述酯是活化的酯。在某些实施方案中,所述活化的酯是EDC-碳化二亚胺。
在某些实施方案中,所述第一反应性基团是叠氮化物或炔烃。在某些实施方案中,所述第二反应性基团选自由炔烃、叠氮化物、硫醇、二硫醇、环辛烯、烯烃、醛、酮、四嗪和降冰片烯组成的组。在某些实施方案中,所述第二反应性基团是炔烃或叠氮化物。在某些实施方案中,所述第一反应性基团和所述第二反应性基团经由点击反应而偶联。在某些实施方案中,所述第二反应性基团通过接头偶联至所述支持物。在某些实施方案中,所述接头是键或任选取代的亚烷基或任选取代的杂亚烷基。在某些实施方案中,所述支持物是阵列。在某些实施方案中,所述支持物是珠子。在某些实施方案中,所述与第一反应性基团偶联的氨基酸是末端氨基酸。
在某些实施方案中,所述与第一反应性基团偶联的氨基酸是内部氨基酸。在某些实施方案中,(a)中的氨基酸与(c)中的偶联至标记物的氨基酸相同。在某些实施方案中,(a)中的氨基酸不同于(c)中的偶联至标记物的氨基酸。在某些实施方案中,(c)进一步包括:在(b)之前,使所述标记物偶联至所述肽的氨基酸。在某些实施方案中,(c)进一步包括:在(b)之后,使所述标记物偶联至所述肽的氨基酸。
在某些实施方案中,所述标记物偶联至报告部分。在某些实施方案中,所述报告部分偶联至第三反应性基团或抗体。在某些实施方案中,所述第三反应性基团或所述抗体设置为与(c)中所述肽的氨基酸偶联。在某些实施方案中,(c)中所述肽的氨基酸是末端氨基酸。在某些实施方案中,(c)中所述肽的氨基酸是内部氨基酸。在某些实施方案中,所述报告部分偶联至接头,其中所述抗体偶联至(c)中所述肽的氨基酸。
本申请的另一方面提供了一种用于测定样品中的肽的序列的试剂盒,所述试剂盒包含:报告子;标记物,其包含第一反应性基团和(i)第二反应性基团或(ii)保护基团,其中所述第一反应性基团设置为与氨基酸类型的氨基酸偶联,其中所述第二反应性基团设置为与所述报告子偶联,所述报告子包含被设置为发射信号的报告部分,且其中所述保护基团设置为防止所述标记物和所述报告部分之间的偶联;和关于使用所述标记物来处理所述肽以提供包含与所述标记物偶联的氨基酸的肽的说明。
在某些实施方案中,其中所述报告子与第三反应性基团偶联,所述第三反应性基团设置为与所述第二反应性基团反应。在某些实施方案中,所述报告子设置为在激发时发射信号。在某些实施方案中,所述报告子包含荧光染料。在某些实施方案中,所述报告子包含间隔子。在某些实施方案中,所述保护基团不发射光学可检测信号。
在某些实施方案中,所述试剂盒包含蛋白捕获试剂。在某些实施方案中,所述蛋白捕获试剂包含偶联至可切割接头的固体支持物,其中所述可切割接头与醛偶联。在某些实施方案中,所述蛋白捕获试剂设置为与所述肽的N-端偶联。在某些实施方案中,所述固体支持物是珠子。在某些实施方案中,所述醛是吡啶甲醛(PCA)或其衍生物。
在某些实施方案中,所述试剂盒进一步包含表面附着试剂。在某些实施方案中,所述表面附着试剂包含炔烃或叠氮化物。在某些实施方案中,所述表面附着试剂设置为与所述肽的C-端偶联。在某些实施方案中,所述试剂盒进一步包含所述表面附着试剂所附着的支持物。在某些实施方案中,所述支持物是显微镜载玻片。在某些实施方案中,所述试剂盒进一步包含至少一种蛋白酶、至少一种消化试剂和固体支持珠子。
在某些实施方案中,所述方法进一步包括:在(c)之后,使所述肽经受足以从所述肽的末端端部除去氨基酸的条件。在某些实施方案中,所述条件是埃德曼降解条件。在某些实施方案中,所述方法进一步包括:重复(c)和(d)一次或多次以鉴定所述肽的多个氨基酸的信号模式,所述多个氨基酸的信号模式包括(d)中的所述信号或其变化。在某些实施方案中,所述方法进一步包括:使用所述多个氨基酸的信号模式来得到所述肽的序列。
本申请的另一个方面提供了包含机器可执行代码的非暂时性计算机可读介质,所述机器可执行代码在由一个或多个计算机处理器执行时实现上文或本文别处的任何方法。
本申请的另一个方面提供了一种系统,其包括一个或多个计算机处理器和与其相连的计算机存储器。所述计算机存储器包含机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时实现上文或本文别处的任何方法。
根据以下详细描述,本领域技术人员将容易地明白本申请的其它方面和优点,其中以下详细描述仅显示和描述了本申请的示例性实施方案。如将意识到的,本申请能够具有其它和不同的实施方案,并且其若干细节能够在各种明显方面进行修改,所有这些均不背离本申请。因此,附图和描述在性质上应被认为是示例性的,而不是限制性的。
通过引用并入
本说明书中提及的所有出版物、专利和专利申请都通过引用并入本文,其程度如同明确地且单独地指出每篇单独的出版物、专利或专利申请通过引用并入。在通过引用并入的出版物和专利或专利申请与说明书中所包含的公开内容相冲突的情况下,本说明书意在替代和/或优先于任何这样的相冲突的材料。
附图说明
本发明的新颖特征尤其特别在所附权利要求中阐述。通过参考阐述示例性实施方案(其中利用了本发明的原理)的下述详细描述和附图(在本文中也称作“图”),将获得对本发明的特征和优点的更好理解,在附图中:
图1A显示了肽的实施例,该肽设置为与第一支持物、第二支持物和标记物偶联,所述标记物设置为与报告部分或保护基团偶联。
图1B示出了通过N-端与第一支持物偶联、通过C-端与第二支持物偶联和通过内部氨基酸与多个标记物偶联的肽。
图2显示了用于分析肽的方法的实施例,所述方法包括将所述肽经由N-端氨基酸捕获在支持物上,使至少一个标记物偶联至所述肽,从所述支持物释放标记的肽,和使所述标记的肽偶联至表面。
图3提供了试剂盒的实施例,所述试剂盒包含设置在阵列中的多个氨基酸特异性标记物。
图4显示了试剂盒的实施例,所述试剂盒包含氨基酸特异性标记物和多种报告部分和保护基团,以及与标记物和氨基酸的不同组合一起设置的阵列。标记物和标记物的每种组合可以进一步与许多报告部分组合。
图5显示了使用N-端氨基酸结合剂(NAAB)对肽进行测序的方法的实施例。
图6显示了被编程或以其它方式配置以实施本文提供的方法的计算机系统。
图7示出了用于标记和固定肽的方法。
图8示出了将肽捕获在提杆上的工作流程。
图9描绘了用双官能化、氨基酸特异性的标记物来标记肽的试剂盒。
图10提供了用氨基酸特异性标记物来选择性标记肽的试剂盒。
图11提供了计算设计并然后使用本申请的标记-荧光团试剂盒的示例性工作流程。
图12A至图12D提供了用埃德曼降解(E1-E7)和非降解(M1-M4)步骤的荧光测序实验的荧光减少结果。在每个实验中标记的氨基酸的类型显示在每个图的左侧。图12A用标记的半胱氨酸进行。图12B用标记的谷氨酸进行。图12C用标记的磷酸丝氨酸进行。图12D用标记的赖氨酸进行。
具体实施方式
尽管本文已经显示和描述了本发明的各种实施方案,但是对本领域技术人员来说明显的是,这样的实施方案仅以示例性提供。在不背离本发明的情况下,本领域技术人员可以做出众多改动、改变和替换。应当理解,可以采用本文描述的本发明实施方案的各种替代方案。
每当术语“至少”、“大于”或“大于或等于”在一系列两个或多个数值中的第一个数值之前时,术语“至少”、“大于”或“大于或等于”适用于该系列数值中的每个数值。例如,大于或等于1、2或3等同于大于或等于1、大于或等于2、或大于或等于3。
每当术语“不大于”、“小于”或“小于或等于”在一系列两个或多个数值中的第一个数值之前时,术语“不大于”、“小于”或“小于或等于”适用于该系列数值中的每个数值。例如,小于或等于3、2或1等同于小于或等于3、小于或等于2、或小于或等于1。
本文中使用的术语“分析物”通常表示测量或鉴定其存在或不存在的物质(例如,分子)。分析物可以是一种物质(例如,分子),可使用针对其的可检测探针来鉴定该种物质的存在或不存在。作为非限制性实施例,分析物可以是大分子,例如肽或蛋白。分析物可以是含有或疑似含有其它组分的样品的一部分,或者可以是样品的唯一或主要组分。分析物可以是完整细胞或组织的组分、细胞或组织提取物、经分级分离的裂解物(fractionatedlysate)或细胞或组织、或基本上纯化的分子。在某些实施方案中,所述分析物是肽。
如在本文中互换使用的术语“多肽”和“肽”通常表示氨基酸的聚合物,其中一个氨基酸可以通过肽键连接至另一个氨基酸。在某些实施例中,肽是蛋白。氨基酸可以是天然存在的氨基酸或非天然存在的氨基酸(例如,氨基酸类似物)。肽可以是直链的或支链的。肽可以包括经修饰的氨基酸。所述肽可以被非氨基酸中断。肽可以作为单链或缔合的链的形式。所述肽可以包括多个氨基酸。肽可以具有二级和三级结构(例如,肽可以是包含确定的二级、三级和四级结构的蛋白)。在某些实施例中,肽包含至少2、3、4、5、6、7、8、9、10、20、30、40、50、100、1000、10000个或更多个氨基酸。肽可以是较大聚合物的片段。在某些实施例中,肽是较大肽的片段,诸如蛋白的片段。
本文中使用的术语“氨基酸”通常表示天然存在的或非天然存在的氨基酸(例如,氨基酸类似物)。非天然存在的氨基酸可以是工程化或合成的氨基酸。氨基酸可包含“侧链”,其可以将氨基酸类型彼此区分开。
本文中使用的术语“氨基酸序列”、“肽序列”和“多肽序列”通常表示共价连接(例如,通过肽(酰胺)键或肽键类似物)的至少两个氨基酸或氨基酸类似物的序列。肽序列可以表示完整序列或序列的一部分。例如,肽序列可以含有缺口、具有未知身份的位置或可以适应不同物种的位置。
本文中使用的术语“侧链”通常表示连接至α碳(附接氨基酸的胺和羧酸基团)的结构,其对于每个氨基酸类型可能是独特的。侧链可以具有特定的形状、大小、电荷、反应性或其组合。侧链可以含有碱性部分(例如,精氨酸中的胍基基团)、酸性部分(例如,天冬氨酸中的羧酸)、极性部分(例如,丝氨酸、苏氨酸和酪氨酸中的羟基基团)、疏水部分(例如,亮氨酸、异亮氨酸、丙氨酸和缬氨酸中的烷基基团)或它们的任意组合。在某些情况下,氨基酸含有超过一个的侧链。侧链可以是或包括氢、烷基基团、羟基基团、芳基基团、杂芳基基团、羧酸、酰胺、胺、胍、硫醇、硫醚、硒醇或它们的任意组合。在某些实例中,侧链是氢(具有氢侧链的氨基酸可以是例如甘氨酸)。
本文中使用的术语“可切割单元”通常表示分子的可以用于将分子分裂或解离成两个或更多个其它分子的部分。可切割单元可以在切割条件下分裂。切割条件的非限制性实例包括使用酶、亲核试剂或碱性试剂、还原剂、光辐照、亲电或酸性试剂、有机金属或金属试剂,和氧化试剂。
本文中使用的术语“样品”通常表示含有或疑似含有肽的化学或生物样品。例如,样品可以是含有一种或多种肽的生物样品。生物样品可以从以下物质得到(例如,提取或分离)或包括以下物质:血液(例如,全血)、血浆、血清、尿液、唾液、粘膜分泌物、痰、粪便和泪液。所述生物样品可以是流体或组织样品(例如,皮肤样品)。在某些实施例中,样品来源于匀浆化的组织样品(例如,脑匀浆、肝匀浆、肾匀浆)。在某些实施方案中,样品取自特定类型的细胞(例如,神经元细胞、肌肉细胞、肝细胞、肾细胞)。样品可以获自于患病的细胞或组织(例如,肿瘤细胞、坏死细胞)。在某些实施例中,样品来自疾病相关的内含物(例如,噬斑、生物膜、肿瘤、非癌性生长)。在某些实施例中,样品得自于无细胞体液,诸如全血、唾液或尿液。在某些实施例中,样品可以包括循环的肿瘤细胞。在某些实施例中,样品是环境样品(例如,土壤、废弃物、环境空气)、工业样品(例如,来自任何工业过程的样品)和食品样品(例如,乳制品、蔬菜产品和肉制品)。可以在上样至微流控装置之前,对样品进行处理。例如,可对样品进行处理以纯化肽和/或包括试剂。
本文中使用的术语“支持物”通常表示可以将物质(例如,分子构建体)固定到其上的实体。该实体可以是固体或半固体(例如,凝胶)支持物。作为非限制性实例,支持物可以是珠子、聚合物基质、阵列、显微镜载玻片、玻璃表面、塑料表面、透明表面、金属表面、磁性表面、多孔板、纳米颗粒、微米颗粒、提杆(lantern),或官能化的表面。支持物可以是平坦的。作为替代方案,支持物可以是非平坦的,诸如包括一个或多个孔。珠子可以是例如大理石、聚合物珠子(例如,多糖珠子、纤维素珠子、合成的聚合物珠子、天然的聚合物珠子)、硅胶珠子、官能化的珠子、活化的珠子、条形码化的珠子、标记的珠子、PCA珠子、磁珠或其组合。珠子可以经功能基序功能化。功能基序的一些非限制性实例包括捕获试剂(例如,吡啶羧基醛(PCA))、生物素、链霉亲和素、strep-标签II、接头或可以与分子(例如,醛、磷酸盐、硅酸盐、酯、酸、酰胺、炔烃、叠氮化物或醛二硫杂环戊烷)反应的官能团。官能团可以特异性地偶联至肽的N-端或C-端。官能团可以特异性地偶联至氨基酸侧链。官能团可以偶联至氨基酸的侧链(例如,谷氨酸盐或天冬氨酸盐的酸,半胱氨酸的硫醇,赖氨酸的胺,或谷氨酰胺的酰胺,或天冬酰胺)。官能团可以特异性地偶联至特定物质(诸如标记物)上的反应性基团。在官能化的珠子的一些实施例中,功能基序可以被可逆地偶联和切割。功能基序也可以不可逆地与分子偶联。
本文中使用的术语“埃德曼(Edman)降解”通常表示使用异硫氰酸酯(例如,异硫氰酸苯酯)从肽的N-末端端部除去氨基酸的方法。埃德曼降解可以与各种肽测序和分析方法相结合。埃德曼降解可以依次进行。
本文中使用的术语“阵列”通常表示位点群。这样的位点群可以根据相对位置而彼此区分开。根据位点在阵列中的位置,可以将位于阵列的不同位点的不同分子彼此区分开。阵列的单个位点可以包括具体类型的一个或多个分子。例如,一个位点可以包括单个具有特定序列的肽,或者一个位点可以包括几个具有相同序列的肽。阵列的位点可以是位于同一基底上的不同特征。这样的特征可以包括但不限于基底中的孔、基底中或基底上的珠子(或其它颗粒)、基底的突起、基底上的脊或基底中的通道。阵列的位点可以是各自带有至少一个分子的单独基底。根据基底在与基底相关的表面上的位置或根据基底在液体或凝胶中的位置,可以鉴定附着到单独基底的不同分子。这样的不同的分子可以具有相同的或不同的序列。阵列可以包括一个或多个孔,并且一个或多个孔中的一个孔可以具有一个或多个珠子。作为一个替代方案,所述阵列可以是具有例如固定化在其上的分子的平面表面,或者作为另一个实施例,具有例如固定化在其上的一个或多个珠子。
本文中使用的术语“标记”通常表示可以偶联至反应性基团的分子或大分子构建体。标记可以包含至少一个反应性基团(例如,第一反应性基团和第二反应性基团)。至少一个反应性基团可以被设置为偶联至肽。至少一个反应性基团可以被设置为偶联至支持物。至少一个反应性基团可以被设置为偶联至报告部分。标记可以提供可测量的信号。
本文中使用的术语“聚合物基质”通常表示包含至少一种聚合物的(例如,连续的)相材料。在某些实施方案中,聚合物基质表示至少一种聚合物以及未被该聚合物占据的间隙空间。聚合物基质可以由一种或多种类型的聚合物组成。聚合物基质可以包括直链、支链和交联的聚合物单元。聚合物基质还可以含有插入在其未被聚合物链占据的间隙空间内的非聚合物物质。所述插入的物质可以是固态、液态或气态物质。例如,术语“聚合物基质”可以涵盖干燥的水凝胶、水合的水凝胶和含有玻璃纤维的水凝胶。
本文中使用的术语“报告部分(reporter moiety)”通常表示产生可测量信号的试剂。这样的信号可以包括但不限于荧光(例如,染料)、可见光、移动(例如,质量标签)、辐射或核酸序列(例如,条形码)。这样的信号可以包括但不限于荧光、磷光或辐射。这样的信号可以是光(或电磁辐射)。光可以包括电磁波谱的可见光部分中的频率或频率分布。例如,光可以是红外线或紫外线。信号可以是静电、导电或阻抗信号。信号可以是电荷。“报告子”可以包含“报告部分”。所述报告子可以包含反应性基团。所述反应性基团可以被设置为偶联至标记物。
单分子肽测序可以用于各种应用,诸如蛋白质工程、生物工程和系统生物学。提供具有提高的速度、准确度、多功能性和易用性的单分子蛋白测序平台可以加速广泛的生物和化学学科的研究。与单分子肽测序相关的挑战例如包括高用户输入要求、无法处理受试肽的复杂性或修饰(诸如翻译后修饰)以及速度和易用性。
可以从肽分子或肽分子的一个或多个部分获得肽序列信息。肽测序可以提供关于肽序列或一部分肽序列的完整或部分氨基酸序列信息。可以在单分子水平上确定肽序列的至少一部分。在某些情况下,部分氨基酸序列信息包括例如特定类型氨基酸(例如,赖氨酸)在肽或一部分肽中的相对位置,可能足以唯一地鉴定单个肽分子。例如,氨基酸的模式,诸如X-X-X-Lys-X-X-X-X-Lys-X-Lys(SEQ ID NO:1),其指示单个肽分子内赖氨酸分子的分布,从而可以对照给定生物体的已知蛋白质组来搜索以鉴定该单个肽分子。这样的信息可以用于鉴定源自于该肽的大分子(例如,蛋白),并且可以必要需要鉴定肽的所有氨基酸。
肽测序可用于从多种肽分子的混合物中的单个肽分子来获取信息(包括,例如氨基酸序列信息)。本申请的方法可以包含检测与固定在固体表面(包括例如玻璃载玻片或其表面经化学修饰的玻璃载玻片,塑料载玻片、多孔板、盒子)上的一个肽或多个肽的氨基酸偶联的报告部分。在某些情况下,检测包括光学(例如,荧光)检测。在某些情况下,报告部分包含荧光基团。在某些情况下,报告部分包含与一个肽或多个肽的多种类型的氨基酸偶联的多种氨基酸类型特异性标记物。在某些情况下,检测包括单分子(例如,单个肽)灵敏度。
众多商购可得的光学装置可以以这样的方式应用。例如,配备有全内反射照明和增强型电荷耦合器件(CCD)检测器的常规显微镜可以适用于本申请的测序方法。高灵敏度CCD照相机可以被设置为同时记录分布在表面上的多个独立(例如,单个)肽分子的荧光强度,并且可以偶联至图像分离器以促进多个不同图像(例如,包含第一波长的光的第一图像和包含第二波长的光的第二图像)的同时收集。使用带有自动聚焦控制的电动显微镜载物台对流动池中的多个载物台位置成像,可以允许在单个实验中分析(例如,测序)数千、数万、数十万、数百万或更多独立的单个肽。
本申请提供了用于分析肽的一系列方便且简单的方法。此外,本申请的一些方面提供了促进有效肽表征和分析的组合物。此外,在某些方面,本申请提供了能够进行有效肽分析的试剂盒。
1.蛋白质组学
蛋白质组学是对存在于生物体、系统或生物群落中的蛋白的大规模研究。蛋白是生物体的基础,促进了生命进行的大部分化学和物理过程。因此,在细胞、生物体或系统中表达的蛋白组通常强烈反映健康、生物状态、生物活性和物理条件(例如,热应激、营养耗竭或刺激)。因此,肽测序是可以用于蛋白质组学领域内各种应用的工具。
本申请提供了用于肽(例如,蛋白)分析(例如,组成分析和测序)的方法和系统。本申请的方法能够以提供各种非限制性益处的方式对肽(例如,蛋白)进行分析(例如,测序),诸如(i)对包含经化学修饰的N-端氨基酸的蛋白或肽(例如,ADP-核糖基化、荧光团等)进行测序,
(ii)对包含非天然氨基酸残基的蛋白或肽(例如,β-氨基酸、类肽、PNA等)进行测序,或(iii)尽量降低染料的交叉反应性。肽测序可以用于揭示用于诊断癌症和其它疾病或理解健康细胞功能的新型生物标志物。由细胞或组织产生的肽可以作为独特的生物标志物。通过肽测序增强对这些生物标志物的检测可以提供更早、更准确的疾病诊断。
本文提供了通过简化、优化或以其它方式提高肽处理或分析的速度、效率或准确度来增强生物标志物的检测的系统、方法和试剂盒。
本申请的方法可以被设置为分析样品中浓度跨越至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9或至少10个数量级的肽。例如,本申请的方法可以允许同时测量来自人血清的免疫球蛋白和细胞因子,而这些肽由于其7+数量级浓度差异而在传统上是难以同时检测的。本申请的方法可以被设置为鉴定样品中的至少100、至少500、至少1000、至少5000、至少104、至少5×104、至少105或至少5×105种不同蛋白。本申请的方法可以被设置为鉴定样品(例如,人肺匀浆)中的至少50、至少100、至少150、至少200、至少250、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1200、至少1500、至少1800、至少2000、至少2500、至少3000、至少3500、至少4000或至少5000种类型的蛋白。本申请的方法可以被设置为同时(例如,在单次测定内)鉴定样品(例如,血沉棕黄层裂解物)中的至少50、至少100、至少150、至少200、至少250、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1200、至少1500、至少1800、至少2000、至少2500、至少3000、至少3500、至少4000或至少5000种类型的蛋白。本申请的方法可以被设置为鉴定生物样品(例如,人生物样品)中的至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的肽类型。例如,本申请的方法可包括将半胱氨酸特异性和赖氨酸特异性的标记物偶联至源自于人尿液样品的多个肽,将约105种肽固定到玻璃载玻片上,对肽进行连续几轮的标记物检测和N-端氨基酸除去,并将经鉴定的半胱氨酸和赖氨酸肽序列与已知人尿液肽的数据库进行对比,由此鉴定样品中约105种肽中的至少60%。
2.氨基酸选择性标记物
本申请提供了用于选择性地标记氨基酸(例如用于肽测序)的一系列组合物、系统和方法。通过选择性标记特定氨基酸类型(例如,半胱氨酸、赖氨酸、组氨酸、酪氨酸、苏氨酸、丝氨酸、精氨酸、谷氨酸、天冬氨酸盐、色氨酸或它们的任意组合)和氨基酸位置(例如,N-端或C-端氨基酸),可以改进样品制备。标记物可以包含第一反应性基团,其被设置为偶联至特定氨基酸类型(例如,精氨酸)或氨基酸类型集合(例如,赖氨酸和半胱氨酸)。
本申请的组合物、系统或方法可以选择性地标记半胱氨酸、赖氨酸、酪氨酸、组氨酸、谷氨酸、天冬氨酸、酪氨酸、苏氨酸、丝氨酸、精氨酸、N-端胺、C-端羧基基团或它们的任意组合。组合物、系统或方法可以选择性地标记一组氨基酸,例如特定的马来酰亚胺试剂可以被设置为偶联至样品中存在的赖氨酸和半胱氨酸残基。组合物、系统或方法可以选择性地标记单个氨基酸,例如特定的环氧化物试剂可以被设置为选择性地偶联至组氨酸残基,而不是其它氨基酸类型。
本申请提供了用于选择性地标记特定氨基酸类型(例如,半胱氨酸)和氨基酸组(例如,含有羧酸酯侧链的氨基酸,诸如谷氨酸和天冬氨酸)的一系列试剂。半胱氨酸特异性标记物的非限制性实例可以包括某些碘乙酰胺、硫醇、苄基和烯丙基卤化物、硒代氰酸酯、马来酰亚胺和炔烃(例如,某些炔烃酰胺)。在某些情况下,马来酰亚胺可以被设置为偶联至半胱氨酸和赖氨酸。在下面的方案2中示出了半胱氨酸标记方案的实例,其中半胱氨酸硫醇至碘乙酰胺。
方案2
Figure BDA0004041285780000161
赖氨酸特异性标记物的非限制性实例可以包括某些硫氰酸酯和异硫氰酸酯、马来酰亚胺、醛、靛红酸酐和NHS酯。例如,赖氨酰基丁基胺侧链可以选择性地偶联至NHS酯,如在方案3中所示出。
方案3
Figure BDA0004041285780000162
肽羧酸酯(例如,谷氨酸酯、天冬氨酸酯和C-端羧酸酯)可以通过亲核偶联步骤进行标记。方案4中提供了该偶联方法的实例,其示出了通过基于胺的亲核取代将羧基转化为酰胺。
方案4
Figure BDA0004041285780000163
酪氨酸特异性标记物的非限制性实例可以包括某些芳基重氮化合物、曼尼西反应试剂(例如,胺和甲醛)和亚胺。方案5提供了包含芳基重氮化合物的酪氨酸特异性标记物方案的实例。
方案5
Figure BDA0004041285780000171
组氨酸特异性标记物的非限制性实例可以包括某些α,β-不饱和酮和环氧化物。方案6中提供了组氨酸特异性标记物方案的实例,其示出了用2-环已烯酮试剂的组氨酸标记。
方案6
Figure BDA0004041285780000172
精氨酸标记物的非限制性实例包括精氨酸胍酰化和用乙二醛标记物衍生成嘧啶。方案7示出了借助于巴顿(Barton)碱通过NHS酯进行的精氨酸标记的实例。
方案7
Figure BDA0004041285780000173
精氨酸标记物的非限制性实例包括二苯甲酮和氧氮杂环丙烷,诸如在方案8中示出了氧氮杂环丙烷标记过程。
方案8
Figure BDA0004041285780000181
色氨酸标记物的非限制性实例可以包括重氮基丙酸酯和光活化卤代烯烃。方案9提供了用重氮基丙酸酯对色氨酸吲哚进行标记以产生胺衍生化的色氨酸的实例。
方案9
Figure BDA0004041285780000182
本申请还提供了用于标记翻译后修饰的氨基酸的一系列组合物、系统和方法。可被标记的翻译后修饰的氨基酸的非限制性实例包括磷酸化的氨基酸、糖基化的氨基酸、亚硝酰化的氨基酸、瓜氨酸化的氨基酸、亚磺酰化的氨基酸和三甲基化的氨基酸。例如,如方案10所示,磷酸丝氨酸或磷酸苏氨酸也可以通过磷酰基β-消除然后标记共轭加成来选择性地标记。
方案10
Figure BDA0004041285780000183
荧光测序
本申请的各个方面提供了用于肽荧光测序的组合物、系统和方法。本文公开的荧光测序方法可以在单分子水平提供肽序列信息。例如,可以使用荧光测序方法来鉴定肽条形码的序列,或同时确定多个肽条形码的序列。在美国专利号9,625,469、美国专利申请系列号16/709,903和美国专利申请系列号15/510,962中提供了示例性的荧光测序方法。与本申请一致的方法可以对肽进行荧光测序和其它形式的分析。
许多荧光测序方法的特有特征是使氨基酸标记物与待测序的肽偶联。标记物可以是氨基酸特异性标记物(例如,被设置为偶联至特定类型的氨基酸或特定氨基酸类型集合)。荧光测序方法可以包括:用单独的氨基酸类型特异性标记物来标记多种类型的氨基酸。荧光测序方法可以八廓:标记受试肽或蛋白中的一种、两种、三种、四种、五种、六种或更多种不同类型的氨基酸残基。肽可以包含在N-端氨基酸、半胱氨酸、赖氨酸、谷氨酸、天冬氨酸、色氨酸、酪氨酸、丝氨酸、苏氨酸、精氨酸、组氨酸、甲硫氨酸或它们的任意组合上的标记物。肽可以包含在非经典氨基酸,诸如磷酸丝氨酸/磷酸苏氨酸、焦谷氨酸、羟脯氨酸、叠氮赖氨酸、脱氢丙氨酸或它们的任意组合上的标记。这些氨基酸残基中的每一种都可以用不同的标记物来标记。多个氨基酸残基可以用相同的标记物来标记,诸如(i)天冬氨酸和谷氨酸或(ii)丝氨酸和苏氨酸。
标记可以包含报告部分。报告部分可以是光学可检测的(例如,荧光、磷光、发光或吸光)。报告部分可以是电化学可检测的(例如,具有特征性氧化或还原电位的氧化还原活性部分)。报告部分可以包含质量标签(例如,用于质谱法鉴定)。报告部分可以鉴定其所附着的标记物。多个标记可以包含多个可检测部分,它们通过它们的类型鉴定所述多个标记中的标记物。例如,一种方法可以包括多个类型的标记,所述标记被设置为偶联至不同的氨基酸,每一种氨基酸包含不同的报告部分,所述报告部分通过其类型唯一地鉴定所述标记。
标记物可以包含反应性基团。反应性基团可以被设置为偶联至报告部分、保护基团或它们的任意组合。一种方法可以包括:将标记物偶联至肽的氨基酸(例如,将标记物偶联至特定类型的每个氨基酸),并然后将报告部分或保护基团偶联至所述标记物。一种方法可以包含将多种类型包含反应性基团的标记物偶联至肽的多个氨基酸,并基于它们的类型将多个报告部分、保护基团或其组合偶联至标记物。一种方法可以包含将多种类型的标记物偶联至肽的多个氨基酸,其中所述多种类型的标记物包含具有反应性基团的标记物、具有报告部分的标记物(例如,与染料偶联的半胱氨酸反应性标记物)、缺少反应性基团和报告部分的标记物或它们的任意组合。
标记物(例如,包含被设置为偶联至报告部分或保护基团的反应性基团的标记)可以可逆地或不可逆地结合一种氨基酸类型,并因此可以与靶标肽化学地(例如,通过添加裂解试剂)或物理地(例如,通过施加热或光)解偶联。因此,一种方法可以包含封闭第一氨基酸,标记第二氨基酸类型(例如,苏氨酸),解封闭所述第一氨基酸类型,以及标记所述第一氨基酸类型。可逆标记物的实例可以包括硅烷(例如,三甲基硅烷)、乙酰基基团、苯甲酰基基团、不饱和的吡喃和呋喃基团、脲形成基团、氨基甲酸酯形成基团、碳酸酯形成基团、硫脲形成基团、硫代氨基甲酸酯形成基团、硫代碳酸酯形成基团,及其衍生物。不可逆标记物的实例可以包括烷基基团、氧代基团、酰胺形成基团(例如,被设置为将胺转化为酰胺的酰氯)及其衍生物。
标记特异性可能是荧光测序方法的主要挑战。在许多情况下,标记物可具有对多种氨基酸类型的反应性。例如,一些马来酰亚胺标记物可以与半胱氨酸、赖氨酸和N-端胺反应。可以采用多种策略来利用或防止这样的交叉反应。方法可包括依次氨基酸标记,例如以确保在对一种或多种该多特异性标记所设置为与之偶联的氨基酸类型进行化学阻断或标记且因此不能与多多特异性标记物反应之后,才将多特异性标记物添加到系统中。
荧光测序可包括:在检测受试肽之后或之前,通过诸如化学切割、埃德曼降解或其它形式的酶切割等技术除去肽。依次肽除去可能产生序列或位置特异性的信息。例如,N-端氨基酸除去步骤后荧光的降低可能指示,经标记的氨基酸,和因此特定类型的氨基酸设置于肽N-端。每个氨基酸残基的除去可以通过多种不同的技术进行,包括埃德曼降解和溶蛋白性切割(proteolytic cleavage)。所述技术可包括使用埃德曼降解除去末端氨基酸残基。可替代地,所述技术可包括使用酶除去末端氨基酸残基。这些末端氨基酸残基可以从肽链的C-端或N-端除去。在使用埃德曼降解的情况下,在肽链的N-端处的氨基酸残基被除去。
本申请的标记物、报告部分或保护基团可以被设置为耐受从肽除去一个或多个氨基酸残基的条件。可用在本发明方法中的潜在报告部分的一些非限制性实例包括例如在红色到红外光谱中发射荧光信号的那些,诸如Alexa Fluor
Figure BDA0004041285780000201
染料、Atto染料、Janelia Fluor
Figure BDA0004041285780000202
染料、罗丹明染料或其它类似染料。能够耐受除去氨基酸残基的条件的这些染料中的每种染料的实例包括Alexa Fluor
Figure BDA0004041285780000203
405、罗丹明B、四甲基罗丹明、Janelia Fluor
Figure BDA0004041285780000204
549、Alexa Fluor
Figure BDA0004041285780000205
555、Atto647N和(5)6-萘并荧光素(napthofluorescein)。报告部分可以包含荧光肽(例如,绿色荧光蛋白或其变体)或光学可检测的材料,诸如碳纳米管、纳米棒或量子点。
肽检测或成像可包括将肽固定在表面上。通过使肽衍生的半胱氨酸残基、肽N-端或肽C-端与表面或者与偶联至表面的试剂偶联,可以将肽固定在表面上。通过使半胱氨酸残基与表面或者与偶联至表面的捕获试剂反应,可以固定肽。通过使肽C-端或N-端与本文描述的捕获部分偶联,可以固定肽。可以将肽固定在表面上。检测经固定的肽可以包括捕获包含肽的图像。该图像可以包括特定于该肽的空间地址。可以在单个图像中检测多个肽,其中一个或多个肽可以包含图像内的空间地址。所述表面可以在可见光谱和/或红外光谱范围是光学透明的。所述表面可以具有低折射率(例如,1.3至1.6之间的折射率)。所述表面可以是10至50nm厚、20至80nm厚、50至200nm厚、100至500nm厚、200至800nm厚、500nm至1μm厚、1至5μm厚、2至10μm厚、5至20μm厚、20至50μm厚、50至200μm厚、200至500μm厚或大于500μm的厚度。所述表面可以对有机溶剂具有化学抗性。所述表面可以对强酸(诸如三氟乙酸或硫酸)具有化学抗性。本文描述的方法中可使用多种基材(如含氟聚合物(Teflon-AF(Dupont)、Cytop
Figure BDA0004041285780000211
(Asahi Glass,日本))、芳族聚合物(聚二甲苯类(Parylene,Kisco,Calif.)、聚苯乙烯、聚甲基丙烯酸甲酯)和金属表面(金涂层)、涂布方案(旋涂、浸渍涂布、金属电子束沉积、热气相沉积和等离子体增强化学气相沉积)和官能化方法(聚烯丙胺接枝、在PECVD中使用氨气、掺杂长链末端官能化的氟代烷烃等)来作为有用的表面。本文描述的方法中可使用由Cytop
Figure BDA0004041285780000212
制成的20nm厚的光学透明的含氟聚合物表面。本文使用的表面可以进一步用多种氟代烷烃衍生化,这些氟代烷烃将螯合用于测序的肽和用于选择的经修饰靶标。可替代地,本文描述的方法中可使用氨基硅烷修饰的表面。该方法可包括将肽固定在珠子、树脂、凝胶、石英颗粒、玻璃珠或其组合的表面上。在某些非限制性实施例中,该方法考虑使用已固定在Tentagel
Figure BDA0004041285780000213
珠子、Tentagel
Figure BDA0004041285780000214
树脂或其它类似珠子或树脂的表面上的肽。本文使用的表面可以涂覆有聚合物,诸如聚乙二醇。所述表面可以是胺官能化的或硫醇官能化的。
本文描述的测序技术可包括对肽或蛋白进行成像以确定与肽偶联的一种或多种标记物或报告部分(例如,氨基酸标记物)的存在。所述测序技术可包括对多种肽或蛋白进行成像以确定一种或多种标记物或报告部分在该多种肽的单个肽上的存在。所述测序技术可包括对至少103、至少104、至少105、至少106、至少107、至少108或更多种蛋白或肽进行成像(例如,对包含至少103至至少108种蛋白或肽的表面的一部分进行成像)。这些图像可以在每次除去氨基酸残基后拍摄,并因此可以能够确定特定氨基酸在肽序列中的位置。例如,C-端固定的肽可以包含KDDYAGGGAAGKDA(SEQ ID NO:2,其中‘K’表示赖氨酸,‘D’表示天冬氨酸,‘Y’表示酪氨酸,‘A’表示丙氨酸,且‘G’表示甘氨酸)的序列(从N-端到C-端),并且可以包含与每个赖氨酸和酪氨酸残基偶联的标记物。包含C-端固定的肽的第一图像可以指示肽中存在两个赖氨酸和一个酪氨酸。可以除去N-端氨基酸(例如,通过埃德曼降解),使得包含C-端固定的肽的第二图像可以指示肽中存在一个赖氨酸和一个酪氨酸。可以重复该过程直到针对肽鉴定出KXXYXXXXXXXKX(SEQ ID NO:3)的序列,其中‘X’表示非赖氨酸、非酪氨酸氨基酸,‘K’表示赖氨酸,且‘Y’表示酪氨酸。本申请的方法可以鉴定特定氨基酸在肽序列中的位置。可以使用方法来确定特定氨基酸残基在肽序列中的位置,或者这些结果可以用于确定肽序列中的氨基酸残基的完整列表。一种方法可以包含确定肽序列中一种或多种氨基酸残基的位置并将这些位置与已知的肽序列进行对比,这可以鉴定肽序列中的氨基酸残基的完整列表。例如,鉴定人蛋白的40个氨基酸片段中赖氨酸和半胱氨酸的位置可以唯一地鉴定该蛋白(例如,只有一种人蛋白含有在40个氨基酸片段中鉴定出的赖氨酸和半胱氨酸残基的特定模式)。
成像方法可包括多种不同的分光光度法和显微方法,诸如荧光测定法、漫反射法、干涉散射法、拉曼法、共振增强的拉曼法、红外吸收法、可见光吸收法、紫外吸收法和荧光方法。荧光方法可以采用这样的荧光技术,诸如荧光偏振、Forster共振能量转移(FRET)或时间分辨荧光。分光光度法和显微方法可以用于确定与单个肽偶联的一种或多种荧光团的存在。这种成像方法可以用于确定在特定肽序列上是否存在标记物。在重复除去氨基酸残基和对受试肽成像的循环之后,可以确定肽中标记的氨基酸残基的位置。
肽降解
本申请提供了用于温和且连续蛋白降解的一系列化学和酶促技术。降解可以用在一系列肽测序和分析方法中,例如用于在荧光测序测定中确定特定氨基酸的顺序或身份。可以使肽或蛋白迭代经受切割条件以确定其序列的至少一部分的序列。使用本文描述的方法和组合物,可以确定肽的完整序列。受控的氨基酸除去(例如,N-或C-端氨基酸除去)可以通过多种技术来进行,这些技术包括例如埃德曼降解、有机磷酸酯降解或溶蛋白性切割。在某些情况下,使用埃德曼降解来从肽N-或C-端除去单个末端氨基酸残基。在某些情况下,从肽中选择性除去N-端氨基酸残基。用于除去末端氨基酸的化学或酶促技术可以除去限定数目(例如,恰好一个、恰好两个、至多两个)的氨基酸。因此,用于分析肽的方法可包括连续的降解和分析步骤,使得每步中从N-端或C-端除去确定数目的氨基酸在分析期间提供位置和序列特定氨基酸鉴定。用于除去末端氨基酸的化学或酶促技术可以在确定的位置(例如,仅在两个丙氨酸残基之间,或仅在将N-端氨基酸与肽的其余部分连接的肽键处)切割肽。
埃德曼降解方法可包括:对肽N-端或C-端进行化学官能化(例如,以形成N-端胺的硫脲或胍衍生物),然后使官能化的末端氨基酸与试剂(例如,肼)、条件(例如,高或低的pH或温度)或酶(例如,对官能化的末端氨基酸具有特异性的埃德曼酶)接触以除去官能化的末端氨基酸。
双活化的磷酸酯或膦酸酯可以用于肽切割。这样的方法可以利用酸来除去官能化的氨基酸。双活化的磷酸酯或膦酸酯可以是二卤代磷酸酯。在其它实施方案中,所述技术涉及使用酶来除去末端氨基酸残基,诸如外肽酶或埃德曼酶(Edmanase)。例如,一种方法可以包含用双活化的磷酸酯来衍生化肽的N-端氨基酸,并使肽与对磷酸酯官能化的N-端氨基酸具有切割活性的埃德曼酶接触。
切割方法(例如,在测序方法中实施的切割方法)可包括酶切割。所述切割方法可包括使用单一蛋白酶、一系列蛋白酶(例如,以特定顺序提供)或蛋白酶的组合。在表1中提供了示例性的蛋白酶及其相关的切割位点。切割方法可包括使肽条形码与分子解偶联。例如,肽条形码可以包含可切割的接头,所述接头包含被表1中列出的蛋白酶识别的切割位点。在这样的情况下,切割位点的序列可能存在于可切割接头中,且不存在于肽条形码中。切割方法可包括使肽条形码片段化(例如,在肽条形码测序之前切割内部肽键)。
表1.示例性蛋白酶
Figure BDA0004041285780000231
Figure BDA0004041285780000241
肽切割可包括化学切割。与本申请一致的化学切割试剂的实例包括溴化氰、BNPS-粪臭素、甲酸、羟胺和2-硝基-5-硫氰基苯甲酸。肽条形码可以包含化学可切割部分,诸如二硫化物。肽条形码可通过包含化学可切割部分的接头偶联至分子。肽条形码可以通过化学可切割的键与分子偶联。切割方法可包括化学和酶切割试剂的组合(例如,平行或顺序使用)。切割方法可包括活化(例如,官能化)氨基酸以进行化学或酶促切割。例如,方法可包括衍生化肽的N-端氨基酸残基,然后使肽与被设置为除去衍生化的N-端氨基酸残基的“埃德曼酶”接触。
肽切割条件可通过溶剂来实现。溶剂可以是水性溶剂、有机溶剂或其组合或混合物。溶剂可以是有机溶剂。有机溶剂可具有与水的混溶性。有机溶剂可以是无水的。溶剂可以是非极性溶剂(例如,己烷、二氯甲烷(DCM)、二乙基醚等)、极性非质子溶剂(例如,四氢呋喃(THF)、乙酸乙酯、二甲基甲酰胺(DMF)、乙腈(MeCN)、二甲亚砜(DMSO)等)或极性质子溶剂(例如,异丙醇(IPA)、乙醇、甲醇、乙酸、水等)。溶剂可以是DMF。溶剂可以是C1-C12卤代烷烃。C1-C12卤代烷烃可以是DCM。溶剂可以是两种或更多种溶剂的混合物。两种或更多种溶剂的混合物可以是极性非质子溶剂和C1-C12卤代烷烃的混合物。两种或更多种溶剂的混合物可以是DMF和DCM的混合物。溶剂的混合物可以是它们的任何组合。
降解过程可包括多个步骤。例如,方法可包括用于衍生化肽的末端氨基酸的初始步骤,以及从肽切割衍生化的末端氨基酸的后续步骤。一种这样的方法包括:有机磷化合物介导的N-端官能化和除去,并因此提供了对一些埃德曼降解方案中基于异硫氰酸酯(例如,异硫氰酸苯酯)的方法的替代方案。
基于有机磷酸酯的降解方案可包括:在有机碱(例如,三乙胺、N,N-二异丙基乙胺(DIPEA)、1,8-二氮杂双环[5.4.0]十一碳-7-烯(DBU)、吡啶、1,5-二氮杂双环(4.3.0)壬-5-烯、2,6-二叔丁基吡啶、咪唑、组氨酸、碳酸钠等)的存在下,将肽溶解在有机溶剂或有机溶剂混合物(例如,二氯甲烷和二甲基甲酰胺的混合物)中。然后可以使肽与至少一种有机磷化合物接触。通过添加弱酸(例如,在水中的甲酸)可以启动肽或蛋白N-端的切割。也可以用水启动肽或蛋白N-端的切割。所得产物可以包括以磷酰胺形式从肽释放的肽或蛋白的末端氨基酸以及缩短了末端氨基酸残基的肽或蛋白(其包含可以用于进行后续切割反应的游离N-端)。
切割方法可包括消化肽以产生具有所需平均长度的片段。切割方法可以产生平均长度为至少5个氨基酸、至少8个氨基酸、至少10个氨基酸、至少12个氨基酸、至少15个氨基酸、至少20个氨基酸、至少25个氨基酸、至少30个氨基酸、至少40个氨基酸或至少50个氨基酸的肽(例如,通过作用于肽的复杂混合物,例如细胞裂解物)。切割方法可以产生平均长度为至多50个氨基酸、至多40个氨基酸、至多30个氨基酸、至多25个氨基酸、至多20个氨基酸、至多15个氨基酸、至多12个氨基酸、至多10个氨基酸、至多8个氨基酸或至多5个氨基酸的肽。切割方法可以产生平均长度为5至20个氨基酸、5至30个氨基酸、10至20个氨基酸、10至30个氨基酸、12至18个氨基酸、15至30个氨基酸、20至40个氨基酸,或30至50个氨基酸之间的肽片段。
反应混合物可以包含化学计量或过量浓度的切割化合物(例如,相对于待切割肽的浓度)。反应混合物可以包含至少约0.001%v/v、约0.01%v/v、约0.1%v/v、约1%v/v、约5%v/v、约10%v/v、约15%v/v、约20%v/v、约30%v/v、约40%v/v、约50%v/v或更高的切割化合物。反应混合物可以包含至多约50%v/v、约40%v/v、约30%v/v、约20%v/v、约15%v/v、约10%v/v、约5%v/v、约1%v/v、约0.1%v/v、约0.01%v/v、约0.001%v/v或更低的切割化合物。反应混合物可以包含约0.1%v/v至约20%v/v、约0.5%v/v至约10%v/v、或约1%v/v至约10%v/v的切割化合物。反应混合物可以包含约5%v/v的切割化合物。
反应可以在至少约0℃、至少约5℃、至少约10℃、至少约15℃、至少约20℃、至少约25℃、至少约30℃、至少约40℃、至少约50℃、至少约60℃、至少约70℃、至少约80℃或至少约90℃的温度下进行。反应可以在至多约90℃、至多约80℃、至多约70℃、约60℃、约50℃、约40℃、约30℃、约25℃、约20℃、约15℃、约10℃、约5℃、约0℃或更低的温度下进行。反应可以在约0℃至约70℃、约10℃至约50℃、约20℃至约40℃、或约20℃至约30℃的温度下进行。反应可以在室温以上的温度(例如,约22℃至约27℃)下进行。反应可以在室温下进行。反应可以在接近0℃或0℃以下(例如,在防冻剂的存在下)进行。
肽和切割化合物可混合或孵育至少约1分钟、约5分钟、约10分钟、约20分钟、约30分钟、约40分钟、约50分钟、约60分钟、约2小时、约3小时、约4小时、约6小时、约8小时、约10小时、约12小时、约16小时、约20小时、约24小时或更久。肽和切割化合物可混合或孵育至多约24小时、约20小时、约16小时、约12小时、约10小时、约8小时、约6小时、约4小时、约3小时、约2小时、约1小时、约50分钟、约40分钟、约30分钟、约20分钟、约10分钟、约5分钟、约1分钟或更短。肽和切割化合物可混合或孵育约1分钟至约24小时、5分钟至约6小时、5分钟至约2小时,或5分钟至约30分钟。
具有多个反应性基团的标记物
本申请的方面提供了氨基酸标记物,其包含用于与氨基酸(或其部分,诸如氨基酸侧链的反应性官能团)偶联的第一反应性基团和用于与报告部分或保护基团偶联的第二反应性基团。这样的系统可以被称作“卡-扣(click-clack)”标记系统,其中“卡(click)”试剂表示被设置为与氨基酸偶联的标记物,且“扣(clack)”试剂表示被设置为与“卡(click)”试剂偶联的报告部分或保护基团。标记物的第二反应性基团可以被设置为可逆地或不可逆地偶联至报告部分、保护基团或它们的任意组合。第二反应性基团可以可逆地偶联至保护基团,与保护基团解偶联,并然后偶联至报告部分。例如,标记物可以带有与其第一或第二反应性基团偶联的保护基团(例如,与标记物的醛反应性基团偶联的二醇)。这样的模块化标记方法可使得多氨基酸标记方案能够降低氨基酸和标记类型之间的交叉反应性。这样的标记方法还可以通过在氨基酸标记步骤使化学敏感的报告部分(例如,pH敏感或化学可猝灭的染料)附接来使用该化学敏感的报告部分。例如,方法可包括:用第一标记物选择性地标记肽的半胱氨酸残基;用第二标记物选择性地标记肽的赖氨酸残基;用第三标记物选择性地标记肽的含有羧酸酯的残基(例如,天冬氨酸和谷氨酸);用第四标记选择性地标记肽的精氨酸残基;化学修饰(例如,氧化)肽的甲硫氨酸残基;用第五标记物选择性地标记肽的化学修饰的甲硫氨酸残基;以及,在单个步骤中,使不同的报告部分(例如,不同颜色染料)与所述第一、第二、第三、第四和第五标记物中的每一种偶联(例如,在同时添加所有标记试剂时)。还可以想象,一种或多种报告荧光团直接标记肽链上的氨基酸。本申请的双官能标记物可以防止标记物的第一反应性基团和报告部分之间的交叉反应性。例如,双官能标记物的使用可以允许使用与标记物的第一反应性基团具有交叉反应性的报告部分,诸如碘乙酰胺反应性染料和包含半胱氨酸反应性碘乙酰胺基团的标记物。
本申请的标记物可以用于交联两种生物物质,诸如两种氨基酸残基。例如,方法可包括使赖氨酸选择性标记物与第一肽偶联,并使半胱氨酸选择性标记物与第二肽偶联,然后使赖氨酸选择性标记物和半胱氨酸选择性标记物交联。交联可以为使赖氨酸和半胱氨酸选择性标记物直接偶联(例如,通过化学键),或可以包含接头,诸如被设置为偶联至赖氨酸和半胱氨酸选择性标记物的第二反应性基团的“扣”试剂。
表2中提供了包含第二反应性基团的氨基酸选择性标记物的实例以及用于其合成的示例性试剂对。半胱氨酸-和赖氨酸-选择性的“卡”标记物可以包含作为第一反应性基团的碘乙酰胺(例如,用于偶联至半胱氨酸或赖氨酸)和作为第二反应性基团的叠氮化物(例如,用于偶联至“扣”报告部分或保护基团),诸如表2的A行中所示的碘乙酰胺PEG叠氮化物化合物。半胱氨酸-选择性的“卡”标记物可以包含作为第一反应性基团的碘乙酰胺和作为第二反应性基团的降冰片烯,诸如表2的B行中所示的反应物。这种试剂可通过将降冰片烯胺与碘乙酰胺N-羟基琥珀酰胺酯偶联来合成。半胱氨酸-选择性的“卡”标记可以包含作为第一反应性基团的碘乙酰胺和作为第二反应性基团的醛,诸如2-碘-N-(3-氧代丙基)乙酰胺(如表2的C行中所示)。这种化合物可通过使N-羟基琥珀酰胺酯与包含偕二醚(其被构造为水解成醛)的胺偶联来产生。半胱氨酸-选择性标记物可以包含用于偶联至半胱氨酸的第一反应性基团,但是没有第二反应性基团(例如,所述标记物可以是“假(dummy)”标记物),并因此不能偶联至“扣”报告部分或保护基团试剂。这种试剂的实例可以是碘乙酰胺,如表2的D行中所示。
赖氨酸-选择性的“卡”标记物可以包含作为第一反应性基团的N-羟基琥珀酰胺酯和作为第二反应性基团的降冰片烯,诸如在表的F行中所示的试剂。赖氨酸-选择性的“卡”标记物可以包含作为第一反应性基团的N-羟基琥珀酰胺酯和作为第二反应性基团的偕二醚,诸如表2的G行所示的试剂。这种试剂可通过使1-羟基吡咯烷-2,5-二酮与包含偕二醚(geminal diether)的化合物的羧酸偶联来产生。赖氨酸-选择性标记物可以包含用于偶联至赖氨酸的第一反应性基团,但是没有用于偶联至“扣”报告部分或保护基团的第二反应性基团。这种试剂的一个实例可以是活化的酯,诸如表2的H行中所示的试剂。
羧酸酯-选择性的(例如,对天冬氨酸和谷氨酸侧链羧酸酯选择性的)“卡”标记物可以包含胺作为第一反应性基团和叠氮化物作为第二反应性基团,诸如在表2的I行中所示的试剂。羧酸酯-选择性的“卡”标记物可以包含胺作为第一反应性基团和降冰片烯作为第二反应性基团,诸如在表2的J行中所示的试剂。羧酸酯-选择性的“卡”标记物可以包含胺作为第一反应性基团和偕二醚作为第二反应性基团,诸如在表2的K和L行中所示的试剂。羧酸酯-选择性标记物可以包含用于偶联至羧酸酯的第一反应性基团,但是没有用于偶联至“扣”报告部分或保护基的第二反应性基团。这种试剂的实例可以是烷基胺,诸如表2的M行中所示的化合物。
磷酸丝氨酸-、磷酸苏氨酸-和/或糖基化-选择性的“卡”试剂可以包含二硫化物作为第一反应性基团,以及叠氮化物、降冰片烯、偕二醚或醛作为第二反应性基团,如表2的N-R行中所示。磷酸丝氨酸-、磷酸苏氨酸-和/或糖基化-选择性的“卡”试剂可以包含二硫化物作为第一反应性基团且可以没有第二反应性基团。
表2.与本申请一致的示例性“卡”标记物
Figure BDA0004041285780000281
Figure BDA0004041285780000291
可通过用多个系列的连续步骤标记多个氨基酸残基来改进样品制备。本申请提供了一系列有助于标记多种氨基类型的系统。所述系统可以最小化氨基酸、报告部分(例如,荧光分子(例如,染料))的交叉反应性,或最小化例如敏感报告部分(例如,荧光分子(例如,染料))的分解。
在另一个方面,本文提供了一种包含肽的系统,其中所述肽:被固定至至少一种支持物;且包含偶联至标记物的氨基酸,其中所述标记物包含(i)第一反应性基团,其被设置为偶联至第二反应性基团,所述第二反应性基团偶联至被设置为发射信号的报告部分,或(ii)保护基团,其被设置为防止所述标记物和所述第二反应性基团之间的偶联。
在另一个方面,本文提供了一种用于处理或分析肽的系统,包括:包含偶联至第一反应性基团的氨基酸的肽和偶联至第二反应性基团的支持物,其中所述第一反应性基团被设置为偶联至所述第二反应性基团以固定邻近所述支持物的肽。在某些实施方案中,所述系统被设置为将肽偶联至支持物(例如,表面)。在某些实施方案中,所述系统被设置为将肽的氨基酸残基偶联至支持物(例如,表面)。所述支持物(例如,表面)可包括被设置为偶联至官能团的反应性基团,所述官能团偶联至所述肽的氨基酸残基。
所述肽可以包含多个氨基酸。所述肽可以是包含氨基酸或氨基酸类似物的寡聚体或聚合物。所述肽可以包含为L-氨基酸或D-氨基酸的氨基酸。肽可以是合成的、重组的或天然存在的。合成的肽可以是体外通过人工手段产生的肽。所述多个氨基酸中的至少一个氨基酸可以选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、谷氨酰胺、天冬酰胺和色氨酸组成的组。所述多个氨基酸可以包含一种或多种氨基酸,所述一种或多种氨基酸选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、谷氨酰胺、天冬酰胺和色氨酸组成的组。所述肽可以包含选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、谷氨酰胺、天冬酰胺和色氨酸组成的组中的一种氨基酸。所述多个氨基酸可以包含非天然氨基酸。所述多个氨基酸可以包含D-氨基酸。
所述多个氨基酸中的至少一个氨基酸可以偶联至标记物。所述多个氨基酸可以包含至少两种或更多种氨基酸类型。所述至少两种或更多种氨基酸类型可以包含第一氨基酸类型和第二氨基酸类型。所述第一氨基酸类型可以偶联至第一标记物。所述第二氨基酸类型可以偶联至第二标记物。所述第一氨基酸类型可以偶联至第一标记物且所述第二氨基酸类型可以偶联至第二标记物。所述第一标记物和所述第二标记物可以各自偶联至不同的报告部分。所述多个氨基酸可以包含至少1、2、3、4、5、6、7、8、9、10、11种或更多种氨基酸类型。所述多个氨基酸可以包含2至20种氨基酸类型。所述多个氨基酸可以包含4至18种氨基酸类型。所述多个氨基酸可以包含6至16种氨基酸类型。所述多个氨基酸可以包含8至14种氨基酸类型。所述多个氨基酸可以包含9至11种氨基酸类型。并非多个氨基酸中的所有氨基酸类型都可被标记。所述至少两种氨基酸类型中的每种氨基酸类型可以偶联至不同的标记物。所述肽可以包含至少四种氨基酸类型,其中所述至少四种氨基酸类型中的每种氨基酸类型偶联至不同的标记物。并非全部所述多个氨基酸都可被标记。所述多个氨基酸中的每个可以被标记。
所述多个氨基酸可以包含至少两种氨基酸类型,且所述至少两种氨基酸类型中的每种氨基酸类型可以偶联至不同的标记物。所述肽可以包含至少三种氨基酸类型,其中所述至少三种氨基酸类型中的每种氨基酸类型偶联至不同的标记物。所述肽可以包含至少四种氨基酸类型,其中所述至少四种氨基酸类型中的每种氨基酸类型偶联至不同的标记物。所述肽可以包含至少5或6种氨基酸类型,其中所述至少5或6种氨基酸类型中的每种氨基酸类型偶联至不同的标记物。所述肽可以包含至少8种氨基酸类型,其中所述至少8种氨基酸类型中的每种氨基酸类型偶联至不同的标记物。所述肽可以包含至少10种氨基酸类型,其中所述至少10种氨基酸类型中的每种氨基酸类型偶联至不同的标记物。偶联至不同氨基酸类型的每种标记可以独立地偶联至被设置为发射信号的报告部分,所述信号对应于每个氨基酸类型。在某些情况下,所述多个氨基酸中的大部分被标记。在某些情况下,所述多个氨基酸中的大部分未被标记。
可以偶联至标记物的氨基酸可以是选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、脯氨酸、天冬酰胺、谷氨酰胺和色氨酸组成的组中的氨基酸。偶联至标记的氨基酸可以包含翻译后修饰。所述翻译后修饰可以是糖基化、乙酰化、烷基化、生物素化、谷氨酰化、糖基化、异戊二烯化、磷酸化、脂化、磷酸泛酰巯基乙胺化、硫酸化、硒化、酰胺化、泛素化、羟基化、硝化、亚硝酰化、瓜氨酸化、环化(诸如N-端谷氨酸或谷氨酰胺环化)和SUMO化。
所述肽可以包含偶联至多个标记物的多个氨基酸。所述多个氨基酸可以包含偶联至多个标记物的多种氨基酸。所述偶联至多个标记的多种氨基酸可以包含偶联至第一标记物的第一氨基酸和偶联至第二标记物的第二氨基酸。所述多个氨基酸可以包含偶联至多个第一标记物的多个第一氨基酸。所述多个氨基酸可以包含偶联至多个第二标记物的多个第二氨基酸。所述多个氨基酸可以包含(i)偶联至多个第一标记物的多个第一氨基酸和(ii)偶联至多个第二标记物的多个第二氨基酸。所述第一标记物或多个标记物可以仅偶联至所述第一氨基酸或多个第一氨基酸。所述第二标记物或多个标记物可以仅偶联至所述第二氨基酸或多个第二氨基酸。所述第一标记物或多个第一标记物可以仅偶联至所述第一氨基酸或多个第一氨基酸,且所述第二标记物或多个第二标记物仅偶联至所述第二氨基酸或多个第二氨基酸。所述多个标记物中的至少一个标记物可以偶联至所述多个氨基酸中的特定氨基酸类型。例如,所述多个标记物中的一个标记物可以偶联至赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、谷氨酰胺、天冬酰胺或色氨酸。
标记物可以包含第一反应性基团,该第一反应性基团被设置为偶联至第二反应性基团。所述第一反应性基团可以选自由叠氮化物、炔烃、烯烃、醛、酮、四嗪、硫醇、二硫醇、环辛烯和降冰片烯组成的组。所述第二反应性基团可以选自由叠氮化物、炔烃、烯烃、醛、酮、四嗪、硫醇、二硫醇、环辛烯和降冰片烯组成的组。所述第一反应性基团可以选自由叠氮化物、烯烃、醛、酮和四嗪组成的组。所述第一反应性基团可以是应变炔烃。所述第二反应性基团可以选自由叠氮化物、硫醇、二硫醇、环辛烯、烯烃、醛、酮、四嗪、降冰片烯和炔烃组成的组。所述第二反应性基团可以是应变炔烃。
所述多个标记物中的至少一个标记物可以被设置为与偶联至特定报告部分的特定第二反应性基团反应。所述第一反应性基团可以选自由炔烃、硫醇、二硫醇和环辛烯组成的组,且所述第二反应性基团可以选自由炔烃、叠氮化物、硫醇、二硫醇、环辛烯、烯烃、醛、酮、四嗪和降冰片烯组成的组。所述第一反应性基团可以被设置为与特定第二反应性基团反应。例如,所述第一反应性基团可以是叠氮化物且所述第二反应性基团可以是炔烃,所述第一反应性基团可以是炔烃且所述第二反应性基团可以是叠氮化物,所述第一反应性基团可以是烯烃且所述第二反应性基团可以是硫醇,所述第一反应性基团可以包含羰基(例如,酮或醛)且所述第二反应性基团可以是二硫醇,所述第一反应性基团可以是四嗪且所述第二反应性基团可以是环辛烯(例如,反式-环辛烯)。
偶联至氨基酸或多个氨基酸的至少一个标记物可以偶联至报告部分。所述报告部分可以被设置为在激发时发射信号。所述信号可以是可检测信号。例如,所述信号可以是光学信号,诸如荧光或磷光信号。所述光学信号可以由染料产生。所述报告部分也可以产生非光学可检测信号。例如,报告部分可以产生电信号、放射性信号或化学信号。所述报告部分可以偶联至间隔子。所述间隔子可以邻接报告部分和第二反应性基团。报告子可以被设置为与标记物反应。所述报告子可以包含报告部分和反应性基团(例如,第二反应性基团)。所述报告子可以包含报告部分、反应性基团(例如,第二反应性基团)和间隔子。
所述至少一种支持物可以是珠子、聚合物基质、阵列或它们的任意组合。所述至少一种支持物可以是珠子、聚合物基质或阵列。所述至少一种支持物可以是珠子和阵列。所述至少一种支持物可以是珠子。所述至少一种支持物可以是阵列。所述阵列可以是表面。所述阵列可以是载玻片。所述载玻片可以是显微镜载玻片。所述至少一种支持物可以是显微镜载玻片。所述至少一种支持物可以是聚合物基质。
所述支持物可以是固体支持物或半固体支持物。所述固体支持物或半固体支持物可以是珠子。所述珠子可以是凝胶珠子。所述珠子可以是聚合物珠子。所述支持物可以是树脂。非限制性支持物可以包含,例如,琼脂糖(agarose)、琼脂糖(sepharose)、聚苯乙烯、聚乙二醇(PEG)或它们的任意组合。所述支持物可以是聚苯乙烯珠子。所述支持物可以包括官能团,诸如胺、巯基、酸、醇、溴化物、马来酰胺、琥珀酰亚胺基酯(NHS)、磺基琥珀酰亚胺基酯、二硫化物、叠氮化物、炔烃、异硫氰酸酯(ITC)或其组合。所述支持物可以是PEGA树脂。所述支持物可以是氨基PEGA树脂。所述支持物可以包含胺基团。所述支持物可以包括经保护的官能团,诸如Boc、Fmoc、烷基酯、Cbz或其组合。所述珠子可以含有金属核。所述珠子可以是聚合物磁珠。所述聚合物磁珠可以包含金属氧化物。所述支持物可以包含至少一个氧化铁核。
所述肽的N-端、C-端、内部氨基酸或它们的任意组合可以偶联至所述至少一种支持物。所述肽的N-端和C-端可以偶联至所述至少一种支持物。所述肽的N-端可以偶联至一种支持物且所述肽的C-端可以偶联至另一种支持物。所述肽的N-端可以偶联至珠子。所述肽的C-端可以偶联至载玻片。所述肽的N-端可以偶联至珠子且所述C-端可以不偶联至支持物。所述肽的C-端可以偶联至载玻片且所述肽的N-端可以不偶联至支持物。所述肽的N-端可以偶联至珠子且所述肽的C-端可以偶联至载玻片。
所述肽的N-端可以偶联至所述至少一种支持物。所述肽的N-端可以偶联至可切割单元。所述可切割单元可以偶联至所述至少一种支持物。所述可切割单元可以包含(i)可切割部分、(ii)醛、(iii)所述至少一种支持物或(iv)间隔子中的至少一种。所述可切割单元可以包含可切割部分。所述可切割部分可以包含rink基团。所述可切割单元可以包含醛。所述醛可以是吡啶甲醛(PCA)或其任何衍生物。所述可切割单元可以包含间隔子。所述可切割单元可以包含(i)可切割部分、(ii)醛、(iii)所述至少一种支持物或(iv)间隔子中的至少两种。所述可切割单元可以包含可切割部分和醛。所述可切割单元可以包含所述至少一种支持物和醛。所述可切割单元可以包含(i)可切割部分、(ii)醛、(iii)所述至少一种支持物或(iv)间隔子中的至少三种。所述可切割单元可以包含醛、至少一种支持物和间隔子。所述可切割单元可以包含醛、至少一种支持物和可切割部分。所述可切割单元可以包含间隔子、至少一种支持物和可切割部分。所述可切割单元可以包含(i)可切割部分、(ii)醛、(iii)所述至少一种支持物和(iv)间隔子。所述可切割单元可以如在WO2020072907A1中所述。所述醛、所述间隔子、所述可切割部分或它们的任意组合可以如在WO2020072907A1中所述。
所述肽的C-端可以修饰有被设置为将C-端偶联至至少一种支持物的试剂。所述试剂可以包含炔烃或叠氮化物,其中任一种可以被设置为偶联至至少一种支持物。所述C-端可以包含酸性氨基酸。所述C-端可以包含第一酸性残基和第二酸性残基。所述第一酸性残基可以是C-端羧酸。所述第二酸性残基可以是天冬氨酸侧链或谷氨酸侧链。所述C-端的第一酸性残基和第二酸性残基可以是经修饰的。在所述肽的C-端含有两个酸性残基的情况下,所述第一和第二酸性残基可以被包含炔烃或叠氮化物的试剂修饰,其中任一种可以被设置为偶联至至少一种支持物。
作为一个非限制性实施例,用于用在本系统中的报告子(或报告部分)可以发射可检测信号或光学信号(例如,从荧光染料)。但是,本文中描述任何数目的报告子(或报告部分)可以因为其各种有利特征而被使用。作为另一个实施例,报告子(或报告部分)可以发射辐射信号,该辐射信号可以通过电离室、气体电离检测器、盖革计数器、光检测器、闪烁计数器或半导体检测器等来检测。相反,报告子(或报告部分)可以根本不发射信号。报告子(和报告部分)可以通过与其侧链反应而选择性地标记特定氨基酸,或可以检测氨基酸的翻译后修饰。在某些实施例中,所述肽中将含有许多或全部可以偶联至标记和/或报告子(或报告部分)的多个氨基酸。
由两个或更多个氨基酸组成的肽可以具有N-端和C-端。这些末端可以被一个或多个氨基酸隔开。N-端是末端氨基酸且可以含有末端胺。所述末端胺可以是未取代的,或可以是取代的。在某些情况下,所述胺可以被切割、封闭、官能化或以其它方式的修饰。天然存在的肽通常在N-端位置含有未取代的胺。任何氨基酸在键切割事件以后可以变成N-端。类似地,C-端是末端氨基酸且可以含有末端羧酸。所述末端羧酸可以是未取代的或取代的。在某些情况下,所述羧酸可以被切割、封闭、官能化或以其它方式的修饰。天然存在的肽通常在C-端位置含有未取代的羧酸。任何氨基酸在键切割事件以后可以变成C-端。在某些实施例中,如本文提供的,C-端可以是任何氨基酸。在其它实施例中,C-端是酸性氨基酸(例如,谷氨酸或天冬氨酸)。本申请提供了第一肽在已知位点处的特异性切割,以便产生具有特定的(例如,期望的)C-端氨基酸残基的第二肽。在切割以后的C-端氨基酸可以是酸性残基。在切割以后的C-端氨基酸可以是非酸性残基。类似地,可以有意地切割第一肽以产生具有特定的(例如,期望的)N-端氨基酸残基的第二肽。
肽可以具有非直链结构。在某些情况下,肽可以是支链的。在某些情况下,肽可以是环状的。在某些情况下,两个或更多个肽可以交联。在某些情况下,两个或更多个肽可以共价交联。在某些情况下,两个或更多个肽可以非共价结合。
系统可以如图1A中所示来构造。所述系统可包括:具有至少一个氨基酸(例如,111、112、119)的肽100。所述肽可以包含N-端氨基酸119、C-端氨基酸111和内部氨基酸112。N-端氨基酸可以偶联至N-端捕获试剂103。N-端捕获试剂可以包含用于偶联至N-端氨基酸的第一反应性柄部(handle)120。N-端捕获试剂包含被设置为偶联至支持物104(诸如珠子)的第二反应性柄部125。支持物104和第一反应性柄部120可以通过可切割接头连接,所述可切割接头由第一连接基团121、可切割接头122和123以及第二连接基团124构成,使得可切割接头122和123的切割从支持物104释放肽102。C-端氨基酸可以偶联至表面附着剂101,该表面附着剂101可以包含用于偶联至肽C-端111的反应性柄部110、接头109和被设置为偶联至表面100的反应性柄部108。标记物107可以偶联至肽102的至少一个氨基酸(例如,内部氨基酸112)。所述标记物可以包含偶联至氨基酸112的第一反应性基团112、接头113和第二反应性基团114。在所示构型中,所述第二反应性基团偶联至报告部分106的反应性基团116,可检测部分118,诸如荧光团。可检测部分118可以直接偶联至反应性基团116或可以通过接头117偶联至反应性基团。在替代构型中,所述标记物的第二反应性基团115可以偶联至保护基团105的反应性基团126。所述保护基团可以包含化学惰性部分128,后者可以直接偶联至反应性基团126,或可以通过接头127偶联至所述反应性基团。
图1B提供了图1A的系统的构型,其中多个标记物113a、113b和113c偶联至多个内部氨基酸112a、112b、112c。在某些构型中,所述多个标记物包含偶联至不同氨基酸的多种类型的标记物。在某些构型中,所述多个标记物属于单一类型。所述多个标记物可以偶联至多个报告部分、保护基团或其组合。
3.方法
在另一个方面,本文提供了一种改进用于分析肽的样品制备的方法。所述方法可以改进用于肽测序(例如,荧光测序)的样品制备。通过选择性地标记至少一个氨基酸侧链,包括N-端氨基酸、C-端氨基酸和内部氨基酸的那些,可以改进样品制备。通过用第一反应性基团和第二反应性基团之间的定量反应有效地标记至少一个氨基酸侧链,可以改进样品制备。本文提供了一种用于标记多个氨基酸或氨基酸类型的方法。所述方法可以最小化氨基酸、报告部分(例如,荧光分子(例如,染料))的交叉反应性,或例如敏感报告部分(例如,荧光分子(例如,染料))的分解。
在另一个方面,本文提供了一种用于标记肽的氨基酸的方法,所述方法包括:提供所述肽,其中所述肽包含偶联至叠氮化物的内部氨基酸和偶联至炔烃的C-端;以及,在使得第一报告子与所述内部氨基酸反应的条件下使所述肽与所述第一报告子接触。所述第一报告子可以包含炔烃。所述炔烃可以是应变炔烃。允许所述第一报告子与所述内部氨基酸反应的条件可以是无铜条件。例如,当所述第一报告子包含应变炔烃时,可以在不存在铜(Cu)的情况下进行(b)。所述方法可以进一步包括使不同于所述第一报告子的第二报告子与所述肽的C-端反应。所述第二报告子可以包含炔烃。所述第二报告子可以包含非应变炔烃。可以在存在铜的情况下进行所述第二报告子和所述肽的C-端之间的反应(例如,当所述炔烃是非应变炔烃时)。在某些情况下,所述第一报告子不与所述第二报告子反应。在某些情况下,所述内部氨基酸偶联至叠氮化物,而所述叠氮化物不与偶联至所述肽的C-端的炔烃反应。
在另一个方面,本文提供了一种用于处理或分析肽的方法,所述方法包括:(a)提供所述肽,该肽包含偶联至标记物的氨基酸,其中所述标记物包含(i)被设置为偶联至第二反应性基团的第一反应性基团,所述第二反应性基团偶联至被设置为发射信号的报告部分,或(ii)保护基团,其被设置为防止所述标记物和所述第二反应性基团之间的偶联;(b)使所述肽与包含所述第二反应性基团的混合物接触;(c)在所述肽固定至至少一种支持物的情况下,检测来自所述肽的信号;以及,(d)使用所述信号或信号变化来鉴定所述氨基酸或所述肽的另外氨基酸。所述信号或信号变化可以用于鉴定所述肽的序列的至少一部分。所述信号或信号变化可以用于鉴定所述肽的完整序列。在(a)至(c)之后,可使用所述信号或信号变化来鉴定所述氨基酸或所述肽的另外氨基酸。所述标记物可以包含第一反应性基团,所述第一反应性基团在(b)中与所述第二反应性基团反应。
所述标记物可以包含所述第一反应性基团。所述报告部分可以包含所述第二反应性基团。所述第二反应性基团可以与所述第一反应性基团反应。在(a)中,所述标记物可以包含所述第一反应性基团。在(b)中,所述第二反应性基团可以与所述第一反应性基团反应。在(a)中,所述标记物可以包含所述第一反应性基团,且在(b)中,所述第二反应性基团可以与所述第一反应性基团反应。
所述肽可以以多个肽的形式来提供。所述肽可以包含所述多个肽中的至少一个肽。所述多个肽可以包含第一肽和第二肽。所述肽可以是所述多个肽的第一肽或第二肽。所述第一肽可以包含偶联至第一标记物的第一氨基酸。所述第二肽可以包含偶联至第二标记物的第二氨基酸。所述第一肽可以包含偶联至第一标记物的第一氨基酸和偶联至第二标记物的第二氨基酸。所述第二肽可以包含偶联至第一标记物的第一氨基酸和偶联至第二标记物的第二氨基酸。所述第一肽可以包含偶联至第一标记物的第一氨基酸且所述第二肽包含偶联至第二标记物的第二氨基酸。所述第一标记物可以被设置为与所述第二反应性基团反应。所述第二标记物可以被设置为与所述第二反应性基团反应。所述第一标记物可以被设置为与所述第二反应性基团反应且所述第二标记物可以被设置为与不同于所述第二反应性基团的第二反应性基团反应。被设置为偶联至第一标记物和第二标记物中的每一个的第二反应性基团之间的差异可以允许第一标记物与第一氨基酸以及第二标记物与第二氨基酸的选择性偶联。每个第二反应性基团可以偶联至独立地被设置为发射信号的报告部分。例如,所述不同的第二反应性基团可以偶联至第二报告部分,所述第二报告部分被设置为发射与所述报告部分不同的信号。
可以在(a)或(b)中将所述肽固定至所述至少一种支持物。可以在(a)中将所述肽固定至所述至少一种支持物。可以在(b)中将所述肽固定至所述至少一种支持物。可以在(a)和(b)中将所述肽固定至所述至少一种支持物。所述方法可以进一步包括在(c)之前固定所述肽。所述方法可以进一步包括在(b)之后固定所述肽。可以在检测来自所述肽的信号之前将所述肽固定至所述至少一种支持物。在使肽与包含所述第二反应性基团的混合物接触之后,可以将所述肽固定至所述至少一种支持物。可以将所述肽固定至第一支持物。可以将所述肽固定至第二支持物。可以将所述肽固定至第一支持物并然后固定至第二支持物。可以将所述肽固定至第一支持物,从所述第一支持物除去,并然后固定至第二支持物。可以在(d)之前将所述肽固定至一种或多种不同的支持物。
可以将所述多个肽固定至多个支持物。所述多个肽可以包含至少1、10、100、1000、10000、100000、1000000个或更多个固定至相同支持物的肽。至少一种支持物可以是珠子、聚合物基质、阵列或它们的任意组合。所述至少一种支持物可以是珠子、聚合物基质或阵列。所述至少一种支持物可以是珠子和阵列。所述至少一种支持物可以是珠子。所述至少一种支持物可以是阵列。所述阵列可以是表面。所述阵列可以是载玻片。所述载玻片可以是显微镜载玻片。所述至少一种支持物可以是显微镜载玻片。所述至少一种支持物可以是聚合物基质。
所述支持物可以是固体支持物或半固体支持物。所述固体支持物或半固体支持物可以是珠子。所述珠子可以是凝胶珠子。所述珠子可以是聚合物珠子。所述支持物可以是树脂。非限制性的支持物可以包含例如琼脂糖(agarose)、琼脂糖(sepharose)、聚苯乙烯、聚乙二醇(PEG)或它们的任意组合。所述支持物可以是聚苯乙烯珠子。所述支持物可以包括官能团,诸如,胺、巯基、酸、醇、溴化物、马来酰胺、琥珀酰亚胺基酯(NHS)、磺基琥珀酰亚胺基酯、二硫化物、叠氮化物、炔烃、异硫氰酸酯(ITC)或其组合。所述支持物可以是PEGA树脂。所述支持物可以是氨基PEGA树脂。所述支持物可以包含胺基团。所述支持物可以包括经保护的官能团,诸如Boc、Fmoc、烷基酯、Cbz或其组合。所述珠子可以含有金属核。所述珠子可以是聚合物磁珠。所述聚合物磁珠可以包含金属氧化物。所述支持物可以包含至少一个氧化铁核。
所述肽可以包含多个氨基酸。所述多个氨基酸中的至少一个氨基酸可以选自由以赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、谷氨酰胺、天冬酰胺和色氨酸组成的组。所述多个氨基酸可以包含一个或多个氨基酸,所述一个或多个氨基酸选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、谷氨酰胺、天冬酰胺和色氨酸组成的组。所述肽可以包含选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、谷氨酰胺、天冬酰胺和色氨酸组成的组中的一种氨基酸。所述多个氨基酸可以包含非天然的氨基酸。所述多个氨基酸可以包含D-氨基酸。
所述多个氨基酸中的至少一个氨基酸可以偶联至标记物。所述多个氨基酸可以包含至少两种或更多种氨基酸类型。所述至少两种或更多种氨基酸类型可以包含第一氨基酸类型和第二氨基酸类型。所述第一氨基酸类型可以偶联至第一标记物。所述第二氨基酸类型可以偶联至第二标记物。所述第一氨基酸类型可以偶联至第一标记物且所述第二氨基酸类型可以偶联至第二标记物。所述第一标记物和所述第二标记物可以各自偶联至不同的报告部分。所述多个氨基酸可以包含至少2、3、4、5、6、7、8、9、10、11种或更多种氨基酸类型。所述多个氨基酸可以包含2至20种氨基酸类型。所述多个氨基酸可以包含4至18种氨基酸类型。所述多个氨基酸可以包含6至16种氨基酸类型。所述多个氨基酸可以包含8至14种氨基酸类型。所述多个氨基酸可以包含9至11种氨基酸类型。并非所述多个氨基酸所有氨基酸类型都可被标记。所述至少两种氨基酸类型中的每种氨基酸类型可以偶联至不同的标记物。所述肽可以包含至少四种氨基酸类型,其中所述至少四种氨基酸类型中的每种氨基酸类型偶联至不同的标记物。并非所述多个氨基酸都可被标记。所述多个氨基酸中的每个可以被标记。
氨基酸可以选自由甘氨酸、丙氨酸、异亮氨酸、亮氨酸、缬氨酸、苯丙氨酸、色氨酸、酪氨酸、天冬酰胺、半胱氨酸、谷氨酰胺、甲硫氨酸、丝氨酸、苏氨酸、精氨酸、组氨酸、赖氨酸、天冬氨酸、谷氨酸、谷氨酸和脯氨酸组成的组。氨基酸可以是本文提供的任何氨基酸的衍生物(例如,吡咯赖氨酸、硒代半胱氨酸或N-甲酰基甲硫氨酸)。氨基酸可以是极性的、不带电荷的、带电荷的(例如,带负电荷的或带正电荷的)、脂族的、芳族的、中性的(例如,两性离子)、疏水性的或它们的任意组合。氨基酸可以是天然或非天然的氨基酸。氨基酸可以是D或L氨基酸。氨基酸可以是α或β氨基酸。
所述多个氨基酸可以包含至少两种氨基酸类型,且所述至少两种氨基酸类型中的每种氨基酸类型可以偶联至不同的标记物。所述肽可以包含至少三种氨基酸类型,其中所述至少三种氨基酸类型中的每种氨基酸类型偶联至不同的标记物。所述肽可以包含至少四种氨基酸类型,其中所述至少四种氨基酸类型中的每种氨基酸类型偶联至不同的标记物。所述肽可以包含至少5或6种氨基酸类型,其中所述至少5或6种氨基酸类型中的每种氨基酸类型偶联至不同的标记物。所述肽可以包含至少8种氨基酸类型,其中所述至少8种氨基酸类型中的每种氨基酸类型偶联至不同的标记物。所述肽可以包含至少10种氨基酸类型,其中所述至少10种氨基酸类型中的每种氨基酸类型偶联至不同的标记物。偶联至不同氨基酸类型的每种标记物可以独立地偶联至被设置为发射信号的报告部分,所述信号对应于每种氨基酸类型。在某些情况下,所述多个氨基酸中的大部分是被标记的。在某些情况下,所述多个氨基酸中的大部分是未被标记的。
可以偶联至标记物的氨基酸可以是选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、脯氨酸、天冬酰胺、谷氨酰胺和色氨酸组成的组中的氨基酸。偶联至标记物的氨基酸可以包含翻译后修饰。所述翻译后修饰可以是糖基化、乙酰化、烷基化、生物素化、谷氨酰化、糖基化、异戊二烯化、磷酸化、脂化、磷酸泛酰巯基乙胺化、硫酸化、硒化、酰胺化、泛素化、羟基化、硝化、亚硝酰化、瓜氨酸化、环化(诸如N-端谷氨酸或谷氨酰胺环化)和SUMO化。在某些情况下,标记物可以对具有特定翻译后修饰的特定氨基酸具有特异性。
所述肽可以包含偶联至多个标记物的多个氨基酸。所述多个氨基酸可以包含偶联至多个标记物的多种氨基酸。所述偶联至多个标记的多种氨基酸可以包含偶联至第一标记物的第一氨基酸和偶联至第二标记物的第二氨基酸。所述多个氨基酸可以包含偶联至多个第一标记物的多个第一氨基酸。所述多个氨基酸可以包含偶联至多个第二标记物的多个第二氨基酸。所述多个氨基酸可以包含(i)偶联至多个第一标记物的多个第一氨基酸和(ii)偶联至多个第二标记物的多个第二氨基酸。所述多个氨基酸可以包含(i)偶联至多个第一标记物的多个第一氨基酸和(ii)偶联至多个第二标记物的多个第二氨基酸。所述第一标记物或多个第一标记物可以仅偶联至所述第一氨基酸或多个第一氨基酸。所述第二标记物或多个第二标记物可以仅偶联至所述第二氨基酸或多个第二氨基酸。所述第一标记物或多个可以仅偶联至所述第一氨基酸或多个第一氨基酸,且所述第二标记物或多个第二标记物仅偶联至所述第二氨基酸或多个第二氨基酸。所述多个标记物中的至少一个标记物可以偶联至所述多个氨基酸中的特定氨基酸类型。例如,所述多个标记物中的一个标记物可以偶联至赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、谷氨酰胺、天冬酰胺或色氨酸。
标记物可以包含第一反应性基团,该第一反应性基团被设置为偶联至第二反应性基团。所述第一反应性基团可以选自由叠氮化物、炔烃、烯烃、醛、酮、四嗪、硫醇、二硫醇、环辛烯和降冰片烯组成的组。所述第二反应性基团可以选自由叠氮化物、炔烃、烯烃、醛、酮、四嗪、硫醇、二硫醇、环辛烯和降冰片烯组成的组。所述第一反应性基团可以选自由以叠氮化物、烯烃、醛、酮和四嗪组成的组。所述第一反应性基团可以是应变炔烃。所述第二反应性基团可以选自由叠氮化物、硫醇、二硫醇、环辛烯、烯烃、醛、酮、四嗪、降冰片烯和炔烃组成的组。所述第二反应性基团可以是应变炔烃。
所述多个标记物中的至少一个标记物可以被设置为与偶联至特定报告部分的特定第二反应性基团反应。所述第一反应性基团可以选自由炔烃、硫醇、二硫醇和环辛烯组成的组,且所述第二反应性基团可以选自由炔烃、叠氮化物、硫醇、二硫醇、环辛烯、烯烃、醛、酮、四嗪和降冰片烯组成的组。所述第一反应性基团可以被设置为与特定第二反应性基团反应。例如,所述第一反应性基团可以是叠氮化物且所述第二反应性基团可以是炔烃,所述第一反应性基团可以是炔烃且所述第二反应性基团可以是叠氮化物,所述第一反应性基团可以是烯烃且所述第二反应性基团可以是硫醇,所述第一反应性基团可以包含羰基(例如,酮或醛)且所述第二反应性基团可以是二硫醇,所述第一反应性基团可以是四嗪且所述第二反应性基团可以是环辛烯(例如,反式-环辛烯)。
偶联至氨基酸或多个氨基酸的至少一个标记物可以偶联至报告部分。所述报告部分可以被设置为发射信号。所述报告部分可以被设置为在激发时发射信号。所述信号可以是可检测信号。例如,所述信号可以是光学信号,诸如荧光或磷光信号。所述光学信号可以由染料产生。所述报告部分也可以产生非光学可检测信号。例如,报告部分可以产生电信号、放射性信号或化学信号。所述报告部分可以偶联至间隔子。所述间隔子可以邻接报告部分和第二反应性基团。报告子可以被设置为与标记物反应。所述报告子可以包含报告部分和反应性基团(例如,第二反应性基团)。所述报告子可以包含报告部分、反应性基团(例如,第二反应性基团)和间隔子。
所述方法可以包含使所述肽经受足以从固定至所述至少一种支持物的所述肽除去至少一个氨基酸的条件。所述至少一个氨基酸可以从所述肽的N-端除去。足以从固定至所述至少一种支持物的所述肽除去至少一个氨基酸的条件可以是埃德曼降解条件。足以除去至少一个氨基酸的条件可以包含埃德曼降解试剂或含有有机磷酸酯的试剂。在(e)之后,与所述标记物偶联的氨基酸可以变成末端氨基酸。
所述方法可以进一步包括:(f),重复步骤(d)和(e)以检测来自固定至所述至少一种支持物的所述肽的至少一个另外信号或信号变化,和(ii)使用所述信号或信号变化和所述另外信号或信号变化来鉴定固定至所述至少一种支持物的所述肽的序列的至少一部分。
可以在(a)-(c)之后,鉴定所述肽的氨基酸或另外氨基酸。可以用光学检测器检测所述至少一个信号或信号变化。所述光学检测器可以包含成像系统。所述光学检测器可具有单分子灵敏度。所述至少一个信号或信号变化可以包含光学信号。所述至少一个信号或信号变化可以是光学信号。所述至少一个信号或信号变化可以包含多个信号。所述至少一个信号或信号变化可以包含不同频率或频率范围的多个信号。所述至少一个信号或信号变化可以包含不同强度的多个信号。所述多个信号的两个信号可以在至少一个方面存在差异。所述多个信号的两个信号可以具有不同的频率或频率范围。所述多个信号的两个信号可以具有不同的寿命。所述多个信号的两个信号可以具有不同的强度。
所述至少一个信号或信号变化可以由所述报告部分产生。所述报告部分可以包含染料。所述染料可以产生所述至少一个信号或信号变化。所述染料可以选自由荧光染料、磷光染料、化学发光染料、颜料和光可转换的报告子(photoswitchable reporters)组成的组。
所述保护基团可以被设置为防止所述标记物和第二反应性基团之间的偶联。含有保护基团的标记物可以作为假标记物起作用。所述假标记物可以阻断反应基性团与氨基酸反应的反应性。所述保护基团可以包含一个或多个基团。所述一个或多个基团可以是独立地选自由叠氮化物、烷基、亚烷基、芳基、杂芳基、杂芳基-烷基和芳基-烷基组成的组。所述一个或多个基团可以包含叠氮化物(例如,N3或-CH2N3)。所述一个或多个基团可以包含烷基(例如,甲基)或亚烷基。所述一个或多个基团可以包含芳基(例如,苯基)、杂芳基、杂芳基-烷基或芳基-烷基(例如,苄基)。
可以在至多0.001纳摩尔(nM)、0.01nM、0.1nM、1nM、10nM、100nM或更高的肽浓度进行所述方法。可以在至少100nM、10nM、1nM、0.1nM、0.01nM、0.001nM或更低的肽浓度进行所述方法。可以在从0.001nM至100nM、0.01nM至100nM或0.1nM至50nM的肽浓度进行所述方法。
在另一个方面,本文描述了一种用于将肽偶联至支持物(如本文中所述)的方法。所述方法可以包括使偶联至所述肽的试剂与所述支持物反应。所述支持物可以包含被设置为与偶联至所述肽的试剂反应的基团(例如,炔烃、叠氮化物或本文描述的任何反应性基团)。所述方法可以将第一肽偶联至第一支持物(例如,通过第一基团),并且将第二肽偶联至第二支持物(例如,通过第二基团)。
方法可包括:将肽偶联至珠子,标记所述肽,以及将所述肽偶联至表面。在某些情况下,将所述肽从所述珠子释放,然后将它偶联至表面。在某些情况下,将所述肽偶联至珠子和表面。在某些情况下,将所述肽通过可切割接头偶联至珠子。在这样的情况下,通过可切割接头的切割可以将所述肽从所述珠子释放,然后偶联至表面。相反,所述肽可以在偶联至表面以后从所述珠子释放。
图2描绘了与本申请一致的方法。所述方法可包括:将多个肽204捕获200在多个珠子205上。所述珠子可以包含被设置为偶联至多个肽204的捕获试剂206。所述捕获试剂可以是N-端捕获试剂、C-端捕获试剂、氨基酸类型特异性的捕获试剂,或可以包含一定程度的结合非特异性。所述方法可以包含标记201所述多个肽。这样的步骤可以包含将氨基酸类型特异性标记207偶联至所述多个肽。这样的步骤可以包含将多个标记物偶联至所述多个肽。在标记之后,可以将所述多个肽从多个珠子202释放。所述肽可以偶联203至表面208并进行分析。
图7示出了与申请一致的用于标记和固定肽的方法。所述方法可包括收集、任选地测量和任选地溶解(例如,通过加入离液剂诸如尿素)多个肽710。可以消化720所述多个肽以产生多个肽片段。然后可以将所述多个肽片段固定730在珠子(例如,多个珠子)上,任选地进行洗涤或纯化(例如,以使未结合珠子的肽与珠子分离),并偶联740至标记物(例如,“卡”试剂)。所述纯化可包括使溶液和珠子磁分离。在某些情况下,所述多个肽片段偶联至多个不同的标记物(例如,被设置为偶联至不同类型的氨基酸的标记物)。在这样的情况下,可以使两种标记物在不同时间与所述多个肽片段接触,中间插入洗涤步骤741以除去来自标记步骤的多余的(例如,未反应的)标记试剂或副产物。在某些情况下,在每个偶联步骤中使不超过一种标记物与所述多个肽片段接触。在某些情况下,在单个偶联步骤中使多个标记物与所述多个肽片段接触。所述标记物可以偶联750至报告部分、保护基团或它们的任意组合。在某些情况下,在单个步骤中将多个标记物偶联750至报告部分。在某些情况下,在多个步骤中将多个标记偶联物750至报告部分(例如,在每个步骤中偶联一个报告部分和标记物)。可以将所述珠子洗涤760以除去多余的标记试剂,并然后偶联770至基底,诸如玻璃载玻片或提杆,其中可以对所述多个肽片段进行分析,诸如荧光测序。所述肽可以任选地在偶联770至基底之前或之后从所述珠子释放。
在另一个方面,本文描述了一种用于处理或分析肽的方法,所述方法包括:提供所述肽,该肽包含偶联至第一反应性基团的氨基酸,所述第一反应性基团被设置为偶联至与支持物偶联的第二反应性基团;使所述肽与所述第二反应性基团接触以允许所述第一反应性基团偶联至所述第二反应性基团,由此将所述肽固定至所述支持物;在所述肽固定至所述支持物的情况下,检测来自偶联至所述肽的氨基酸的标记物的信号;以及,使用所述信号或其变化来鉴定所述氨基酸。
所述方法可以进一步包括:检测来自标记物的信号,所述标记偶联至所述肽的氨基酸,所述肽固定化至所述支持物。所述信号或其变化可以用于鉴定所述氨基酸。可以偶联至可检测标记的氨基酸和偶联至所述第一反应性基团的氨基酸可以是相同的氨基酸。偶联至可检测标记的氨基酸和偶联至所述第一反应性基团的氨基酸可以是不同的。
所述第一反应性基团可以经由官能团偶联至所述氨基酸。所述官能团可以偶联至所述氨基酸的反应性侧链。(a)可以进一步包含将所述氨基酸偶联至与所述第一反应性基团偶联的官能团。所述官能团可以仅偶联至(a)中的氨基酸。(a)中的氨基酸可以与(c)中偶联至所述标记物的所述氨基酸相同。(a)中的氨基酸可以与(c)中偶联至所述标记物的所述氨基酸不同。(c)可以进一步包含在(b)之前将所述标记物偶联至所述肽的所述氨基酸。(c)可以进一步包含在(b)之后将所述标记物偶联至所述肽的所述氨基酸。
偶联至第一反应性基团的氨基酸可以是末端氨基酸。偶联至第一反应性基团的氨基酸可以是内部氨基酸。所述氨基酸可以选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、脯氨酸、谷氨酰胺和色氨酸组成的组。所述氨基酸可以选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、苏氨酸、丝氨酸、谷氨酰胺和色氨酸组成的组。
所述第一反应性基团可以选自由叠氮化物、炔烃、烯烃、醛、酮、四嗪、硫醇、二硫醇、酯、环辛烯和降冰片烯或活化的酯(例如,EDC-碳化二亚胺)组成的组。所述第一反应性基团可以是叠氮化物或炔烃。所述第一反应性基团可以是叠氮化物。所述第一反应性基团可以是炔烃。所述酯可以是活化的酯。所述活化的酯可以是EDC-碳化二亚胺。
所述第二反应性基团可以选自由炔烃、叠氮化物、硫醇、二硫醇、环辛烯、烯烃、醛、酮、四嗪和降冰片烯组成的组。所述第二反应性基团可以是叠氮化物或炔烃。所述第二反应性基团可以是叠氮化物。所述第二反应性基团可以是炔烃。所述酯可以是活化的酯。所述活化的酯可以是EDC-碳化二亚胺。所述第一反应性基团和所述第二反应性基团可以经由点击反应偶联。所述第二反应性基团可以通过间隔子(如本文中所述)或接头偶联至所述支持物。所述接头可以是键或任选取代的亚烷基或任选取代的亚杂烷基。
所述至少一种支持物可以是珠子、聚合物基质、阵列或它们的任意组合。所述至少一种支持物可以是珠子、聚合物基质或阵列。所述至少一种支持物可以是珠子和阵列。所述至少一种支持物可以是珠子。所述至少一种支持物可以是阵列。所述阵列可以是表面。所述阵列可以是载玻片。所述载玻片可以是显微镜载玻片。所述至少一种支持物可以是显微镜载玻片。所述至少一种支持物可以是聚合物基质。
所述标记物可以偶联至报告部分。所述报告部分可以被设置为发射信号。所述报告部分可以被设置为在激发时发射信号。所述报告部分可以被设置为吸收特定波长的光。所述信号可以是可检测信号。例如,所述信号可以是光学信号,诸如荧光或磷光信号。所述光学信号可以由染料产生。所述报告部分也可以产生非光学可检测信号。例如,报告部分可以产生电信号、放射性信号或化学信号。所述信号可以来自核酸。所述核酸可以是条形码。所述条形码可以是DNA条形码或RNA条形码。所述报告部分可以偶联至间隔子。
所述报告部分可以偶联至第三反应性基团或抗体。所述报告子可以包含报告部分和反应性基团(例如,第三反应性基团或抗体)。所述报告子可以包含报告部分、反应性基团(例如,第三反应性基团或抗体)和间隔子。所述第三反应性基团或所述抗体可以被设置为偶联至与所述标记偶联的氨基酸。所述氨基酸可以是末端氨基酸或内部氨基酸。所述报告部分可以通过接头偶联至第三反应性基团或抗体。所述信号可以从偶联至氨基酸的标记物检测到,其中所述标记物偶联至抗体。
所述方法可以进一步包括:使所述肽经受足以从所述肽的末端端部除去氨基酸的条件。所述氨基酸的除去可以在(c)之后进行。所述至少一个氨基酸可以从所述肽的N-端除去。足以从固定至所述至少一种支持物的所述肽除去至少一个氨基酸的条件可以是埃德曼降解条件。足以除去至少一个氨基酸的条件可以包含埃德曼降解试剂或含有有机磷酸酯的试剂。在(b)之后,与所述标记物偶联的氨基酸可以变成末端氨基酸。
所述方法可以进一步包括:重复(c)和(d)一次或多次来鉴定所述肽的多个氨基酸的信号模式,其中所述多个氨基酸的所述信号模式包含在(d)中的所述信号或其变化。所述方法可以进一步包括:使用所述多个氨基酸的所述信号模式以得到所述肽的序列或所述肽的序列的一部分。
可替换地,该方法可以如在图5中所示来进行。所述方法可以包括:将第一肽500消化501成至少一种第二肽502。所述至少一种第二肽的C-端可以用标记物509来官能化503。所述至少一种第二肽可以固化504至支持物512(诸如表面、载玻片或珠子),例如通过将标记物509偶联至捕获试剂511,后者偶联至支持物512。然后可以将所述至少一种第二肽的N-端氨基酸偶联至N-端结合剂505,后者可以偶联至报告部分诸如条形码化的核酸506(用于通过测序进行检测)或荧光团507(用于光学检测)。所述N-端结合剂可具有对N-端氨基酸类型(诸如赖氨酸)或一组氨基酸(诸如具有包含芳族基团的侧链的氨基酸)的特异性。所述条形码或荧光团可以鉴定所述N-端结合剂所偶联的至少一种第二肽的N-端氨基酸类型。任选地,可以除去所述至少一种第二肽的N-端氨基酸,从而暴露新的N-端氨基酸,其可以与另外的N-端结合剂接触。可以将这样的N-端氨基酸鉴定和除去重复多次循环来鉴定所述至少一种第二肽的序列。在某些情况下,所述N-端氨基酸在它偶联至N-端氨基酸结合剂之前被官能化。例如,可以将N-端氨基酸偶联至包含第二反应性基团的标记物,随后将N-端结合剂识别基团偶联至所述标记物的第二反应性基团,随后将N-端结合剂偶联至包含N-端结合剂识别基团的N-端氨基酸。这样的N-端结合剂识别基团可以包含对所述N-端结合剂的亲和力。
4.试剂盒
在另一个方面,本文提供了一种用于分析肽的试剂盒。在某些方面,所述试剂盒用于测定肽的序列。所述试剂盒可以用在能够对核酸测序的装置中。所述试剂盒可以包装在盒中,所述盒被设置为用在能够对核酸测序的装置中。
在另一个方面,本文提供了一种用于测定样品中的肽的序列的试剂盒,所述试剂盒包含标记物,所述标记物包含第一反应性基团和(i)第二反应性基团或(ii)保护基团,其中所述第一反应性基团被设置为偶联至一种氨基酸类型的氨基酸,其中所述第二反应性基团被设置为偶联至报告部分,所述报告部分包含被设置为发射信号的报告部分,且其中所述保护基团被设置为防止所述标记物和所述报告部分之间的偶联;和关于使用所述标记物处理所述肽以提供包含偶联至所述标记物的所述氨基酸的所述肽的说明。所述第一反应性基团可以被设置为偶联至一种氨基酸类型的氨基酸。所述第二反应性基团可以被设置为偶联至所述报告子。所述报告子可以偶联至第三反应性基团,所述第三反应性基团被设置为所述第二反应性基团。所述报告子可以包含间隔子。所述报告子可以被设置为在激发时发射信号。所述报告子可以包含荧光染料。所述保护基团可以被设置为防止所述标记物和所述报告子之间的偶联。所述保护基团可以不发射光学可检测信号。
所述试剂盒可以包含蛋白捕获试剂。所述蛋白捕获试剂可以被设置为偶联至所述肽的N-端。所述蛋白捕获试剂可以包含偶联至可切割接头的固体支持物。所述蛋白捕获试剂可以通过可切割接头偶联至固体支持物。所述固体支持物可以包含珠子、阵列、载玻片、聚合物基质或它们的任意组合。所述可切割接头可以是酶可切割的。所述可切割接头可以是化学可切割的接头。所述可切割接头可以是光可切割的接头。所述可切割接头可以能够通过pH的变化而被切割。所述可切割接头可以包含醛。所述醛可以是吡啶甲醛(PCA)或PCA的衍生物。
捕获试剂可以与至少一种肽或蛋白反应。捕获试剂可以与至少一种肽或蛋白的N-端反应。捕获试剂可以与至少一种肽或蛋白的C-端反应。捕获试剂可以与一种肽或蛋白反应。捕获试剂可以与一种肽或蛋白的N-端反应。捕获试剂可以与一种肽或蛋白的C-端反应。细胞的每种肽或蛋白可以被多个捕获试剂捕获。所述支持物可以进一步包含捕获试剂,所述捕获试剂可以捕获不是肽或蛋白的分子。所述支持物可以进一步包含能够捕获核酸分子的捕获试剂。所述支持物可以进一步包含能够捕获核糖核酸分子的捕获试剂。
所述报告子(或报告部分)可以被设置为发射信号。所述报告子(或报告部分)可以包含染料。所述染料可以选自由荧光染料、磷光染料、化学发光染料、颜料和光可转换的报告子组成的组。所述报告子(或报告部分)可以包含荧光染料。所述报告子可以被设置为在激发时发射信号。所述报告子可以是荧光蛋白分子。
所述试剂盒可以包含表面附着试剂。所述表面附着试剂可以包含炔烃或叠氮化物。所述表面附着试剂可以被设置为偶联至肽的C-端。试剂盒可以包含所述表面附着试剂所附着的支持物。在某些情况下,所述支持物是载玻片。所述载玻片可以是玻璃载玻片。所述载玻片可以是显微镜载玻片。
所述试剂盒可以包含用于进行反应、处理肽或本文描述的任何试剂或进行分析的另外试剂。试剂盒可以包含来自由蛋白酶、消化试剂、固体支持物珠子或它们的任意组合组成的组中的一种或多种物质。试剂盒还可以包含可用于进行反应的小分子、缓冲剂和溶剂。试剂盒可以预包装在容器套件中。预包装可以是被设置为用于任何测序平台中的盒。
图3示出了与本申请一致的试剂盒。所述试剂盒可以包含基底301,后者包含多个容积302(例如,包含多个孔的孔板)。可以为试剂指定所述基底的每个容积。例如,所述基底可以包含容积的阵列,其中每行可以对应于不同的报告部分且每列可以对应于不同的靶标氨基酸类型。所述试剂盒可以包含用于处理、标记和检测肽的一系列试剂300,包括带有报告部分的预制标记物。因此,氨基酸标记的类型和报告部分类型的每种组合都需要被包括在试剂盒的单独容器或容积中。例如,如果试剂盒含有在组合上与6种类型的报告部分组合的6种类型的氨基酸标记,则该试剂盒需要包括至少36个单独的容器或容积(每种标记-报告部分组合至少一次)。
本申请的试剂盒可如在图4中所示来构造。可以将试剂400以套件的形式来提供,且可以包括“卡”试剂410(例如,包含用于偶联至靶标的第一反应性基团和用于偶联至“扣”试剂的第二反应性基团的标记物)、“扣”试剂411(例如,报告部分或被设置为偶联至”卡”试剂的第二反应性基团的保护基团)、溶剂和缓冲剂412、假标记物413(例如,包含用于偶联至靶标的第一反应性基团、但是没有用于偶联至“扣”试剂的第二反应性基团的标记物)、珠子414(例如,包含用于N-端或C-端肽捕获的捕获试剂的珠子)和用于洗涤步骤415的试剂。所述试剂盒可以包含手册416,其概述了使用试剂盒的方法。所述试剂盒可以包含孔板401,后者包含孔402,在其中“卡”和”假”标记物可以偶联至肽,且“卡”标记物可以偶联至“扣”试剂。在某些构型中,所述孔板的孔可以用于构建可检测标记物(例如,将“卡”标记偶联至“扣”试剂),使得平板的每个行和列指定“卡”和“扣”对。所述孔板可以包含与标记物类型404对应的行和与靶氨基酸类型405对应的列。扣试剂可以包含一系列报告部分403,诸如多种不同颜色的染料。这种试剂盒设计可以能够从一个相对较小的试剂集合产生一个大型的标记-报告部分组合库。例如,与图4一致的试剂盒可以包含6种类型的报告部分和6种类型的氨基酸特异性标记,从而能够产生36种单独的标记-报告部分缀合物。
图9示出了与本申请一致的试剂盒设计。所述试剂盒可以包含基底900,其包含多个容积。所述容积可以包含被设置为偶联至特定氨基酸类型的标记物、以及用于偶联至所述标记物的一系列“扣”试剂。不同行的所述基底可以对应于不同的氨基酸类型(在所示的试剂盒中,行A-H分别对应于半胱氨酸、赖氨酸、酪氨酸、天冬氨酸、谷氨酸、磷酸丝氨酸、磷酸苏氨酸和C-端氨基酸)。在该试剂盒中,半胱氨酸“卡”标记物包括具有叠氮化物第二反应性基团的碘乙酰胺标记物、具有降冰片烯酮第二反应性基团的碘乙酰胺标记物、具有醛第二反应性基团的碘乙酰胺标记物和没有第二反应性基团的碘乙酰胺“假”标记物。赖氨酸“卡”标记物包括具有叠氮化物第二反应性基团的NHS酯标记物、具有降冰片烯酮第二反应性基团的NHS酯标记物、具有醛第二反应性基团的NHS酯标记物和没有第二反应性基团的NHS酯“假”标记物。酪氨酸“卡”标记物包括具有叠氮化物第二反应性基团的芳基重氮鎓标记物、具有降冰片烯酮第二反应性基团的芳基重氮鎓标记物、具有醛第二反应性基团的芳基重氮鎓标记物和芳基重氮鎓“假”标记物。天冬氨酸和谷氨酸“卡”标记包括具有叠氮化物第二反应性基团的胺标记物、具有降冰片烯酮第二反应性基团的胺标记物、具有醛第二反应性基团的胺标记物和胺“假”标记物。磷酸丝氨酸和磷酸苏氨酸标记物包括试剂诸如氢氧化钡、TCEP和标记物诸如包含反应性硫醇的试剂(例如,胱胺)。所述试剂盒包括用于将“卡”标记物偶联至肽的试剂,诸如Hunigs碱、2-(6-氯-1-H-苯并三唑-1-基)-1,1,3,3-四甲基铵(aminium)六氟磷酸盐(HCTU)、TCEP和Ba(OH)2。所述试剂盒也含有4种不同颜色的“扣”可检测部分以偶联至各种“卡”标记物,包括一系列荧光团-PEG4、Atto425-PEG4、JFX554-PEG4和Atto647N-PEG4“扣”试剂,从而实现4种颜色与任何“卡”试剂的任意组合。其它荧光团诸如Atto495、Janelia fluor 525和Janelia Fluor 579也可以用于制备这些“扣”试剂作为报告分子。
图10示出了与本申请一致的另一种试剂盒设计。所述试剂盒可以包含具有多个行1001-1007和列1010-1020的基底,包含用于处理肽的试剂1030、1040-1043、1050-1053、1060、1070的多个集合。每个试剂集合可以包含在每行中的不同试剂。所述基底可以包括用于肽固定化1030的试剂、用于偶联至肽1040-1043的标记物(例如,“卡”标记物)、用于偶联至标记物1050-1053的试剂(例如,“扣”报告部分或保护基团)、洗涤试剂1060和用于偶联肽和从固体支持物1070解偶联肽的试剂。所述基底可以包含每个行和列对的至少一个容积(例如,至少一个孔)。
一种方法可以包含为特定方法、样品类型或期望的性能水平(例如,灵敏度)定制试剂盒或组合物。可以选择试剂(例如,标记物、报告部分、溶剂、缓冲剂、蛋白酶)的组合来优化特定实验或调查。通过提供可以从中选择子集的多个试剂,试剂盒可以实现这样的优化。
用于单分子测序工作流程的最佳标记物组合可能随所研究的生物体的类型和待鉴定的分子的浓度而变化。由于氨基酸组成在生物体之间变化,适合于第一生物体中的肽区分的标记物选择(例如,半胱氨酸标记物、赖氨酸标记物和色氨酸标记物)对于在第二生物体中的肽区分可能不是最佳的。因此,本申请的方法可以包含基于所查询的样品(例如,人血清)或生物体(例如,毕赤酵母Pichia pastoris)的类型来选择一组标记物。
可以针对样品相容性来优化试剂。一种方法可以包括选择在样品中具有低交叉反应性的试剂。例如,已知一些荧光团会嵌入核酸中(例如,基于类黄酮的染料可以快速嵌入存在于许多样品中的B-DNA中),并因此可能被排除在利用含核酸样品的方法之外。一种方法可以包括选择这样的试剂(例如,报告部分):其在衍生出分析物的样品中在25℃具有至少1小时、至少2小时、至少4小时、至少6小时、至少8小时、至少12小时、至少16小时、至少24小时、至少36小时、至少48小时、至少60小时、至少72小时、至少90小时或至少120小时的半衰期。一种方法可以包含选择这样的试剂(例如,报告部分):其在用于查询分析物的样品(例如,用于荧光测序的缓冲液)中在25℃具有至少1小时、至少2小时、至少4小时、至少6小时、至少8小时、至少12小时、至少16小时、至少24小时、至少36小时、至少48小时、至少60小时、至少72小时、至少90小时或至少120小时的半衰期。一种方法可以包含选择对样品的pH、温度、盐度或反应性物质具有耐受性的试剂。
在本申请的在试剂盒中提供的或方法中使用的荧光团的组合可以针对一系列方法进行优化。可以选择用于一种方法或在试剂盒中提供的荧光团的类型以:(i)减少猝灭和(ii)减少光谱重叠(激发和/或发射光谱重叠)。例如,用于四色荧光测序方法的最佳荧光团类型可能不同于用于双色细胞成像染色的最佳荧光团类型。尽管荧光测序方法可以产生来自偶联至单个肽的多荧光团的相对短的荧光团间距离并因此需要低猝灭活性荧光团对,但是该染色方法可能包含来自光学活性细胞材料的环境的更高背景信号并因此以更高的猝灭为代价有利于更高的量子效率。
还可以优化一组试剂或试剂盒,以便可以在单个步骤中进行多个反应。本公开内容的试剂盒可以包含多个“卡”标记物和对应的“扣”报告部分或保护基,其反应性基团对适用于单个步骤偶联反应。例如,试剂盒可以被构造用于这样的方法:其中存在于样品中的半胱氨酸残基偶联至第一标记,存在于样品中的赖氨酸残基偶联至第二标记,存在于样品中的色氨酸残基偶联至第三标记,并然后所有三种标记在单个步骤中偶联至不同的“扣”报告部分(例如,胱氨酸标记偶联至蓝色报告部分、赖氨酸标记偶联至红色报告部分和色氨酸标记偶联至绿色报告部分)。一种方法可以包含在单个步骤中将至少两种“扣”报告部分或保护基偶联至至少两种“卡”标记物。一种方法可以包含在单个步骤中将至少三种“扣”报告部分或保护基偶联至至少三种“卡”标记物。一种方法可以包含在单个步骤中将至少四种“扣”报告部分或保护基偶联至至少四种“卡”标记物。一种方法可以包含在单个步骤中将至少五种“扣”报告部分或保护基偶联至至少四五“卡”标记物。所述单个步骤可以是其中所有“扣”报告部分被同时加入、与标记同时反应或它们的任意组合的步骤。
一种方法可包括:计算设计与本申请一致的试剂盒或试剂集合。用户可以输入方法的类型、所需的灵敏度、样品条件(例如,体内、离体或体外;pH、温度、靶标浓度等)至被设置为优化试剂集合的程序中。所述程序可以搜索多个样品和生物体的已知蛋白质组、反应性物质(例如,谷胱甘肽浓度)和细胞溶质条件的数据库,以产生最佳试剂集合。例如,所述程序可以基于靶标生物体的氨基酸丰度选择蛋白酶和一组氨基酸特异性标记物。
图11示出了一种用于设计与本申请一致的试剂盒的方法。所述方法可以在处理装置诸如智能电话上执行。用户可以输入1101关于其预期方法的信息,诸如蛋白信息(例如,要查询的样品中存在的蛋白类型)、其方法未靶向的背景物质(例如,蛋白)的列表、样品和实验参数、光漂白率、化学或工艺效率(例如,在荧光测序方法中进行的埃德曼反应的预期效率)和染料失效率。然后,处理装置可以将用户提供的信息输入到计算模型1102中以输出1103对于用户基于输入信息想要执行的给定方法的试剂的最佳选择(例如,标记和报告部分组合)。输出1103可以进一步包括(例如,通过单分子测序工作流程的并行云实现)实验方案,诸如来自蛋白荧光测序实验的预期蛋白鉴定的数目、要测量的斑点的数目、要包括的重复的数目、以及在定量中的预期置信度。然后用户可以生成1104推荐的试剂集合(例如,试剂盒),其包括输出试剂。在某些情况下,用户可以通过将“卡”标记物与“扣”报告部分和保护基偶联来生成推荐的试剂集合。在某些情况下,用户可以订购标记物和其它试剂(例如,蛋白酶)以供使用。用户可以使用试剂1105进行他们的方法,并且任选地可以基于他们的预期实验处理或分析1106他们的数据。
4.1氨基酸特异性试剂
本文描述的氨基酸特异性试剂可以是氨基酸特异性的双官能化接头,也被称作“标记物”。标记物可以含有两个或更多个反应性基团(例如,标记物的部分或区域)。所述第一反应性基团可以被设置为偶联至特定氨基酸类型或一组特定氨基酸类型。在某些情况下,所述第一反应性基团能够区分两种类似的氨基酸(例如,酪氨酸和丝氨酸),且可以被设置为偶联至一种氨基酸类型或特定数目的氨基酸类型。在其它实施例中,所述第一反应性基团被设置为偶联至多种氨基酸类型(例如,第一反应性基团可以被设置为偶联至含有氨基酸(包括谷氨酸、天冬氨酸和C-端氨基酸)的羧酸酯。在特定情况下,第一官能团能够偶联至任何氨基酸。
第一反应性基团可以偶联至氨基酸的侧链。可替代地,标记物可以偶联至氨基酸的主链。在某些情况下,标记物对肽内的位置具有选择性(例如,末端残基、内部残基、邻近特定氨基酸的残基)。一些标记物偶联(例如,选择性地偶联)至氨基酸上的翻译后修饰的位点。可以偶联至标记物的(对氨基酸的)翻译后修饰的一些非限制性实例包括糖基化、乙酰化、烷基化、生物素化、谷氨酰化、甘氨酰化、异戊二烯化、磷酸化、脂化、磷酸泛酰巯基乙胺化、硫酸化、硒化、酰胺化、泛素化、羟基化、亚硝酰化、琥珀酰化、羧基化、氧化、谷胱甘肽化、卤化、N-端氨基酸环化、翻译后衍生的辅因子形成(例如,绿色-荧光蛋白生色团和酪氨酸-半胱氨酸交联)和SUMO化。
在某些情况下,第一反应性基团包含偶联至特定氨基酸侧链的官能团。官能团的一些非限制性实例包括碘乙酰胺、琥珀酰亚胺基酯、N-羟基琥珀酰亚胺酯、烷基胺、重氮化合物、硫醇、甲基丙烯酸和炔丙基胺。
在某些实施例中,所述第二反应性基团是无反应性的或惰性的。所述无反应性的第二反应性基团可以不与系统内的任何其它实体反应。在某些实施例中,所述无反应性的第二反应性基团充当保护基团。所述保护基团可以例如防止偶联至报告子(或报告部分)。所述保护基团可以不发射可检测信号。在某些情况下,具有惰性的或无反应性的第二反应性基团的标记物被称作“假标记物”。本申请进一步提供了可将所述假标记物转化成反应性性标记。将假标记物转化成反应性标记物可以通过酶促过程、氧化或还原过程、光催化过程、金属催化过程、酸性或碱性过程或自由基过程来完成。
所述第二反应性基团可以是反应性的。所述第一反应性基团可以被设置为偶联至报告子。所述第一反应性基团可以能够偶联至第二反应性基团。在某些实施例中,所述第二反应性基团被设置在报告子上,由此将标记物偶联至报告子。这样的标记物可以是双官能化的,具有氨基酸官能团和报告子偶联官能团。本文提供的标记物可以具有超过一个反应性结构域或反应性基团,从而能够偶联至超过一种报告子。具有多个反应性结构域或反应性基团的标记物可以是多官能化的标记物。
作为非限制性实施例,选择用于与报告部分(或多个报告部分)偶联的第二反应性基团可以包括叠氮化物、烯烃、醛、酮、四嗪、炔烃、应变炔烃(例如,环炔、环辛炔、DBCO)、硫醇、二硫醇、反式-环辛烯、双环烯烃、碘苯、氰基噻唑、并苯、二硫杂环戊烷、溴烷(bromane)、氨基硫醇、吡咯二酮或它们的任意组合。第二反应性基团-报告部分反应性基团对的非限制性实例包括叠氮化物和炔烃、叠氮化物和二苯并环辛炔(DBCO)、烯烃和硫醇、醛和二硫醇、酮和二硫醇、四嗪和反式-环辛烯、四嗪和降冰片烯(nobornen)-NHS-酯、双环烯烃和四嗪、醛和二硫杂环戊烷、碘苯和溴烷、氰基噻唑和氨基硫醇、以及并苯和吡咯二酮。反应性标记物可以选择性地偶联至特定报告子。可以被设置为选择性地偶联的反应性基团的实例显示在表3中。
表3.具有选择性偶联活性的反应性基团的实例
Figure BDA0004041285780000531
在某些情况下,反应性标记物是非选择性的并且可以偶联至多个报告子。在其它情况下,所述第二反应性基团可以是直接可检测的(例如,荧光的),无需偶联至报告子。标记物可以含有其它可鉴定或可检测的包含物,诸如条形码或同位素。在某些实施例中,所述条形码是含有可鉴定序列的重复单元(例如,核酸)的分子条形码。第二反应性基团可以设置在不发射可检测信号的非报告子上。第二反应性基团可以设置在作为保护基团起作用的分子构建体上,其为基本上无反应性的或惰性的。
在某些情况下,所述试剂盒可以包含缓冲剂。缓冲剂可以表示这样的物质:相对于如果缓冲剂不存在则会发生的pH变化,其可以减小组合物中的pH变化的程度。缓冲剂的非限制性实例包括。在某些情况下,本发明的系统可以包含选自由钠磷酸盐、HEPES、MES和柠檬酸盐组成的组中的缓冲剂。在某些情况下,缓冲剂可以是固体形式。在某些情况下,缓冲剂可以溶解在液体中。在某些情况下,缓冲剂可以吸附到固体上。
本发明的溶液可以包含缓冲剂。所述缓冲剂可以以1nM或更高的浓度存在。在某些情况下,所述缓冲剂可以以10nM或更高的浓度存在。在某些情况下,所述缓冲剂可以以100nM或更高的浓度存在。在某些情况下,所述缓冲剂以1μM或更高的浓度存在。所述缓冲剂可以以10μM或更高的浓度存在。在某些情况下,所述缓冲剂可以以100μM或更高的浓度存在。在某些情况下,所述缓冲剂可以以1mM或更高的浓度存在。在某些情况下,所述缓冲剂可以以10mM或更高的浓度存在。在某些情况下,所述缓冲剂可以以100mM或更高的浓度存在。在某些情况下,所述缓冲剂可以以200mM或更高的浓度存在。在某些情况下,所述缓冲剂可以以500mM或更高的浓度存在。
在某些情况下,包含缓冲剂的溶液可以具有2至12之间的pH。在某些情况下,包含缓冲剂的溶液可以具有2至6之间的pH。在某些情况下,包含缓冲剂的溶液可以具有3至7之间的pH。在某些情况下,包含缓冲剂的溶液可以具有4至8之间的pH。在某些情况下,包含缓冲剂的溶液可以具有5至9之间的pH。在某些情况下,包含缓冲剂的溶液可以具有6至10之间的pH。在某些情况下,包含缓冲剂的溶液可以具有7至11之间的pH。在某些情况下,包含缓冲剂的溶液可以具有8至12之间的pH。在某些情况下,包含缓冲剂的溶液可以具有约7的pH。
本申请的系统可以包含钠磷酸盐。在某些情况下,溶液可以包含钠磷酸盐。在某些情况下,所述钠磷酸盐可以是磷酸二氢钠。在某些情况下,所述钠磷酸盐可以是磷酸氢二钠。在某些情况下,所述钠磷酸盐可以是磷酸三钠。
报告子
本申请的报告子可以是可被检测(例如,光学检测、质量检测、辐射检测、通过与另一个实体的反应化学检测)和/或鉴定(例如,通过颜色、通过质量、通过解码或测序)的构建体。在本申请中使用的报告子可以含有超过一个结构域。例如,报告子可以含有反应性结构域,其可以偶联至互补标记物的反应性结构域。报告子可以含有第二反应性基团,其可以偶联至互补标记物的第一反应性基团。在某些情况下,所述第二反应性基团仅与特定标记物偶联。在其它实施例中,所述第二反应性基团可以偶联至任何标记物。报告子可以偶联至超过一种标记物。报告子可以含有第二反应性基团,其可以直接偶联至氨基酸(特异性地或非特异性地)。在该情况下,所述报告子可以偶联至氨基酸的侧链或翻译后修饰的侧链。作为非限制性实施例,用于用在报告子中的一些第二反应性基团可以选自由叠氮化物、烯烃、醛、酮、四嗪、炔烃、应变炔烃(例如,环炔、环辛炔、DBCO)、硫醇、二硫醇或反式-环辛烯组成的组。本申请的一个有利方面是标记物和报告子的配对,其中官能团是已知的且偶联条件经过优化以将已知的报告子选择性地偶联至已知的标记物。通过在报告子内的可检测或可鉴定的部分可以鉴定氨基酸。
除了反应性偶联结构域之外,本发明的报告子还可以含有报告部分。报告部分可以含有可鉴定的结构域。在某些实施例中,可鉴定的结构域与分离的地址(例如,条形码或频率)相关。在某些实施例中,这样的报告部分被设置为在激发时发射信号。在某些实施例中,这样的信号是光学信号。所述报告子可以含有非可检测结构域,其中所述报告子不发射光学可检测信号。报告子还可以含有惰性结构域。惰性结构域可以是可切割的。惰性结构域可以作为保护基团起作用以防止反应性。
报告子可以在激发时发射信号。激发可以以电磁辐射(例如,光)的形式来提供。报告子也可以在激发后减少或丢失信号。从报告子(或设置在其上的可检测结构域)发出的信号可以是可检测的。信号可以是光学的、化学的、辐射的、电子的、信息的或其组合。光学信号可以是发光的,例如,化学发光的、生物发光的、电致发光的、声致发光的、光致发光的、放射发光的或热致发光的。光致发光的光学信号的一些实例包括荧光或磷光信号。光学信号可以来自生色团(例如,荧光团、荧光染料)。光学信号可以是能够发射光子的任何分子、大分子或分子构建体。响应于激发可以发射光学信号。光学信号可以是彼此可区分的,诸如通过颜色。在某些实施例中,有利的是,在单个系统、方法或试剂盒中使用多个光学信号。例如,可能有利的是,提供多个荧光团,其中一些或全部能够发射可辨别的光学信号。多个光学信号可以包括例如多种颜色。可能有利的是,提供产生一种颜色、两种颜色、三种颜色、四种颜色、五种颜色或更多种颜色的荧光染料。可能有利的是,提供产生二十种或更多种颜色的荧光染料。荧光团可以包括,例如,荧光团-碘乙酰胺(例如,Atto647N-碘乙酰胺);荧光团-琥珀酰亚胺基酯(例如,Atto647N-NHS)、荧光团-胺(例如,Atto647N-胺)、二硫杂环戊烷-荧光团(例如定制的合成荧光团、氧化的二硫杂环戊烷-荧光团、还原的二硫杂环戊烷-荧光团)、荧光团-叠氮化物(例如,Atto647N-叠氮化物)、俄勒冈绿(OG)-碘乙酰胺、OG488-NHS、OG488-叠氮化物、OG488-四嗪、OG514-NHS、Janelia Fluor(JF)-NHS、JF-游离酸(FreeAcid)、JF-叠氮化物、JF-二硫杂环戊烷、Atto647N-炔烃、Atto647N-游离酸、Atto425-NHS、Atto425-游离酸、Atto425-胺、Atto425-叠氮化物、Atto425-DBCO、SF554-NHS或德克萨斯红-NHS。光学信号也可以包含光学信号的缺失或丢失(例如,光漂白、光猝灭)或光学信号的变化(例如,FRET、BRET、同质-FRET或其它能量转移发光)。
报告子还可以含有间隔子。在某些实施例中,间隔子邻接报告子和信号发射实体。间隔子可以邻接两个结构域(例如,偶联结构域和可检测结构域)。报告子可以直接地或间接地邻接第二反应性基团和荧光染料。间隔子可以使两个目标实体定位成彼此间隔特定距离以便优化功能性(例如FRET)。可以使用间隔子来防止拥挤或空间干扰。间隔子可以增强信号的可检测性。在某些实施例中,间隔子增强第二反应性基团或反应性(例如偶联)结构域的反应性。间隔子可以由聚合物、生物聚合物或非聚合物、杂原子链、聚胺链、聚酯链、聚醚链、聚酰胺链组成。
可切割单元
可切割单元可以包含官能团,诸如二硫化物。可切割单元可以通过例如酶、亲核或碱性试剂、还原剂、光辐照、亲电或酸性试剂、有机金属或金属试剂、氧化试剂或其组合而切割。所述可切割基团可以是酸可切割的氨基甲基基团(例如,rink-酰胺、Sieber、肽酰胺接头(PAL))、羟基甲基(Wang型)、三苯甲基或氯代三苯甲基、芳基-酰肼接头。所述可切割基团可以是金属可切割基团,诸如alloc接头,肼可切割基团,或光不稳定的可切割基团,诸如基于硝基苄基的(例如,4-[4-(1-(Fmoc-氨基)乙基)-2-甲氧基-5-硝基苯氧基丁酸)或基于羰基的接头。所述可切割单元可以用TFA切割。
样品类型
本文所述的方法可以包括对生物样品进行分析。生物样品可以来源于受试者(例如,研究中的患者或参与者)、组织样品(例如,工程化的组织样品)、细胞培养物(例如,人细胞系或细菌集落)、细胞(例如,在单细胞分选测定期间分离的细胞)或其部分(例如,来自细胞的细胞器或来自血液样品的外核体)。生物样品可以是合成的,诸如包含化学合成肽的组合物。样品可以包含单一物质或物质的混合物。生物样品可以包含来自单一生物体的生物材料、来自遗传上几乎相同的生物体的集落的生物材料或来自多个生物体(例如,来自人消化道的肠上皮细胞和小生物群)的生物材料。可以对生物样品进行分级(例如,从全血中分离的血浆)、过滤或耗竭(例如,从血浆中除去的高丰度蛋白诸如白蛋白和血浆铜蓝蛋白)。
样品可以包含来自受试者、组织样品、细胞培养物、细胞或其部分的所有或部分生物分子。例如,来自受试者的样品可以包含在该受试者中存在的大部分蛋白,或者可以包含来自该受试者的蛋白的一小部分。生物样品可以包含体液,诸如脑脊液、唾液、尿液、泪液、血液、血浆、血清、乳房抽吸物、前列腺液、精液、粪便、羊水、眼内流体、粘液或它们的任意组合。生物样品可以包含组织培养物,例如肿瘤样品,或来自肾、肝、肺、胰腺、胃、肠、膀胱、卵巢、睾丸、皮肤、结肠直肠、乳房、脑、食管、胎盘或前列腺的组织。
所述生物样品可以包含可测量或鉴定其存在或不存在的分子。所述生物样品可以包含大分子,诸如多肽或蛋白。所述大分子可以被分离(例如,与它来源的其它组分分离)或纯化,使得所述大分子按重量计(例如,按干重或包括溶剂)占组合物的至少0.5%、至少1%、至少2%、至少3%、至少4%、至少5%、至少7.5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%或至少99%。所述生物样品可以是复杂的,并且可以包含多种组分(例如,不同的多肽、来自蛋白病患者的CSF的异质样品)。所述生物样品可以包含细胞或组织的组分、细胞或组织提取物或其分级分离的裂解物。所述生物样品可以被基本上纯化成含有单一类型的分子(肽、核酸、脂质、小分子)。生物样品可以包含配置用于本申请的方法(例如,消化、C-端标记或荧光测序)的多个肽。
与本申请一致的方法可以包含从生物样品中分离、富集或纯化生物分子、生物大分子结构(例如,细胞器或核糖体)、细胞或组织。一种方法可以利用生物样品作为感兴趣的生物物质的来源。例如,一种测定可以从血液或血浆样品衍生出蛋白诸如α突触核蛋白、细胞诸如循环肿瘤细胞(CTC)或核酸诸如无细胞DNA。一种方法可以从生物样品衍生出多种不同的生物物质,诸如两种不同类型的细胞。在这样的情况下,可以对不同的生物物质分离进行不同的分析(例如,可以对CTC裂解物和棕黄层蛋白进行分离并分别分析)或合并起来进行共同分析。生物物质可以在分析之前被匀浆化、片段化或裂解。在特定情况下,可以收集来自匀浆物、片段化产物或裂解物的一种物质或多种物质用于分析。例如,一种方法可包括在液体活组织检查期间收集循环肿瘤细胞,任选地分离个体循环肿瘤细胞,裂解循环肿瘤细胞,从得到的裂解物中分离肽,以及通过本申请的荧光测序方法分析肽。一种方法可包括使用C-端捕获试剂捕获来自样品的肽,并分析所述肽(例如,通过荧光测序方法)。
与本申请一致的方法可包括核酸分析,诸如测序、DNA印迹或表现遗传分析。核酸分析可以与第二分析方法(诸如本申请的荧光测序方法)平行进行。所述第二分析方法的核酸和受试者可以衍生自同一受试者或同一样品。例如,一种方法可以包含从人血浆样品收集无细胞DNA和肽,对无细胞DNA进行测序(例如,以鉴定癌症标志物),以及对血浆蛋白进行蛋白质组学分析。
计算机系统
本申请提供了被编程以实现本申请方法的计算机系统。图6显示了计算机系统601,其被编程或以其它方式设置为实现本文提供的方法或方法的一部分。计算机系统601可以调节本申请的各个方面,诸如控制反应或反应循环(例如,通过添加试剂、调节温度)、分析来自系统的信号(例如,来自报告部分的荧光信号)。计算机系统601可以是用户的电子设备或相对于电子设备位于远程的计算机系统。所述电子设备可以是移动电子设备。
计算机系统601包括中央处理单元(CPU,在本文中也被称作“处理器”和“计算机处理器”)605,其可以是单核或多核处理器,也可以是用于并行处理的多个处理器。计算机系统601还包括存储器或存储器位置610(例如,随机存取存储器、只读存储器、快闪存储器)、电子存储单元615(例如,硬盘)、用于与一个或多个其它系统通信的通信接口620(例如,网络适配器),和外围设备625(诸如高速缓存、其它存储器、数据存储和/或电子显示适配器)。存储器610、存储单元615、接口620和外围设备625通过通信总线(实线)诸如主板与CPU 605通信。存储单元615可以是用于存储数据的数据存储单元(或数据仓库)。计算机系统601可以借助于通信接口620可操作地偶联至计算机网络(“网络”)630。网络630可以是因特网、因特网和/或外联网、或与因特网通信的内联网和/或外联网。在某些情况下,网络630是电信和/或数据网络。网络630可以包括一个或多个计算机服务器,其可以实现分布式计算,诸如云计算。在某些情况下,借助于计算机系统601,网络630可以实现点对点网络,这可以使偶联到计算机系统601的设备能够充当客户端或服务器。
CPU 605可以执行一系列机器可读指令,所述指令可以体现在程序或软件中。所述指令可以存储在存储器位置,诸如存储器610。所述指令可以指向CPU 605,其可以随后对CPU 605以编程或以其它方式配置来实现本申请的方法。由CPU 605执行的操作的实例可以包括获取、解码、执行和写回。
CPU 605可以是电路(诸如集成电路)的一部分。系统601的一个或多个其它组件可以被包括在电路中。在某些情况下,所述电路是专用集成电路(ASIC)。
存储单元615可以存储文件,诸如驱动程序、库和保存的程序。存储单元615可以存储用户数据,例如用户偏好和用户程序。在某些情况下,计算机系统601可以包括一个或多个在计算机系统601外部的附加数据存储单元,诸如位于通过内联网或因特网与计算机系统601通信的远程服务器上。
计算机系统601可以通过网络630与一个或多个远程计算机系统通信。例如,计算机系统601可以与用户的远程计算机系统(例如,荧光光谱仪)通信。远程计算机系统的实例包括个人计算机(例如,便携式PC)、平板或平板PC(例如,Apple
Figure BDA0004041285780000591
iPad、Samsung
Figure BDA0004041285780000592
GalaxyTab)、电话,智能电话(例如,Apple
Figure BDA0004041285780000593
iPhone、支持Android的设备、Blackberry
Figure BDA0004041285780000594
)或个人数字助理。用户可以通过网络630访问计算机系统1101。
如本文描述的方法可以通过存储在计算机系统601的电子存储位置(诸如存储器610或电子存储单元615)上的机器(例如,计算机处理器)可执行代码来实施。机器可执行的或机器可读的代码可以以软件的形式提供。在使用过程中,所述代码可以由处理器605执行。在某些情况下,可以从存储单元615取回所述代码并将其存储在存储器610上以供处理器605随时访问。在某些情况下,可以排除电子存储单元615,并且将机器可执行指令存储在存储器610上。
可以对代码进行预编译且构造,以用于与具有适于执行所述代码的处理器的机器一起使用,或者可以在运行时编译。可以以编程语言来提供代码,所述编程语言可以经过选择以使代码能够以预编译或并行编译(as-compiled)的方式执行。
本文提供的系统和方法的方面,诸如计算机系统1101,可以体现在编程中。所述技术的各个方面可以被认为是“产品”或“制成品”,通常以在一种类型的机器可读介质上承载或体现的机器(或处理器)可执行代码和/或相关数据的形式。机器可执行代码可以存储在电子存储单元诸如存储器(例如,只读存储器、随机存取存储器、快闪存储器)或硬盘上。“存储”型介质可以包括计算机、处理器等的任何或所有有形存储器或其相关模块,诸如各种半导体存储器、磁带驱动器、磁盘驱动器等,它们可以在任何时间为软件编程提供非暂时性存储。全部或部分的软件有时可以通过因特网或各种其它电信网络进行通信。例如,这样的通信可以实现将软件从一台计算机或处理器加载到另一台计算机或处理器中,例如,从管理服务器或主机计算机加载到应用服务器的计算机平台中。因此,可以承载软件元素的另一种类型的介质包括光波、电波和电磁波,诸如通过本地设备之间的物理接口、通过有线和光输送路线网络以及通过各种空中链路使用。承载这种波的物理元件,诸如有线或无线链路、光链路等,也可以被认为是承载软件的介质。如本文中使用的,除非限于非暂时性的有形的“存储”介质,否则术语诸如计算机或机器“可读介质”表示参与向处理器提供指令以供执行的任何介质。
因此,机器可读介质诸如计算机可执行代码可以采取多种形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,诸如任何计算机等中的任何存储设备,诸如可以用于实现数据库等,如附图中所示。易失性存储介质包括动态存储器,诸如这样的计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光纤,包括构成计算机系统内总线的线。载波传输介质可以采用电或电磁信号的形式,或声波或光波的形式,诸如在射频(RF)和红外(IR)数据通信期间产生的那些。因此,计算机可读介质的常见形式包括例如:软盘、软磁盘、硬盘、磁带、任何其它磁性介质、CD-ROM、DVD或DVD-ROM、任何其它光学介质、穿孔卡片纸带、任何其它带有孔图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其它存储芯片或筒、传输数据或指令的载波、传输这样的载波的电缆或链路,或计算机可以从中读取编程代码和/或数据的任何其它介质。许多这些形式的计算机可读介质可能涉及将一个或多个指令的一个或多个序列传送到处理器以供执行。
计算机系统601可以包括电子显示器635或与电子显示器635通信,所述电子显示器635包含用户界面(UI)640,其用于提供例如用于操纵反应器系统的选项。UI的实例包括但不限于图形用户界面(GUI)和基于网的用户界面。
本申请的方法和系统可以通过一种或多种算法来实现。算法可以在中央处理单元605执行后通过软件来实现。例如,所述算法可以实现本文描述的方法的部分。
实施例
实施例1:肽样品制备
肽在支持物上的N-端固定
本文提供的系统、方法和试剂盒描述了将待处理或分析的肽附着到支持物的各个方面。在该实施例中,将肽附着到珠子以便促进肽的分析。在该实施例中的珠子可以是官能化的珠子,附有可切割接头和捕获试剂。捕获试剂可以是吡啶甲醛(PCA),其共价地偶联至肽的N-端。在程序结束时,通过使用衍生化的肼试剂,可以无痕除去肽。衍生化的肼试剂是2-(二甲基氨基)乙基肼二盐酸盐(CAS No.57659-80-0)。可能有利的是,使用蛋白酶诸如GluC或胰蛋白酶消化较大的肽或蛋白以便分离较小尺寸的肽,这将促进快速、有效和准确的处理和分析(例如,测序)。但是,也可以处理和分析大的或全长的肽(例如,蛋白)。还可能有利的是,在缓冲的溶液(例如,HEPES缓冲液,pH 8.0)中提供肽。
如图2所示,第一步是将肽(例如,流体样品中的多个肽)捕获在PCA-官能化的珠子上以固定化肽。PCA部分与肽中的N-端胺特异性地反应。通过与相邻酰胺键的分子内环化,PCA捕获试剂与肽中的其它胺(例如,赖氨酸)的N-端反应,确保期望的附接。在随后的步骤中,标记固定的肽,并将其从珠子上切割下来,然后通过荧光测序进行分析。PCA珠子是衍生化的rink树脂,其包含以线性排列连接的聚合物PEG珠子、间隔子、rink部分和捕获试剂(PCA)(如方案1所示)。用于制备固定的肽的其他试剂包括HEPES缓冲液(pH 8.0)、二甲基甲酰胺(DMF)、水、硼硅玻璃培养试管和biospin色谱柱(Biorad,目录号732-6008)。
方案1
Figure BDA0004041285780000611
条件包括以下:(i)将大约250微升(μL)珠子加入biospin色谱柱,该量对于大约1毫克(mg)肽而言是足够的,(ii)将该柱放在测试试管(13mm×100mm)上,(iii)洗涤(参见下面的方案(A));(iv)将肽溶解在1毫升(mL)HEPES缓冲液(pH 8.0)中,(v)盖上旋转柱(spincolumn)并加入肽溶液;(vi)将柱在振荡器中于37℃下孵育过夜,(vii)洗涤(参见下面的方案(B))。该过程使肽固定在支持物(例如,珠子)上。7至9之间的pH是优选的,因为酸性pH可能不允许固定反应发生。
洗涤方案
用于本文描述的系统、方法和试剂盒的示例性固体支持物系统是基于PEG的聚合物珠子。虽然可以使用本文公开的任何支持物,但为简洁起见,仅描述了基于PEG的聚合物珠子。用PCA官能化PEG珠子,然后将肽固定于其上。固相捕获使得能够洗涤珠子以(a)除去先前的试剂、染料、盐等,和(b)为标记肽提供环境而不损失基底。这些珠子可能是敏感的,并在干燥时可能会破裂。珠子储存在DMF和甲醇中,这将促进珠子的膨胀和悬浮。珠子的洗涤依次进行,从有机条件移向水性缓冲液,且在某些条件下,从水性缓冲液回到有机条件。在洗涤步骤中使用的材料和试剂包括二甲基甲酰胺(DMF)、乙腈、甲醇、水和硼硅玻璃培养试管(100mm×13mm)。
在各种实施例中可能需要的洗涤步骤如下进行:移除安装在硼硅玻璃试管上的biospin柱。接下来,根据以下任一个方案洗涤在biospin柱内的样品:方案(a),从水性条件过渡到有机条件;或方案(b),以从有机条件过渡到水性条件。
方案(A)水性至有机:用水洗涤柱(i)两次,然后用(1:1v/v)水/乙腈洗涤(ii)至少一次,随后用(1:1v/v)乙腈/DMF洗涤(iii)至少两次。在每次洗涤之间,将珠子在溶剂中孵育大约10分钟。
方案(B)有机至水相:(0)如果使用甲醇,首先用甲醇洗涤柱一次,然后用DMF洗涤(i)两次,随后用乙腈(ii)洗涤至少一次,随后用(1:1v/v)乙腈/水洗涤(iii)至少一次,随后用水洗涤(iv)两次。在每次洗涤之间,将珠子在溶剂中孵育大约10分钟。
实施例2:肽标记
C-端标记
方案2
Figure BDA0004041285780000631
如果在pH 8消化缓冲液或足够类似的蛋白酶/缓冲系统下使用GluC消化肽,则切割位点发生在酸性残基(例如,天冬氨酸和谷氨酸)的C-端(方案2)。因而,由于肽的所有酸性残基在肽的C-端,因此该肽适用于酰胺偶联。将C-端酸性残基转化为炔烃,用于随后固定至支持物。C-端羧酸、侧链羧酸或两者是否被炔基化并固定至支持物可能不影响本文公开的系统、方法和试剂盒的功能。可以使用替代的反应性基团代替炔烃。但是,为简洁起见,本文仅讨论炔烃实例。
首先,将前面描述的肽固定至第一支持物(例如,官能化的珠子),以小于1微摩尔的量提供。用于C-端标记的其他试剂包括炔丙基胺(CASNo.2450-71-7)、O-(1H-6-氯苯并三唑-1-基)-1,1,3,3-四甲基脲鎓六氟磷酸盐(HCTU)(CAS No.330645-87-9)、N,N-二异丙基乙胺(Hunig碱,DIEA,或DIPEA)(CAS No.7087-68-5)储备浓度5.7M和二甲基甲酰胺(DMF)(CAS No.68-12-2)。
用1个柱体积的DMF来洗涤固定的肽。然后用以下(或基本上类似的)组合准备反应物:(a)HCTU-20mg,50当量;(b)Hunig碱-8μL,50当量;(c)炔丙基胺-3μL,50当量;和(d)二甲基甲酰胺-500μL。盖上biospin反应器并将混合物加入到肽中。然后在环境温度下于不断混合下孵育内容物1至4h。然后按照前面描述的洗涤步骤(例如,方案(b)然后方案(a))洗涤内容物,将内容物储存在DMF中直到进行下一步。得到的产物是在其N-端固定至支持物(例如,PCA-官能化的珠子)的肽,特征在于炔基化的C-端和酸性C-端氨基酸(例如,炔基化的谷氨酸或天冬氨酸)。
对于将荧光标记的肽固定到官能化的玻璃载玻片上的方法,使用点击化学。使用标准的Cu(I)-点击化学将大约200pM的肽固定在叠氮化物-硅烷载玻片(来自PolyAn的定制载玻片,Germany)上。简而言之,将2mL包含肽(200pM)、CuSO4/三-羟丙基三唑基甲基胺(THPTA)混合物(1mM/0.5mM)和新鲜制备的L-抗坏血酸钠(5mM)的溶液在叠氮化物-硅烷载玻片上在室温孵育2小时。孵育以后,用水冲洗载玻片并如以前所述6经过微小修改进行荧光测序。为了去保护N-端PCA帽,将载玻片在0.5M DMAEH中在60℃浸泡16小时。通过用20%哌啶在DMF中的溶液孵育载玻片1小时,进行Fmoc基团的去保护。使用定制开发的脚本处理图像。
半胱氨酸标记
方案3
Figure BDA0004041285780000641
半胱氨酸侧链的游离硫醇基团是亲核的并且存在可能在随后的步骤中副反应的风险(方案3)。为了控制这一点,使侧链硫醇与第二试剂反应,从而降低副反应或交叉反应的风险。具体而言,使硫醇与惰性标记物(例如,保护基团)、官能化标记物(例如,具有可以与另一实体偶联的反应性基团的标记物)或报告标记物(例如,发射信号的标记物)反应。
为了用碘乙酰胺官能化的荧光团(能够在激发后发射信号的报告子)标记半胱氨酸,使用以下试剂:荧光团-碘乙酰胺(例如,Atto647N-碘乙酰胺)-200μg在20μL的DMF储备溶液中,DMF,水和碘乙酰胺(例如,作为非报告子“假”标记物)。
首先用1个柱体积的新鲜蒸馏的DMF洗涤固定的肽。然后用以下(或基本上类似的)组成来准备反应物:(a)荧光团-碘乙酰胺储备溶液200μg在20μL中;0.05mM(50μM)在500μL中;0.2umol;和(b)DMF-500μL。盖上biospin反应器并将混合物加入至肽。然后在不断混合下于环境温度下孵育内容物2h。然后按照前面描述的洗涤步骤(例如,方案(b)然后方案(a))洗涤内容物,将内容物储存在DMF中直到进行下一步。得到的产物是这样的肽:其中半胱氨酸残基标记有任选地荧光团偶联的碘乙酰胺标记物。如前所述,可以以与本文描述的方式类似的方式使用替代的标记物。
赖氨酸标记
方案4
Figure BDA0004041285780000651
赖氨酸的胺可以用NHS酯特异性地标记(方案4)。因为N-端伯胺预先与支持物偶联,赖氨酸氨基酸是唯一具有游离伯胺的实体。该步骤可以在半胱氨酸标记后进行,以防止交叉反应。
为了用NHS酯官能化的荧光团(能够在激发后发射信号的报告子)标记赖氨酸,使用下述试剂:荧光团-琥珀酰亚胺基酯(例如,Atto647N-NHS)-200μg在20μL的DMF储备溶液中,N,N-二异丙基乙胺(Hunig碱),无水DMF,和磺基-NHS乙酸酯(例如,作为非报告子“假”标记物)。
用1个柱体积的DMF来洗涤固定的肽。然后用以下(或基本上类似的)组合准备反应物:(a)荧光团-NHS储备溶液,200μg在20μL中;0.05mM(50μL)在500μL中;0.2umol;(b)1mM的Hunigs碱溶液-1μL;和(c)无水DMF-500μL。盖上biospin反应器并将所述混合物加入到肽中。然后在环境温度下于不断混合下孵育内容物2h。将按照前面描述的洗涤步骤(例如,方案(b)然后方案(a))洗涤内容物,将内容物储存在DMF中直到进行下一步。得到的产物是这样的肽:其中赖氨酸残基将标记有任选地荧光团偶联的NHS酯标记物。如前所述,可以以与本文描述的方式类似的方式使用替代的标记物。
天冬氨酸/谷氨酸标记
方案5
Figure BDA0004041285780000652
通过直接酰胺偶联步骤用胺官能化的试剂来标记天冬氨酸和谷氨酸的羧酸(方案5)。该步骤可以应用于内部酸性残基。在将GluC用作蛋白酶的实施例中,所有酸性残基都将位于C-端,并且已经如上文C-端标记部分所述预先炔基化。除了使用GluC,在标记赖氨酸残基之后如本文所述标记内部酸性残基,来防止分子内环化或交叉反应。
为了用胺官能化的荧光团(能够在激发后发射信号的报告子)标记天冬氨酸或谷氨酸,使用下述试剂:荧光团-胺酯(例如,Atto647N-胺)-200μg在20μL的DMF储备溶液中,N,N-二异丙基乙胺(Hunig碱),O-(1H-6-氯苯并三唑-1-基)-1,1,3,3-四甲基脲鎓六氟磷酸盐(HCTU),无水DMF,和丙胺(例如,作为非报告子“假”标记物)。本文描述的过程中可类似地使用替代的碱、偶联剂或标记物。
用1个柱体积的新鲜蒸馏的DMF洗涤固定的肽。然后用以下(或基本上类似的)组合准备反应物:(a)荧光团-NH2储备溶液200μg在20μL中;0.05mM(50μL)在500μL中;0.2μmol;(b)500mM的Hunigs碱溶液-1μL;(c)HCTU-2mg,5当量;和(c)无水DMF-500μL。盖上biospin反应器并将混合物加入至肽。然后在不断混合下于环境温度下孵育内容物2h。按照前面描述的洗涤步骤(例如,方案(b)然后方案(a))洗涤内容物,将内容物储存在DMF中直到进行下一步。得到的产物是这样的肽:其中天冬氨酸和谷氨酸残基标记有任选地荧光团偶联的胺标记物。如前所述,可以以与本文描述的方式类似的方式使用替代的标记物。
酪氨酸标记
方案6
Figure BDA0004041285780000661
使用双官能化的重氮鎓试剂通过两步标记过程可标记与酪氨酸的酚部分相邻(例如,邻位)的位置(方案6)。重氮鎓盐在其制备后约3-4周可以在功能上偶联,但在此后可能表现出降低的活性。新鲜制备的试剂可以优选用在本文中。提供第二试剂,即二硫杂环戊烷-荧光团(或二硫杂环戊烷非荧光团),以标记肽内的一个或多个酪氨酸残基。如果可用的话,任一种试剂都可以定制合成或从适当的供应商订购。
为了用官能化的二硫杂环戊烷荧光团(能够在激发后发射信号的报告子)标记酪氨酸,使用下述试剂:磷酸钠缓冲液-150mM或更高,pH7.5;三氟乙酸;甲醇;水;重氮鎓盐储备物(例如,定制合成)-1mg在25μL DMF中新鲜制备;二硫杂环戊烷-荧光团(例如,定制合成)-200μg在20μL DMF中新鲜制备;DMF;和二硫杂环戊烷-烷基(例如,作为非报告子“假”标记物)。在该实施例中使用的重氮鎓盐是4-甲酰基苯重氮鎓六氟磷酸盐。应当指出,该标记步骤的部分可以发生在将肽固定到支持物上之前。
首先用以下(或基本上类似的)组合准备反应物:(a)溶解在50-100μL磷酸钠缓冲液中的肽;(b)4-甲酰基苯重氮鎓六氟磷酸盐-1mg在25μL DMF中,4当量;和(c)150mM磷酸钠缓冲液,pH 7.5-50-100μL。盖上反应容器,并在不断混合下于环境温度下孵育混合物2h。用DMF将样品稀释至1mL总体积。接着,如前面在标题为“肽支持物上的固定”部分中所述,将肽固定至支持物。制备甲醇酸性溶液,其含有下述试剂:(i)475μL甲醇;(ii)475μL水;和(iii)50μL三氟乙酸。将二硫杂环戊烷-荧光团或二硫杂环戊烷-烷基假标记物(200μg,用TCEP还原)溶解在500μL甲醇酸性缓冲液中并与固定的肽一起孵育2h。最后,将用10个柱体积的水洗涤柱,随后如前文所述进行洗涤步骤(方案(a)),将内容物储存在DMF中直到进行下一步。得到的产物是这样的肽:其中酪氨酸残基标记有任选地荧光团偶联的二硫杂环戊烷标记物。如前所述,可以以与本文描述的方式类似的方式使用替代的标记物。
组氨酸标记
方案7
Figure BDA0004041285780000671
使用环已烯酮试剂通过两步标记过程可选择性地标记组氨酸的仲胺(方案7)。使2-环已烯酮与组氨酸以亲核加成反应进行反应,然后使酮反应以附接报告子(或非报告标记物)。一种能够与酮反应的试剂是如前所述的二硫杂环戊烷。具有与关于酪氨酸标记所述不同的荧光部分的衍生化形式可以提供另外的效用,使人们能够基于不同的报告子而区分两种氨基酸。相反,标记化学的特异性(例如,从环己酮相对于重氮鎓的反应性来看)可以用于鉴定哪个二硫杂环戊烷对应于哪个氨基酸。
为了用官能化的二硫杂环戊烷荧光团(能够在激发后发射信号的报告子)标记组氨酸,使用下述试剂:磷酸盐缓冲液-50mM或更高,pH 7.5;2-环已烯酮;三氟乙酸;甲醇;水;二硫杂环戊烷-荧光团(例如,定制合成)-200μg在20μL DMF中新鲜制备;DMF;和二硫杂环戊烷-烷基(例如,作为非报告子“假”标记物)。
首先,将固定至支持物的肽在磷酸盐缓冲液中平衡,如果必要的话,预先进行如上所述的洗涤步骤。接着,将磷酸盐缓冲液(500μL)和环已烯酮(25μL;50当量)的溶液加入含有固定的肽的biospin柱。盖上反应容器,并将在不断混合下于环境温度或30℃下孵育混合物12h。按照如上面所提供的方案(a),洗涤反应的内容物,最后在甲醇中平衡。制备甲醇酸性溶液,其含有下述试剂:(i)475μL甲醇;(ii)475μL水;和(iii)50μL三氟乙酸。将二硫杂环戊烷-荧光团或二硫杂环戊烷-烷基假标记物(200μg,用TCEP还原)溶解在500μL甲醇酸性缓冲液中并与固定的肽一起孵育2h。最后,用10个柱体积的水洗涤该柱,随后进行如前所述的洗涤步骤(方案(a)),将内容物储存在DMF中直到进行下一步。得到的产物是这样的肽:其中组氨酸残基标记有任选地荧光团偶联的二硫杂环戊烷标记物。如前所述,可以以与本文描述的方式类似的方式使用替代的标记物。
精氨酸标记
方案8
Figure BDA0004041285780000681
借助于巴顿碱用NHS酯可特异性地标记精氨酸残基的胺(方案8)。本文提供的反应可能显示出伯胺(例如,N-端赖氨酸)或硫醇(例如,半胱氨酸)的交叉反应性或干扰。该步骤可以在N-端支持物固定和半胱氨酸和赖氨酸标记之后进行以防止交叉反应。
为了用NHS酯官能化的荧光团(能够在激发后发射信号的报告子)来标记精氨酸,使用下述试剂:荧光团-琥珀酰亚胺基酯(例如,Atto647N-NHS)-200μg在20μL的DMF储备溶液中,2-叔丁基-1,1,3,3-四甲基胍(巴顿碱),无水DMF,和磺基-NHS乙酸酯(例如,作为非报告子“假”标记物)。
用1个柱体积的DMF洗涤固定的肽。用以下(或基本上类似的)组合准备反应物:(a)巴顿碱-2μL;和(b)无水DMF-200μL;随后(c)荧光团-NHS储备溶液200μg在20μL中;0.05mM(50μM)在500μL中;0.2umol。盖上biospin反应器并将所述混合物加入至所述肽。在不断混合下于40℃下孵育内容物8h。按照前面描述的洗涤步骤(例如,方案(b)然后方案(a))洗涤内容物,将内容物储存在DMF中直到进行下一步。得到的产物是这样的肽:其中精氨酸残基标记有任选地荧光团偶联的NHS酯标记物。如前所述,可以以与本文描述的方式类似的方式使用替代的标记物。
甲硫氨酸标记
方案9
Figure BDA0004041285780000691
甲硫氨酸具有弱亲核性并且可以通过基于氧化还原的方案来被选择性地标记,其中氧氮杂环丙烷基团特异性地与硫醚反应而不与半胱氨酸交叉反应(方案9)。所形成的键对还原剂诸如TCEP是稳定的。
为了用叠氮化物官能化的荧光团(能够在激发后发射信号的报告子)标记甲硫氨酸,使用下述试剂:荧光团-叠氮化物(例如,Atto647N-叠氮化物)-200μg在20μL的DMF储备溶液中;L-抗坏血酸钠-10mg在250μL缓冲液中(200mM);三(羟丙基三唑基甲基)胺(THPTA)-8.7mg在200μL水中(200mM);硫酸铜-4mg在120μL水中(200mM);水;磷酸盐缓冲液-pH 7(50mM);和氧氮杂环丙烷试剂,如在上面的方案中描述。
首先,通过将5μL浓缩试剂稀释在500μL磷酸盐缓冲液,来制备氧氮杂环丙烷试剂。将固定的肽与氧氮杂环丙烷试剂一起在环境温度下孵育10分钟。用缓冲液和水洗涤固定的肽,或者如果必要的话,按照前面概述的洗涤步骤进行洗涤。100mM硫酸铜试剂储备溶液通过组合CuSO4(50μL)、THPTA(25μL)和水(25μL)来制备;与肽一起孵育30分钟。用以下(或基本上类似的)组合来准备反应物:(a)磷酸盐缓冲液(400μL);(b)抗坏血酸钠(25μL)(c)CuSO4储备溶液(50μL);和(d)荧光团-氮化物储备溶液200μg在20μL中;0.05mM(50μM)在500μL中;0.2μmol。将反应物与固定的肽组合,并然后在不断混合下于环境温度下孵育内容物2-4h。按照前面描述的洗涤步骤(例如,方案(a)然后方案(b))来洗涤内容物,将内容物储存在DMF中直到进行下一步。得到的产物是这样的肽:其中甲硫氨酸残基标记有任选地荧光团偶联的三唑标记物。如前所述,可以以与本文描述的方式类似的方式使用替代的标记物。
标记磷酸化的残基
方案10
Figure BDA0004041285780000701
通过β-消除随后共轭加成(例如,迈克尔受体反应)可标记磷酸化的氨基酸诸如丝氨酸和苏氨酸方案10)。这一系列反应步骤提供了相对于其它磷酸化的氨基酸诸如酪氨酸(pTyr)对磷酸化的丝氨酸(pSer)和苏氨酸(pThr)的选择性标记。后续可以实施泛磷酸标记(pan-phospho labeling)方法来标记pTyr。
为了用官能化的NHS酯荧光团(能够在激发后发射信号的报告子)标记pSer和pThr,使用下述试剂:溶解的肽-1μmol在100μL水或水/乙腈(1:1vv)中;氢氧化钡八水合物(46mg在1mL水中);HEPES缓冲液-pH 8.5(100mM);三(2-羧基乙基)膦盐酸盐溶液(TCEP)(500mM);胱胺二盐酸盐-152mg在1mL水中(1M);荧光团-琥珀酰亚胺基酯(例如,Atto647N-NHS)-200μg在20μL的DMF储备溶液中;Hunig碱(500mM在DMF中);和无水DMF。
通过将100μL肽溶液(1μmol)与100μL氢氧化钡溶液组合,在微量离心管中制备第一反应物。将反应混合物在37℃孵育4h,随后以5000rpm离心2分钟。磷酸钡从溶液沉淀出来。将内容物用HEPES缓冲液中和,并固定至支持物,如前所述。接着,用下述组合准备第二反应物:(a)1M胱胺溶液(50μL);(b)500mM TCEP溶液(100μL);(c)HEPES缓冲液(100μL);和(d)水(250μL)。在不断混合下于37℃下孵育反应混合物4-12h。反应结束以后,将反应物用10个柱体积的水洗涤,随后用洗涤方案(a)进行洗涤。接着,用下述组合准备第三反应物:荧光团-NHS,200μg在20μL中,0.5mM(500μM)在500μL.0.2μmol中;500mM储备溶液Hunig碱(1μL);和无水DMF(500μL)。将反应混合物加入固定的肽,并盖上反应容器,并在不断混合下于环境温度下孵育4h。反应结束以后,按照前面描述的洗涤步骤(方案(b),随后方案(a))洗涤肽,将内容物储存在DMF中直到进行下一步。得到的产物是这样的肽:其中pSer和pThr残基标记有任选地荧光团偶联的标记物。如前所述,可以以与本文描述的方式类似的方式使用替代的标记物。
实施例3:从支持物切割肽
在涉及三氟乙酸(TFA)和随后的肼的两步过程之后,从支持物切割肽。在支持物是包含珠子、间隔子、rink部分的PCA树脂和结合至肽的PCA部分的实施例中,PCA部分通过用TFA处理从rink部分切割的。在第二步中,肽从PCA部分被切割,从而提供具有完整N-端的肽。
为了从支持物诸如PCA树脂切割肽,使用下述试剂:任选经标记的(例如,一种或多种荧光团标记物)固定的肽;500mM Hunig碱;DMF;甲醇;水;100mM二甲基氨基乙基肼二盐酸盐(DMEAE-肼)-440mg在25mL PBS中;乙腈;三氟乙酸;三异丙基硅烷;二氯甲烷(DCM);和乙醚(Et2O)。
首先,根据前文描述的洗涤步骤,按照方案(a),或者如果先前储存在有机介质中,则按照方案(b)随后按照方案(a),来洗涤固定的肽。用DCM充分洗涤肽,然后在真空下干燥。接着,用以下(或基本上类似的)组合制备TFA溶液:(a)TFA(4.8mL);(b)三异丙基硅烷(0.1mL);和(c)水(0.1mL)。将TFA溶液(1mL)加入所述肽,并盖上反应容器并进行旋转。在环境温度或稍微温热(例如,30℃)下孵育反应物1-2h,然后将溶液洗脱到微量离心管中。借助于氮气吹扫以除去TFA或大幅减少TFA体积。将肽重新悬浮在Et2O中并冷却至-80℃。将微量离心管在4℃下以10000rpm离心10分钟。除去上清液以后,用1:1v/v甲醇/水溶解沉淀物。接着,将溶解的肽固定至第二支持物(例如,玻璃载玻片),如下所述。一旦肽被固定至第二支持物(例如,通过肽的C-末端),就可以借助于肼从N-端无痕切割PCA部分。如上面试剂列表中所述,使用440mg DMEAE-肼和25mL PBS缓冲液制备肼溶液。将固定至第二支持物的肽浸泡在肼溶液中,将该溶液加热至60℃保持12-16h。用水洗涤肽。最终结果是标记的肽在其C-端固定至第二支持物,从而促进从N-端进行荧光测序(例如,使用埃德曼降解或相关技术)。
实施例4:肽捕获过程
本实施例涵盖选择性地将肽捕获在提杆上的方法。本申请提供了一系列用于捕获肽的基底。一类这样的基底是提杆,其可以包含含有肽捕获试剂的固体支持物、以及用于将固体支持物定位在样品内的杆。提杆可以由用户(例如,用户可以握住提杆的杆)或器械来操纵。提杆固体支持物可以包含本申请的反应性基团,诸如对半胱氨酸或肽C-端具有选择性的反应性基团。
图8描绘了与本申请一致的使用提杆的方法。将肽混合物溶解在大约500μL包含水、3%乙腈和0.1%甲酸的溶液中,其中该肽混合物含有血管紧张素(作为阳性对照肽提供)、包含序列AKGAGRY{PRA}N-ONH2(SEQ ID NO:4,其中{PRA}表示炔丙基甘氨酸)的肽、捕获阴性对照肽和感兴趣的肽。将包含肽捕获试剂的提杆固体支持物置于样品中并在37℃孵育24小时,为血管紧张素、2K肽、捕获阴性对照肽和感兴趣的肽偶联至提杆的肽捕获试剂提供足够的时间。然后将提杆在新鲜的去离子水中洗涤两次各2分钟以除去未结合的肽。然后将提杆在空气中或用N2流干燥。最后,将提杆放入干净的离心管中进行储存或运输。通过将提杆重新悬浮在溶液中并提供切割试剂以使所述肽从肽捕获试剂解偶联,可以回收偶联至提杆的肽。
实施例4:荧光测序测定稳定性和效率
本实施例涵盖了一组实施例荧光测序测定。在该实施例中,序列AXAGANGSNG{PRA}N(SEQ ID NO:5)的肽,其中PRA是炔丙基甘氨酸且X是氨基酸-Cys、Glu、pSer或Lys,如图12A-图12D所示。使位置X处的Cys、Glu、pSer或Lys与标记物反应,与包含叠氮化物第二反应性基团(图12A-图12C)或降冰片烯第二反应性基团(图12D)的“卡”标记物反应。然后将“扣”报告部分偶联至“卡”标记物(荧光团Atto647N-PEG4-DBCO偶联至叠氮化物卡柄部和荧光团Atto647N-PEG4-mTET偶联至降冰片烯卡柄部)。
图12A-图12D提供了以热图形式的经标记的肽的荧光测序结果,其中显示了在每个埃德曼循环(E)后消失的荧光点的计数。缺少埃德曼试剂的对照循环用M来表示。最大计数在E2位置。对于半胱氨酸、谷氨酸和赖氨酸(图12A、图12B和图12D),最大荧光减少发生在第二次埃德曼降解步骤之后。结果表明,可以用“卡”标记-“扣”报告部分来稳定地标记肽。
尽管在本文中已经显示和描述了本发明的优选实施方案,但是本领域技术人员将会明白,这样的实施方案仅作为示例提供。本发明无意受限于在说明书内提供的具体实施例。虽然已经参考前述说明书描述了本发明,但本文实施方案的描述和例证无意以限制性含义进行解释。现在本领域技术人员会做出众多变体、变化和置换而不脱离本发明。此外,应当理解,本发明的所有方面不限于本文阐述的具体叙述、构型或相对比例,其取决于各种条件和变量。应当理解,本文描述的发明的实施方案的各种替代方案可以用于实践本发明。因此,考虑本发明还应涵盖任何这样的替代、修改、变化或等效物。以下权利要求意图限定本发明的范围,并且由此覆盖在这些权利要求和它们的等同方案的范围内的方法和结构。
序列表
<110> 德克萨斯大学系统董事会
<120> 用于多肽处理和分析的方法、系统和试剂盒
<130> UTFB.P1234WO
<150> US 63/027,219
<151> 2020-05-19
<160> 5
<170> PatentIn 3.5版
<210> 1
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 合成的肽
<220>
<221> misc_feature
<222> (1)..(3)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (5)..(8)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (10)..(10)
<223> Xaa可以是任何天然存在的氨基酸
<400> 1
Xaa Xaa Xaa Lys Xaa Xaa Xaa Xaa Lys Xaa Lys
1 5 10
<210> 2
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> 合成的肽
<400> 2
Lys Asp Asp Tyr Ala Gly Gly Gly Ala Ala Gly Lys Asp Ala
1 5 10
<210> 3
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 合成的肽
<220>
<221> misc_feature
<222> (2)..(3)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (5)..(11)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (13)..(13)
<223> Xaa可以是任何天然存在的氨基酸
<400> 3
Lys Xaa Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Lys Xaa
1 5 10
<210> 4
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成的肽
<220>
<221> MOD_RES
<222> (8)..(8)
<223> X = 炔丙基甘氨酸
<400> 4
Ala Lys Gly Ala Gly Arg Tyr Xaa Asn
1 5
<210> 5
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 合成的肽
<220>
<221> misc_feature
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MOD_RES
<222> (11)..(11)
<223> X = 炔丙基甘氨酸
<400> 5
Ala Xaa Ala Gly Ala Asn Gly Ser Asn Gly Xaa Asn
1 5 10

Claims (146)

1.一种包含肽的系统,其中所述肽固定至至少一种支持物;且其中所述肽包含与标记物偶联的氨基酸,其中所述标记物包含:(i)设置为与第二反应性基团偶联的第一反应性基团,所述第二反应性基团与设置为发射信号的报告部分偶联,或(ii)保护基团,所述保护基团设置为防止所述标记物和所述第二反应性基团之间的偶联。
2.根据权利要求1所述的系统,其中所述至少一种支持物包含珠子、聚合物基质或阵列。
3.根据权利要求2所述的系统,其中所述阵列是显微镜载玻片。
4.根据权利要求1所述的系统,其中所述肽的N-端与所述至少一种支持物偶联。
5.根据权利要求4所述的系统,其中所述至少一种支持物是珠子。
6.根据权利要求4所述的系统,其中所述肽的N-端与可切割单元偶联,其中所述可切割单元与所述至少一种支持物偶联。
7.根据权利要求6所述的系统,其中所述可切割单元包含以下中的至少一种:(i)可切割部分、(ii)醛、(iii)所述至少一种支持物或(iv)间隔子。
8.根据权利要求7所述的系统,其中所述可切割单元包含(i)至(iv)。
9.根据权利要求1所述的系统,其中所述肽的C-端与所述至少一种支持物偶联。
10.根据权利要求9所述的系统,其中所述至少一种支持物是显微镜载玻片。
11.根据权利要求9所述的系统,其中所述C-端修饰有包含炔烃或叠氮化物的化合物。
12.根据权利要求11所述的系统,其中所述炔烃或所述叠氮化物设置为与所述至少一种支持物偶联。
13.根据权利要求9所述的系统,其中所述C-端是酸性氨基酸,其中所述C-端包含第一酸性残基和第二酸性残基。
14.根据权利要求13所述的系统,其中所述第一酸性残基是C-端羧酸。
15.根据权利要求13所述的系统,其中所述第二酸性残基是天冬氨酸侧链或谷氨酸侧链。
16.根据权利要求13所述的系统,其中所述第一酸性残基和所述第二酸性残基修饰有包含炔烃或叠氮化物的化合物。
17.根据权利要求16所述的系统,其中所述炔烃或所述叠氮化物设置为与所述至少一种支持物偶联。
18.根据权利要求1所述的系统,其中所述肽的N-端与所述至少一种支持物的第一支持物偶联,其中所述第一支持物是珠子,且其中所述肽的C-端与所述至少一种支持物的第二支持物偶联,其中所述第二支持物是显微镜载玻片。
19.根据权利要求1所述的系统,其中所述报告部分设置为在激发时发射所述信号。
20.根据权利要求1所述的系统,其中所述信号是可检测信号。
21.根据权利要求20所述的系统,其中所述可检测信号是光学信号。
22.根据权利要求1所述的系统,其中所述报告部分包含荧光染料。
23.根据权利要求1所述的系统,其中所述报告部分包含间隔子。
24.根据权利要求1所述的系统,其中所述保护基团不发射光学可检测信号。
25.根据权利要求1所述的系统,其中所述氨基酸选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、脯氨酸、天冬酰胺、谷氨酰胺和色氨酸组成的组。
26.根据权利要求1所述的系统,其中所述氨基酸包含翻译后修饰。
27.根据权利要求26所述的系统,其中所述翻译后修饰选自由糖基化、乙酰化、烷基化、生物素化、谷氨酰化、糖基化、异戊二烯化、磷酸化、脂化、磷酸泛酰巯基乙胺化、硫酸化、硒化、酰胺化、泛素化、羟基化、硝化、亚硝酰化、瓜氨酸化、N-端谷氨酰胺环化、N-端谷氨酸环化和SUMO化组成的组。
28.根据权利要求1所述的系统,其中所述肽包含与多个标记物偶联的多个氨基酸。
29.根据权利要求28所述的系统,其中所述多个氨基酸包含与第一标记物偶联的第一氨基酸和与第二标记物偶联的第二氨基酸。
30.根据权利要求29所述的系统,其中所述多个氨基酸包含:(i)与多个第一标记物偶联的多个第一氨基酸,以及(ii)与多个第二标记物偶联的多个第二氨基酸。
31.根据权利要求29所述的系统,其中所述第一标记物仅与所述第一氨基酸偶联,且所述第二标记物仅与所述第二氨基酸偶联。
32.根据权利要求28所述的系统,其中所述多个标记物中的至少一个标记物与所述多个氨基酸的特定氨基酸类型偶联。
33.根据权利要求28所述的系统,其中所述多个标记物中的至少一个标记物设置为与偶联至特定报告部分的特定第二反应性基团反应。
34.根据权利要求1所述的系统,其中所述肽包含多个氨基酸。
35.根据权利要求34所述的系统,其中所述多个氨基酸中的至少一个氨基酸选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、谷氨酰胺、天冬酰胺和色氨酸组成的组。
36.根据权利要求35所述的系统,其中所述至少一个氨基酸与所述标记物偶联。
37.根据权利要求1所述的系统,其中所述第一反应性基团选自由叠氮化物、炔烃、烯烃、醛、酮、四嗪、硫醇、二硫醇、环辛烯和降冰片烯组成的组。
38.根据权利要求37所述的系统,其中所述炔烃是应变炔烃。
39.根据权利要求37所述的系统,其中所述第一反应性基团选自所述叠氮化物、所述烯烃、所述醛、所述酮和所述四嗪组成的组。
40.根据权利要求1所述的系统,其中所述第二反应性基团选自由炔烃、叠氮化物、硫醇、二硫醇、环辛烯、烯烃、醛、酮、四嗪和降冰片烯组成的组。
41.根据权利要求40所述的系统,其中所述第一反应性基团选自由所述炔烃、所述硫醇、所述二硫醇和所述环辛烯组成的组。
42.根据权利要求40所述的系统,其中所述炔烃是应变炔烃。
43.一种用于处理或分析肽的方法,所述方法包括:
(a)提供所述肽,所述肽包含与标记物偶联的氨基酸,其中所述标记物包含(i)设置为与第二反应性基团偶联的第一反应性基团,所述第二反应性基团偶联至设置为发射信号的报告部分,或(ii)保护基团,所述保护基团设置为防止所述标记物和所述第二反应性基团之间的偶联;
(b)使所述肽与包含所述第二反应性基团的混合物接触;
(c)在所述肽固定至至少一种支持物的情况下,检测来自所述肽的信号;和
(d)使用所述信号或信号变化来鉴定所述肽的所述氨基酸或另外氨基酸。
44.根据权利要求43所述的方法,其中,在(a)或(b)中,将所述肽固定至所述至少一种支持物。
45.根据权利要求43所述的方法,所述方法进一步包括:在(c)之前,固定所述肽。
46.根据权利要求43所述的方法,所述方法进一步包括:在(b)之后,固定所述肽。
47.根据权利要求43所述的方法,其中,在(a)中,所述标记物包含所述第一反应性基团,且其中,在(b)中,使所述第二反应性基团与所述第一反应性基团反应。
48.根据权利要求43所述的方法,其中以多个肽的形式来提供所述肽。
49.根据权利要求48所述的方法,其中所述肽包含所述多个肽中的至少一个肽。
50.根据权利要求48所述的方法,其中将所述多个肽固定至多个支持物。
51.根据权利要求48所述的方法,其中所述多个肽包含第一肽和第二肽。
52.根据权利要求51所述的方法,其中所述第一肽包含与第一标记物偶联的第一氨基酸,且所述第二肽包含与第二标记物偶联的第二氨基酸。
53.根据权利要求52所述的方法,其中所述第一标记物设置为与所述第二反应性基团反应,且所述第二标记物设置为与和所述第二反应性基团不同的第二反应性基团反应。
54.根据权利要求53所述的方法,其中所述不同的第二反应性基团与第二报告部分偶联,所述第二报告部分配置为发射与所述报告部分不同的信号。
55.根据权利要求43所述的方法,其中所述肽包含与多个标记物偶联的多个氨基酸。
56.根据权利要求55所述的方法,其中所述多个氨基酸包含与第一标记物偶联的第一氨基酸,和与第二标记物偶联的第二氨基酸。
57.根据权利要求56所述的方法,其中所述多个氨基酸包含与多个第一标记物偶联的多个第一氨基酸,和与多个第二标记偶联的多个第二氨基酸。
58.根据权利要求56所述的方法,其中所述第一标记物仅与所述第一氨基酸偶联,且所述第二标记物仅与所述第二氨基酸偶联。
59.根据权利要求55所述的方法,其中所述多个标记物中的至少一个标记物与所述多个氨基酸的特定氨基酸类型偶联。
60.根据权利要求55所述的方法,其中所述多个标记物中的至少一个标记物设置为与偶联至特定报告部分的特定第二反应性基团反应。
61.根据权利要求43所述的方法,其中所述肽包含多个氨基酸。
62.根据权利要求61所述的方法,其中所述多个氨基酸中的至少一个氨基酸选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、天冬酰胺、谷氨酰胺和色氨酸组成的组。
63.根据权利要求61所述的方法,其中所述至少一个氨基酸偶联至所述标记。
64.根据权利要求61所述的方法,其中所述多个氨基酸包含至少两种氨基酸类型。
65.根据权利要求64所述的方法,其中并非所有氨基酸类型的所述多个氨基酸被标记。
66.根据权利要求64所述的方法,其中所述至少两种氨基酸类型包含第一氨基酸类型和第二氨基酸类型。
67.根据权利要求66所述的方法,其中所述第一氨基酸类型与第一标记物偶联,且其中所述第二氨基酸类型与第二标记物偶联。
68.根据权利要求67所述的方法,其中所述第一标记物和所述第二标记物各自与不同的报告部分偶联。
69.根据权利要求64所述的方法,其中所述至少两种氨基酸类型中的每种氨基酸类型与不同的标记物偶联。
70.根据权利要求64所述的方法,其中所述肽包含至少四种氨基酸类型,其中所述至少四种氨基酸类型中的每种氨基酸类型与不同的标记物偶联。
71.根据权利要求61所述的方法,其中并非全部的所述多个氨基酸被标记。
72.根据权利要求43所述的方法,其中使用所述信号或信号变化来鉴定所述肽的序列的至少一部分。
73.根据权利要求43所述的方法,所述方法进一步包括:(e),使所述肽经受足以从固定至所述至少一种支持物的所述肽中除去至少一个氨基酸的条件。
74.根据权利要求73所述的方法,所述方法进一步包括:(f),重复(d)和(e)以检测来自固定至所述至少一种支持物的所述肽的至少一个另外信号或信号变化,和(ii)使用所述信号或信号变化和所述另外信号或信号变化来鉴定固定至所述至少一种支持物的所述肽的序列的至少一部分。
75.根据权利要求73所述的方法,其中足以除去至少一个氨基酸的所述条件包括埃德曼降解试剂或含有有机磷酸酯的试剂。
76.根据权利要求73所述的方法,其中从所述肽的N-端除去所述至少一个氨基酸。
77.根据权利要求73所述的方法,其中,在(e)之后,与所述标记物偶联的所述氨基酸变成末端氨基酸。
78.根据权利要求43所述的方法,其中,在(a)至(c)之后,进行(d)。
79.根据权利要求43所述的方法,其中,用具有单分子灵敏度的光学检测器检测所述至少一个信号或信号变化。
80.根据权利要求43所述的方法,其中所述至少一个信号或信号变化包括不同频率或频率范围的多个信号。
81.根据权利要求43所述的方法,其中所述至少一个信号或信号变化包括不同强度的多个信号。
82.根据权利要求43所述的方法,其中所述至少一个信号或信号变化是光学信号。
83.根据权利要求43所述的方法,其中所述报告部分产生所述至少一个信号或信号变化。
84.根据权利要求43所述的方法,其中所述报告部分包含染料,所述染料产生所述至少一个信号或信号变化。
85.根据权利要求43所述的方法,其中所述保护基团包含一个或多个基团,每个基团独立地选自由叠氮化物、烷基、亚烷基、芳基、杂芳基、杂芳基-烷基和芳基-烷基组成的组。
86.一种用于标记肽的氨基酸的方法,所述方法包括:
(a)提供所述肽,其中所述肽包含与叠氮化物偶联的内部氨基酸和与炔烃偶联的C-端;和
(b)在使第一报告子与所述内部氨基酸反应的条件下,使所述肽与所述第一报告子接触,其中所述第一报告子包含应变炔烃。
87.根据权利要求86所述的方法,其中在不存在铜(Cu)的情况下,进行(b)。
88.根据权利要求86所述的方法,所述方法进一步包括:(c),使不同于所述第一报告子的第二报告子与所述C-端反应,其中所述第二报告子包含非应变炔烃。
89.根据权利要求88所述的方法,其中在存在铜(Cu)的情况下,进行(c)。
90.根据权利要求86所述的方法,其中偶联至所述内部氨基酸的所述叠氮化物不与偶联至所述C-端的所述炔烃反应。
91.用于测定样品中的肽的序列的试剂盒,所述试剂盒包含:
报告子;
标记物,其包含:第一反应性基团以及(i)第二反应性基团或(ii)保护基团,其中所述第一反应性基团设置为与氨基酸类型的氨基酸偶联,其中所述第二反应性基团设置为与所述报告子偶联,所述报告子包含设置为发射信号的报告部分,且其中所述保护基团设置为防止所述标记物和所述报告部分之间的偶联;和
关于使用所述标记物来处理所述肽以提供包含与所述标记物偶联的所述氨基酸的所述肽的说明。
92.根据权利要求91所述的试剂盒,其中所述报告子与第三反应性基团偶联,所述第三反应性基团设置为与所述第二反应性基团反应。
93.根据权利要求91所述的试剂盒,其中所述报告子设置为在激发时发射所述信号。
94.根据权利要求91所述的试剂盒,其中所述报告子包含荧光染料。
95.根据权利要求91所述的试剂盒,其中所述报告子包含间隔子。
96.根据权利要求91所述的试剂盒,其中所述保护基团不发射光学可检测信号。
97.根据权利要求91所述的试剂盒,所述试剂盒进一步包含(d)蛋白捕获试剂。
98.根据权利要求97所述的试剂盒,其中所述蛋白捕获试剂包含偶联至可切割接头的固体支持物,其中所述可切割接头与醛偶联。
99.根据权利要求98所述的试剂盒,其中所述蛋白捕获试剂设置为与所述肽的N-端偶联。
100.根据权利要求98所述的试剂盒,其中所述固体支持物是珠子。
101.根据权利要求98所述的试剂盒,其中所述醛是吡啶甲醛(PCA)或其衍生物。
102.根据权利要求97所述的试剂盒,所述试剂盒进一步包含(e)表面附着试剂。
103.根据权利要求102所述的试剂盒,其中所述表面附着试剂包含炔烃或叠氮化物。
104.根据权利要求102所述的试剂盒,其中所述表面附着试剂设置为与所述肽的C-端偶联。
105.根据权利要求102所述的试剂盒,所述试剂盒进一步包含所述表面附着试剂所附着的支持物。
106.根据权利要求105所述的试剂盒,其中所述支持物是显微镜载玻片。
107.根据权利要求91所述的试剂盒,所述试剂盒进一步包含至少一种蛋白酶、至少一种消化试剂和固体支持珠子。
108.一种用于处理或分析肽的方法,所述方法包括:
(a)提供所述肽,所述肽包含与第一反应性基团偶联的氨基酸,所述第一反应性基团设置为与偶联至支持物的第二反应性基团偶联;
(b)使所述肽与所述第二反应性基团接触以允许所述第一反应性基团偶联至所述第二反应性基团,由此将所述肽固定至所述支持物;
(c)在所述肽固定至所述支持物的情况下,检测来自与所述肽的氨基酸偶联的标记物的信号;和
(d)使用所述信号或其变化来鉴定所述氨基酸。
109.根据权利要求108所述的方法,其中所述第一反应性基团经由官能团偶联至所述氨基酸。
110.根据权利要求109所述的方法,其中所述官能团偶联至所述氨基酸的反应性侧链。
111.根据权利要求108所述的方法,其中(a)进一步包括:使所述氨基酸偶联至与所述第一反应性基团偶联的官能团。
112.根据权利要求111所述的方法,其中所述官能团在(a)中仅偶联至所述氨基酸。
113.根据权利要求108所述的方法,其中所述氨基酸选自由赖氨酸、半胱氨酸、谷氨酸、天冬氨酸、酪氨酸、精氨酸、组氨酸、苏氨酸、丝氨酸、脯氨酸、谷氨酰胺和色氨酸组成的组。
114.根据权利要求108所述的方法,其中所述第一反应性基团选自由叠氮化物、炔烃、烯烃、醛、酮、四嗪、硫醇、二硫醇、酯、环辛烯和降冰片烯或活化的酯组成的组。
115.根据权利要求114所述的方法,其中所述酯是活化的酯。
116.根据权利要求115所述的方法,其中所述活化的酯是EDC-碳化二亚胺。
117.根据权利要求114所述的方法,其中所述第一反应性基团是所述叠氮化物或所述炔烃。
118.根据权利要求108所述的方法,其中所述第二反应性基团选自由炔烃、叠氮化物、硫醇、二硫醇、环辛烯、烯烃、醛、酮、四嗪和降冰片烯组成的组。
119.根据权利要求116所述的方法,其中所述第二反应性基团是所述炔烃或所述叠氮化物。
120.根据权利要求108所述的方法,其中所述第一反应性基团和所述第二反应性基团经由点击反应而偶联。
121.根据权利要求108所述的方法,其中所述第二反应性基团通过接头偶联至所述支持物。
122.根据权利要求119所述的方法,其中所述接头是键或任选取代的亚烷基或任选取代的杂亚烷基。
123.根据权利要求108所述的方法,其中所述支持物是阵列。
124.根据权利要求108所述的方法,其中所述支持物是珠子。
125.根据权利要求108所述的方法,其中所述与第一反应性基团偶联的氨基酸是末端氨基酸。
126.根据权利要求108所述的方法,其中所述与第一反应性基团偶联的氨基酸是内部氨基酸。
127.根据权利要求108所述的方法,其中在(a)中的所述氨基酸与在(c)中偶联至所述标记物的所述氨基酸相同。
128.根据权利要求108所述的方法,其中在(a)中的所述氨基酸与在(c)中偶联至所述标记物的所述氨基酸不同。
129.根据权利要求108所述的方法,其中(c)进一步包括:在(b)之前,使所述标记物偶联至所述肽的所述氨基酸。
130.根据权利要求108所述的方法,其中(c)进一步包含在(b)之后,使所述标记物偶联至所述肽的所述氨基酸。
131.根据权利要求108所述的方法,其中所述标记物偶联至报告部分。
132.根据权利要求131所述的方法,其中所述报告部分偶联至第三反应性基团或抗体。
133.根据权利要求132所述的方法,其中所述第三反应性基团或所述抗体设置为与(c)中所述肽的所述氨基酸偶联。
134.根据权利要求133所述的方法,其中(c)中所述肽的所述氨基酸是末端氨基酸。
135.根据权利要求133所述的方法,其中(c)中所述肽的所述氨基酸是内部氨基酸。
136.根据权利要求131所述的方法,其中所述报告部分偶联至接头,其中所述抗体偶联至(c)中所述肽的所述氨基酸。
137.根据权利要求108所述的方法,所述方法进一步包括:在(c)之后,使所述肽经受足以从所述肽的末端端部除去氨基酸的条件。
138.根据权利要求137所述的方法,其中所述条件是埃德曼降解条件。
139.根据权利要求108所述的方法,所述方法进一步包括:重复(c)和(d)一次或多次以鉴定所述肽的多个氨基酸的信号模式,其中所述多个氨基酸的所述信号模式包括(d)中的所述信号或其变化。
140.根据权利要求139所述的方法,所述方法进一步包括:使用所述多个氨基酸的所述信号模式来得到所述肽的序列。
141.一种用于处理或分析肽的系统,所述系统包括:
包含与第一反应性基团偶联的氨基酸的肽;和
与第二反应性基团偶联的支持物,
其中所述第一反应性基团设置为与所述第二反应性基团偶联以固定邻近所述支持物的所述肽。
142.根据权利要求43至85中任一项所述的方法,所述方法进一步包括:至少部分地基于所述肽的序列来选择所述标记物。
143.根据权利要求43至85或142中任一项所述的方法,所述方法进一步包括:至少部分地基于所述肽所源自的生物体的类型来选择所述标记物。
144.根据权利要求143所述的方法,其中所述标记物设置为与所述氨基酸偶联,且其中所述氨基酸的类型包括所述生物体的氨基酸的至少1%。
145.根据权利要求143所述的方法,其中所述标记物设置为与所述氨基酸偶联,且其中所述氨基酸的类型是所述生物体中赖氨酸、半胱氨酸、酪氨酸、组氨酸、谷氨酸盐、天冬氨酸盐和色氨酸中的最丰富的。
146.根据权利要求43至85和142至145中任一项所述的方法,其中所述报告部分在所述肽所源自的样品中在25℃具有至少12小时的半衰期。
CN202180049655.6A 2020-05-19 2021-05-19 用于多肽处理和分析的方法、系统和试剂盒 Pending CN115916799A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063027219P 2020-05-19 2020-05-19
US63/027,219 2020-05-19
PCT/US2021/033077 WO2021236716A2 (en) 2020-05-19 2021-05-19 Methods, systems and kits for polypeptide processing and analysis

Publications (1)

Publication Number Publication Date
CN115916799A true CN115916799A (zh) 2023-04-04

Family

ID=78708910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180049655.6A Pending CN115916799A (zh) 2020-05-19 2021-05-19 用于多肽处理和分析的方法、系统和试剂盒

Country Status (5)

Country Link
US (1) US20240002925A1 (zh)
EP (1) EP4153608A4 (zh)
JP (1) JP2023527149A (zh)
CN (1) CN115916799A (zh)
WO (1) WO2021236716A2 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11435358B2 (en) 2011-06-23 2022-09-06 Board Of Regents, The University Of Texas System Single molecule peptide sequencing
CA3117476A1 (en) 2018-10-05 2020-04-09 Board Of Regents, The University Of Texas System Solid-phase n-terminal peptide capture and release
CN117813506A (zh) * 2021-05-26 2024-04-02 德克萨斯大学系统董事会 缀合的生物分子条形码的组合物、方法和效用
CN119790193A (zh) 2022-07-12 2025-04-08 阿布鲁斯生物公司 通过将氨基酸聚合物重新编码为dna聚合物来确定蛋白质信息
WO2024040236A2 (en) 2022-08-19 2024-02-22 Abrus Bio, Inc. Determination of protein information by recoding amino acid polymers into dna polymers
WO2024076928A1 (en) 2022-10-03 2024-04-11 Erisyon Inc. Fluorophore-polymer conjugates and uses thereof
WO2024211297A2 (en) * 2023-04-02 2024-10-10 Oregon Health & Science University Protein / polypeptide sequencing by expansion (prose)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2020006395A (es) * 2017-12-18 2020-12-03 Janssen Biotech Inc Radioetiquetado de polipeptidos.
CA3117476A1 (en) * 2018-10-05 2020-04-09 Board Of Regents, The University Of Texas System Solid-phase n-terminal peptide capture and release

Also Published As

Publication number Publication date
WO2021236716A2 (en) 2021-11-25
US20240002925A1 (en) 2024-01-04
EP4153608A4 (en) 2024-11-06
JP2023527149A (ja) 2023-06-27
EP4153608A2 (en) 2023-03-29
WO2021236716A3 (en) 2022-06-23

Similar Documents

Publication Publication Date Title
US20240302380A1 (en) Single molecule peptide sequencing
US20240002925A1 (en) Methods, systems and kits for polypeptide processing and analysis
US11971417B2 (en) Single-molecule protein and peptide sequencing
US12379381B2 (en) Single molecule peptide sequencing
US12498379B2 (en) Solid-phase N-terminal peptide capture and release
EP4281774B1 (en) Biomolecule quantitation
US20240201198A1 (en) Compositions, methods, and utility of conjugated biomolecule barcodes
WO2023091961A2 (en) Methods and systems for automated sample processing
US20230104998A1 (en) Single-molecule protein and peptide sequencing
US20240426831A1 (en) Structural profiling of native proteins using fluorosequencing, a single molecule protein sequencing technology
US20250180575A1 (en) High efficiency labels for biomolecular analysis
WO2024076928A1 (en) Fluorophore-polymer conjugates and uses thereof
WO2025024572A1 (en) Protein quantification, tracking, and identification via peptide barcodes
WO2007009457A2 (en) Identification of protein ligands modifying a cellular response

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination