CN120303045A - 用于鉴定形成、稳定或破坏分子复合物的化合物的方法和系统 - Google Patents
用于鉴定形成、稳定或破坏分子复合物的化合物的方法和系统 Download PDFInfo
- Publication number
- CN120303045A CN120303045A CN202380081283.4A CN202380081283A CN120303045A CN 120303045 A CN120303045 A CN 120303045A CN 202380081283 A CN202380081283 A CN 202380081283A CN 120303045 A CN120303045 A CN 120303045A
- Authority
- CN
- China
- Prior art keywords
- fractions
- compounds
- protein
- sample
- fraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01D—SEPARATION
- B01D15/00—Separating processes involving the treatment of liquids with solid sorbents; Apparatus therefor
- B01D15/08—Selective adsorption, e.g. chromatography
- B01D15/26—Selective adsorption, e.g. chromatography characterised by the separation mechanism
- B01D15/34—Size-selective separation, e.g. size-exclusion chromatography; Gel filtration; Permeation
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/14—Extraction; Separation; Purification
- C07K1/16—Extraction; Separation; Purification by chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8675—Evaluation, i.e. decoding of the signal into analytical information
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6845—Methods of identifying protein-protein interactions in protein mixtures
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B30/00—Methods of screening libraries
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/88—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
- G01N2030/8809—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample
- G01N2030/8813—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials
- G01N2030/8831—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials involving peptides or proteins
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N24/00—Investigating or analyzing materials by the use of nuclear magnetic resonance, electron paramagnetic resonance or other spin effects
- G01N24/08—Investigating or analyzing materials by the use of nuclear magnetic resonance, electron paramagnetic resonance or other spin effects by using nuclear magnetic resonance
- G01N24/088—Assessment or manipulation of a chemical or biochemical reaction, e.g. verification whether a chemical reaction occurred or whether a ligand binds to a receptor in drug screening or assessing reaction kinetics
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2500/00—Screening for compounds of potential therapeutic value
- G01N2500/02—Screening involving studying the effect of compounds C on the interaction between interacting molecules A and B (e.g. A = enzyme and B = substrate for A, or A = receptor and B = ligand for the receptor)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2570/00—Omics, e.g. proteomics, glycomics or lipidomics; Methods of analysis focusing on the entire complement of classes of biological molecules or subsets thereof, i.e. focusing on proteomes, glycomes or lipidomes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Hematology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Urology & Nephrology (AREA)
- Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medicinal Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Food Science & Technology (AREA)
- Cell Biology (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Organic Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Library & Information Science (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本文描述了用于鉴定蛋白质‑蛋白质复合物的组分的方法以及用于鉴定引起蛋白质复合物形成、稳定化或解离的一种或多种化合物的方法。还描述了用于执行此类方法的系统。所述方法可包括对含有生物样品的第一部分的第一样品和含有与药物、化合物库或天然提取物组合的所述生物样品的第二部分的第二样品进行分级。可使用蛋白质组学或代谢组学方法分析洗脱级分,以鉴定与靶蛋白形成复合物的一种或多种结合蛋白,或引起复合物形成、稳定化或解离的一种或多种化合物。
Description
相关申请的交叉引用
本申请要求2022年11月26日提交的印度申请号202211068104的优先权权益,该申请的内容以引用方式并入本文以用于所有目的。
技术领域
本文描述了用于鉴定蛋白质-蛋白质复合物的组分的系统和方法。本文还描述了用于鉴定引起复合物形成、稳定化或解离的化合物的系统和方法。
背景技术
蛋白质-蛋白质相互作用(PPI)是多种生物过程的核心,并且其功能障碍与一系列人类疾病和病症的发病机制有关。两种蛋白质之间的接触界面是它们相互作用的结构基础。相似或重叠的蛋白质界面可以是混杂的,并且在枢纽蛋白中多次采用。PPI可以是瞬时的或永久的、相同的或异质的、以及特异性的或非特异性的,并且可通过信号传导(生物化学)级联来调控。因此,使用小分子抑制剂调节疾病相关蛋白质-蛋白质相互作用(PPI)的能力是重要的诊断和治疗策略。
用于查询PPI调节剂的现有技术依赖于低通量方法,诸如“诱饵和猎物”测定。因此,人们越来越关注开发高通量、多路复用的方法,其以无偏的方式同时查询蛋白质复合物的多种调节剂。
发明内容
本文描述了用于鉴定蛋白质-蛋白质复合物的组分的系统和方法。本文还描述了用于鉴定引起复合物形成、稳定化或解离的化合物的系统和方法。
一种用于鉴定蛋白质-蛋白质复合物的组分的方法可包括:使用尺寸排阻色谱法对第一样品进行分级以产生第一多个级分,该第一样品包含生物样品的含有蛋白质的第一部分;使用尺寸排阻色谱法对第二样品进行分级以产生第二多个级分,该第二样品包含(i)生物样品的第二部分和(ii)化合物库、药物或天然提取物;分析第一多个级分和第二多个级分以鉴定第一多个级分和第二多个级分中的蛋白质;对于靶蛋白,鉴定第一多个级分与第二多个级分之间的级分偏移,其中级分偏移指示由化合物库或天然提取物中的一种或多种化合物或者药物引起的复合物形成或稳定化或复合物解离;以及鉴定与靶蛋白形成复合物的一种或多种结合蛋白。一种或多种结合蛋白与靶蛋白在第二多个级分中而非第一多个级分中的共洗脱指示化合物库或天然提取物中的化合物或者药物引起包含靶蛋白和一种或多种结合蛋白中的至少一种结合蛋白的复合物的形成或稳定化。一种或多种结合蛋白与靶蛋白在第一多个级分中而非第二多个级分中的共洗脱指示化合物库或天然提取物中的化合物或者药物引起包含靶蛋白和一种或多种结合蛋白中的至少一种结合蛋白的复合物的解离。共洗脱可例如基于靶蛋白和一种或多种结合蛋白的峰洗脱级分来确定。一种或多种结合蛋白与靶蛋白的共洗脱可基于例如一种或多种结合蛋白的峰洗脱级分和靶蛋白的峰洗脱级分。该方法还可包括基于一种或多种推定的结合蛋白和靶蛋白的分子量以及包含靶蛋白和一种或多种推定的结合蛋白的级分的级分编号来选择所述一种或多种结合蛋白中的一种或多种结合蛋白作为复合物的成员。
一种用于鉴定引起蛋白质复合物形成、稳定化或解离的一种或多种化合物的方法可包括:使用尺寸排阻色谱法对第一样品进行分级以产生第一多个级分,该第一样品包含生物样品的含有蛋白质的第一部分;使用尺寸排阻色谱法对第二样品进行分级以产生第二多个级分,该第二样品包含(i)生物样品的第二部分和(ii)化合物库或天然提取物;分析第一多个级分和第二多个级分以鉴定第一多个级分和第二多个级分中的蛋白质;对于靶蛋白,鉴定第一多个级分与第二多个级分之间的级分偏移,其中级分偏移指示由化合物库或天然提取物中的一种或多种化合物引起的复合物形成或稳定化或复合物解离;以及鉴定引起级分偏移的一种或多种化合物,包括分析以下物质:(1)对于指示由一种或多种化合物引起的复合物形成或稳定化的级分偏移,第二多个级分中的包含靶蛋白的级分,以鉴定级分中与靶蛋白共洗脱的一种或多种化合物,或者(2)对于指示由一种或多种化合物引起的复合物解离的级分偏移,(i)第二多个级分中的包含靶蛋白的级分,以鉴定级分中与靶蛋白共洗脱的一种或多种化合物,或者(ii)第二多个级分中的包含在不存在所述一种或多种化合物的情况下与靶蛋白形成复合物的结合蛋白的级分,以鉴定级分中与结合蛋白共洗脱的一种或多种化合物。
鉴定引起级分偏移的一种或多种化合物可包括例如获得第二多个级分中的级分的代谢组学谱;获得化合物库或天然提取物的代谢组学谱;以及鉴定级分和化合物库或天然提取物中存在的一种或多种化合物。在一些具体实施中,鉴定引起级分偏移的一种或多种化合物还包括获得第一样品的代谢组学谱;以及过滤第二多个级分中的级分的代谢组学谱以排除第一样品中存在的化合物。
代谢组学谱可使用质谱法获得。例如,在一些具体实施中,使用液相色谱和串联质谱法(LC-MS/MS)获得代谢组学谱。在一些实施方案中,使用计算机核磁共振(NMR)获得代谢组学谱。
鉴定引起级分偏移的一种或多种化合物包括确认一种或多种化合物和靶蛋白或一种或多种结合蛋白的共洗脱可基于一种或多种化合物的峰洗脱级分和靶蛋白或结合蛋白的峰洗脱级分。在一些具体实施中,该方法可包括鉴定与靶蛋白形成复合物的结合蛋白,其中结合蛋白与靶蛋白在第一多个级分中而非第二多个级分中的共洗脱指示化合物库或天然提取物中的一种或多种化合物引起包含靶蛋白和结合蛋白的复合物的解离。
在上述方法的一些具体实施中,分析第一多个级分和第二多个级分以鉴定第一多个级分和第二多个级分中的蛋白质包括蛋白质组学分析。在上述方法的一些具体实施中,分析第一多个级分和第二多个级分以鉴定第一多个级分和第二多个级分中的蛋白质包括使用质谱法。例如,分析第一多个级分和第二多个级分以鉴定第一多个级分和第二多个级分中的蛋白质可包括使用液相色谱串联质谱法(LC-MS/MS)。
在上述方法的一些具体实施中,化合物库或天然提取物基本上不含蛋白质。
在上述方法的一些具体实施中,生物样品包括无细胞生物样品、组织提取物、细胞提取物或亚细胞提取物。
在上述方法的一些具体实施中,第二样品包含化合物库。
在上述方法的一些具体实施中,第二样品包含天然提取物。
在上述方法的一些具体实施中,天然提取物是植物提取物。
在上述方法的一些具体实施中,包含蛋白质的生物样品从细胞裂解物获得。
在上述方法的一些具体实施中,包含蛋白质的生物样品从动物组织获得。
在上述方法的一些具体实施中,包含蛋白质的生物样品从哺乳动物组织获得。
在上述方法的一些具体实施中,包含蛋白质的生物样品从脑、肝、肺或肾组织获得。
在一些具体实施中,系统包括一个或多个处理器;以及存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序在由一个或多个处理器执行时使系统:接收通过使用尺寸排阻色谱法对第一样品进行分级而获得的第一多个级分的第一蛋白质组学谱数据,该第一样品包含生物样品的含有蛋白质的一部分;接收通过使用尺寸排阻色谱法对第二样品进行分级而获得的第二多个级分的第二蛋白质组学谱数据,该第二样品包含(i)生物样品的第二部分和(ii)化合物库、药物或天然提取物;基于第一蛋白质组学谱数据和第二蛋白质组学数据来鉴定第一多个级分和第二多个级分中的蛋白质;对于靶蛋白,鉴定第一多个级分与第二多个级分之间的级分偏移,其中级分偏移指示由化合物库或天然提取物中的一种或多种化合物或者药物引起的复合物形成或稳定化或复合物解离;以及鉴定与靶蛋白形成复合物的一种或多种结合蛋白。一种或多种结合蛋白与靶蛋白在第二多个级分中而非第一多个级分中的共洗脱指示化合物库或天然提取物中的化合物或者药物引起包含靶蛋白和一种或多种结合蛋白中的至少一种结合蛋白的复合物的形成或稳定化。一种或多种结合蛋白与靶蛋白在第一多个级分中而非第二多个级分中的共洗脱指示化合物库或天然提取物中的化合物或者药物引起包含靶蛋白和一种或多种结合蛋白中的至少一种结合蛋白的复合物的解离。
在一些具体实施中,系统包括一个或多个处理器;以及存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序在由一个或多个处理器执行时使系统:接收通过使用尺寸排阻色谱法对第一样品进行分级而获得的第一多个级分的第一蛋白质组学谱数据,该第一样品包含生物样品的含有蛋白质的一部分;接收通过使用尺寸排阻色谱法对第二样品进行分级而获得的第二多个级分的第二蛋白质组学谱数据,该第二样品包含(i)生物样品的第二部分和(ii)化合物库或天然提取物;以及基于第一蛋白质组学谱数据和第二蛋白质组学数据来鉴定第一多个级分和第二多个级分中的蛋白质;对于靶蛋白,鉴定第一多个级分与第二多个级分之间的级分偏移,其中级分偏移指示由化合物库或天然提取物中的一种或多种化合物引起的复合物形成或稳定化或复合物解离;接收化合物库或天然提取物的代谢组学数据;接收第二多个级分中的包含靶蛋白或在不存在一种或多种化合物的情况下与靶蛋白形成复合物的结合蛋白的级分的代谢组学数据;以及通过分析化合物库或天然提取物的代谢组学数据和第二多个级分中的包含靶蛋白或在不存在一种或多种化合物的情况下与靶蛋白形成复合物的结合蛋白的级分的代谢组学数据来鉴定引起级分偏移的一种或多种化合物。
附图说明
图1A示出了根据一些实施方案的用于鉴定蛋白质-蛋白质相互作用的示例性方法。
图1B示出了根据一些实施方案的用于确定复合物形成或复合物解离的示例性方法,其可包括在图1A所示的示例性方法中。
图2A示出了根据一些实施方案的用于鉴定调节蛋白质复合物的化合物的示例性方法。
图2B示出了根据一些实施方案的用于确定复合物形成或复合物解离的示例性方法。
图3示出了根据一些实施方案的可视化化合物-蛋白质相互作用的示例性示意图。基于代谢物-蛋白质相互作用置信度的算法评分对相互作用进行优先级排序。
图4示出了根据一些实施方案的用于从已知或新型化合物池中鉴定蛋白质-蛋白质复合物的组分和引起蛋白质复合物形成的化合物的示例性方法。
图5示出了根据示例性实验的在有或没有天然提取物P45的情况下RNF114的可视化化合物-蛋白质相互作用图。基于化合物-蛋白质相互作用置信度的算法评分对相互作用进行优先级排序。
图6示出了根据示例性实验的在有或没有天然提取物P45的情况下RNF114和结合蛋白(灰色圆圈)的可视化化合物-蛋白质相互作用图。基于代谢物-蛋白质相互作用置信度的算法评分对相互作用进行优先级排序。
图7示出了根据一些实施方案的在有或没有天然提取物P45的情况下RNF114和结合蛋白的峰分析图。
图8示出了根据一些实施方案的可与本文所述的方法一起使用的示例性系统。
图9示出了根据一些实施方案的与本文所述的方法一起使用的示例性系统。
具体实施方式
本文描述了用于鉴定蛋白质-蛋白质相互作用的组分的方法和系统。基于表观分子量或大小将包含蛋白质的生物样品(例如,来自哺乳动物来源的裂解物,诸如组织、细胞或亚细胞裂解物,或无细胞生物样品,诸如来自唾液、脑脊液、血浆等的提取物)的样品中的蛋白质分成级分。将相同生物样品的另一部分与来自不同来源(例如,植物)的化合物库、天然提取物或药物组合,并基于表观分子量或大小进行类似分级。与生物样品组合的化合物库、天然提取物或药物优选地不含蛋白质或基本上不含蛋白质。彼此复合的蛋白质以复合的表观大小一起迁移。分析级分以确定每个级分所含蛋白质的身份。
每个级分与洗脱体积(即,在该级分之前从柱洗脱的缓冲液的体积)相关联,该洗脱体积可与蛋白质的表观重量或大小相关(通常基于流体动力学直径假定)。级分偏移是在不同条件下蛋白质的洗脱体积(或级分计数,其与洗脱体积相关联)的变化。如本文所述,靶蛋白的级分偏移是在存在与不存在化合物库、天然提取物或药物的情况下靶蛋白的洗脱体积或级分计数的差异。因此,级分偏移指示由化合物库、天然提取物或药物引起的蛋白质-蛋白质缔合(例如,形成和/或稳定化)或解离事件。
可基于与靶蛋白的共迁移更确信地鉴定结合蛋白,并且可通过蛋白质组学鉴定这些结合蛋白的身份。本文还描述了用于鉴定引起蛋白质复合物形成或稳定化或解离的化合物的方法和系统。在该方法的一些具体实施中,基于表观分子量或大小将生物样品(例如,来自哺乳动物来源的裂解物,诸如组织、细胞或亚细胞提取物,或无细胞生物样品,诸如来自唾液、脑脊液、血浆等的提取物)的样品中的蛋白质分成级分。将相同生物样品的另一部分与来自不同来源(例如,植物提取物)的化合物库、天然提取物或药物组合,并基于表观分子量或大小进行类似分级。彼此复合的蛋白质以复合的表观大小一起迁移。将级分分离用于进一步分析。分析级分的一部分以确定每个级分所含蛋白质的身份。分析级分的另一部分以确定级分所含化合物的身份。
在用于鉴定蛋白质-蛋白质复合物的组分的方法的一些具体实施中,该方法包括使用尺寸排阻色谱法对第一样品进行分级以产生第一多个级分,该第一样品包含生物样品(例如,无细胞生物样品、组织提取物、细胞提取物或亚细胞提取物)的含有蛋白质的第一部分。还使用尺寸排阻色谱法对第二样品进行分级以产生第二多个级分,该第二样品包含(i)生物样品的第二部分和(ii)化合物库、药物或天然提取物。分析第一多个级分和第二多个级分以鉴定第一多个级分和第二多个级分中的蛋白质。对于靶蛋白,然后可鉴定第一多个级分与第二多个级分之间的级分偏移。级分偏移指示由化合物库或天然提取物中的一种或多种化合物或者药物引起的复合物形成或稳定化或复合物解离。然后可鉴定与靶蛋白形成复合物的一种或多种结合蛋白。例如,一种或多种结合蛋白与靶蛋白在第二多个级分中而非第一多个级分中的共洗脱指示化合物库或天然提取物中的化合物或者药物引起包含靶蛋白和一种或多种结合蛋白中的至少一种结合蛋白的复合物的形成或稳定化。一种或多种结合蛋白与靶蛋白在第一多个级分中而非第二多个级分中的共洗脱指示化合物库或天然提取物中的化合物或者药物引起包含靶蛋白和一种或多种结合蛋白中的至少一种结合蛋白的复合物的解离。共洗脱可例如基于靶蛋白和一种或多种结合蛋白的峰洗脱级分来确定。在一些情况下,结合蛋白被确认为结合蛋白。因此,在一些具体实施中,该方法还包括基于一种或多种结合蛋白和靶蛋白的分子量以及包含靶蛋白和一种或多种结合蛋白的级分的级分编号来选择所述一种或多种结合蛋白中的一种或多种结合蛋白作为复合物的成员。
用于鉴定引起蛋白质复合物形成或解离的一种或多种化合物的方法可包括使用尺寸排阻色谱法对第一样品进行分级以产生第一多个级分,该第一样品包含生物样品(例如,无细胞生物样品、组织提取物、细胞提取物或亚细胞提取物)的含有蛋白质的第一部分。还可使用尺寸排阻色谱法对第二样品进行分级以产生第二多个级分,该第二样品包含(i)生物样品的第二部分和(ii)化合物库或天然提取物。可分析第一多个级分和第二多个级分以鉴定第一多个级分和第二多个级分中的蛋白质。对于靶蛋白,可鉴定第一多个级分与第二多个级分之间的级分偏移。级分偏移指示由化合物库或天然提取物中的一种或多种化合物引起的复合物形成或稳定或复合物解离。由此可鉴定引起级分偏移的一种或多种化合物。例如,对于指示由一种或多种化合物引起的复合物形成或稳定化的级分偏移,可以分析第二多个级分中的包含靶蛋白的级分,以鉴定级分中与靶蛋白共洗脱的一种或多种化合物。对于指示由一种或多种化合物引起的复合物解离的级分偏移,(i)可以分析第二多个级分中的包含靶蛋白的级分,以鉴定级分中与靶蛋白共洗脱的一种或多种化合物,或者(ii)可以分析第二多个级分中的包含在不存在一种或多种化合物的情况下与靶蛋白形成复合物的结合蛋白的级分,以鉴定级分中与结合蛋白共洗脱的一种或多种化合物。鉴定引起级分偏移的一种或多种化合物可包括获得第二多个级分中的级分的代谢组学谱;获得化合物库或天然提取物的代谢组学谱;以及鉴定级分和化合物库或天然提取物两者中存在的一种或多种化合物。任选地,鉴定引起级分偏移的一种或多种化合物还包括获得第一样品的代谢组学谱;以及过滤第二多个级分中的级分的代谢组学谱以排除第一样品中存在的化合物。鉴定引起级分偏移的一种或多种化合物可任选地包括基于一种或多种化合物的峰洗脱级分和靶蛋白或结合蛋白的峰洗脱级分来确认一种或多种化合物和靶蛋白或一种或多种结合蛋白的共洗脱。该方法还可任选地包括鉴定与靶蛋白形成复合物的结合蛋白,其中结合蛋白与靶蛋白在第一多个级分中而非第二多个级分中的共洗脱指示化合物库或天然提取物中的一种或多种化合物引起包含靶蛋白和结合蛋白的复合物的解离。
本文进一步描述了可用于实现本文所述的方法的系统。此类系统可包括一个或多个处理器和存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序在由一个或多个处理器执行时使系统执行本文所述的方法步骤。该系统还可包括液相色谱系统(其可包括尺寸排阻色谱柱和/或反相色谱柱)和/或质谱(或串联质谱)系统。
定义
如在本说明书和所附权利要求中所用,除非上下文另有明确规定,否则单数形式“一个”、“一种”和“该”包括复数指代物。因此,例如,对“一个细胞”的提及任选地包括两个或更多个此类细胞的组合等。
如本文所用的术语“约”和“大约”是指本技术领域的技术人员容易知道的相应值的通常误差范围。示例性误差程度在给定值或值范围的20%以内,典型地在10%以内,更典型地在5%以内。本文中对“约”或“大约”值或参数的提及包括(并描述)涉及该值或参数本身的实施方案。
应当理解,本文所述的本发明的各方面和实施方案包括“包含”各方面和实施方案、“由各方面和实施方案组成”以及“基本上由各方面和实施方案组成”。
“化合物库”是多种化合物的任何集合。化合物库可包含2种或更多种的任何数量的化合物,诸如5种或更多种、50种或更多种、100种或更多种、500种或更多种、或1000种或更多种小分子化合物。化合物库可以是小分子库。
“提取物”是已加工以去除或基本上去除材料的一种或多种组分的生物材料。例如,可加工提取物以去除脂肪、碳水化合物或蛋白质中的一种或多种。提取物可含有蛋白质或可基本上不含蛋白质。提取物被认为是“基本上不含蛋白质”的提取物含有其原始蛋白质含量(即,来自生物材料的天然状态)的5%(按质量计)或更少。
如本文所用,术语“样品”是指从感兴趣的受试者和/或个体获得或衍生的组合物,其含有将例如基于物理、生物化学、化学和/或生理特征进行表征和/或鉴定的细胞和/或其他分子实体。样品可以是组织、细胞、亚细胞结构(例如,细胞器)或无细胞生物样品(例如,唾液、血浆、脑脊液等)或可以是来自它们的提取物。
如本文所用,术语“个体”、“患者”或“受试者”可互换使用,并且是指需要治疗的任何单个动物,例如哺乳动物(包括非人动物,例如狗、猫、马、兔、动物园动物、牛、猪、绵羊和非人灵长类动物)。在具体实施方案中,本文中的患者是人。
“小分子”是分子量为1000道尔顿或更小的任何分子。
在提供值的范围的情况下,应当理解,该范围的上限和下限之间的每个中间值以及该所述范围内的任何其他所述值或中间值均涵盖在本公开的范围内。在所述范围包括上限或下限的情况下,排除那些包括的限值中的任一个限值的范围也包括在本公开中。
应当理解,本文所述的各种实施方案的一个、一些或所有特性可组合以形成本发明的其他实施方案。本文所使用的小节标题仅出于组织性目的并且不解释为限制所描述的主题。
上文关于“实施方案”所述的特征和偏好是不同的偏好,并且不仅限于该特定实施方案;在技术上可行的情况下,它们可与来自其他实施方案的特征自由组合,并且可形成特征的优选组合。呈现该描述以使本领域普通技术人员能够制造和使用本发明,并且在专利申请及其要求的上下文中提供该描述。对所述的实施方案的各种修改对于本领域技术人员将是显而易见的,并且本文的一般原理可应用于其他实施方案。因此,本发明不旨在限于所示的实施方案,而是符合与本文所述的原理和特征一致的最宽范围。
本说明书中提及的所有出版物、专利和专利申请均全文以引用方式并入本文,其程度如同每个单独的出版物、专利或专利申请被具体地且单独地指出全文以引用方式并入一样。在本文中的术语与并入的参考文献中的术语之间发生冲突的情况下,以本文中的术语为准。
用于鉴定蛋白质-蛋白质复合物的方法
本文描述了用于鉴定蛋白质-蛋白质复合物的组分的方法。蛋白质-蛋白质复合物可在存在化合物(例如,小分子或药物)的情况下形成、稳定化或解离,该化合物可以是化合物库或天然提取物的一部分,或单独测试的单一药物。样品诸如生物样品(例如,无细胞生物样品、组织提取物、细胞提取物或亚细胞提取物)可与化合物库、药物(例如,研究中的药物)或天然提取物(诸如植物提取物)混合。蛋白质复合物可通过以下方式鉴定:对样品进行分级(例如,通过尺寸排阻色谱法)以获得多个级分(即,第一样品的第一多个级分和第二样品的第二多个级分);分析第一多个级分和第二多个级分以鉴定级分中的蛋白质(例如,使用蛋白质组学分析);对于靶蛋白,鉴定第一多个级分与第二多个级分之间的级分偏移;以及鉴定与靶蛋白形成复合物的一种或多种结合蛋白。
对于靶蛋白,在存在或不存在化合物库、药物或天然提取物的情况下比较蛋白质迁移(例如,洗脱特征)可以确定复合物是否由化合物库或天然提取物中的一种或多种化合物或者药物形成或稳定化或解离。也就是说,由化合物库、药物或天然提取物引起的级分偏移可通过比较在具有化合物库、药物或天然提取物的情况下和不具有化合物库、药物或天然提取物的情况下的靶蛋白洗脱来鉴定。级分偏移可用于确定化合物库、药物或天然提取物是否引起稳定分子复合物或破坏分子复合物的形成。与靶蛋白形成复合物的结合蛋白还可通过分析在存在或不存在化合物库或天然提取物的情况下与靶蛋白类似地迁移(例如,共洗脱或共迁移)的其他蛋白质的级分来鉴定。一种或多种结合蛋白与靶蛋白在第二多个级分中而非第一多个级分中的共洗脱指示化合物库或天然提取物中的化合物或者药物引起包含靶蛋白和一种或多种结合蛋白中的至少一种结合蛋白的复合物的形成或稳定化。一种或多种结合蛋白与靶蛋白在第一多个级分中而非第二多个级分中的共洗脱指示化合物库或天然提取物中的化合物或者药物引起包含靶蛋白和一种或多种结合蛋白中的至少一种结合蛋白的复合物的解离。
用于鉴定蛋白质-蛋白质复合物的示例性方法示于图1A中。首先分析生物样品(诸如无细胞生物样品、组织提取物、细胞提取物或亚细胞提取物)的一部分以鉴定样品内蛋白质和蛋白质复合物的基线洗脱特征。将药物、化合物库或天然提取物添加到生物样品的另一部分中。单独分析该样品(即,含有药物、化合物库或天然提取物)以鉴定在存在药物、化合物库或天然提取物的情况下样品内蛋白质和蛋白质复合物的洗脱特征。在两个样品之间的不同级分中洗脱的蛋白质被确定为具有级分偏移。根据级分偏移的方向,偏移可指示蛋白质在存在药物、化合物库或天然提取物的情况下与其结合配偶体缔合或解离。所述的方法使用级分偏移来鉴定在存在药物、化合物库或天然提取物的情况下缔合或解离的靶蛋白的结合蛋白(例如,结合配偶体)。
将样品(例如,第一样品和第二样品)分别分级,诸如在图1A的102和104中。第一样品可以是生物样品(例如,无细胞生物样品、组织提取物、细胞提取物或亚细胞提取物)的一部分。第二样品是生物样品的与药物、化合物库或天然提取物(诸如植物提取物)组合的另一部分。组合可最佳地包括在分级之前将生物样品与药物、化合物库或天然提取物混合或温育。生物样品和药物、化合物库或天然提取物的温育可在各种温度和/或持续时间下进行,但在优选地保持样品完整性的条件下进行。温育也可在生理条件下进行。温育可在样品非静止(例如,旋转或搅拌)或静止时进行。任选地,可在温育期间将一种或多种蛋白酶抑制剂添加到样品中。样品完整性可通过测定蛋白水解、蛋白质去折叠和/或蛋白质聚集来确定。
生物样品可通过裂解来自组织的细胞或从细胞分离的亚细胞结构来获得。细胞、组织和/或亚细胞结构可例如通过超声处理或洗涤剂来裂解。可处理裂解的材料,例如通过离心和/或过滤(例如,以去除细胞固体)、通过酶或化学品(例如,以去除核酸)、透析或缓冲液更换或其他处理技术。对于亚细胞裂解物,可使用标准分离技术诸如密度梯度离心将靶亚细胞结构(例如,线粒体、细胞核和其他细胞器)与其他细胞组分分离。在样品分级之前,可进一步减少细胞提取物样品体积。优选地,这种提取物处理不会使裂解物中的蛋白质变性或诱导其蛋白水解或聚集。如本文进一步讨论,生物样品不限于细胞提取物,因为在一些具体实施中,生物样品可以是无细胞生物样品(例如,唾液、脑脊液、血浆等)或无细胞生物样品的提取物。
在一些实施方案中,包含蛋白质的生物样品从动物组织获得。在一些实施方案中,包含蛋白质的生物样品从哺乳动物组织获得。在一些实施方案中,生物样品从脑、肝、肺或肾组织获得。
可划分生物样品,使得第一部分和第二部分可分别用于第一样品和第二样品。第一样品包含生物样品的含有蛋白质的一部分。在一些实施方案中,第一样品包含生物样品,该生物样品包含从组织、细胞或亚细胞器获得的蛋白质。在一些实施方案中,包含蛋白质的生物样品(例如,组织、细胞或亚细胞提取物)从动物组织获得。在一些实施方案中,包含蛋白质的生物样品从哺乳动物组织获得。在一些实施方案中,包含蛋白质的生物样品从脑、肝、肺或肾组织获得。在一些实施方案中,用于鉴定蛋白质-蛋白质复合物的组分的方法包括对第一样品进行分级以产生第一多个级分。在一些实施方案中,用于鉴定蛋白质的方法包括通过尺寸排阻色谱法对第一样品进行分级以产生第一多个级分。
第二样品包含生物样品的与化合物库(例如,小分子库)、药物或天然提取物(例如,植物、动物、细菌或真菌提取物)组合的部分。化合物库可包含完全合成的化合物、完全天然的化合物或合成化合物和天然化合物的混合物。天然提取物可来自与产生生物样品的生物体不同的分类学分类的生物体。例如,组织、细胞或亚细胞提取物可来自与天然提取物的来源不同的界(例如,动物界、植物界、真菌界、原生生物界、古细菌界或真细菌界)、门、纲、目、科、属或种。可混合和/或温育第二样品的组合组分,以允许化合物库、药物或天然提取物的组分与生物样品的组分相互作用或结合。在一些实施方案中,药物、化合物库或天然提取物基本上不含蛋白质。优选地,第一样品与第二样品之间的差异在于第二样品中化合物库、药物或天然提取物的存在。
用于鉴定蛋白质-蛋白质复合物的组分的方法可包括对第一样品和第二样品进行分级以产生第一多个级分(即,对于第一样品)和第二多个级分(即,对于第二样品),如图1A的102和104所示。可使用分级方法诸如尺寸排阻色谱法或高效液相色谱法(HPLC)将样品分级以获得多个级分。分级是一种分离过程,其中基于样品组分的一种或多种物理特征,例如流体动力学直径(例如,当基于尺寸排阻色谱法分离组分时)或分子量,将样品分成多个较小的量或级分。当根据本文所述的方法使用时,流体动力学直径是分子量的适当近似值。基于各个组分的特定性质的一种或多种差异收集级分。为了确保蛋白质复合物在分级过程中不被破坏,样品的分级应在非变性条件下进行。例如,分级可在生理条件下进行,例如在约6和约8之间的pH下。分馏也可在可能是或可能不是生理性的温度范围内进行。在本文所述方法的一些具体实施中,分级在磷酸盐缓冲盐水中进行。在一些实施方案中,用于鉴定蛋白质-蛋白质复合物的组分的方法包括使用尺寸排阻色谱法对样品进行分级。
可以恒定的流速和/或设定的体积对样品进行分级。将最终样品稀释成分级后获得的若干种级分。分级的样品在所有级分中不含相同的蛋白质和/或化合物,因为它们将基于通过分级技术选择的一个或多个标准进行分离。例如,尺寸排阻色谱法基于物理性质诸如蛋白质或蛋白质复合物的大小和形状(流体动力学大小)分离混合物。级分还可包含一种或多种化合物。
收集级分并分析以鉴定每个级分中的蛋白质。如图1A的106所示,分析来自第一样品的级分以鉴定第一样品的多个级分中的蛋白质,并且如108所示,分析来自第二样品的级分以鉴定第二样品的多个级分中的蛋白质。该鉴定可例如使用蛋白质组学分析来进行。示例性蛋白质组学分析技术可包括使用质谱法(例如,液相色谱串联质谱法(LC-MS/MS))。在鉴定之前,可进一步处理样品。例如,也可通过SDS-PAGE分离样品,并且可从凝胶中切下特定大小的蛋白质用于进一步分析。还可使用一种或多种蛋白酶有意地消化基于液体或凝胶的样品,以在蛋白质鉴定之前将蛋白质片段化为较短的多肽。在一些实施方案中,蛋白酶是氨基酸特异性蛋白酶。在一些实施方案中,蛋白酶仅在氨基酸的N端处切割。在一些实施方案中,蛋白酶仅在氨基酸的C端处切割。还可对级分进行进一步处理以制备样品,诸如缓冲液更换以去除可能干扰分析的盐和其他缓冲液组分。例如,为了制备用于LC-MS/MS的样品,使用试剂盒(包含诸如缓冲液的组分)或化学品将级分中的蛋白质从溶液中沉淀出来,然后重悬于相容的缓冲液中。可使用蛋白质鉴定技术(包括蛋白质印迹或LC-MS/MS)进行样品的分析。可通过使用液相色谱法进一步分离收集的级分以分离肽,然后将洗脱液导向具有电离源的质谱仪。可用于鉴定级分中的蛋白质的方法包括蛋白质组学方法,诸如免疫测定、质谱法和/或它们的组合。在一些实施方案中,鉴定第一多个级分和第二多个级分中的蛋白质包括使用质谱法。在一些实施方案中,质谱法是液相色谱质谱法(LC-MS/MS)。在一些实施方案中,用于鉴定第一级分和第二级分中的蛋白质的方法是相同的方法。
可在生物样品内鉴定感兴趣的蛋白质。感兴趣的蛋白质可以是例如药物靶标或潜在药物靶标。该蛋白质可被指定为靶蛋白。在存在药物、化合物库或天然提取物的情况下在不同级分中洗脱(例如,具有级分偏移)的靶蛋白表明它已经历复合物状态的变化(例如,通过复合物形成或稳定化或解离),如通过流体动力学大小的变化所证明。例如,结合蛋白与靶蛋白共洗脱,因为复合物在分级期间保持缔合。在图1A的110处,可鉴定第一样品与第二样品之间的靶蛋白的级分偏移。鉴定靶蛋白的级分偏移表明,在存在或不存在药物、化合物库或天然提取物的情况下,靶蛋白与其他蛋白质(例如,结合蛋白)以不同方式相互作用,例如通过复合物形成或稳定化或复合物解离。
鉴定级分偏移可包括将分级信息和蛋白质身份数据转换为二维矩阵,例如图3所示。在一个轴上,呈现对应于一个样品(例如,第一样品)的级分编号。在另一个轴上,呈现对应于另一个样品(例如,第二样品)的级分编号。代表鉴定的蛋白质的数据点基于它们在任一样品中洗脱的级分在图上被分配坐标。虽然蛋白质洗脱是一种分布并且可覆盖一系列级分,但基于在所有级分之间观察到的最大蛋白质丰度(例如,最大强度)来分配峰洗脱级分。
评价蛋白质(诸如靶蛋白)的级分偏移可指示化合物库中的化合物或天然提取物或者药物是否引起复合物形成或稳定化或解离。如果蛋白质在一个样品而不是另一个样品的不同级分中洗脱,则代表该蛋白质的数据点将位于对角线之外(图3)。如果靶蛋白在第一样品(不含药物、化合物库或天然提取物的生物样品)中洗脱的级分晚于该蛋白在第二样品(含有药物、化合物库或天然提取物的生物样品)中洗脱的级分,则可以得出结论,药物、化合物库或天然提取物引起包含靶蛋白的复合物的形成或稳定化。这是因为药物、化合物库或天然提取物引起靶蛋白在具有较高分子量的物质中缔合。相比之下,如果靶蛋白在第一样品(不含药物、化合物库或天然提取物的生物样品)中洗脱的级分早于该蛋白在第二样品(含有药物、化合物库或天然提取物的生物样品)中洗脱的级分,则可以得出结论,药物、化合物库或天然提取物引起包含靶蛋白的复合物的解离。如果蛋白质在两个样品之间不改变其峰洗脱级分,则表示该蛋白质的数据点将沿着对角线定位(例如,分配给两个样品中的相同级分)。
在图1A所示方法的108处,鉴定与靶蛋白(在第一样品或第二样品中)形成复合物的一种或多种结合蛋白。用于鉴定一种或多种结合蛋白的示例性方法进一步详细显于图1B中。在202处,评价级分偏移以确定药物、化合物库或天然提取物是否引起复合物形成或稳定化或复合物解离。一种或多种附加蛋白质与靶蛋白在第一样品或第二样品(但不是两者)中的共洗脱指示化合物库或天然提取物中的一种或多种化合物或者药物引起包含靶蛋白和一种或多种附加蛋白质的复合物的形成或稳定化或复合物解离。因此,复合物中的一种或多种蛋白质(除靶蛋白之外)可被称为“结合蛋白”,因为它们涉及第一样品或第二样品中的含有靶蛋白的复合物。在存在药物、化合物库或天然提取物的情况下在与靶蛋白相同的级分中共洗脱(但在不具有药物、化合物库或天然提取物的情况下不共洗脱)的蛋白质表明附加的一种或多种蛋白质是在存在药物、化合物库或天然提取物的情况下与靶蛋白形成复合物的结合蛋白。在不存在药物、化合物库或天然提取物的情况下在与靶蛋白相同的级分中共洗脱(但在存在药物、化合物库或天然提取物的情况下不共洗脱)的蛋白质表明附加的一种或多种蛋白质是在不存在药物、化合物库或天然提取物的情况下与靶蛋白形成复合物的结合蛋白。如果药物、化合物库或天然提取物引起复合物形成或稳定化,则与第二多个级分(即,包含生物样品和药物、化合物库或天然提取物的第二样品的多个级分)中的靶蛋白共洗脱的蛋白质可被鉴定为靶蛋白的结合蛋白,如204处所示。任选地,可以分析第一多个级分(即,包含生物样品并且不包含药物、化合物库或天然提取物的第一样品的多个级分)中的等同级分(例如,相同的级分编号),其中存在于所述级分中的蛋白质作为结合蛋白被排除,如206处所示。如果药物、化合物库或天然提取物引起复合物解离,则与第一多个级分(即,包含生物样品并且不包含药物、化合物库或天然提取物的第一样品的多个级分)中的靶蛋白共洗脱的蛋白质可被鉴定为靶蛋白的结合蛋白,如208所示。
用于鉴定调节蛋白质复合物的化合物的方法
本文描述了用于鉴定调节蛋白质复合物的化合物的组分的方法。蛋白质-蛋白质复合物可在存在一种或多种化合物(例如来自化合物库或天然提取物的一种或多种化合物)的情况下形成或稳定化或解离。样品诸如生物样品(例如,无细胞生物样品、组织提取物、细胞提取物或亚细胞提取物)可与化合物库或天然提取物(诸如植物提取物)混合。蛋白质复合物可通过对样品进行分级以获得多个级分来鉴定。对样品进行分级可通过多种方法来完成,例如尺寸排阻色谱法。蛋白质组学分析可应用于级分以鉴定蛋白质。代谢组学分析(诸如LC-MS/MS或计算机NMR)也可用于鉴定级分的一种或多种化合物。蛋白质组学和代谢组学分析的组合可用于鉴定引起复合物形成或稳定化或解离的一种或多种化合物。
例如,化合物可引起靶蛋白与一种或多种结合配偶体缔合。在一些具体实施中,当样品被分级时,化合物将保持与新形成的蛋白质复合物结合。因此,鉴定出与靶蛋白及其结合配偶体共洗脱的一种或多种化合物表明该化合物调节蛋白质复合物形成。鉴定引起级分偏移的一种或多种化合物可通过获得代谢组学谱,例如通过级分的串联质谱法(LC-MS/MS)并鉴定级分和化合物库或天然提取物两者中存在的化合物来完成。在一些具体实施中,将第一样品的级分(例如,第一级分)的代谢组学谱与来自第二样品的级分的代谢组学谱进行比较。例如,当与第一样品相比时,第二级分(例如,第二级分)中化合物的量增加指示新的共洗脱化合物。可基于其中检测到蛋白质和/或化合物的峰洗脱(例如,最大丰度、最大强度)的级分来确定共洗脱。
在一些具体实施中,化合物可引起靶蛋白与其一个或多个结合配偶体解离。例如,当样品被分级时,化合物可保持与靶蛋白或复合物的另一成员(例如,一种或多种结合配偶体)结合。因此,鉴定出与靶蛋白或其结合配偶体共洗脱的一种或多种化合物表明该化合物调节蛋白质复合物解离。鉴定引起级分偏移的一种或多种化合物可通过获得代谢组学谱,例如通过级分的串联质谱法(LC-MS/MS)并鉴定级分和化合物库或天然提取物两者中存在的化合物来完成。确定化合物是否在新级分中共洗脱的另一种方法是将第一样品的级分(例如,第一级分)的代谢组学谱与来自第二样品的级分的代谢组学谱进行比较。例如,当与第一样品相比时,化合物在第二级分(例如,第二级分)中的富集指示新的共洗脱化合物。共洗脱可通过其中检测到蛋白质和/或化合物的峰洗脱(例如,最大丰度、最大强度)的级分来定义。
对于靶蛋白,在存在或不存在化合物库或天然提取物的情况下比较蛋白质迁移(例如,洗脱特征)可以确定复合物是否由化合物库或天然提取物中的一种或多种化合物形成或稳定化或解离。也就是说,由化合物库或天然提取物引起的级分偏移可通过比较在具有化合物库或天然提取物的情况下和不具有化合物库或天然提取物的情况下的靶蛋白洗脱来鉴定。级分偏移可用于确定化合物库或天然提取物是否引起稳定分子复合物或破坏分子复合物的形成。与靶蛋白形成复合物的结合蛋白还可通过分析在存在或不存在化合物库或天然提取物的情况下与靶蛋白类似地迁移(例如,共洗脱或共迁移)的其他蛋白质的级分来鉴定。一种或多种结合蛋白与靶蛋白在第二多个级分中而非第一多个级分中的共洗脱指示化合物库或天然提取物中的化合物或者药物引起包含靶蛋白和一种或多种结合蛋白中的至少一种结合蛋白的复合物的形成或稳定化。一种或多种结合蛋白与靶蛋白在第一多个级分中而非第二多个级分中的共洗脱指示化合物库或天然提取物中的化合物或者药物引起包含靶蛋白和一种或多种结合蛋白中的至少一种结合蛋白的复合物的解离。
负责引起复合物形成或稳定化或复合物解离的化合物预期与靶蛋白和/或一种或多种结合蛋白共洗脱。例如,如果化合物负责复合物形成或稳定化,则预期该化合物将与靶蛋白和/或结合蛋白结合,并且因此与靶蛋白和一种或多种结合蛋白在含有生物样品和化合物库或天然提取物的样品的多个级分中共洗脱。如果化合物负责复合物解离,则预期该化合物将与靶蛋白或结合蛋白结合,并且因此与靶蛋白或结合蛋白在含有生物样品和化合物库或天然提取物的样品的多个级分中共洗脱。
用于鉴定蛋白质-蛋白质复合物的示例性方法示于图2A中。首先分析生物样品(诸如无细胞生物样品、组织提取物、细胞提取物或亚细胞提取物)的一部分以鉴定样品内蛋白质和蛋白质复合物的基线洗脱特征。将化合物库或天然提取物添加到生物样品的另一部分中。单独分析该样品(即,含有药物、化合物库或天然提取物)以鉴定在存在药物、化合物库或天然提取物的情况下样品内蛋白质和蛋白质复合物的洗脱特征。在两个样品之间的不同级分中洗脱的蛋白质被确定为具有级分偏移。根据级分偏移的方向,偏移可指示蛋白质在存在化合物库或天然提取物的情况下与其结合配偶体缔合或解离。
将样品(例如,第一样品和第二样品)分别分级,诸如在图2A的302和304中。第一样品可以是生物样品(例如,无细胞生物样品、组织提取物、细胞提取物或亚细胞提取物)的一部分。第二样品是生物样品的与化合物库或天然提取物(诸如植物提取物)组合的另一部分。组合可最佳地包括在分级之前将生物样品与化合物库或天然提取物混合或温育。生物样品和化合物库或天然提取物的温育可在各种温度和/或持续时间下进行,但在优选地保持样品完整性的条件下进行。温育也可在生理条件下进行。温育可在样品非静止(例如,旋转或搅拌)或静止时进行。任选地,可在温育期间将一种或多种蛋白酶抑制剂添加到样品中。样品完整性可通过测定蛋白水解、蛋白质去折叠和/或蛋白质聚集来确定。
生物样品可通过裂解来自组织的细胞或从细胞分离的亚细胞结构来获得。细胞、组织和/或亚细胞结构可例如通过超声处理或洗涤剂来裂解。可处理裂解的材料,例如通过离心和/或过滤(例如,以去除细胞固体)、通过酶或化学品(例如,以去除核酸)、透析或缓冲液更换或其他处理技术。对于亚细胞裂解物,可使用标准分离技术诸如密度梯度离心将靶亚细胞结构(例如,线粒体、细胞核和其他细胞器)与其他细胞组分分离。在样品分级之前,可进一步减少细胞提取物样品体积。优选地,这种提取物处理不会使裂解物中的蛋白质变性或诱导其蛋白水解或聚集。如本文进一步讨论,生物样品不限于细胞提取物,因为在一些具体实施中,生物样品可以是无细胞生物样品(例如,唾液、脑脊液、血浆等)或无细胞生物样品的提取物。
在一些实施方案中,包含蛋白质的生物样品从动物组织获得。在一些实施方案中,包含蛋白质的生物样品从哺乳动物组织获得。在一些实施方案中,生物样品从脑、肝、肺或肾组织获得。
可划分生物样品,使得第一部分和第二部分可分别用于第一样品和第二样品。第一样品包含生物样品的含有蛋白质的一部分。在一些实施方案中,第一样品包含生物样品,该生物样品包含从组织、细胞或亚细胞器获得的蛋白质。在一些实施方案中,包含蛋白质的生物样品(例如,组织、细胞或亚细胞提取物)从动物组织获得。在一些实施方案中,包含蛋白质的生物样品从哺乳动物组织获得。在一些实施方案中,包含蛋白质的生物样品从脑、肝、肺或肾组织获得。在一些实施方案中,用于鉴定蛋白质-蛋白质复合物的组分的方法包括对第一样品进行分级以产生第一多个级分。在一些实施方案中,用于鉴定蛋白质的方法包括通过尺寸排阻色谱法对第一样品进行分级以产生第一多个级分。
第二样品包含生物样品的与化合物库(例如,小分子库)或天然提取物(例如,植物、动物、细菌或真菌提取物)组合的部分。化合物库可包含完全合成的化合物、完全天然的化合物或合成化合物和天然化合物的混合物。天然提取物可来自与产生生物样品的生物体不同的分类学分类的生物体。例如,组织、细胞或亚细胞提取物可来自与天然提取物的来源不同的界(例如,动物界、植物界、真菌界、原生生物界、古细菌界或真细菌界)、门、纲、目、科、属或种。可混合和/或温育第二样品的组合组分,以允许化合物库、药物或天然提取物的组分与生物样品的组分相互作用或结合。在一些实施方案中,化合物库、药物或天然提取物基本上不含蛋白质。优选地,第一样品与第二样品之间的差异在于第二样品中化合物库或天然提取物的存在。
用于鉴定调节复合物形成、稳定化或解离的化合物的方法可包括对第一样品和第二样品进行分级以产生第一多个级分(即,对于第一样品)和第二多个级分(即,对于第二样品),如图2A的302和304所示。可使用分级方法诸如尺寸排阻色谱法或高效液相色谱法(HPLC)将样品分级以获得多个级分。分级是一种分离过程,其中基于样品组分的一种或多种物理特征,例如流体动力学直径(例如,当基于尺寸排阻色谱法分离组分时)或分子量,将样品分成多个较小的量或级分。当根据本文所述的方法使用时,流体动力学直径是分子量的适当近似值。基于各个组分的特定性质的一种或多种差异收集级分。为了确保蛋白质复合物在分级过程中不被破坏,样品的分级应在非变性条件下进行。例如,分级可在生理条件下进行,例如在约6和约8之间的pH下。分馏也可在可能是或可能不是生理性的温度范围内进行。在本文所述方法的一些具体实施中,分级在磷酸盐缓冲盐水中进行。在一些实施方案中,用于鉴定蛋白质-蛋白质复合物的组分的方法包括使用尺寸排阻色谱法对样品进行分级。
可以恒定的流速和/或设定的体积对样品进行分级。将最终样品稀释成分级后获得的若干种级分。分级的样品在所有级分中不含相同的蛋白质和/或化合物,因为它们将基于通过分级技术选择的一个或多个标准进行分离。例如,尺寸排阻色谱法基于物理性质诸如蛋白质或蛋白质复合物的大小和形状(流体动力学大小)分离混合物。级分还可包含一种或多种化合物。
收集级分并分析以鉴定每个级分中的蛋白质。如图1A的306所示,分析来自第一样品的级分以鉴定第一样品的多个级分中的蛋白质,并且如308所示,分析来自第二样品的级分以鉴定第二样品的多个级分中的蛋白质。该鉴定可例如使用蛋白质组学分析来进行。示例性蛋白质组学分析技术可包括使用质谱法(例如,液相色谱串联质谱法(LC-MS/MS))。在鉴定之前,可进一步处理样品。例如,也可通过SDS-PAGE分离样品,并且可从凝胶中切下特定大小的蛋白质用于进一步分析。还可使用一种或多种蛋白酶有意地消化基于液体或凝胶的样品,以在蛋白质鉴定之前将蛋白质片段化为较短的多肽。在一些实施方案中,蛋白酶是氨基酸特异性蛋白酶。在一些实施方案中,蛋白酶仅在氨基酸的N端处切割。在一些实施方案中,蛋白酶仅在氨基酸的C端处切割。还可对级分进行进一步处理以制备样品,诸如缓冲液更换以去除可能干扰分析的盐和其他缓冲液组分。例如,为了制备用于LC-MS/MS的样品,使用试剂盒(包含诸如缓冲液的组分)或化学品将级分中的蛋白质从溶液中沉淀出来,然后重悬于相容的缓冲液中。可使用蛋白质鉴定技术(包括蛋白质印迹或LC-MS/MS)进行样品的分析。可通过使用液相色谱法进一步分离收集的级分以分离肽,然后将洗脱液导向具有电离源的质谱仪。可用于鉴定级分中的蛋白质的方法包括蛋白质组学方法,诸如免疫测定、质谱法和/或它们的组合。在一些实施方案中,鉴定第一多个级分和第二多个级分中的蛋白质包括使用质谱法。在一些实施方案中,质谱法是液相色谱质谱法(LC-MS/MS)。在一些实施方案中,用于鉴定第一级分和第二级分中的蛋白质的方法是相同的方法。
可在生物样品内鉴定感兴趣的蛋白质。感兴趣的蛋白质可以是例如药物靶标或潜在药物靶标。该蛋白质可被指定为靶蛋白。在存在化合物库或天然提取物的情况下在不同级分中洗脱(例如,具有级分偏移)的靶蛋白表明它已经历复合物状态的变化(例如,通过复合物形成或稳定化或解离),如通过流体动力学大小的变化所证明。例如,结合蛋白与靶蛋白共洗脱,因为复合物在分级期间保持缔合。在图2A的310处,可鉴定第一样品与第二样品之间的靶蛋白的级分偏移。鉴定靶蛋白的级分偏移表明,在存在或不存在药物、化合物库或天然提取物的情况下,靶蛋白与其他蛋白质(例如,结合蛋白)以不同方式相互作用,例如通过复合物形成或稳定化或复合物解离。
鉴定级分偏移可包括将分级信息和蛋白质身份数据转换为二维矩阵,例如图3所示。在一个轴上,呈现对应于一个样品(例如,第一样品)的级分编号。在另一个轴上,呈现对应于另一个样品(例如,第二样品)的级分编号。代表鉴定的蛋白质的数据点基于它们在任一样品中洗脱的级分在图上被分配坐标。虽然蛋白质洗脱是一种分布并且可覆盖一系列级分,但基于在所有级分之间观察到的最大蛋白质丰度(例如,最大强度)来分配峰洗脱级分。
评价蛋白质(诸如靶蛋白)的级分偏移可指示化合物库中的化合物或天然提取物或者药物是否引起复合物形成或稳定化或解离。如果蛋白质在一个样品而不是另一个样品的不同级分中洗脱,则代表该蛋白质的数据点将位于对角线之外(图3)。如果靶蛋白在第一样品(不含化合物库或天然提取物的生物样品)中洗脱的级分晚于该蛋白在第二样品(含有化合物库或天然提取物的生物样品)中洗脱的级分,则可以得出结论,化合物库或天然提取物引起包含靶蛋白的复合物的形成或稳定化。这是因为化合物库或天然提取物引起靶蛋白在具有较高分子量的物质中缔合。相比之下,如果靶蛋白在第一样品(不含化合物库或天然提取物的生物样品)中洗脱的级分早于该蛋白在第二样品(含有化合物库或天然提取物的生物样品)中洗脱的级分,则可以得出结论,化合物库或天然提取物引起包含靶蛋白的复合物的解离。如果蛋白质在两个样品之间不改变其峰洗脱级分,则表示该蛋白质的数据点将沿着对角线定位(例如,分配给两个样品中的相同级分)。
在图2A的308处,鉴定引起级分偏移(即,引起复合物形成或稳定化或复合物解离)的一种或多种化合物。一种或多种化合物的鉴定可包括第二多个级分中的含有靶蛋白和/或结合蛋白的级分的代谢组学分析。用于鉴定引起级分偏移的一种或多种化合物的过程可根据化合物库或天然提取物是否引起复合物形成或稳定化或复合物解离而不同。
用于鉴定一种或多种化合物的示例性过程示于图2B中。在图2B的402处,评价级分偏移以确定化合物库或天然提取物是否引起复合物形成或稳定化或复合物解离。如果级分偏移指示复合物形成或稳定化,则在404处鉴定与靶蛋白共洗脱的一种或多种化合物,例如通过获得包含靶蛋白的洗脱级分的代谢组学谱。在一些具体实施中,共洗脱基于含有靶蛋白和化合物的峰洗脱的级分。例如,可进行靶蛋白洗脱级分和一个或多个相邻级分的代谢组学和蛋白质组学分析,以确定化合物和靶蛋白的洗脱级分。任选地,可获得化合物库或天然提取物的代谢组学谱(例如,通过对化合物库或天然提取物进行代谢组学测定),如406所示。化合物库或天然提取物的代谢组学谱可用于鉴定与靶蛋白共洗脱的化合物。任选地,可获得生物样品的代谢组学谱(例如,通过对生物样品进行代谢组学测定)。生物样品的代谢组学谱可用于排除引起复合物形成或稳定化的化合物。可通过鉴定存在于包含靶蛋白的级分和化合物库或天然提取物两者中的一种或多种化合物来确认引起级分偏移的一种或多种化合物,如408所示。
如果级分偏移指示复合物解离,则引起复合物解离的一种或多种化合物可与靶蛋白或一种或多种结合蛋白结合(并与其共洗脱)。因此,如果级分偏移指示复合物解离,则可以鉴定一种或多种结合蛋白(即,在不存在来自化合物库或天然提取物的一种或多种化合物的情况下与靶蛋白形成复合物的一种或多种蛋白质),如410所示。如上所述,在不具有化合物库或天然提取物的情况下在与靶蛋白相同的级分中共洗脱(但在存在化合物库或天然提取物的情况下不共洗脱)的蛋白质表明附加的一种或多种蛋白质是在存在化合物库或天然提取物的情况下与靶蛋白形成复合物的结合蛋白。因此,可通过鉴定与第一多个级分中的级分中的靶蛋白共洗脱的一种或多种蛋白质来鉴定一种或多种结合蛋白,例如通过对第一多个级分中的一个或多个级分(即,与包含生物样品而不含天然提取物或化合物库的样品相关联的级分)进行蛋白质组学分析。一旦鉴定一种或多种结合蛋白,就可鉴定来自第二多个级分(即,与包含生物样品和化合物库或天然提取物的样品相关联的级分)的一种或多种结合蛋白的洗脱级分(或多个洗脱级分),如412处所示,例如通过第二多个级分中的级分的蛋白质组学分析。然后可在414处鉴定与一种或多种结合蛋白或与靶蛋白共洗脱的一种或多种化合物,例如使用代谢组学分析。在一些具体实施中,共洗脱基于含有靶蛋白或结合蛋白和化合物的峰洗脱的洗脱级分。例如,可进行靶蛋白洗脱级分和/或结合蛋白洗脱级分和一个或多个相邻级分的代谢组学和蛋白质组学分析,以确定化合物和靶蛋白或结合蛋白的洗脱级分。任选地,可获得化合物库或天然提取物的代谢组学谱(例如,通过对化合物库或天然提取物进行代谢组学测定),如416所示。化合物库或天然提取物的代谢组学谱可用于鉴定与靶蛋白共洗脱的化合物。任选地,可获得生物样品的代谢组学谱(例如,通过对生物样品进行代谢组学测定)。生物样品的代谢组学谱可用于排除引起复合物形成或稳定化的化合物。可通过鉴定存在于包含靶蛋白(或结合蛋白)的级分和化合物库或天然提取物两者中的一种或多种化合物来确认引起级分偏移的一种或多种化合物,如418所示。
样品
如本文所述的样品(例如,第一样品)可以是生物样品(例如,组织、细胞或亚细胞提取物或无细胞生物样品)。可将生物样品分成第一样品和第二样品。第一样品可包含生物样品,但不应包含根据本文所述方法研究的药物、化合物库或天然提取物。第二样品包含相同的生物样品(即,生物样品的第二部分),并且还包含至少一种药物、化合物库或天然提取物。将第二样品与药物、化合物库或天然提取物组合(例如,通过混合)。优选地,第一样品和第二样品仅在存在或不存在药物、化合物库或天然提取物方面不同。样品可以是悬浮在缓冲液中的蛋白质和多肽。样品可具有蛋白质、多肽和化合物。
在一些实施方案中,样品包含蛋白质。在一些实施方案中,样品包含化合物。在一些实施方案中,样品包含蛋白质和化合物两者。在一些实施方案中,样品可包含来自不同来源的提取物。在一些实施方案中,天然提取物是植物提取物。
在一些实施方案中,可通过本文所公开的任一方法对样品进行分级。在一些实施方案中,通过尺寸排阻色谱法对样品进行分级。在一些实施方案中,对样品进行分级以获得多个级分。分级是一种分离过程,其中将混合物分成多个较小的量或级分,其中组成有所不同。基于各个组分的特定性质的一种或多种差异收集级分。在一些实施方案中,可对样品进行分级以获得多个级分。在一些实施方案中,多个级分具有相同、相似或相等的体积。在一些实施方案中,可通过蛋白质组学和/或代谢组学方法进一步分析多个级分。在一些实施方案中,收集各个级分,然后分析。在一些实施方案中,收集各个级分,合并,然后分析。在一些实施方案中,收集各个级分,进一步分开,然后分析。在一些实施方案中,收集各个级分,进一步分开,然后使用两种不同的方法进行分析。下文描述了可用于本发明的示例性类型的样品。
生物样品
生物样品可衍生自或得自从任何生物体(诸如人或啮齿动物)分离的生物材料。生物样品可来自组织提取物、细胞提取物或亚细胞提取物(例如,细胞器提取物)或无细胞生物样品。示例性无细胞生物样品包括但不限于血浆样品、脑脊髓样品、唾液样品、乳液样品、痰液样品和粪便样品。组织可从生物体分离,机械消化、酶消化或两者以释放细胞。然后可将细胞应用于进一步的裂解方案以产生细胞提取物。在细胞裂解之前,可以分离或分选特定细胞类型以获得特定细胞类型提取物。亚细胞提取物也可通过首先温和地裂解细胞,然后应用一系列离心或纯化(诸如标签纯化)方法以分离感兴趣的完整细胞器,然后完全裂解以获得亚细胞提取物。
通常使用若干种方法来提取蛋白质,包括机械破碎、液体均质化、高频声波(超声处理)、冷冻/解冻循环和手动研磨。细胞裂解方法的选择取决于起始材料、体积和被提取的蛋白质的敏感性。
物理破坏是裂解多种细胞的有效方法,并且具有高裂解效率。物理提取的方法包括但不限于以下任一种或以下的组合:杜恩斯匀浆器、超声波仪、搅拌机、研钵和研杵、用试剂诸如干冰与乙醇或液氮冷冻以及弗氏压碎器。在物理破坏方法中,材料通过剪切力或外力物理分解以释放细胞组分。
洗涤剂溶解蛋白质并破坏脂质-脂质、蛋白质-蛋白质和蛋白质-脂质相互作用。它可用于从各种样品类型中提取总蛋白质或亚细胞级分或细胞器。基于洗涤剂的裂解容易适用于小体积或较大的样品,并且是细胞膜物理破坏的更温和的替代方案,尽管在从组织制备蛋白质样品时,它通常与均质化和机械研磨结合使用以实现完全细胞破坏。
在一些实施方案中,本文所公开的方法对第一样品进行分级。在一些实施方案中,在一些实施方案中,第一样品包含细胞提取物的含有蛋白质的一部分。在一些实施方案中,第一样品是包含从组织、细胞或亚细胞提取物获得的蛋白质的细胞提取物。在一些实施方案中,包含蛋白质的细胞提取物从动物组织获得。在一些实施方案中,包含蛋白质的细胞提取物从哺乳动物组织获得。在一些实施方案中,包含蛋白质的提取物从脑、肝、肺或肾组织获得。
天然提取物
提取物是次级代谢物的混合物。在植物及其提取物中存在不同类别的化合物;然而,大多数生物活性化合物来自四个主要类别:生物碱、苷类、多酚和萜烯。各种传统和现代方法用于从植物的不同部分制备植物提取物,诸如索氏提取、回流提取、超声处理、煎煮、浸渍、加压液体提取、固相提取、微波辅助提取、水蒸馏和酶辅助提取。样品制备首先分解基质,然后分离靶分析物。
在一些实施方案中,本文所公开的方法对第二样品进行分级。在一些实施方案中,第二样品包含天然提取物。在一些实施方案中,第二样品包含(i)组织、细胞或亚细胞提取物的第二部分和(ii)天然提取物。在一些实施方案中,天然提取物是植物提取物。在一些实施方案中,天然提取物基本上不含蛋白质。
化合物库
化学品库或化合物库是通常最终用于高通量筛选或工业制造的储存化学品的集合。化学品库可简单地由一系列储存化学品组成。每种化学品具有存储在数据库中的相关信息,包括诸如化合物的化学结构、纯度、量和生化特征的信息。例如,在药物发现过程中,在高通量筛选中需要多种有机化学品来针对疾病模型进行测试。化学品库可包含完全合成的化合物、完全天然的化合物或合成化合物和天然化合物的混合物。化合物库可包含一种或多种药物和/或一种或多种天然提取物。
在一些实施方案中,本文所公开的方法包括对包含天然提取物的第二样品进行分级。在一些实施方案中,第二样品包含(i)细胞提取物的第二部分和(ii)化合物库。在一些实施方案中,化合物库基本上不含蛋白质。
药物
药物可以是完全天然、完全合成或半合成来源的化学物质或化合物。如上所述,它可以从天然来源(例如,植物提取物)中分离。药物也可以是合成的或部分合成的。
在一些实施方案中,本文所公开的方法包括对包含药物的第二样品进行分级。在一些实施方案中,第二样品包含(i)细胞提取物的第二部分和(ii)药物。在一些实施方案中,药物基本上不含蛋白质。
分析方法
本发明的方法利用一种或多种分析方法来分离和/或分析蛋白质、肽和化合物的复杂混合物。
液相色谱法
将样品分离成简化的或单独的部分的一种方法是液相色谱法。液相色谱法包括流动相和固定相。具有蛋白质的样品和/或将样品分离成其各个部分。这种分离在具有流动相和固定相的情况下基于样品的组分而进行。流动相(液相)可以是缓冲液,优选地生理学相关的缓冲液。液相色谱法使用泵使加压液体和样品混合物流过填充有吸附剂(固定相)的柱,其基于样品组分与固定相的相互作用分离样品组分。在一些实施方案中,缓冲液可为pH6-8。在一些实施方案中,缓冲液包含磷酸盐缓冲盐水。固定相包含形成基质的树脂。分子将进入柱并基于其各种性质与固定相以不同方式相互作用。例如,在离子交换色谱法中,固定相可带电以基于蛋白质或多肽的电荷或等电点分离蛋白质或多肽。
固定相也可由不同的树脂制成,以形成基于流体动力学大小或分子量保留蛋白质的基质。尺寸排阻色谱法(SEC)是一种色谱方法,其中溶液中的分子(诸如蛋白质和多肽)根据其大小分离,并且在一些情况下根据分子量分离。可基于给定分子量范围内的表观分子量的分辨率来选择尺寸排阻柱。在一些实施方案中,通过尺寸排阻色谱法对样品进行分级。当蛋白质离开柱时,可使用一个或多个检测器鉴定蛋白质相对于单独的缓冲液的存在。
高效液相色谱法(HPLC)高压液相色谱法类似于SEC,因为它使用固定相和流动相来分离、鉴定和定量混合物中的组分。该技术被应用于分析化学,并且还依赖于泵使样品通过柱。样品内的组分将与固定相不同地相互作用,导致它们在不同时间处洗脱。流动相可以是溶剂(例如水、乙腈和/或甲醇)的混合物。
HPLC与尺寸排阻色谱法不同,因为它在高压、较短的柱长度和较小的树脂下操作以产生化合物的高分辨率分离。当化合物离开柱时,可使用一个或多个检测器鉴定化合物相对于单独的缓冲液的存在。在一些实施方案中,包含化合物的样品通过HPLC进行分级。
蛋白质组学
蛋白质组学是蛋白质的大规模研究。如本申请中所应用,蛋白质组学分析包括鉴定样品内或每个级分内的所有蛋白质,诸如从分级样品获得的多个级分。
基于质谱法(MS)的蛋白质组学(例如,测量和分析样品或级分中蛋白质的质量和数量)可用于分析已知蛋白质或肽以计算分子或化合物的可能片段化。本发明的样品中的蛋白质和/或肽可通过将保留时间/指数(IR)、离子的质荷比(m/z)和MS片段化模式与已知蛋白质和/或肽进行比较来鉴定。
在一些实施方案中,分析第一多个级分和第二多个级分以鉴定第一多个级分和第二多个级分中的蛋白质。在一些实施方案中,分析包括蛋白质组学分析。在一些实施方案中,分析包括使用质谱法。在一些实施方案中,分析包括使用液相色谱串联质谱法(LC-MS/MS)。
代谢组学
代谢组学方法可根据所述的方法使用,例如以鉴定样品中的药物、化合物或小分子。
基于MS的代谢组学
基于MS的代谢组学(例如,测量和分析样品或级分中化合物的质量、身份和数量)可用于分析化合物的已知化学结构以计算化合物的可能片段化。本发明的样品中的化合物可通过将保留时间/指数(IR)、离子的质荷比(m/z)和MS片段化模式与已知化合物(诸如存在于化合物库或天然提取物中的那些)进行比较来鉴定。
在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括获得级分的代谢组学谱。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括从第二多个级分获得代谢组学谱。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括获得化合物库或天然提取物的代谢组学谱。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括鉴定存在于级分和化合物库或天然提取物两者中的一种或多种化合物。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括:(i)获得第二多个级分中的级分的代谢组学谱;(ii)获得化合物库或天然提取物的代谢组学谱;以及(iii)鉴定存在于级分和化合物库或天然提取物两者中的一种或多种化合物。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物还包括获得第一样品的代谢组学谱。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物还包括过滤第二多个级分中的级分的代谢组学谱以排除第一样品中存在的化合物。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物还包括(i)获得第一样品的代谢组学谱;以及(ii)过滤第二多个级分中的级分的代谢组学谱以排除第一样品中存在的化合物。在一些实施方案中,使用质谱法获得代谢组学谱。在一些实施方案中,使用液相色谱和串联质谱法(LC-MS/MS)获得代谢组学谱。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括基于一种或多种化合物的峰洗脱级分和靶蛋白或结合蛋白的峰洗脱级分来确认一种或多种化合物和靶蛋白或一种或多种结合蛋白的共洗脱。
在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括确定天然提取物的片段化谱。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括确定化合物库的片段化谱。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括确定细胞提取物和天然提取物的片段化谱。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括确定细胞提取物和化合物库的片段化谱。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括确定天然提取物的片段化谱并将其与细胞提取物和天然提取物的片段化谱进行比较。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括确定化合物库的片段化谱并将其与细胞提取物和化合物库的片段化谱进行比较。
计算机NMR/计算NMR
计算机(计算)核磁共振(NMR)可用于分析化合物或药物的已知化学结构,以计算化合物与蛋白质和/或肽结合的可能性。该方法通过计算核磁共振化学偏移来预测液体溶液中稳定的化合物-蛋白质复合物。
在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括获得级分的代谢组学谱。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括从第二多个级分获得代谢组学谱。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括获得化合物库或天然提取物的代谢组学谱。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括鉴定存在于级分和化合物库或天然提取物两者中的一种或多种化合物。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括:(i)获得第二多个级分中的级分的代谢组学谱;(ii)获得化合物库或天然提取物的代谢组学谱;以及(iii)鉴定存在于级分和化合物库或天然提取物两者中的一种或多种化合物。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物还包括获得第一样品的代谢组学谱。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物还包括过滤第二多个级分中的级分的代谢组学谱以排除第一样品中存在的化合物。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物还包括(i)获得第一样品的代谢组学谱;以及(ii)过滤第二多个级分中的级分的代谢组学谱以排除第一样品中存在的化合物。在一些实施方案中,使用计算机NMR获得代谢组学谱。在一些实施方案中,鉴定引起级分偏移的一种或多种化合物包括基于一种或多种化合物的峰洗脱级分和靶蛋白或结合蛋白的峰洗脱级分来确认一种或多种化合物和靶蛋白或一种或多种结合蛋白的共洗脱。在一些实施方案中,确认共洗脱包括使用计算机NMR。
系统
本文还描述了用于执行本文所述方法的系统。该系统可包括一个或多个处理器和存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序在由一个或多个处理器执行时使系统执行该方法。在一些具体实施中,系统可被配置用于鉴定蛋白质-蛋白质复合物的组分。在一些具体实施中,系统可被配置用于鉴定引起蛋白质复合物形成、稳定化或解离的一种或多种化合物。系统还可包括用于获得在所执行的方法中使用的数据的一个或多个分析组件,例如被配置为对一个或多个样品进行分级的色谱系统(其可包括例如尺寸排阻色谱柱)、一个或多个质谱仪(其可被配置为获得蛋白质组学数据和/或代谢组学数据)。包括一个或多个质谱仪的系统还可包括液相色谱系统(其可包括例如反相液相色谱柱)。例如,系统可包括串联质谱仪,其可进一步配备有液相色谱系统,例如以执行LC-MS/MS。
被配置用于鉴定蛋白质-蛋白质复合物的组分的示例性系统可包括一个或多个处理器;以及存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序在由一个或多个处理器执行时使系统:接收通过对第一样品进行分级而获得的第一多个级分的第一蛋白质组学谱数据(例如,使用尺寸排阻色谱法),该第一样品包含生物样品的含有蛋白质的一部分;接收通过对第二样品进行分级(例如,使用尺寸排阻色谱法)而获得的第二多个级分的第二蛋白质组学谱数据,该第二样品包含(i)生物样品的第二部分和(ii)化合物库、药物或天然提取物;基于第一蛋白质组学谱数据和第二蛋白质组学数据来鉴定第一多个级分和第二多个级分中的蛋白质;对于靶蛋白,鉴定第一多个级分与第二多个级分之间的级分偏移,其中级分偏移指示由化合物库或天然提取物中的一种或多种化合物或者药物引起的复合物形成或稳定化或复合物解离;以及鉴定与靶蛋白形成复合物的一种或多种结合蛋白。一种或多种结合蛋白与靶蛋白在第二多个级分中而非第一多个级分中的共洗脱指示化合物库或天然提取物中的化合物或者药物引起包含靶蛋白和一种或多种结合蛋白中的至少一种结合蛋白的复合物的形成或稳定化。一种或多种结合蛋白与靶蛋白在第一多个级分中而非第二多个级分中的共洗脱指示化合物库或天然提取物中的化合物或者药物引起包含靶蛋白和一种或多种结合蛋白中的至少一种结合蛋白的复合物的解离。一种或多种结合蛋白和靶蛋白的共洗脱可基于例如靶蛋白和一种或多种结合蛋白的峰洗脱级分来确定。例如,一种或多种结合蛋白与靶蛋白的共洗脱可基于一种或多种结合蛋白的峰洗脱级分和靶蛋白的峰洗脱级分。
一个或多个程序在由一个或多个处理器执行时可进一步使系统基于一种或多种推定的结合蛋白和靶蛋白的分子量以及包含靶蛋白和一种或多种推定的结合蛋白的级分的级分编号来选择所述一种或多种结合蛋白中的一种或多种结合蛋白作为复合物的成员。
系统还可包括用于获得第一蛋白质组学谱数据和/或第二蛋白质组学数据谱的分析系统。例如,系统可包括一个或多个质谱仪。在一些具体实施中,系统可包括液相色谱系统和串联质谱仪,其可被配置为使用LC-MS/MS生成蛋白质组学谱数据。
被配置用于鉴定引起蛋白质复合物形成、稳定化或解离的一种或多种化合物的示例性系统可包括一个或多个处理器;以及存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序在由一个或多个处理器执行时使系统:接收通过对第一样品进行分级(例如,使用尺寸排阻色谱法)而获得的第一多个级分的第一蛋白质组学谱数据,该第一样品包含生物样品的含有蛋白质的一部分;接收通过对第二样品进行分级(例如,使用尺寸排阻色谱法)而获得的第二多个级分的第二蛋白质组学谱数据,该第二样品包含(i)生物样品的第二部分和(ii)化合物库或天然提取物;基于第一蛋白质组学谱数据和第二蛋白质组学数据来鉴定第一多个级分和第二多个级分中的蛋白质;对于靶蛋白,鉴定第一多个级分与第二多个级分之间的级分偏移,其中级分偏移指示由化合物库或天然提取物中的一种或多种化合物引起的复合物形成或稳定化或复合物解离;接收化合物库或天然提取物的代谢组学数据;接收第二多个级分中的包含靶蛋白或在不存在一种或多种化合物的情况下与靶蛋白形成复合物的结合蛋白的级分的代谢组学数据;以及通过分析化合物库或天然提取物的代谢组学数据和第二多个级分中的包含靶蛋白或在不存在一种或多种化合物的情况下与靶蛋白形成复合物的结合蛋白的级分的代谢组学数据来鉴定引起级分偏移的一种或多种化合物。
在一些具体实施中,系统被配置为通过接收第二多个级分中的级分的代谢组学谱来鉴定引起级分偏移的一种或多种化合物;接收化合物库或天然提取物的代谢组学谱;以及鉴定级分和化合物库或天然提取物两者中存在的一种或多种化合物。系统可被进一步配置为接收第一样品的代谢组学谱;以及过滤第二多个级分中的级分的代谢组学谱以排除第一样品中存在的化合物。
系统还可包括用于获得第一蛋白质组学谱数据和/或第二蛋白质组学数据谱的分析系统。例如,系统可包括一个或多个质谱仪。在一些具体实施中,系统可包括液相色谱系统和串联质谱仪,其可被配置为使用LC-MS/MS生成蛋白质组学谱数据。
系统还可包括用于获得代谢组学谱数据和/或第二蛋白质组学数据谱的分析系统。例如,系统可包括一个或多个质谱仪。在一些具体实施中,系统可包括液相色谱系统和串联质谱仪,其可被配置为使用LC-MS/MS生成蛋白质组学谱数据。在一些实施方案中,系统可包括核磁共振(NMR)系统。例如,系统可被配置为使用计算机核磁共振(NMR)获得代谢组学谱数据。
在一些具体实施中,鉴定引起级分偏移的一种或多种化合物可包括例如基于一种或多种化合物的峰洗脱级分和靶蛋白或结合蛋白的峰洗脱级分来确认一种或多种化合物和靶蛋白或一种或多种结合蛋白的共洗脱。
在一些具体实施中,系统被配置为鉴定与靶蛋白形成复合物的结合蛋白。例如,结合蛋白与靶蛋白在第一多个级分中而非第二多个级分中的共洗脱指示化合物库或天然提取物中的一种或多种化合物引起包含靶蛋白和结合蛋白的复合物的解离。
图8示出了根据一个实施方案的计算装置或系统的实例。装置800可以是连接到网络的主机计算机。装置800可以是客户端计算机或服务器。如图8所示,装置800可以是任何合适类型的基于微处理器的装置,诸如个人计算机、工作站、服务器或手持式计算装置(便携式电子装置),诸如电话或平板电脑。装置可包括例如一个或多个处理器810、输入装置820、输出装置830、存储器或存储装置840、通信装置860以及一个或多个分析系统870(例如,一个或多个液相色谱系统和/或一个或多个质谱仪)。驻留在存储器或存储装置840中的软件850可包括例如操作系统以及用于执行本文所述的方法的软件。输入装置820和输出装置830通常可对应于本文所述的那些,并且可与计算机连接或集成。
输入装置820可以是提供输入的任何合适的装置,诸如触摸屏、键盘或小键盘、鼠标或语音识别装置。输出装置830可以是提供输出的任何合适的装置,诸如触摸屏、触觉装置或扬声器。
存储装置840可以是提供存储的任何合适的装置(例如,电、磁或光存储器,包括RAM(易失性和非易失性)、高速缓存、硬盘驱动器或可移除存储盘)。通信装置860可包括能够通过网络发送和接收信号的任何合适的装置,诸如网络接口芯片或装置。计算机的组件可以任何合适的方式连接,诸如经由有线介质(例如,物理系统总线880、以太网连接或任何其他有线传输技术)或无线地(例如, 或任何其他无线技术)。
可作为可执行指令存储在存储装置840中并由处理器810执行的软件模块850可包括例如操作系统和/或体现本公开的方法的功能性的过程(例如,体现在如本文所述的装置中)。
软件模块850还可在任何非暂态计算机可读存储介质内存储和/或传输以供指令执行系统、设备或装置(诸如本文所述的那些)使用或与其结合使用,可从指令执行系统、设备或装置获取与软件相关联的指令并执行指令。在本公开的上下文中,计算机可读存储介质可以是任何介质,诸如存储装置840,其可包含或存储供指令执行系统、设备或装置使用或与其结合使用的过程。计算机可读存储介质的实例可包括存储器单元,如硬盘驱动器、闪存驱动器和作为单个功能单元操作的分布式模块。此外,本文所述的各种过程可被体现为被配置为根据上述实施方案和技术进行操作的模块。另外,虽然可单独示出和/或描述过程,但本领域技术人员将理解,上述过程可以是其他过程内的例程或模块。
软件模块850还可在任何传输介质内传播以供指令执行系统、设备或装置(诸如上述那些)使用或与其结合使用,可从指令执行系统、设备或装置获取与软件相关联的指令并执行指令。在本公开的上下文中,传输介质可以是可通信、传播或传输程序以供指令执行系统、设备或装置使用或与其结合使用的任何介质。传输可读介质可包括但不限于电子、磁、光、电磁或红外有线或无线传播介质。
装置800可连接到网络(例如,网络904,如图9所示和/或如下所述),该网络可以是任何合适类型的互连通信系统。网络可实现任何合适的通信协议,并且可通过任何合适的安全协议来保护。网络可包括可实现网络信号的发送和接收的任何合适布置的网络链路,诸如无线网络连接、T1或T3线路、电缆网络、DSL或电话线。
装置800可使用任何操作系统例如适于在网络上操作的操作系统来实现。软件模块850可用任何合适的编程语言编写,诸如C、C++、Java或Python。在各种实施方案中,体现本公开的功能性的应用软件可以不同的配置部署,诸如以客户端/服务器布置或通过网络浏览器作为基于网络的应用程序或网络服务。在一些实施方案中,操作系统由一个或多个处理器(例如,处理器810)执行。
装置800还可包括一个或多个分析系统870(例如,一个或多个液相色谱系统和/或一个或多个质谱仪)。
图9示出了根据一个实施方案的计算系统的实例。在系统900中,装置800(例如,如上所述并示于图8中)连接到网络904,该网络还连接到装置906。在一些实施方案中,装置906是分析系统(其可包括例如一个或多个液相色谱系统和/或一个或多个质谱仪)。
装置800和906可例如使用合适的通信接口经由网络904(诸如局域网(LAN)、虚拟专用网络(VPN)或互联网)进行通信。在一些实施方案中,网络904可以是例如互联网、内联网、虚拟专用网络、云网络、有线网络或无线网络。装置800和906可部分地或全部地经由无线或硬连线通信(诸如以太网、IEEE 802.11b无线等)进行通信。另外,装置800和906可例如使用合适的通信接口经由第二网络(诸如移动/蜂窝网络)进行通信。装置800和906之间的通信还可包括各种服务器(诸如邮件服务器、移动服务器、媒体服务器、电话服务器等)或与各种服务器通信。在一些实施方案中,装置800和906可例如经由无线或硬连线通信(诸如以太网、IEEE 802.11b无线等)直接通信(作为经由网络904通信的代替或补充)。在一些实施方案中,装置800和906经由通信908进行通信,该通信可以是直接连接或者可经由网络(例如,网络904)进行。
装置800和906中的一者或全部通常包括逻辑(例如,http网络服务器逻辑)或被编程为将从本地或远程数据库或其他数据和内容源访问的数据格式化,以根据本文所述的各种实例经由网络904提供和/或接收信息。
实施例
实施例1:用于可扩展药物发现的代谢物-宿主蛋白相互作用的高通量映射。
将细胞裂解物与天然提取物混合并进行分析。若干种蛋白质被鉴定为在化合物的存在下与RNF114共洗脱。本实施例展示了鉴定化合物-蛋白质相互作用的示例性高通量方法。
裂解物和提取物制备:将冷冻的小鼠组织(从脑、肝、肺和肾汇集)在具有1X PBS和锆珠的2mL螺旋盖管中于珠磨仪(速度3450rpm)中均质化(30s x 5个循环)。均质化后,将裂解物以21,000xg离心15分钟以获得澄清的上清液。使用BCA蛋白质测定试剂盒测定蛋白质浓度。将植物提取物分别溶解于DMSO中,然后与小鼠组织裂解物(总共60mg蛋白质)合并。
样品分离:将结合反应/共温育在25℃温育1小时,然后进行尺寸排阻色谱法。使用SUPERDEX 200pg 16/600柱(GE)在AKTA AVANT 150(GE),Cytiva(UNICORNTM软件7.6版)上进行尺寸排阻色谱法。用于分离的运行缓冲液是milliQ水中的50mM碳酸氢铵+150mM NaCl。在样品分析之前,用2倍柱体积的运行缓冲液以1mL/min的流速平衡柱。将样品加载到柱上后,用运行缓冲液以0.8mL/min的流速收集80个收集物。使用BCA测定法定量每个级分的蛋白质的量。
用于代谢组学的样品制备:对于每个级分,从用于代谢组学的级分(总共800μL)中取样对应于20μg总蛋白质的体积。使用speedvac干燥样品,然后添加甲醇。将样品超声处理10分钟,然后涡旋5分钟,并在室温下离心10分钟。使用浓缩器干燥等分试样。
用于蛋白质组学的样品制备:取相当于20μg蛋白质的级分用于蛋白质组学,并与20% SDS混合。将蛋白质用5mM三(2-羧乙基)膦盐酸盐在37℃下还原1小时,并用甲基硫代磺酸甲酯(MMTS)在室温下在黑暗中烷基化30分钟。在37℃下,在恒温混合器上用胰蛋白酶/lysC(1:100)进一步消化蛋白质过夜。消化后,从恒温混合器中取出样品,并向样品中添加0.5pmol PREMISTM(Promega)肽混合物。然后将肽加载到S-TRAP柱上并以10,000xg离心30s。用三乙基碳酸氢铵缓冲液(TEABC)、0.1%甲酸和50%乙腈(ACN)洗脱肽。
将肽重悬于0.1%甲酸中,并进行液相色谱串联质谱(LC-MS/MS)分析。在与Orbitrap Eclipse偶联的Ultimate 3000RSLCnano系统上解析肽。将1μg加载到C18柱50cm,3.0μm Easy-Spray柱(Thermo Fisher Scientific)上。用0-40%梯度的缓冲液B(80%乙腈,0.1%甲酸)以300nl/min的流速洗脱肽,并进样用于MS分析。LC梯度运行100分钟。在Orbitrap(R=240k;AGQ目标=400000;最大IT=50ms;RF透镜=30%;质量范围=400-2000;质心数据)中采集MS1光谱。采用动态排除10秒,排除给定前体的所有电荷状态。在线性离子阱(速率=turbo;AGQ目标=20,000;最大IT=50ms;NCEHCD=35%)中收集MS2光谱。
数据分析:质谱.raw文件用于蛋白质组学数据库检索。使用Fra gpipe软件[版本17.1;Releases Nesvilab/FragPipe(github.com)]针对从UniProt下载的人和小鼠蛋白质组数据库(UniProtKB Release 2021_03)进行蛋白质组学数据库搜索,包括污染物和诱饵蛋白,以用于原始数据搜索。搜索分别以10ppm和0.05Da的前体和片段容差进行。在肽和蛋白质水平均保持0.1%的错误发现率。使用组合肽输出文件进行剂量反应曲线(DRC)肽趋势分析。
蛋白质组学和代谢组学LC-MS/MS数据按照所述的清除策略进一步过滤。从蛋白质组学数据中去除污染物和人类蛋白质如角蛋白,然后去除75%级分中出现的蛋白质,我们保留了具有至少≥2个独特肽和≥2个鉴定的肽谱匹配(PSM)总数的蛋白质,用于下游相关性分析。通过去除所有75%的级分中出现的代谢物(特征),包括丰度值>10000的代谢物(特征),并选择具有相关MS/MS光谱的代谢物/特征,从而对代谢组学数据集进行预处理。根据Pearson R2值计算错误发现率(FDR)为5%。
结果:绘制化合物-蛋白质相互作用以可视化在存在化合物库的情况下的峰偏移(图5)。在存在代谢物的情况下不改变峰洗脱级分的蛋白质在对角线上可视化。移动到对角线右侧的蛋白质表明蛋白质以较低编号的级分洗脱,在存在天然提取物的情况下增加表观分子量。移动到对角线左侧的蛋白质表明蛋白质以较高编号的级分洗脱,在存在天然提取物的情况下失去表观分子量。
示例性蛋白质RNF114在没有代谢物库的情况下在小鼠裂解物的级分37中洗脱(图5)。当裂解物与P45植物提取物一起温育时,观察到RNF114在级分16中洗脱(图5)。这表明RNF114既可形成较大表观分子量的复合物,又可以在存在P45的情况下分解成较小表观分子量的复合物(图5)。
观察到其他蛋白质在对照裂解物中以较高编号的级分洗脱,但在存在代谢物的情况下在较低编号的级分中与RNF114共洗脱(图6)。峰洗脱体积的偏移表明RNF114和结合蛋白在存在化合物的情况下都增加了表观分子量。这表明该化合物可介导RNF114与结合蛋白之间的蛋白质复合物形成。
结果:为了验证化合物依赖性复合物形成,将小鼠蛋白质裂解物与或不与P45共温育。在不存在化合物的情况下,RNF114和结合蛋白(K-Ras信号传导调节剂)在单独的级分中迁移(图7)。在存在化合物的情况下,对应于未结合蛋白的峰分别在级分31和37中变得不可检测,但出现在级分16中。这表明P45天然提取物介导RNF114与结合蛋白之间的蛋白质-蛋白质缔合。
Claims (26)
1.一种用于鉴定蛋白质-蛋白质复合物的组分的方法,所述方法包括:
使用尺寸排阻色谱法对第一样品进行分级以产生第一多个级分,所述第一样品包含生物样品的含有蛋白质的第一部分;
使用所述尺寸排阻色谱法对第二样品进行分级以产生第二多个级分,所述第二样品包含(i)所述生物样品的第二部分和(ii)化合物库、药物或天然提取物;
分析所述第一多个级分和所述第二多个级分以鉴定所述第一多个级分和所述第二多个级分中的蛋白质;
对于靶蛋白,鉴定所述第一多个级分与所述第二多个级分之间的级分偏移,其中所述级分偏移指示由所述化合物库、所述药物或所述天然提取物中的一种或多种化合物引起的复合物形成或稳定化或复合物解离;以及
鉴定与所述靶蛋白形成复合物的一种或多种结合蛋白,其中:
所述一种或多种结合蛋白与所述靶蛋白在所述第二多个级分中而非所述第一多个级分中的共洗脱指示所述化合物库、所述药物或所述天然提取物中的化合物引起包含所述靶蛋白和所述一种或多种结合蛋白中的至少一种结合蛋白的复合物的形成或稳定化;并且
所述一种或多种结合蛋白与所述靶蛋白在所述第一多个级分中而非所述第二多个级分中的共洗脱指示所述化合物库、所述药物或所述天然提取物中的化合物引起包含所述靶蛋白和所述一种或多种结合蛋白中的至少一种结合蛋白的复合物的解离。
2.如权利要求1所述的方法,所述方法还包括基于所述一种或多种推定的结合蛋白和所述靶蛋白的分子量以及包含所述靶蛋白和所述一种或多种推定的结合蛋白的级分的级分编号来选择所述一种或多种结合蛋白中的一种或多种结合蛋白作为所述复合物的成员。
3.如权利要求1或2所述的方法,其中基于所述靶蛋白和所述一种或多种结合蛋白的峰洗脱级分来确定共洗脱。
4.如权利要求1至3中任一项所述的方法,其中所述一种或多种结合蛋白与所述靶蛋白的共洗脱基于所述一种或多种结合蛋白的峰洗脱级分和所述靶蛋白的峰洗脱级分。
5.一种用于鉴定引起蛋白质复合物形成、稳定化或解离的一种或多种化合物的方法,所述方法包括:
使用尺寸排阻色谱法对第一样品进行分级以产生第一多个级分,所述第一样品包含生物样品的含有蛋白质的第一部分;
使用所述尺寸排阻色谱法对第二样品进行分级以产生第二多个级分,所述第二样品包含(i)所述生物样品的第二部分和(ii)化合物库或天然提取物;
分析所述第一多个级分和所述第二多个级分以鉴定所述第一多个级分和所述第二多个级分中的蛋白质;
对于靶蛋白,鉴定所述第一多个级分与所述第二多个级分之间的级分偏移,其中所述级分偏移指示由所述化合物库或所述天然提取物中的一种或多种化合物引起的复合物形成或稳定化或复合物解离;以及
鉴定引起所述级分偏移的所述一种或多种化合物,包括分析以下物质:(1)对于指示由所述一种或多种化合物引起的复合物形成或稳定化的级分偏移,分析所述第二多个级分中的包含所述靶蛋白的级分,以鉴定所述级分中与所述靶蛋白共洗脱的一种或多种化合物,或者(2)对于指示由所述一种或多种化合物引起的复合物解离的级分偏移,分析(i)所述第二多个级分中的包含所述靶蛋白的级分,以鉴定所述级分中与所述靶蛋白共洗脱的一种或多种化合物,或者(ii)所述第二多个级分中的包含在不存在所述一种或多种化合物的情况下与所述靶蛋白形成复合物的结合蛋白的级分,以鉴定所述级分中与所述结合蛋白共洗脱的所述一种或多种化合物。
6.如权利要求5所述的方法,其中鉴定引起所述级分偏移的所述一种或多种化合物包括:
获得所述第二多个级分中的所述级分的代谢组学谱;
获得所述化合物库或所述天然提取物的代谢组学谱;以及
鉴定所述级分和所述化合物库或所述天然提取物两者中存在的一种或多种化合物。
7.如权利要求6所述的方法,鉴定引起所述级分偏移的所述一种或多种化合物还包括:
获得所述第一样品的代谢组学谱;以及
过滤所述第二多个级分中的所述级分的所述代谢组学谱以排除所述第一样品中存在的化合物。
8.如权利要求6或7所述的方法,其中使用质谱法获得所述代谢组学谱。
9.如权利要求8所述的方法,其中使用液相色谱和串联质谱法(LC-MS/MS)获得所述代谢组学谱。
10.如权利要求6或7所述的方法,其中使用计算机核磁共振(NMR)获得所述代谢组学谱。
11.如权利要求5至10中任一项所述的方法,其中鉴定引起所述级分偏移的所述一种或多种化合物包括基于所述一种或多种化合物的峰洗脱级分和所述靶蛋白或所述结合蛋白的峰洗脱级分来确认所述一种或多种化合物和所述靶蛋白或所述一种或多种结合蛋白的共洗脱。
12.如权利要求5至11中任一项所述的方法,所述方法包括鉴定与所述靶蛋白形成所述复合物的所述结合蛋白,其中所述结合蛋白与所述靶蛋白在所述第一多个级分中而非所述第二多个级分中的共洗脱指示所述化合物库或所述天然提取物中的一种或多种化合物引起包含所述靶蛋白和所述结合蛋白的复合物的解离。
13.如权利要求1至12中任一项所述的方法,其中分析所述第一多个级分和所述第二多个级分以鉴定所述第一多个级分和所述第二多个级分中的蛋白质包括蛋白质组学分析。
14.如权利要求13所述的方法,其中分析所述第一多个级分和所述第二多个级分以鉴定所述第一多个级分和所述第二多个级分中的蛋白质包括使用质谱法。
15.如权利要求13所述的方法,其中分析所述第一多个级分和所述第二多个级分以鉴定所述第一多个级分和所述第二多个级分中的蛋白质包括使用液相色谱串联质谱法(LC-MS/MS)。
16.如权利要求1至15中任一项所述的方法,其中所述化合物库、所述药物或所述天然提取物基本上不含蛋白质。
17.如权利要求1至16中任一项所述的方法,其中所述生物样品包括无细胞生物样品、组织提取物、细胞提取物或亚细胞提取物。
18.如权利要求1至17中任一项所述的方法,其中所述第二样品包含所述化合物库。
19.如权利要求1至17中任一项所述的方法,其中所述第二样品包含所述天然提取物。
20.如权利要求19所述的方法,其中所述天然提取物是植物提取物。
21.如权利要求1至20中任一项所述的方法,其中包含蛋白质的所述生物样品从细胞裂解物获得。
22.如权利要求1至21中任一项所述的方法,其中包含蛋白质的所述生物样品从动物组织获得。
23.如权利要求1至22中任一项所述的方法,其中包含蛋白质的所述生物样品从哺乳动物组织获得。
24.如权利要求1至23中任一项所述的方法,其中包含蛋白质的所述生物样品从脑、肝、肺或肾组织获得。
25.一种系统,所述系统包括:
一个或多个处理器;以及
存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序在由所述一个或多个处理器执行时使所述系统:
接收通过使用尺寸排阻色谱法对第一样品进行分级而获得的第一多个级分的第一蛋白质组学谱数据,所述第一样品包含生物样品的含有蛋白质的一部分;
接收通过使用所述尺寸排阻色谱法对第二样品进行分级而获得的第二多个级分的第二蛋白质组学谱数据,所述第二样品包含(i)所述生物样品的第二部分和(ii)化合物库、药物或天然提取物;
基于所述第一蛋白质组学谱数据和所述第二蛋白质组学数据来鉴定所述第一多个级分和所述第二多个级分中的蛋白质;
对于靶蛋白,鉴定所述第一多个级分与所述第二多个级分之间的级分偏移,其中所述级分偏移指示由所述化合物库、所述药物或所述天然提取物中的一种或多种化合物引起的复合物形成或稳定化或复合物解离;以及
鉴定与所述靶蛋白形成复合物的一种或多种结合蛋白,其中:
所述一种或多种结合蛋白与所述靶蛋白在所述第二多个级分中而非所述第一多个级分中的共洗脱指示所述化合物库、所述药物或所述天然提取物中的化合物引起包含所述靶蛋白和所述一种或多种结合蛋白中的至少一种结合蛋白的复合物的形成或稳定化;并且
所述一种或多种结合蛋白与所述靶蛋白在所述第一多个级分中而非所述第二多个级分中的共洗脱指示所述化合物库、所述药物或所述天然提取物中的化合物引起包含所述靶蛋白和所述一种或多种结合蛋白中的至少一种结合蛋白的复合物的解离。
26.一种系统,所述系统包括:
一个或多个处理器;以及
存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序在由所述一个或多个处理器执行时使所述系统:
接收通过使用尺寸排阻色谱法对第一样品进行分级而获得的第一多个级分的第一蛋白质组学谱数据,所述第一样品包含生物样品的含有蛋白质的一部分;
接收通过使用所述尺寸排阻色谱法对第二样品进行分级而获得的第二多个级分的第二蛋白质组学谱数据,所述第二样品包含(i)所述生物样品的第二部分和(ii)化合物库或天然提取物;以及
基于所述第一蛋白质组学谱数据和所述第二蛋白质组学数据来鉴定所述第一多个级分和所述第二多个级分中的蛋白质;
对于靶蛋白,鉴定所述第一多个级分与所述第二多个级分之间的级分偏移,其中所述级分偏移指示由所述化合物库或所述天然提取物中的一种或多种化合物引起的复合物形成或稳定化或复合物解离;
接收所述化合物库或所述天然提取物的代谢组学数据;
接收所述第二多个级分中的包含所述靶蛋白或在不存在所述一种或多种化合物的情况下与所述靶蛋白形成复合物的结合蛋白的级分的代谢组学数据;以及
通过分析所述化合物库或所述天然提取物的所述代谢组学数据和所述第二多个级分中的包含所述靶蛋白或在不存在所述一种或多种化合物的情况下与所述靶蛋白形成复合物的所述结合蛋白的所述级分的所述代谢组学数据来鉴定引起所述级分偏移的所述一种或多种化合物。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| IN202211068104 | 2022-11-26 | ||
| IN202211068104 | 2022-11-26 | ||
| PCT/US2023/081000 WO2024112940A1 (en) | 2022-11-26 | 2023-11-22 | Methods and systems for identifying compounds for forming, stabilizing or disrupting molecular complexes |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN120303045A true CN120303045A (zh) | 2025-07-11 |
Family
ID=91196694
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202380081283.4A Pending CN120303045A (zh) | 2022-11-26 | 2023-11-22 | 用于鉴定形成、稳定或破坏分子复合物的化合物的方法和系统 |
Country Status (3)
| Country | Link |
|---|---|
| EP (1) | EP4622725A1 (zh) |
| CN (1) | CN120303045A (zh) |
| WO (1) | WO2024112940A1 (zh) |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20030091976A1 (en) * | 2001-11-14 | 2003-05-15 | Ciphergen Biosystems, Inc. | Methods for monitoring polypeptide production and purification using surface enhanced laser desorption/ionization mass spectrometry |
| AU2003258036A1 (en) * | 2002-08-01 | 2004-02-23 | Wyeth | Methods and reagents relating to inflammation and apoptosis |
| ATE380344T1 (de) * | 2002-09-12 | 2007-12-15 | Vlaams Interuniv Inst Biotech | Verfahren zum identifizieren von drug targets |
| WO2005000226A2 (en) * | 2003-06-06 | 2005-01-06 | Diversa Corporation | Mixed bed multi-dimensional chromatography systems and methods of making and using them |
| US8097427B2 (en) * | 2007-03-16 | 2012-01-17 | Covalx Ag | Direct mass spectrometric analysis of drug candidates targeting protein complexes |
| WO2010078601A1 (en) * | 2009-01-05 | 2010-07-08 | The Regents Of The University Of California | High throughput biomolecule separation and analysis |
| EP3465207B1 (en) * | 2016-05-30 | 2021-09-01 | Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. | Ligand identification by co-fractionation |
-
2023
- 2023-11-22 WO PCT/US2023/081000 patent/WO2024112940A1/en not_active Ceased
- 2023-11-22 EP EP23895504.1A patent/EP4622725A1/en active Pending
- 2023-11-22 CN CN202380081283.4A patent/CN120303045A/zh active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| EP4622725A1 (en) | 2025-10-01 |
| WO2024112940A1 (en) | 2024-05-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Brown et al. | Top-down proteomics: challenges, innovations, and applications in basic and clinical research | |
| Kirkwood et al. | Characterization of native protein complexes and protein isoform variation using size-fractionation-based quantitative proteomics | |
| Knepper | Proteomics and the kidney | |
| Baggerman et al. | Gel-based versus gel-free proteomics: a review | |
| Mirzaei et al. | TMT one-stop shop: from reliable sample preparation to computational analysis platform | |
| Hinneburg et al. | Unlocking cancer glycomes from histopathological formalin-fixed and paraffin-embedded (FFPE) tissue microdissections | |
| Schrader | Origins, technological development, and applications of peptidomics | |
| CN102395886A (zh) | 用于对修饰的肽进行定量的方法 | |
| Veyel et al. | System-wide detection of protein-small molecule complexes suggests extensive metabolite regulation in plants | |
| Thingholm et al. | Sequential elution from IMAC (SIMAC): an efficient method for enrichment and separation of mono-and multi-phosphorylated peptides | |
| Diémé et al. | Workflow methodology for rat brain metabolome exploration using NMR, LC–MS and GC–MS analytical platforms | |
| Nice | The separation sciences, the front end to proteomics: An historical perspective | |
| Wu et al. | Integrating titania enrichment, iTRAQ labeling, and Orbitrap CID‐HCD for global identification and quantitative analysis of phosphopeptides | |
| Brockbals et al. | Development and thorough evaluation of a multi-omics sample preparation workflow for comprehensive LC-MS/MS-based metabolomics, lipidomics and proteomics datasets | |
| Cheng et al. | Peptide labeling using isobaric tagging reagents for quantitative phosphoproteomics | |
| Loo et al. | Proteomics in molecular diagnosis: typing of amyloidosis | |
| Fu et al. | Deep bottom-up proteomics enabled by the integration of liquid-phase ion trap | |
| Takahashi et al. | Proteomics: advanced technology for the analysis of cellular function | |
| CN120303045A (zh) | 用于鉴定形成、稳定或破坏分子复合物的化合物的方法和系统 | |
| Tiambeng et al. | Size exclusion chromatography strategies and MASH explorer for large proteoform characterization | |
| Liu et al. | Unrestrictive identification of post-translational modifications in the urine proteome without enrichment | |
| Maccarrone et al. | Brain quantitative proteomics combining GeLC-MS and isotope-coded protein labeling (ICPL) | |
| O’Brien et al. | Employing TMT quantification in a shotgun-MS platform | |
| WO2024261269A1 (en) | Method for detecting ligand-target interactions using solvent- induced precipitation in intact cells | |
| Heinzelman et al. | Shotgun proteomic profiling of bloodborne nanoscale extracellular vesicles |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |