CN110456035A - 基于细胞的探询式分析及其应用 - Google Patents
基于细胞的探询式分析及其应用 Download PDFInfo
- Publication number
- CN110456035A CN110456035A CN201910734226.7A CN201910734226A CN110456035A CN 110456035 A CN110456035 A CN 110456035A CN 201910734226 A CN201910734226 A CN 201910734226A CN 110456035 A CN110456035 A CN 110456035A
- Authority
- CN
- China
- Prior art keywords
- cell
- data
- network
- activity
- overall
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/16—Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P29/00—Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
- A61P3/04—Anorexiants; Antiobesity agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
- A61P3/08—Drugs for disorders of the metabolism for glucose homeostasis
- A61P3/10—Drugs for disorders of the metabolism for glucose homeostasis for hyperglycaemia, e.g. antidiabetics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
- A61P35/02—Antineoplastic agents specific for leukemia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
- A61P9/10—Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/02—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
- C12Q1/025—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
- G01N33/5008—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- Medicinal Chemistry (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Hematology (AREA)
- Biotechnology (AREA)
- Urology & Nephrology (AREA)
- Analytical Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Veterinary Medicine (AREA)
- General Chemical & Material Sciences (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Food Science & Technology (AREA)
- Pathology (AREA)
- General Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Toxicology (AREA)
- Diabetes (AREA)
Abstract
本文公开了基于细胞的探询式分析及其应用,具体描述的是一个用于通过建模来分析生物系统或过程(例如,疾病状态,如癌症)的发现平台技术。
Description
本申请是申请日为2012年9月7日和发明名称为“基于细胞的 探询式分析及其应用”的201280073683.2号发明专利申请的分案申 请。
相关申请
本申请要求2012年4月2日提交的61/619326号美国临时申请、 2012年7月6日提交的61/668617号美国临时申请、2012年4月4 日提交的61/620305号美国临时申请、2012年6月28日提交的 61/665631号美国临时申请、2012年8月1日提交的61/678596号美 国临时申请和2012年8月1日提交的61/678590号美国临时申请的优 先权,其中各自的全部内容明确地通过引用在此引入。
发明背景
自从我们今天称为分子生物学先驱的James Watson和Francis Crick在1964年发现了DNA以来,新药开发已有很大的发展。分子 生物学的工具和产品使得能够在DNA和RNA水平快速、详细和精确 地测量基因调控。在该范式变革性的发现后的三十年间从上述平台出 现了敲除动物模型、关键酶联反应及发病机制和病理生理学的新知 识。在2000年春季,当Craig Ventor和Francis Collins宣布了人类基 因组的最初测序时,科学界掀起了医药学的新浪潮。
基因组作图立即点燃了例如能够控制疾病(甚至在疾病起始之 前)、使用基因治疗来逆转导致阿尔兹海默氏病或帕金森氏疾病的退 化性脑进程和可以被引入到肿瘤的部位并在恢复正常的组织结构和 生理的同时导致疾病消灭的构建体的希望。其他人则采取了有争议的 纠结态度并提出产生在眼睛或头发的颜色、身高等方面想要的后代的 概念。然而十年后,我们仍然没有看到特别的途径使得能够期待基因 治疗的持续成功,或甚至遗传过程的基本控制。
因此,一个显而易见的现实是,遗传学(至少独立于支持结构) 没有推动生理学的终点。事实上,许多过程如转录后修饰、突变、单 核苷酸多态性(SNP)和翻译后修饰可以改变基因和/或其编码的互补 蛋白质的本性(providence),并因而造成疾病过程。
发明概述
信息化时代和互联网的建立已经允许信息过载,同时也促进了国 际性合作和评判。具有讽刺意味的是,上述的现实也可能是科学界忽 略了几个简单的点的原因,包括细胞和/或组织内部及之间的信号级联 和交互(cross-talk)的通讯允许在出差错时发生用于纠正机制的体内稳 态和消息发送。
一个恰当的例子涉及到心血管疾病(CVD),这仍然是在美国和 许多发达国家中的主要死亡原因,仅在美国每2.8例死亡中占1例。 此外,CVD作为基础的病理造成相关的并发症,如慢性肾脏病(~ 1900万US病例)、慢性疲劳综合征和代谢综合征的关键因素。与诊 断学、微创外科技术、药物洗脱支架和有效的临床监测相关的重大技 术进步已经在介入心脏病学领域中开创了空前增长的时期,也使得 CVD的管控更加有效。然而,与CVD及其并发症(如糖尿病和周围 血管疾病)相关的疾病病因尚未完全阐明。
仍然缺乏探索涉及生物学过程如疾病状态(例如,CVD)的病因 学的机制和途径,以及鉴别关键的调控途径和/或目标分子(如“药物 靶标”)和/或用于更好的疾病诊断、管控和/或治疗的标志物的新方法。
本文所描述的发明至少部分地基于网络生物学、基因组学、蛋白 质组学、代谢组学、转录组学和生物信息学的工具和方法的新型的协 同应用,它们在结合时可利用系统生物学方法而用于研究任何目标生 物系统,如所选的疾病状态,包括癌症、糖尿病、肥胖症、心血管疾 病和血管生成。在第一步骤中,开发了细胞建模系统以探测各种不同 生物系统,如疾病过程,其中包含经受各种疾病相关环境刺激(例如, 高血糖症、缺氧、免疫应激和脂质过氧化、细胞密度、血管生成激动 剂和拮抗剂)的疾病相关细胞。在一些实施方式中,细胞建模系统涉 及各种相互作用的细胞类型(如主动脉平滑肌细胞(HASMC)、近 端小管肾细胞(HK-2)、主动脉内皮细胞(HAEC)和真皮成纤维细 胞(HDFa))之间的细胞交互机制。通过使用几种技术的组合,包 括例如,切割边界质谱(cutting edge mass spectrometry)(LC/MSMS)、 流式细胞术、基于细胞的分析和功能分析,获得来自细胞模型系统的 高通量生物学读数。然后通过体外、体内和计算机建模对高通量生物 学读数进行生物信息学分析来研究叠合数据趋势(congruent data trend)。由此产生的矩阵允许其中开发线性和非线性回归分析以达到 确证压力点(conclusive pressure point)(或“枢纽(hub)”)的交叉相关数据挖掘。本文所提出的这些“枢纽”都是药物开发的候选者。特别是, 这些枢纽代表潜在的药物靶标和/或疾病标志物。
差别的分子印记使得能够深入了解规定了导致疾病发作和发展 的组织微环境中的改变的机制。总的来说,上述技术平台与战略性细 胞建模的结合赋予了可被用于进一步建立对疾病的理解而同时建立 可临床强化医疗标准的生物标志物文库和候选药物的确实的情报。
此外,这种方法不仅可用于疾病的诊断或干预,也对生物系统中 的几乎所有病理或非病理状态具有普遍的适用性,如其中两个或更多 个细胞系统相互作用的生物系统。例如,这种方法可以用于获得对与 药物毒性相关联或具有因果关系的机制的深入了解。因此,本发明提 供了可以在广泛情况中普遍适用的用于探询式生物学评估的框架。
本发明的平台的显著特征是,基于AI的系统是基于从细胞模型 系统获得的数据集而不诉诸或考虑本领域中的任何现有知识,如涉及 该生物学过程的已知的生物学关系(即没有数据点是人为的)。因此, 从该平台生成的所得统计模型是无偏的。本发明的平台及其成分(例 如,由其获得的细胞模型系统和数据集)的另一个显著的特点是它允 许随着时间在细胞模型上继续构建(例如,通过引入新的细胞和/或条 件),以使得从生物系统或过程的细胞模型生成的初始的“第一代”一 致因果关系网络(consensus causal network)可以与细胞模型自身的演 变一起进化至多代因果关系网络(及由此获得的增量或增量-增量网 络)。以这种方式,细胞模型、来自细胞模型的数据集及通过使用该 平台技术方法从细胞模型生成的因果关系网络可以在从平台技术获 得的以前的知识上不断演化和构建。
本发明提供用于鉴别生物系统的调节子的方法,所述方法包括:
使用与该生物系统相关的细胞建立该生物系统的模型以代表该 生物系统的特征性方面;
从该模型获得第一数据集,其中该第一数据集代表与生物系统相 关的细胞中的总体蛋白质组学改变;
从该模型获得第二数据集,其中所述第二数据集代表与生物系统 相关的细胞的一种或多种功能活性或细胞反应,其中所述细胞的一种 或多种功能活性或细胞反应包括与该生物系统相关的细胞中的总体 酶学活性和/或总体酶学活性对酶代谢产物或底物的效应;
用编程的计算设备仅基于所述第一和第二数据集生成所述总体 蛋白质组学改变和所述一种或多种功能活性或细胞反应之中的一致 因果关系网络,其中所述一致因果关系网络的生成不是基于所述第一 和第二数据集以外的任何已知的生物学关系;和
从该一致因果关系网络鉴别在所述生物系统中独特的因果关系, 其中与该独特的因果关系相关的至少一种酶被确定为该生物系统的 调节子。
在某些实施方式中,所述第一数据集是单一蛋白质组数据集。在 某些实施方式中,所述第二数据集代表与生物系统相关的细胞的单一 功能活性或细胞反应。在某些实施方式中,所述第一数据集还代表表 征所述与生物系统相关的细胞的脂质组学数据。在某些实施方式中, 所述一致因果关系网络在所述总体蛋白质组学改变、所述脂质组学数 据和所述细胞的一种或多种功能活性或细胞反应之中生成,其中所述 细胞的一种或多种功能活性或细胞反应包括总体酶学活性。
在某些实施方式中,所述第一数据集还代表表征所述与生物系统 相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组 学数据和SNP数据中的一种或多种。在某些实施方式中,所述第一 数据集还代表表征所述与生物系统相关的细胞的脂质组学数据、代谢 组学数据、转录组学数据、基因组学数据和SNP数据中的两种或更 多种。在某些实施方式中,所述一致因果关系网络在所述总体蛋白质 组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因 组学数据和SNP数据中的一种或多种及所述细胞的一种或多种功能 活性或细胞反应之中生成,其中所述细胞的一种或多种功能活性或细 胞反应包括总体酶学活性和/或总体酶学活性对至少一种酶代谢产物 或底物的效应。
在某些实施方式中,所述总体酶学活性包括总体激酶活性。在某 些实施方式中,所述总体酶学活性对酶代谢产物或底物的效应包括所 述细胞的磷酸化蛋白质组。
在某些实施方式中,所述代表细胞的一种或多种功能活性或细胞 反应的第二数据集还包括生物能量学、细胞增殖、细胞凋亡、细胞器 功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选 自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型- 表型相关性中的一种或多种。在某些实施方式中,所述一致因果关系 网络在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、 转录组学数据、基因组学数据和SNP数据中的一种或多种及所述细 胞的一种或多种功能活性或细胞反应之中生成,其中所述细胞的一种 或多种功能活性或细胞反应包括总体酶学活性和/或总体酶学活性对 至少一种酶代谢产物或底物的效应且还包括生物能量学、细胞增殖、 细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降 解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能 模型实现的基因型-表型相关性中的一种或多种。
在本发明的某些实施方式中,生物系统的模型包括与生物系统相 关的细胞的体外培养物。在本发明的某些实施方式中,生物系统的模 型任选地还包含匹配的对照细胞的体外培养物。
在本发明的某些实施方式中,生物系统的模型细胞的体外培养物 经受环境扰动,且匹配的对照细胞的体外培养物是没有经受环境扰动 的相同的细胞。在某些实施方式中,生物系统模型的所述环境扰动包 括与生物活性剂的接触、培养条件的变化、遗传修饰/突变的引入和引 起遗传修饰/突变的媒介的引入中的一种或多种。在某些实施方式中, 生物系统模型的所述环境扰动包括使所述细胞与酶活性抑制剂接触。 在某些实施方式中,生物系统模型中所述酶活性抑制剂是激酶抑制 剂。在某些实施方式中,所述环境扰动包括使所述细胞与CoQ10接 触。在某些实施方式中,所述环境扰动还包括使所述细胞与CoQ10 接触。
在本发明的某些实施方式中,所述生成步骤是由基于人工智能 (AI)的信息学平台完成的。在某些实施方式中,基于AI的信息学 平台接收来自第一和第二数据集的所有数据输入而没有应用统计截 止点。在本发明的某些实施方式中,在鉴别步骤之前,在生成步骤中 建立的一致因果关系网络基于输入的数据通过计算机模拟进一步优 化为模拟因果关系网络,以对一致因果关系网络中的一个或多个因果 关系提供预测的置信水平。
在本发明的某些实施方式中,所述独特因果关系被确定为独特地 存在于与生物系统相关的细胞中且不存在于匹配的对照细胞中的差 异因果关系网络的部分。在某些实施方式中,所述独特因果关系被确 定为独特地存在于与生物系统相关的细胞中且不存在于匹配的对照 细胞中的差异因果关系网络的部分。
在本发明的某些实施方式中,所确定的独特因果关系是选自下组 的至少一对之间的关系:基因的表达和脂质的水平;基因的表达和转 录物的水平;基因的表达和代谢产物的水平;第一基因的表达和第二 基因的表达;基因的表达和SNP的存在;基因的表达和功能活性; 脂质的水平和转录物的水平;脂质的水平和代谢产物的水平;第一脂 质的水平和第二脂质的水平;脂质的水平和SNP的存在;脂质的水 平和功能活性;第一转录物的水平和第二转录物的水平;转录物的水 平和代谢产物的水平;转录物的水平和SNP的存在;第一转录物的 水平和功能活性的水平;第一代谢产物的水平和第二代谢产物的水 平;代谢产物的水平和SNP的存在;代谢产物的水平和功能活性; 第一SNP的存在和第二SNP的存在;及SNP的存在和功能活性。在 某些实施方式中,所确定的独特因果关系是至少脂质的水平、基因的 表达和一种或多种功能活性之间的关系,其中所述功能活性是激酶活 性。
本发明提供用于鉴别疾病过程的调节子的方法,所述方法包括:
使用疾病相关细胞建立疾病过程的模型以代表疾病过程的特征 性方面;
从所述模型获得第一数据集,其中所述第一数据集代表疾病相关 细胞中的总体蛋白质组学改变;
从所述模型获得第二数据集,其中所述第二数据集代表与生物系 统相关的细胞的一种或多种功能活性或细胞反应,其中所述细胞的一 种或多种功能活性或细胞反应包括疾病相关细胞中的总体酶学活性 和/或总体酶学活性对酶代谢产物或底物的效应;
用编程的计算设备仅基于第一和第二数据集生成所述总体蛋白 质组学改变和所述细胞的一种或多种功能活性或细胞反应之中的一 致因果关系网络,其中所述一致因果关系网络的生成不是基于第一和 第二数据集以外的任何已知的生物学关系;和
从该一致因果关系网络鉴别在疾病过程中独特的因果关系,其中 与该独特的因果关系相关的至少一种酶被确定为疾病过程的调节子。
在某些实施方式中,所述第一数据集是单一蛋白质组数据集。在 某些实施方式中,所述第二数据集代表与生物系统相关的细胞的单一 功能活性或细胞反应。在某些实施方式中,所述第一数据集还代表表 征与所述生物系统相关的细胞的脂质组学数据。在某些实施方式中, 所述一致因果关系网络在总体蛋白质组学改变、脂质组学数据和所述 细胞的一种或多种功能活性或细胞反应之中生成,其中所述细胞的一 种或多种功能活性或细胞反应包括总体酶学活性。在某些实施方式 中,所述第一数据集还代表表征所述与生物系统相关的细胞的脂质组 学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种。在某些实施方式中,所述第一数据集还代表表征所 述与生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学 数据、基因组学数据和SNP数据中的两种或更多种。在某些实施方 式中,所述一致因果关系网络在所述总体蛋白质组学改变、所述脂质 组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数 据中的一种或多种及所述细胞的一种或多种功能活性或细胞反应之 中生成,其中所述细胞的一种或多种功能活性或细胞反应包括总体酶 学活性和/或总体酶学活性对至少一种酶代谢产物或底物的效应。
在本发明的某些实施方式中,所述总体酶学活性包括总体激酶活 性,且其中所述总体酶学活性对酶代谢产物或底物的效应包括所述细 胞的磷酸化蛋白质组。在某些实施方式中,所述代表细胞的一种或多 种功能活性或细胞反应的第二数据集还包括生物能量学、细胞增殖、 细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降 解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能 模型实现的基因型-表型相关性中的一种或多种。在某些实施方式中, 所述一致因果关系网络在所述总体蛋白质组学改变、所述脂质组学数 据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的 一种或多种及所述细胞的一种或多种功能活性或细胞反应之中生成, 其中所述细胞的一种或多种功能活性或细胞反应包括生物能量学、细 胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞 外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分 析的功能模型实现的基因型-表型相关性中的一种或多种。
在某些实施方式中,所述疾病过程是癌症、糖尿病、肥胖症、心 血管疾病、年龄相关性黄斑变性、糖尿病性视网膜病或炎性疾病。在 某些实施方式中,所述疾病过程包括血管生成。在某些实施方式中, 所述疾病过程包括肝细胞癌、肺癌、乳腺癌、前列腺癌、黑色素瘤、 癌瘤、肉瘤、淋巴瘤、白血病、鳞状细胞癌、结肠直肠癌、胰腺癌、 甲状腺癌、子宫内膜癌、膀胱癌、肾癌、实体瘤、白血病、非霍奇金 淋巴瘤或耐药性癌症。
在本发明的某些实施方式中,所述疾病模型包含疾病细胞的体外 培养物,任选地进一步包含匹配的对照或正常细胞的体外培养物。在 某些实施方式中,疾病细胞的体外培养物经受环境扰动,且匹配的对 照细胞的体外培养物是未经受环境扰动的相同的疾病细胞。在某些实 施方式中,所述环境扰动包括与生物活性剂的接触、培养条件的变化、 遗传修饰/突变的引入和引起遗传修饰/突变的媒介的引入中的一种或 多种。在某些实施方式中,所述环境扰动包括使所述细胞与酶活性抑 制剂接触。在某些实施方式中,所述酶活性抑制剂是激酶抑制剂。在 某些实施方式中,所述环境扰动进一步包括使所述细胞与CoQ10接 触。在某些实施方式中,所述环境扰动包括使所述细胞与CoQ10接 触。
在某些实施方式中,所述的疾病过程的特征性方面包括缺氧状 态、高血糖状态、富乳酸培养条件或它们的组合。在某些实施方式中, 所述生成步骤通过基于人工智能(AI)的信息学平台完成。在某些实 施方式中,所述基于AI的信息学平台接受来自所述第一和第二数据 集的所有数据输入而不应用统计截止点。
在某些实施方式中,在所述鉴别步骤之前,在所述生成步骤中建 立的所述一致因果关系网络基于输入数据通过计算机模拟进一步优 化到模拟因果关系网络,以对于一致因果关系网络内的一个或多个因 果关系提供预测的置信水平。在某些实施方式中,所述独特因果关系 被确定为独特地存在于疾病细胞的模型中且不存在于匹配的对照细 胞中的差异因果关系网络的部分。在某些实施方式中,所述独特因果 关系被确定为独特地存在于所述经受环境扰动的细胞中且不存在于 匹配的对照细胞中的差异因果关系网络的部分。
本发明提供了用于鉴别生物系统的调节子的方法,所述方法包 括:
使用与该生物系统相关的细胞建立该生物系统的模型来代表该 生物系统的特征性方面;
从所述模型获得第一数据集,其中所述第一数据集代表所述细胞 的总体蛋白质组学改变及表征与该生物系统相关的细胞的脂质组学 数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中 的一种或多种;
从所述模型获得第二数据集,其中所述第二数据集代表与该生物 系统相关的细胞的一种或多种功能活性或细胞反应,其中所述细胞的 一种或多种功能活性或细胞反应包括与该生物系统相关的细胞中的 总体激酶活性和/或总体激酶活性对激酶代谢产物或底物的效应;
使用编程的计算设备,仅仅基于所述第一和第二数据集生成所述 总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学 数据、基因组学数据和SNP数据中的一种或多种及所述一种或多种 功能活性或细胞反应之中的一致因果关系网络,其中所述一致因果关 系网络的生成不基于所述第一和第二数据集以外的任何已知的生物 学关系;和
从该一致因果关系网络鉴别在所述生物系统中独特的因果关系, 其中与该独特的因果关系相关的至少一种激酶被确定为该生物系统 的调节子。
本发明提供了用于治疗哺乳动物受试者的疾病、改善其症状、抑 制其进展、预防、诊断或预后该疾病的方法,所述方法包括:
向需要的哺乳动物施用治疗有效量的包含生物活性物质的药物 组合物,所述生物活性物质影响通过本文提供的任何方法所鉴别的调 节子,从而治疗所述疾病、改善其症状、抑制其进展、预防、诊断或 预后所述疾病。
本发明提供了用于诊断或预后哺乳动物受试者的疾病的方法,所 述方法包括:
测定从所述受试者获得的生物样品中通过本文中提供的任何方 法鉴别的一种或多种调节子的表达或活性水平;和
将所述受试者中的水平与对照样品中所述一种或多种调节子的 表达或活性水平比较,
其中所述受试者中的水平和所述对照样品中一种或多种调节子 的表达或活性水平之间的差异是所述受试者患有疾病、易于发生疾病 或有利地对疾病治疗发生反应的指示,从而诊断或预后所述哺乳动物 受试者的疾病。
本发明提供了鉴别用于治疗哺乳动物受试者的疾病、改善其症 状、抑制其进展或预防该疾病的治疗化合物的方法,所述方法包括:
使来自所述哺乳动物受试者的生物样品与测试化合物接触;
测定所述生物样品中通过本文中提供的任何方法鉴别的一种或 多种调节子的表达水平;
将所述生物样品中一种或多种调节子的表达水平与未与测试化 合物接触的对照样品比较;和
选择调节所述生物样品中一种或多种调节子的表达水平的测试 化合物,
从而鉴别用于治疗哺乳动物受试者的疾病、改善其症状、抑制其 进展或预防该疾病的治疗化合物。
本发明提供了用于治疗哺乳动物受试者的疾病、改善其症状、抑 制其进展或预防所述疾病的方法,所述方法包括:
向需要的哺乳动物施用治疗有效量的包含使用本文中提供的任 何方法鉴别的治疗化合物的药物组合物,从而治疗所述疾病、改善其 症状、抑制其进展或预防所述疾病。
本发明提供了用于治疗哺乳动物受试者的疾病、改善其症状、抑 制其进展或预防所述疾病的方法,所述方法包括:
向需要的哺乳动物施用治疗有效量的包含生物活性物质的药物 组合物,所述生物活性物质影响TCOF1、TOP2A、CAMK2A、CDK1、 CLTCL1、EIF4G1、ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、 HMGB2、HNRNPK、HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、 MAPK1、MARCKS、NME1、NME2、PGK1、PGK2、RAB7A、RPL17、RPL28、RPS5、RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21 中任何一种或多种的表达或活性,
从而治疗所述疾病、改善其症状、抑制其进展或预防所述疾病。 在某些实施方式中,所述疾病是肝细胞癌。
本发明提供了用于诊断或预后哺乳动物受试者的疾病的方法,所 述方法包括:
测定从所述受试者获得的生物样品中TCOF1、TOP2A、CAMK2A、 CDK1、CLTCL1、EIF4G1、ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、 HMGB2、HNRNPK、HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、 MAPK1、MARCKS、NME1、NME2、PGK1、PGK2、RAB7A、RPL17、 RPL28、RPS5、RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21 中的任何一种或多种蛋白质的表达或活性水平;和
将所述受试者中的水平与对照样品中所述一种或多种蛋白质的 表达或活性水平比较,
其中所述受试者中的水平和所述对照样品中一种或多种蛋白质 的表达或活性水平之间的差异是所述受试者患有疾病或易于发生疾 病或有利地对疾病治疗发生反应的指示,从而诊断或预后所述哺乳动 物受试者的疾病。在某些实施方式中,所述疾病是肝细胞癌。
本发明提供了鉴别用于治疗哺乳动物受试者的疾病、改善其症 状、抑制其进展或预防该疾病的治疗化合物的方法,所述方法包括:
使来自所述哺乳动物受试者的生物样品与测试化合物接触;
测定所述生物样品中TCOF1、TOP2A、CAMK2A、CDK1、 CLTCL1、EIF4G1、ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、 HMGB2、HNRNPK、HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、 MAPK1、MARCKS、NME1、NME2、PGK1、PGK2、RAB7A、RPL17、 RPL28、RPS5、RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21 中任何一种或多种蛋白质的表达水平;
将所述生物样品中一种或多种蛋白质的表达水平与未与测试化 合物接触的对照样品比较;和
选择调节所述生物样品中一种或多种蛋白质的表达水平的测试 化合物,
从而鉴别用于治疗哺乳动物受试者的疾病、改善其症状、抑制其 进展或预防该疾病的治疗化合物。在某些实施方式中,所述疾病是肝 细胞癌。
本发明提供了用于治疗哺乳动物受试者的疾病、改善其症状、抑 制其进展或预防所述疾病的方法,所述方法包括:
向需要的哺乳动物施用治疗有效量的包含本文中提供的任何方 法鉴别的治疗化合物的药物组合物,从而治疗所述疾病、改善其症状、 抑制其进展或预防所述疾病。
本发明提供了用于鉴别血管生成的调节子的方法,所述方法包 括:
(1)使用与血管生成相关的细胞建立血管生成的模型来代表血 管生成的特征性方面;
(2)从所述血管生成的模型获得第一数据集,其中所述第一数 据集代表表征所述与血管生成相关的细胞的基因组学数据、脂质组学 数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多 态性(SNP)数据中的一种或多种;
(3)从所述血管生成的模型获得第二数据集,其中所述第二数 据集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应;
(4)使用编程的计算设备,仅仅基于所述第一数据集和第二数 据集生成所述表征与血管生成相关的细胞的基因组学数据、脂质组学 数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多 态性(SNP)数据中的一种或多种及所述与血管生成相关的细胞的一种 或多种功能活性或细胞反应之中的一致因果关系网络,其中所述一致 因果关系网络的生成不基于所述第一数据集和第二数据集以外的任 何已知的生物学关系;
(5)从该一致因果关系网络鉴别在血管生成中独特的因果关系, 其中与该独特的因果关系相关的基因、脂质、蛋白质、代谢产物、转 录物或SNP被确定为血管生成的调节子。
本发明提供了用于鉴别血管生成的调节子的方法,所述方法包 括:
(1)使用与血管生成相关的细胞建立血管生成的模型来代表血 管生成的特征性方面;
(2)从所述血管生成的模型获得第一数据集,其中所述第一数 据集代表脂质组学数据;
(3)从所述血管生成的模型获得第二数据集,其中所述第二数 据集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应;
(4)使用编程的计算设备,仅仅基于所述第一数据集和第二数 据集生成所述脂质组学数据及所述功能活性或细胞反应之中的一致 因果关系网络,其中所述一致因果关系网络的生成不基于所述第一数 据集和第二数据集以外的任何已知的生物学关系;
(5)从该一致因果关系网络鉴别在血管生成中独特的因果关系, 其中与该独特的因果关系相关的脂质被确定为血管生成的调节子。
在某些实施方式中,所述代表与血管生成相关的细胞的一种或多 种功能活性或细胞反应的第二数据集包括所述与血管生成相关的细 胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应。
本发明提供了用于鉴别血管生成的调节子的方法,所述方法包 括:
(1)使用与血管生成相关的细胞建立血管生成的模型来代表血 管生成的特征性方面;
(2)从所述血管生成的模型获得第一数据集,其中所述第一数 据集代表表征所述与血管生成相关的细胞的基因组学数据、脂质组学 数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多 态性(SNP)数据中的一种或多种;
(3)从所述血管生成的模型获得第二数据集,其中所述第二数 据集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应 激酶活性,其中所述一种或多种功能活性或细胞反应包括所述与血管 生成相关的细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物 或底物的效应;
(4)使用编程的计算设备,仅仅基于所述第一数据集和第二数 据集生成所述表征与血管生成相关的细胞的基因组学数据、脂质组学 数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多 态性(SNP)数据中的一种或多种及所述与血管生成相关的细胞的一种 或多种功能活性或细胞反应之中的一致因果关系网络,其中所述一致 因果关系网络的生成不基于所述第一数据集和第二数据集以外的任 何已知的生物学关系;
(5)从该一致因果关系网络鉴别在血管生成中独特的因果关系, 其中与该独特的因果关系相关的酶被确定为血管生成的调节子。
在本发明的某些实施方式中,所述总体酶学活性包括总体激酶活 性且所述与血管生成相关的细胞中总体酶学活性对酶代谢产物或底 物的效应包括所述细胞的磷酸化蛋白质组。在某些实施方式中,所述 总体酶学活性包括总体蛋白酶活性。
在本发明的某些实施方式中,所述调节子刺激或促进血管生成。 在本发明的某些实施方式中,所述调节子抑制血管生成。
在某些实施方式中,所述包含与血管生成相关的细胞的血管生成 模型选自体外细胞培养血管生成模型、大鼠主动脉微血管模型、新生 小鼠视网膜模型、鸡胚绒毛尿囊膜(CAM)模型、角膜血管生成生长因 子囊袋模型、皮下海绵血管生成生长因子植入模型、血 管生成生长因子植入模型和肿瘤植入模型;且其中所述血管生成模型 任选地进一步包括包含对照细胞的匹配对照血管生成模型。在某些实 施方式中,所述体外培养血管生成模型选自管形成分 析、迁移分析、伯伊登室分析、划痕分析。
在某些实施方式中,所述体外培养血管生成模型中与血管生成相 关的细胞是人血管内皮细胞(HUVEC)。在某些实施方式中,所述角膜 血管生成生长因子囊袋模型、皮下海绵血管生成生长因子植入模型或 血管生成生长因子植入模型中的血管生成生长因子选 自FGF-2和VEGF。
在本发明的某些实施方式中,所述血管生成模型中的细胞经受环 境扰动,且所述匹配的血管生成模型中的细胞是没有经受环境扰动的 相同细胞。在某些实施方式中,所述环境扰动包括与试剂的接触、培 养条件的变化、引入的遗传修饰或突变、引起遗传修饰或突变的媒介 和局部缺血的诱导中的一种或多种。
在某些实施方式中,所述试剂是促血管生成剂或抗血管生成剂。 在某些实施方式中,所述促血管生成剂选自FGF-2和VEGF。在某些 实施方式中,所述抗血管生成剂选自VEGF抑制剂、整联蛋白拮抗剂、 血管抑素、内皮抑素、肿瘤抑素、阿瓦斯汀、索拉非尼、舒尼替尼、帕唑帕尼和依维莫司、可溶性VEGF受体、血管生成素2、血小板反 应蛋白1、血小板反应蛋白2、血管形成抑制素、钙网织蛋白、凝血 酶原(kringle结构域-2)、抗凝血酶III片段、血管内皮生长抑制剂 (VEGI)、富含半胱氨酸的酸性分泌蛋白(SPARC)和对应于蛋白质的卵 泡抑素结构域的SPARC肽(FS-E)及辅酶Q10。
在任何实施方式中,所述试剂是酶活性抑制剂。在任何实施方式 中,所述试剂是激酶活性抑制剂。
在本发明的任何实施方式中,所述第一数据集包括基因组数据集 中多个基因的蛋白质和/或mRNA表达水平。在本发明的某些实施方 式中,所述第一数据集包括基因组学数据、脂质组学数据、蛋白质组 学数据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据 中的两种或更多种。在本发明的某些实施方式中,所述第一数据集包 括基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、 转录组学数据和单核苷酸多态性(SNP)数据中的三种或更多种。
在本发明的任何实施方式中,所述代表与血管生成相关的细胞的 一种或多种功能活性或细胞反应的第二数据集包括生物能量学、细胞 增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、酶活性、趋化性、 细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse 分析的功能模型实现的基因型-表型相关性中的一种或多种。
在本发明的任何实施方式中,所述第一数据集可以是单一数据集 如基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、 转录组学数据和单核苷酸多态性(SNP)数据之一。在任何实施方式 中,所述第一数据集可以是两个数据集。在任何实施方式中,所述第 一数据集是三个数据集。在任何实施方式中,所述第一数据集可以是 四个数据集。在任何实施方式中,所述第一数据集可以是五个数据集。 在任何实施方式中,所述第一数据集可以是六个数据集。
在本发明的任何实施方式中,所述第二数据集是单一数据集如与 血管生成相关的细胞的一种或多种功能活性或细胞反应之一,包括生 物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、 酶活性、趋化性、细胞外基质降解、出芽及通过选自ATP、ROS、OXPHOS和Seahorse分析数据的功能模型实现的基因型-表型相关性 中的一种或多种。在任何实施方式中,所述第二数据集可以是两个数 据集。在任何实施方式中,所述第二数据集可以是三个数据集。在某 些实施方式中,所述第二数据集可以是四个数据集。在任何实施方式 中,所述第二数据集可以是五个数据集。在任何实施方式中,所述第 二数据集可以是六个数据集。在任何实施方式中,所述第二数据集可 以是七个数据集。在任何实施方式中,所述第二数据集可以是八个数 据集。在任何实施方式中,所述第二数据集可以是九个数据集。在某 些实施方式中,所述第二数据集可以是十个数据集。
在本发明的任何实施方式中,所述酶活性可以是激酶活性。在本 发明的任何实施方式中,所述酶活性可以是蛋白酶活性。
在本发明的某些实施方式中,步骤(4)是由基于人工智能(AI) 的信息学平台完成的。在某些实施方式中,所述基于AI的信息学平 台包括REFS(TM)。在某些实施方式中,所述基于AI的信息平台 接收来自第一数据集和第二数据集的所有数据输入而没有应用统计截止点。在某些实施方式中,在第(5)步之前,在步骤(4)中建立 的一致因果关系网络基于输入的数据通过计算机模拟进一步优化到 模拟因果关系网络,以对一致因果关系网络中的一个或多个因果关系 提供预测的置信水平。
在本发明的某些实施方式中,所述独特因果关系被确定为独特地 存在于细胞中且不存在于匹配的对照细胞中的差异因果关系网络的 部分。
在本发明中,所确定的独特因果关系是选自下组的至少一对之间 的关系:基因的表达和脂质的水平;基因的表达和转录物的水平;基 因的表达和代谢产物的水平;第一基因的表达和第二基因的表达;基 因的表达和SNP的存在;基因的表达和功能活性;脂质的水平和转 录物的水平;脂质的水平和代谢产物的水平;第一脂质的水平和第二 脂质的水平;脂质的水平和SNP的存在;脂质的水平和功能活性; 第一转录物的水平和第二转录物的水平;转录物的水平和代谢产物的 水平;转录物的水平和SNP的存在;第一转录物的水平和功能活性 的水平;第一代谢产物的水平和第二代谢产物的水平;代谢产物的水 平和SNP的存在;代谢产物的水平和功能活性;第一SNP的存在和 第二SNP的存在;及SNP的存在和功能活性。
在某些实施方式中,所述功能活性选自生物能量学、细胞增殖、 细胞凋亡、细胞器功能、细胞迁移、管形成、酶活性、趋化性、细胞 外基质降解、和出芽及通过选自ATP、ROS、OXPHOS和Seahorse 分析的功能模型实现的基因型-表型相关性。在某些实施方式中,所 述功能活性是激酶活性。在某些实施方式中,所述功能活性是蛋白酶 活性。
在本发明的某些实施方式中,所述确定的独特因果关系是至少脂 质的水平、基因的表达和一种或多种功能活性之间的关系,其中所述 功能活性是激酶活性。
在本发明中,该方法还可以包括验证在血管生成中所鉴别的独特 因果关系。
本发明提供了用于提供在平台方法中使用的血管生成模型的方 法,包括:
使用与血管生成相关的细胞建立血管生成的模型来代表血管生 成的特征性方面,其中所述血管生成的模型可用于生成在平台方法中 使用的数据集;
从而提供在平台方法中使用的血管生成的模型。
本发明提供了用于从在平台方法中使用的血管生成模型获得第 一数据集和第二数据集的方法,包括:
(1)从在平台方法中使用的血管生成模型获得第一数据集,其 中所述血管生成模型包含与血管生成相关的细胞,和其中所述第一数 据集代表表征与血管生成相关的细胞的基因组学数据、脂质组学数 据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态 性(SNP)数据中的一种或多种;
(2)从在平台方法中使用血管生成模型获得第二数据集,其中 所述第二数据集代表与血管生成相关的细胞的一种或多种功能活性 或细胞反应;
由此从在平台方法中使用的血管生成模型获得第一数据集和第 二数据集。
本发明提供了用于鉴别血管生成的调节子的方法,所述方法包 括:
(1)用编程的计算设备生成在从血管生成模型获得的第一数据 集和第二数据集之中的一致因果关系网络,其中所述模型包含与血管 生成相关的细胞,且其中所述第一数据集代表表征与血管生成相关的 细胞的基因组学数据、脂质组学数据、蛋白质组学数据、代谢组学数 据、转录组学数据和单核苷酸多态性(SNP)数据中的一种或多种;和 第二数据集代表与血管生成相关的细胞的一种或多种功能活性或细 胞反应,其中所述一致因果关系网络的生成不是基于第一数据集和第 二数据集以外的任何已知的生物学关系;
(2)从一致因果关系网络鉴别血管生成中独特的因果关系,其 中与独特的因果关系相关的基因、脂质、蛋白质、代谢产物、转录物 或SNP的至少一种被确定为血管生成的调节子;
从而鉴别血管生成的调节子。
本发明提供了用于鉴别血管生成的调节子的方法,所述方法包 括:
(1)提供从血管生成模型生成的一致因果关系网络;
(2)从该一致因果关系网络鉴别在血管生成中独特的因果关系, 其中与独特的因果关系相关的基因、脂质、蛋白质、代谢产物、转录 物或SNP的至少一种被确定为血管生成的调节子;
从而鉴别血管生成的调节子。
在某些实施方式中,一致因果关系网络是用编程的计算设备在从 血管生成模型获得的第一数据集和第二数据集之中生成的,其中所述 模型包含与血管生成相关的细胞,和其中所述第一数据集代表表征与 血管生成相关的细胞的基因组学数据、脂质组学数据、蛋白质组学数 据、代谢组学数据、转录组学数据和单核苷酸多态性(SNP)数据中的 一种或多种;和
第二数据集代表与血管生成相关的细胞的一种或多种功能活性 或细胞反应,其中所述一致因果关系网络的生成不是基于第一数据集 和第二数据集以外的任何已知的生物学关系。
在某些实施方式中,血管生成模型选自体外细胞培养血管生成模 型、大鼠主动脉微血管模型、新生小鼠视网膜模型、鸡胚绒毛尿囊膜 (CAM)模型、角膜血管生成生长因子囊袋模型、皮下海绵血管生成生 长因子植入模型、血管生成生长因子植入模型和肿瘤植 入模型;且其中所述血管生成模型任选地进一步包括包含对照细胞的 匹配对照血管生成模型。
在某些实施方式中,第一数据集包括脂质组学数据。在某些实施 方式中,第一数据集仅包括脂质组学数据。
在某些实施方式中,第二数据集代表与血管生成相关的细胞的一 种或多种功能活性或细胞反应,包括与血管生成相关的细胞中的总体 酶学活性和总体酶学活性对酶代谢产物或底物的效应。
在某些实施方式中,第二数据集包括激酶活性或蛋白酶活性。在 某些实施方式中,第二数据集仅包括激酶活性或蛋白酶活性。
在某些实施方式中,第二数据集代表与血管生成相关的细胞的一 种或多种功能活性或细胞反应,包括生物能量学谱、细胞增殖、细胞 凋亡、细胞器功能、细胞迁移、管形成、激酶活性和蛋白酶活性,及 通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的 基因型-表型相关性中的一种或多种。
在本发明的某些实施方式中,血管生成与疾病状态相关。
本发明提供用于调节哺乳动物受试者的血管生成的方法,所述方 法包括:
向需要的哺乳动物施用治疗有效量的包含生物活性物质的药物 组合物,所述生物活性物质影响通过本文中提供的任一方法鉴别的调 节子,从而调节血管生成。
本发明提供检测哺乳动物受试者中调节的血管生成的方法,所述 方法包括:
测定从所述受试者获得的生物样品中通过本文中提供的任一方 法鉴别的一种或多种调节子的水平、活性或存在;和
比较所述受试者中的水平、活性或存在与对照样品中所述一种或 多种调节子的水平、活性或存在,
其中所述受试者中的水平、活性或存在与所述对照样品中所述一 种或多种调节子的水平、活性或存在之间的差异是所述哺乳动物受试 者中血管生成受到调节的指示。
本发明提供鉴别用于调节哺乳动物受试者中的血管生成的治疗 化合物的方法,所述方法包括:
使来自哺乳动物受试者的生物样品与测试化合物接触;
测定所述生物样品中通过本文中提供的任一方法鉴别的一种或 多种调节子的表达水平;
将所述生物样品的一种或多种调节子的水平、活性或存在与未接 触所述测试化合物的对照样品比较,和
选择调节所述生物样品中一种或多种调节子的水平、活性或存在 的测试化合物,
从而鉴别用于调节哺乳动物受试者中的血管生成的治疗化合物。
本发明提供用于调节哺乳动物受试者中的血管生成的方法,所述 方法包括:
向需要的哺乳动物施用治疗有效量的包含通过本文中提供的任 何方法鉴别的治疗化合物的药物组合物,从而治疗所述疾病、改善其 症状、抑制其进展或预防、诊断或预后所述疾病。
在某些实施方式中,“环境扰动”,本文也称为“外部刺激成分”, 是治疗剂。在某些实施方式中,外部刺激成分是小分子(例如,不超 过5kDa、4kDa、3kDa、2kDa、1kDa、500道尔顿或250道尔顿的 小分子)。在某些实施方式中,外部刺激成分是生物剂。在某些实施 方式中,外部刺激成分是化学剂。在某些实施方式中,外部刺激成分 对于细胞是内源性的或外源性的。在某些实施方式中,外部刺激成分 是MIM或表观代谢转变剂(epishifter)。在某些实施方式中,外部 刺激成分是细胞系统的应激因素,如缺氧、高血糖症、高脂血症、高 胰岛素血症和/或富乳酸状态。
在某些实施方式中,外部刺激成分可包括用于治疗疾病状态的治 疗剂或候选治疗剂,包括化疗剂、蛋白质基的生物药物、抗体、融合 蛋白质、小分子药物、脂质、多糖、核酸等等。
在某些实施方式中,外部刺激成分可以是一个或多个应激因素, 如那些通常在各种疾病状态下在体内遇到的,包括缺氧、高血糖状态、 酸性环境(可通过乳酸处理模拟)等。
在其它实施方式中,外部刺激成分可以包括一种或多种MIM和/ 或表观代谢转变剂,如本文下面所定义的。示例性的MIM包括辅酶 Q10(本文也称为CoQ10)和维生素B族中的化合物,或者包含维生 素B族中的化合物的核苷、单核苷酸或二核苷酸。在某些实施方式中, 外部刺激不是CoQ10。在某些实施方式中,外部刺激不是维生素B 或维生素B族中的化合物。
在进行细胞输出测量(如蛋白质表达、脂质水平)中,可以使用 绝对量(例如,表达或总量)或相对水平(例如,相对表达水平或量)。 在一个实施方式中,使用绝对量(例如,表达或总量)。在一个实施 方式中,使用相对水平或量(例如,相对表达水平)。例如,为了确定细胞系统的蛋白质的相对表达水平,可以将细胞系统中(对细胞系 统有或没有外部刺激)任何给定的蛋白质的量与合适的对照细胞系或 细胞系的混合物(如在同一实验中使用的所有细胞)相比较,并给出 倍数增加或倍数减少值。本领域技术人员将会理解,可以在任何细胞 输出测量(如基因和/或RNA的转录水平、脂质水平或者任何功能输 出,例如,如本文所述的细胞凋亡水平、毒性水平或ECAR或OCR) 中使用绝对量或相对量。预先确定的倍数增加(例如,至少1.2、1.3、 1.4、1.5、1.6、1.7、1.8、1.9、2、2.5、3、3.5、4、4.5、5、6、7、8、 9、10、15、20、25、30、35、40、45、50、75或100或者更多倍的 增加)或倍数减少(例如,至少减少至0.9、0.8、0.75、0.7、0.6、0.5、 0.45、0.4、0.35、0.3、0.25、0.2、0.15、0.1或0.05倍、或者减少到 90%、80%、75%、70%、65%、60%、55%、50%、45%、40%、 35%、30%、25%、20%、15%、10%或5%或更少)的阈值水平可 以被用于选择显著差异,和然后该显著差异的细胞输出数据可包括在 用于本发明的平台技术方法中的数据集(例如,第一和第二数据集) 中。存在于前述列表中的所有的值也可以是范围的上限或下限,例如, 在1.5至5倍、5至10倍、2至5倍之间、或0.9至0.7、0.9至0.5、 0.7至0.3倍之间的范围意图为本发明的部分。
在整个本申请中,显示在列表中的所有值,例如,如上述的那些, 也可以是确定为本发明中的一部分的范围的上限或下限。
在本发明的方法的一个实施方式中,不是因果关系网络中观察到 的每一个因果关系都有生物学意义。对于所述探询生物评价被应用的 任何给定的生物系统,一些(或者也许全部)的因果关系(以及与其 相关的基因)相对于特定的所讨论的生物问题是“确定性的”,例如导 致引起疾病状态(治疗性干预的潜在靶标)或疾病状态的生物标志物 (潜在的诊断或预后的因素)。在一个实施方式中,观察的在生物系 统中独特的因果关系对于所讨论的特定生物问题是确定性的。在一个 实施方式中,并非每一个在生物系统中观察到的独特的因果关系对于 所讨论的特定生物问题是确定性的。
可以由所述方法的最终用户来选择这样的确定性的因果关系,或 者可以由生物信息学软件程序来选择,如REFS、DAVID实现的比较 途径分析程序或者KEGG途径分析程序。在某些实施方式中,使用一 个以上的生物信息学软件程序,和来自两个或更多生物信息学软件程 序的一致结果是优选的。
如本文所用的细胞输出的“差异”包括任何一个或多个细胞输出参 数中的差异(例如,增加或减少的水平)。在某些实施方式中,差异 各自独立地选自于mRNA转录、蛋白质表达、蛋白质活性、代谢物/ 中间体水平和/或配体-靶相互作用中的差别。例如,就蛋白质表达水 平而言,可以通过使用本领域公认的技术,如以质谱分析为基础的检 测(例如,iTRAQ、2D-LC-MSMS等)测量和定量两个细胞输出之间 的差异,例如在外部刺激成分处理之前和之后与细胞系统相关的输 出。
在一个方面,生物系统的细胞模型包含细胞交互系统,其中具有 含外部刺激成分的第一细胞环境的第一细胞系统产生第一改变的细 胞环境,以使得通过将具有第二细胞环境的第二细胞系统暴露于第一 改变的细胞环境而建立交互细胞系统。
在一个实施方式中,产生至少一个与交互细胞系统的显著细胞交 互差异,和鉴别至少一个确定性的细胞交互差异以使得进行探询式生 物学评估。在某些实施方式中,所述至少一个显著的细胞交互差异是 多个差异。
在某些实施方式中,所述至少一个确定性的细胞交互差异是由最 终用户选择的。或者,在另一个实施方式中,所述至少一个确定性的 细胞交互差异是基于定量蛋白质组学数据通过生物信息学软件程序 (如,例如,REFS、KEGG途径分析或DAVID实现的比较途径分析) 而选择的。
在某些实施方式中,所述方法进一步包括产生用于第一细胞系统 的显著细胞输出差异。
在某些实施方式中,差异各自独立地选自于mRNA转录、蛋白质 表达、蛋白质活性、代谢物/中间体水平和/或配体-靶相互作用的差异。
在某些实施方式中,所述第一细胞系统和第二细胞系统独立地选 自于原代细胞的同质群体、癌细胞系或正常细胞系。
在某些实施方式中,第一改变的细胞环境包含由第一细胞系统分 泌到第一细胞环境中的因子,其作为第一细胞系统与外部刺激成分接 触的结果。该因子可以包含分泌的蛋白质或其他的信号分子。在某些 实施方式中,该第一改变的细胞环境基本上没有原来的外部刺激成 分。
在某些实施方式中,交互细胞系统包含具有插入隔室和由膜分隔 的杯状隔室的侵袭实验装置(transwell)。例如,第一细胞系统可在 插入隔室(或杯状隔室)中生长,和所述第二细胞系统可在杯状隔室 (或插入隔室)中生长。
在某些实施方式中,交互细胞系统包含用于第一细胞系统生长的 第一培养物和用于第二细胞系统生长的第二培养物。在这种情况下, 第一改变的细胞环境可以是来自第一细胞系统的条件培养基。
在某些实施方式中,所述第一细胞环境和第二细胞环境可以相 同。在某些实施方式中,所述第一细胞环境和第二细胞环境可以不同。
在某些实施方式中,交互细胞系统包含所述第一细胞系统和第二 细胞系统的共培养。
本发明的方法可用于或应用于多种“探询式生物学评估”。本发明 的方法应用于探询式生物学评估以使其能够鉴别生物系统的一个或 多个调节子或者生物系统或过程的确定性的细胞过程“驱动子”。
本发明的方法可用于进行广泛的探询式生物学评估。在某些实施 方式中,探询式生物学评估是疾病状态的诊断。在某些实施方式中, 探询式生物学评估是确定药物疗效。在某些实施方式中,探询式生物 学评估是药物毒性测定。在某些实施方式中,探询式生物学评估是疾 病状态的分期。在某些实施方式中,探询式生物学评估鉴别抗衰老化 妆品的靶标。
如本文所用的“探询式生物学评估”可包括鉴别生物系统中的一个 或多个调节子,例如,确定性的细胞过程“驱动子”(例如,生物途径, 或途径的关键成员,或途径成员的主要调节子的活性的增加或减少), 其与环境扰动或外部刺激成分或者生物系统或过程中独有的独特因 果关系相关。它可以进一步包括涉及额外的步骤来测试或验证确定的 确定性细胞过程驱动子是否需要和/或足够用于与环境扰动外部刺激 成分相关联的下游事件,包括体内动物模型和/或体外组织培养实验。
在某些实施方式中,探询式生物学评估是疾病状态的诊断或分 期,其中所鉴别的生物系统的调节子,例如,细胞过程的确定性驱动 子(例如,交互差异或生物系统或过程中的独特因果关系)代表疾病 标志物或可以进行治疗干预的治疗靶标。所述探询式生物学评估在理 论上适合任何病情,但可能会发现在某些领域特别有用,如肿瘤/癌症 生物学、糖尿病、肥胖症、心血管疾病和神经系统疾病(尤其是神经 退行性疾病,例如,不限于,阿尔茨海默氏病、帕金森氏病、亨廷顿 氏病、肌萎缩性脊髓侧索硬化症(ALS)和衰老相关的神经退行性疾 病)及与血管生成相关的病症。
在某些实施方式中,探询式生物学评估是药物疗效的确定,其中 所鉴别的生物系统的调节子,例如,确定性的细胞过程驱动子(例如, 交互差异或者生物系统或过程中独特的因果关系)可以是成功药物的 标志,并可随之用于鉴别另外的用于治疗相同疾病状况的试剂,如 MIM或表观代谢转变剂。
在某些实施方式中,探询式生物学评估是鉴别用于预防或治疗感 染的药物靶标,其中所鉴别的确定性细胞过程驱动子(例如,细胞交 互差异或者生物系统或过程中独特的因果关系)可以是标志物/指标或 导致感染状态的关键生物分子,并可以随之被用来鉴别抗感染剂。
在某些实施方式中,探询式生物学评估是试剂(例如药物)对给 定的疾病谱的分子效应的评估,其中所鉴别的生物系统的调节子,例 如,确定性的细胞过程驱动子(例如,细胞交互差异或者生物系统或 过程中独特的因果关系)可以是一个或多个生物途径、途径的主要成 员或途径成员的主要调节子的活性的增加或减少,且可随之被用于, 例如,预测该试剂对于给定疾病的疗效。
在某些实施方式中,探询式生物学评估是试剂(例如药物)对于 细胞、组织、器官或有机体的毒理学特性的评估,其中所鉴别的生物 系统调节子,例如,确定性的细胞过程驱动子(例如,细胞交互差异 或者生物系统或过程中独特的因果关系)可以是毒性(例如,细胞毒 性)的指示剂,且因而可以用来预测或确定试剂的毒理学特性。在一 个实施方式中,鉴别的生物系统调节子,例如,确定性的细胞过程驱 动子(例如,细胞交互差异或者生物系统或过程中独特的因果关系) 是药物或药物候选物的心脏毒性的指示剂,并可随之用来预测或确定 药物或药物候选物的心脏毒性特性。
在某些实施方式中,探询式生物学评估是鉴别用于预防或治疗由 生物武器(如导致疾病的原生动物、真菌、细菌、病菌(protests)、病 毒或毒素)引起的疾病或病症的药物靶标,其中所鉴别的生物系统调 节子,例如,确定性的细胞过程驱动子(例如,细胞交互差异或者生 物系统或过程中独特的因果关系)可以是标志物/指标或引起所述疾病 或病症的关键生物分子,且因而可以用来鉴别生物防御剂。
在某些实施方式中,探询式生物学评估是鉴别抗老化剂(如抗老 化化妆品)的靶标,其中所鉴别的生物系统调节子,例如,确定性的 细胞过程驱动子(例如,细胞交互差异或者生物系统或过程中独特的 因果关系)可以是老化过程的标志物或指示剂,特别是皮肤的老化过 程,并可随之用于鉴别抗老化剂。
在用于鉴别抗衰老化妆品靶标的本发明方法中的一个示例性衰 老细胞模型中,该细胞模型包含用例如UV光(环境扰动或外部刺激 成分)处理的老化的上皮细胞和/或任选地也用UV光处理的新生细 胞。在一个实施方式中,老化的细胞模型包括细胞交互系统。在为鉴 别抗衰老化妆品的靶标而建立的一个示例性的双细胞交互系统中,可 以用UV光(外部刺激成分)处理老化上皮细胞(第一细胞系统), 且由于与处理的老化上皮细胞的条件培养基接触而导致的新生细胞 (第二细胞系统)的变化(例如蛋白质组变化和/或功能变化)可被测 量,例如,可以使用常规的定量质谱法测定蛋白质组的变化,或可以 从由数据生成的因果关系网络鉴别老化过程中独特的因果关系。
在另一个方面,本发明提供了一种试剂盒,其用于使用发现平台 技术进行探询式生物学评估,其包含用于检测作为由本发明的方法生 成的因果关系网络的主题的分析物是否存在和/或用于定量其量的一 种或多种试剂。在一个实施方式中,所述分析物是生物系统中独特的 因果关系的对象,例如,与生物系统中独特的因果关系相关的基因。 在某些实施方式中,分析物是蛋白质,且该试剂包含针对该蛋白质的 抗体、该蛋白质的标记物和/或一种或多种制备用于高通量分析(例如, 基于质谱的测序)的该蛋白质的试剂。
在又另一个方面,所述技术提供一种用于治疗哺乳动物受试者的 疾病、缓解其症状、抑制其进展、预防、诊断或预后该疾病的方法。 所述方法包括向需要的哺乳动物施用治疗有效量的包含生物活性物 质的药物组合物,该生物活性物质影响TCOF1、TOP2A、CAMK2A、CDK1、CLTCL1、EIF4G1、ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、 HMGB2、HNRNPK、HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、 MAPK1、MARCKS、NME1、NME2、PGK1、PGK2、RAB7A、RPL17、 RPL28、RPS5、RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21 中任何一种或多种的表达或活性,从而治疗哺乳动物受试者的疾病、 缓解其症状、抑制其进展、预防、诊断或预后该疾病。在一些实施方 式中,所述疾病是癌症,例如肝细胞癌。在各种实施方式中,所述方 法可以使用1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、 16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、 31、32、33或34种激酶。在一种实施方式中,所述组合物提高一种 或多种激酶的表达和/或活性。在另一种实施方式中,所述组合物降低 一种或多种激酶的表达和/或活性。
在再另一个方面中,所述技术提供一种诊断哺乳动物受试者的疾 病的方法。所述方法包括:(i)测定从所述受试者获得的生物样品中 TCOF1、TOP2A、CAMK2A、CDK1、CLTCL1、EIF4G1、ENO1、 FBL、GSK3B、HDLBP、HIST1H2BA、HMGB2、HNRNPK、HNRPDL、 HSPA9、MAP2K2、LDHA、MAP4、MAPK1、MARCKS、NME1、 NME2、PGK1、PGK2、RAB7A、RPL17、RPL28、RPS5、RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21中任何一种或多种的表达或活 性水平;和(ii)将所述受试者中的水平与对照样品中所述一种或多种 蛋白质的表达或活性水平比较,其中所述受试者中的水平和所述对照 样品中一种或多种蛋白质的表达或活性水平之间的差异是所述受试者患有疾病或易于发生疾病或有利地对疾病治疗发生反应的指示,从 而诊断所述哺乳动物受试者的疾病。在一些实施方式中,所述疾病是 癌症,例如肝细胞癌。在各种实施方式中,所述方法可以使用1、2、 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33或34 种激酶。在一种实施方式中,所述差异是一种或多种激酶的表达和/ 或活性的提高。在另一种实施方式中,所述差异是一种或多种激酶的 表达和/或活性的降低。
在再另一个方面中,所述技术提供一种鉴别用于治疗哺乳动物受 试者的疾病、改善其症状、抑制其进展、预防、诊断或预后该疾病的 治疗化合物的方法。所述方法包括(i)使来自所述哺乳动物受试者的 生物样品与测试化合物接触;(ii)测定所述生物样品中TCOF1、 TOP2A、CAMK2A、CDK1、CLTCL1、EIF4G1、ENO1、FBL、GSK3B、 HDLBP、HIST1H2BA、HMGB2、HNRNPK、HNRPDL、HSPA9、 MAP2K2、LDHA、MAP4、MAPK1、MARCKS、NME1、NME2、PGK1、 PGK2、RAB7A、RPL17、RPL28、RPS5、RPS6、SLTM、TMED4、 TNRCBA、TUBB和UBE21中任何一种或多种的表达水平;(iii)将 所述生物样品中一种或多种蛋白质的表达水平与未与测试化合物接触的对照样品比较;和(iv)选择调节所述生物样品中一种或多种蛋白 质的表达水平的测试化合物,从而鉴别用于治疗哺乳动物受试者的疾 病、改善其症状、抑制其进展、预防、诊断或预后该疾病的治疗化合 物。在一些实施方式中,所述疾病是癌症,例如肝细胞癌。在各种实 施方式中,所述方法可以使用1、2、3、4、5、6、7、8、9、10、11、 12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、 27、28、29、30、31、32、33或34种激酶。在一种实施方式中,所述化合物提高一种或多种激酶的表达和/或活性。在另一种实施方式 中,所述化合物降低一种或多种激酶的表达和/或活性。
在再另一个方面中,所述技术提供一种用于治疗哺乳动物受试者 的疾病、改善其症状、抑制其进展、预防、诊断或预后所述疾病的方 法。所述方法包括向需要的哺乳动物施用治疗有效量的包含通过上述 方面(即,利用TCOF1、TOP2A、CAMK2A、CDK1、CLTCL1、EIF4G1、ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、HMGB2、HNRNPK、 HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、MAPK1、MARCKS、 NME1、NME2、PGK1、PGK2、RAB7A、RPL17、RPL28、RPS5、 RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21中任何一种或 多种)鉴别的治疗化合物的药物组合物,从而治疗所述疾病、改善其 症状、抑制其进展、预防、诊断或预后所述疾病。在一些实施方式中, 所述疾病是癌症,例如肝细胞癌。在各种实施方式中,所述方法可以 使用1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、 32、33或34种激酶。
特别地,本发明涉及以下各项:
1.一种用于鉴别生物系统的调节子的方法,所述方法包括:
使用与该生物系统相关的细胞建立该生物系统的模型来代表该 生物系统的特征性方面;
从所述模型获得第一数据集,其中所述第一数据集代表与该生物 系统相关的细胞中的总体蛋白质组学改变;
从所述模型获得第二数据集,其中所述第二数据集代表与该生物 系统相关的细胞的一种或多种功能活性或细胞反应,其中所述细胞的 一种或多种功能活性或细胞反应包括与该生物系统相关的细胞中的 总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应;
用编程的计算设备,仅仅基于所述第一数据集和第二数据集生成 所述总体蛋白质组学改变和所述一种或多种功能活性或细胞反应之 中的一致因果关系网络,其中所述一致因果关系网络的生成不基于所 述第一数据集和第二数据集以外的任何已知的生物学关系;
从该一致因果关系网络鉴别在该生物系统中独特的因果关系,其 中与该独特的因果关系相关的至少一种酶被确定为该生物系统的调 节子。
2.如第1项的方法,其中所述第一数据集还代表表征与所述生物 系统相关的细胞的脂质组学数据。
3.如第2项的方法,其中所述一致因果关系网络在所述总体蛋白 质组学改变、所述脂质组学数据和所述细胞的一种或多种功能活性或 细胞反应之中生成,其中所述细胞的一种或多种功能活性或细胞反应 包括总体酶学活性和/或总体酶学活性对至少一种酶代谢产物或底物 的效应。
4.如第1项的方法,其中所述第一数据集还代表表征所述与生物 系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、基 因组学数据和SNP数据中的一种或多种。
5.如第1项的方法,其中所述第一数据集还代表表征所述与生物 系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、基 因组学数据和SNP数据中的两种或更多种。
6.如第4或5项的方法,其中所述一致因果关系网络在所述总体 蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、 基因组学数据和SNP数据中的一种或多种及所述细胞的一种或多种 功能活性或细胞反应之中生成,其中所述细胞的一种或多种功能活性 或细胞反应包括总体酶学活性和/或总体酶学活性对至少一种酶代谢 产物或底物的效应。
7.如第1-6项中任一项的方法,其中所述总体酶学活性包括总体 激酶活性。
8.如第1-7项中任一项的方法,其中所述总体酶学活性对酶代谢 产物或底物的效应包括所述细胞的磷酸化蛋白质组。
9.如第1-8项中任一项的方法,其中所述代表细胞的一种或多种 功能活性或细胞反应的第二数据集还包括生物能量学、细胞增殖、细 胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、 出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型 实现的基因型-表型相关性中的一种或多种。
10.如第1-8项中任一项的方法,其中所述一致因果关系网络 在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转 录组学数据、基因组学数据和SNP数据中的一种或多种及所述细胞 的一种或多种功能活性或细胞反应之中生成,其中所述细胞的一种或 多种功能活性或细胞反应包括总体酶学活性和/或总体酶学活性对至 少一种酶代谢产物或底物的效应且还包括生物能量学、细胞增殖、细 胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、 出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型 实现的基因型-表型相关性中的一种或多种。
11.如第1-10项中任一项的方法,其中所述生物系统的模型包 括与所述生物系统相关的细胞的体外培养物,任选地进一步包括匹配 的对照细胞的体外培养物。
12.如第11项的方法,其中所述细胞的体外培养物经受环境扰 动,且所述匹配的对照细胞的体外培养物是没有经受环境扰动的相同 细胞。
13.如第12项的方法,其中所述环境扰动包括与生物活性剂的 接触、培养条件的变化、遗传修饰/突变的引入和引起遗传修饰/突变 的媒介的引入中的一种或多种。
14.如第13项的方法,其中所述环境扰动包括使所述细胞与酶 活性抑制剂接触。
15.如第14项的方法,其中所述酶活性抑制剂是激酶抑制剂。
16.如第13项的方法,其中所述环境扰动包括使所述细胞与 CoQ10接触。
17.如第14项的方法,其中所述环境扰动还包括使所述细胞与 CoQ10接触。
18.如第1项的方法,其中所述生成步骤通过基于人工智能 (AI)的信息学平台完成。
19.如第18项的方法,其中所述基于AI的信息学平台接受来 自所述第一数据集和第二数据集的所有数据输入而不应用统计截止 点。
20.如第1项的方法,其中在所述鉴别步骤之前,在所述生成 步骤中建立的所述一致因果关系网络通过基于输入数据的计算机模 拟进一步优化到模拟因果关系网络,以对于一致因果关系网络内的一 个或多个因果关系提供预测的置信水平。
21.如第11项的方法,其中所述独特因果关系被确定为独特地 存在于所述与生物系统相关的细胞中且不存在于匹配的对照细胞中 的差异因果关系网络的部分。
22.如第12项的方法,其中所述独特因果关系被确定为独特地 存在于所述经受环境扰动的细胞中且不存在于匹配的对照细胞中的 差异因果关系网络的部分。
23.如第1-22项中任一项的方法,其中所述确定的独特因果关 系是选自下组的至少一对之间的关系:基因的表达和脂质的水平;基 因的表达和转录物的水平;基因的表达和代谢产物的水平;第一基因 的表达和第二基因的表达;基因的表达和SNP的存在;基因的表达 和功能活性;脂质的水平和转录物的水平;脂质的水平和代谢产物的 水平;第一脂质的水平和第二脂质的水平;脂质的水平和SNP的存 在;脂质的水平和功能活性;第一转录物的水平和第二转录物的水平; 转录物的水平和代谢产物的水平;转录物的水平和SNP的存在;第 一转录物的水平和功能活性的水平;第一代谢产物的水平和第二代谢 产物的水平;代谢产物的水平和SNP的存在;代谢产物的水平和功 能活性;第一SNP的存在和第二SNP的存在;及SNP的存在和功能 活性。
24.如第1-23项中任一项的方法,其中所述确定的独特因果关 系是至少脂质的水平、基因的表达和一种或多种功能活性之间的关 系,其中所述功能活性是总体激酶活性。
25.一种用于鉴别疾病过程的调节子的方法,所述方法包括:
使用疾病相关细胞建立该疾病过程的模型以代表该疾病过程的 特征性方面;
从所述模型获得第一数据集,其中所述第一数据集代表疾病相关 细胞中的总体蛋白质组学改变;
从所述模型获得第二数据集,其中所述第二数据集代表与所述生 物系统相关的细胞的一种或多种功能活性或细胞反应,其中所述细胞 的一种或多种功能活性或细胞反应包括疾病相关细胞中的总体酶学 活性和/或总体酶学活性对酶代谢产物或底物的效应;
使用编程的计算设备,仅基于所述第一数据集和第二数据集生成 所述总体酶学活性与所述细胞的一种或多种功能活性或细胞反应之 中的一致因果关系网络,其中所述一致因果关系网络的生成不是基于 所述第一数据集和第二数据集以外的任何已知的生物学关系;和
从该一致因果关系网络鉴别在所述疾病过程中独特的因果关系, 其中与该独特的因果关系相关的至少一种酶被确定为所述疾病过程 的调节子。
26.如第25项的方法,其中所述第一数据集还代表表征与所述 生物系统相关的细胞的脂质组学数据。
27.如第26项的方法,其中所述一致因果关系网络在所述总体 蛋白质组学改变、脂质组学数据和所述细胞的一种或多种功能活性或 细胞反应之中生成,其中所述细胞的一种或多种功能活性或细胞反应 包括疾病相关细胞中的总体酶学活性和/或总体酶学活性对酶代谢产 物或底物的效应。
28.如第25项的方法,其中所述第一数据集还代表表征所述与 生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、 基因组学数据和SNP数据中的一种或多种。
29.如第28项的方法,其中所述第一数据集还代表表征所述与 生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、 基因组学数据和SNP数据中的两种或更多种。
30.如第28或29项的方法,其中所述一致因果关系网络在所 述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组 学数据、基因组学数据和SNP数据中的一种或多种及所述细胞的一 种或多种功能活性或细胞反应之中生成,其中所述细胞的一种或多种 功能活性或细胞反应包括疾病相关细胞中的总体酶学活性和/或总体 酶学活性对至少一种酶代谢产物或底物的效应。
31.如第25-30项中任一项的方法,其中所述总体酶学活性包 括总体激酶活性,且其中所述总体酶学活性对酶代谢产物或底物的效 应包括所述细胞的磷酸化蛋白质组。
32.如第25-31项中任一项的方法,其中所述代表细胞的一种 或多种功能活性或细胞反应的第二数据集还包括生物能量学、细胞增 殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基 质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的 功能模型实现的基因型-表型相关性中的一种或多种。
33.如第32项的方法,其中所述一致因果关系网络在所述总体 蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、 基因组学数据和SNP数据中的一种或多种及所述细胞的一种或多种 功能活性或细胞反应之中生成,其中所述细胞的一种或多种功能活性 或细胞反应包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细 胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、 ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关 性中的一种或多种。
34.如第25-33项中任一项的方法,其中所述疾病过程是癌症、 糖尿病、肥胖症、心血管疾病、年龄相关性黄斑变性、糖尿病性视网 膜病或炎性疾病。
35.如第25-33项中任一项的方法,其中所述疾病过程包括血 管生成。
36.如第25-33项中任一项的方法,其中所述疾病过程包括肝 细胞癌、肺癌、乳腺癌、前列腺癌、黑色素瘤、癌瘤、肉瘤、淋巴瘤、 白血病、鳞状细胞癌、结肠直肠癌、胰腺癌、甲状腺癌、子宫内膜癌、 膀胱癌、肾癌、实体瘤、白血病、非霍奇金淋巴瘤或耐药性癌症。
37.如第25-33项任一项的方法,其中所述疾病模型包括疾病 细胞的体外培养物,任选地进一步包括匹配的对照或正常细胞的体外 培养物。
38.如第37项的方法,其中所述疾病细胞的体外培养物经受环 境扰动,且所述匹配的对照细胞的体外培养物是没有经受环境扰动的 相同疾病细胞。
39.如第38项的方法,其中所述环境扰动包括与生物活性剂的 接触、培养条件的变化、遗传修饰/突变的引入和引起遗传修饰/突变 的媒介的引入中的一种或多种。
40.如第39项的方法,其中所述环境扰动包括使所述细胞与酶 活性抑制剂接触。
41.如第40项的方法,其中所述酶活性抑制剂是激酶抑制剂。
42.如第39项的方法,其中所述环境扰动包括使所述细胞与 CoQ10接触。
43.如第25项的方法,其中所述疾病过程的特征性方面包括缺 氧状态、高血糖状态、富乳酸培养条件或它们的组合。
44.如第25项的方法,其中所述生成步骤通过基于人工智能 (AI)的信息学平台完成。
45.如第25项的方法,其中所述基于AI的信息学平台接受来 自所述第一数据集和第二数据集的所有数据输入而不应用统计截止 点。
46.如第25项的方法,其中在所述鉴别步骤之前,在所述生成 步骤中建立的所述一致因果关系网络通过基于输入数据的计算机模 拟进一步优化到模拟因果关系网络,以对于所述一致因果关系网络内 的一个或多个因果关系提供预测的置信水平。
47.如第37项的方法,其中所述独特因果关系被确定为独特地 存在于疾病细胞的模型中且不存在于匹配的对照细胞中的差异因果 关系网络的部分。
48.如第38项的方法,其中所述独特因果关系被确定为独特地 存在于所述经受环境扰动的细胞中且不存在于匹配的对照细胞中的 差异因果关系网络的部分。
49.一种用于鉴别生物系统的调节子的方法,所述方法包括:
使用与该生物系统相关的细胞建立该生物系统的模型来代表该 生物系统的特征性方面;
从所述模型获得第一数据集,其中所述第一数据集代表所述细胞 中的总体蛋白质组学改变及表征与该生物系统相关的细胞的脂质组 学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据 中的一种或多种;
从所述模型获得第二数据集,其中所述第二数据集代表与该生物 系统相关的细胞的一种或多种功能活性或细胞反应,其中所述细胞的 一种或多种功能活性或细胞反应包括与该生物系统相关的细胞中的 总体激酶活性和/或总体激酶活性对激酶代谢产物或底物的效应;
使用编程的计算设备,仅仅基于所述第一数据集和第二数据集生 成所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转 录组学数据、基因组学数据和SNP数据中的一种或多种及所述一种 或多种功能活性或细胞反应之中的一致因果关系网络,其中所述一致 因果关系网络的生成不基于所述第一数据集和第二数据集以外的任 何已知的生物学关系;
从该一致因果关系网络鉴别在所述生物系统中独特的因果关系, 其中与该独特的因果关系相关的至少一种激酶被确定为该生物系统 的调节子。
50.一种用于治疗哺乳动物受试者的疾病、改善其症状、抑制 其进展、预防、诊断或预后该疾病的方法,所述方法包括:
向需要的哺乳动物施用治疗有效量的包含生物活性物质的药物 组合物,所述生物活性物质影响通过第1-18项中任一项所鉴别的调 节子,从而治疗所述疾病、改善其症状、抑制其进展、预防、诊断或 预后所述疾病。
51.一种诊断或预后哺乳动物受试者的疾病的方法,所述方法 包括:
测定从所述受试者获得的生物样品中一种或多种通过第1-48项 中任一项鉴别的调节子的表达或活性水平;和
将所述受试者中的水平与对照样品中所述一种或多种调节子的 表达或活性水平比较,
其中所述受试者中的水平和所述对照样品中一种或多种调节子 的表达或活性水平之间的差异是所述受试者患有疾病、易于发生疾病 或有利地对疾病治疗发生反应的指示,从而诊断或预后所述哺乳动物 受试者的疾病。
52.一种鉴别用于治疗哺乳动物受试者的疾病、改善其症状、 抑制其进展或预防该疾病的治疗化合物的方法,所述方法包括:
使来自所述哺乳动物受试者的生物样品与测试化合物接触;
测定所述生物样品中一种或多种通过第1-48项中任一项鉴别的 调节子的表达水平;
将所述生物样品中一种或多种调节子的表达水平与未与测试化 合物接触的对照样品比较;和
选择调节所述生物样品中一种或多种调节子的表达水平的测试 化合物,
从而鉴别用于治疗哺乳动物受试者的疾病、改善其症状、抑制其 进展或预防该疾病的治疗化合物。
53.一种用于治疗哺乳动物受试者的疾病、改善其症状、抑制 其进展或预防所述疾病的方法,所述方法包括:
向需要的哺乳动物施用治疗有效量的包含第52项的治疗化合物 的药物组合物,从而治疗所述疾病、改善其症状、抑制其进展或预防 所述疾病。
54.一种用于治疗哺乳动物受试者的疾病、改善其症状、抑制 其进展或预防所述疾病的方法,所述方法包括:
向需要的哺乳动物施用治疗有效量的包含生物活性物质的药物 组合物,所述生物活性物质影响TCOF1、TOP2A、CAMK2A、CDK1、 CLTCL1、EIF4G1、ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、 HMGB2、HNRNPK、HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、 MAPK1、MARCKS、NME1、NME2、PGK1、PGK2、RAB7A、RPL17、 RPL28、RPS5、RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21 中任何一种或多种的表达或活性,
从而治疗所述疾病、改善其症状、抑制其进展或预防所述疾病。
55.如第54项的方法,其中所述疾病是肝细胞癌。
56.一种诊断或预后哺乳动物受试者的疾病的方法,所述方法 包括:
测定从所述受试者获得的生物样品中TCOF1、TOP2A、CAMK2A、 CDK1、CLTCL1、EIF4G1、ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、 HMGB2、HNRNPK、HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、 MAPK1、MARCKS、NME1、NME2、PGK1、PGK2、RAB7A、RPL17、 RPL28、RPS5、RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21 中的任何一种或多种蛋白质的表达或活性水平;和
将所述受试者中的水平与对照样品中所述一种或多种蛋白质的 表达或活性水平比较,
其中所述受试者中的水平和所述对照样品中一种或多种蛋白质 的表达或活性水平之间的差异是所述受试者患有疾病或易于发生疾 病或有利地对疾病治疗发生反应的指示,从而诊断或预后所述哺乳动 物受试者的疾病。
57.如第56项的方法,其中所述疾病是肝细胞癌。
58.一种鉴别用于治疗哺乳动物受试者的疾病、改善其症状、 抑制其进展或预防该疾病的治疗化合物的方法,所述方法包括:
使来自所述哺乳动物受试者的生物样品与测试化合物接触;
测定所述生物样品中TCOF1、TOP2A、CAMK2A、CDK1、 CLTCL1、EIF4G1、ENO1、FBL、GSK3B、HDLBP、HIST1H2BA、 HMGB2、HNRNPK、HNRPDL、HSPA9、MAP2K2、LDHA、MAP4、 MAPK1、MARCKS、NME1、NME2、PGK1、PGK2、RAB7A、RPL17、 RPL28、RPS5、RPS6、SLTM、TMED4、TNRCBA、TUBB和UBE21 中任何一种或多种蛋白质的表达水平;
将所述生物样品中一种或多种蛋白质的表达水平与未与测试化 合物接触的对照样品比较;和
选择调节所述生物样品中一种或多种蛋白质的表达水平的测试 化合物,
从而鉴别用于治疗哺乳动物受试者的疾病、改善其症状、抑制其 进展或预防该疾病的治疗化合物。
59.如第58项的方法,其中所述疾病是肝细胞癌。
60.一种用于治疗哺乳动物受试者的疾病、改善其症状、抑制 其进展或预防所述疾病的方法,所述方法包括:
向需要的哺乳动物施用治疗有效量的包含第58项的治疗化合物 的药物组合物,从而治疗所述疾病、改善其症状、抑制其进展或预防 所述疾病。
61.一种用于鉴别血管生成的调节子的方法,所述方法包括:
(1)使用与血管生成相关的细胞建立血管生成的模型来代表血 管生成的特征性方面;
(2)从所述血管生成的模型获得第一数据集,其中所述第一数 据集代表表征所述与血管生成相关的细胞的基因组学数据、脂质组学 数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多 态性(SNP)数据中的一种或多种;
(3)从所述血管生成的模型获得第二数据集,其中所述第二数 据集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应;
(4)使用编程的计算设备,仅仅基于所述第一数据集和第二数 据集生成所述表征与血管生成相关的细胞的基因组学数据、脂质组学 数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多 态性(SNP)数据中的一种或多种及所述与血管生成相关的细胞的一种 或多种功能活性或细胞反应之中的一致因果关系网络,其中所述一致 因果关系网络的生成不基于所述第一数据集和第二数据集以外的任 何已知的生物学关系;
(5)从该一致因果关系网络鉴别在血管生成中独特的因果关系, 其中与该独特的因果关系相关的基因、脂质、蛋白质、代谢产物、转 录物或SNP被确定为血管生成的调节子。
62.一种用于鉴别血管生成的调节子的方法,所述方法包括:
(1)使用与血管生成相关的细胞建立血管生成的模型来代表血 管生成的特征性方面;
(2)从所述血管生成的模型获得第一数据集,其中所述第一数 据集代表脂质组学数据;
(3)从所述血管生成的模型获得第二数据集,其中所述第二数 据集代表与血管生成相关的细胞的一种或多种功能活性或细胞反应;
(4)使用编程的计算设备,仅仅基于所述第一数据集和第二数 据集生成所述脂质组学数据及所述一种或多种功能活性或细胞反应 之中的一致因果关系网络,其中所述一致因果关系网络的生成不基于 所述第一数据集和第二数据集以外的任何已知的生物学关系;
(5)从该一致因果关系网络鉴别在血管生成中独特的因果关系, 其中与该独特的因果关系相关的脂质被确定为血管生成的调节子。
63.如第61或62项的方法,其中所述代表与血管生成相关的 细胞的一种或多种功能活性或细胞反应的第二数据集包括与血管生 成相关的细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或 底物的效应。
64.一种用于鉴别血管生成的调节子的方法,所述方法包括:
(1)使用与血管生成相关的细胞建立血管生成的模型来代表血 管生成的特征性方面;
(2)从所述血管生成的模型获得第一数据集,其中所述第一数 据集代表表征所述与血管生成相关的细胞的基因组学数据、脂质组学 数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多 态性(SNP)数据中的一种或多种;
(3)从所述血管生成的模型获得第二数据集,其中所述第二数 据集代表所述与血管生成相关的细胞的一种或多种功能活性或细胞 反应,其中所述一种或多种功能活性或细胞反应包括所述与血管生成 相关的细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底 物的效应;
(4)使用编程的计算设备,仅仅基于所述第一数据集和第二数 据集生成所述表征与血管生成相关的细胞的基因组学数据、脂质组学 数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多 态性(SNP)数据中的一种或多种及所述与血管生成相关的细胞的一种 或多种功能活性或细胞反应之中的一致因果关系网络,其中所述一致 因果关系网络的生成不基于所述第一数据集和第二数据集以外的任 何已知的生物学关系;
(5)从该一致因果关系网络鉴别在血管生成中独特的因果关系, 其中与该独特的因果关系相关的酶被确定为血管生成的调节子。
65.如第63或64项的方法,其中所述总体酶学活性包括总体 激酶活性且所述总体酶学活性对酶代谢产物或底物的效应包括所述 细胞的磷酸化蛋白质组。
66.如第63或64项的方法,其中所述总体酶学活性包括总体 蛋白酶活性。
67.如第61-66项任一项的方法,其中所述调节子刺激或促进 血管生成。
68.如第61-66项任一项的方法,其中所述调节子抑制血管生 成。
69.如第61-68项任一项的方法,其中所述包含与血管生成相 关的细胞的血管生成模型选自体外细胞培养血管生成模型、大鼠主动 脉微血管模型、新生小鼠视网膜模型、鸡胚绒毛尿囊膜(CAM)模型、 角膜血管生成生长因子囊袋模型、皮下海绵血管生成生长因子植入模 型、血管生成生长因子植入模型和肿瘤植入模型;且其 中所述血管生成模型任选地进一步包括包含对照细胞的匹配对照血 管生成模型。
70.如第69项的方法,其中所述体外培养血管生成模型选自 管形成分析、迁移分析、伯伊登室分析、划痕分析。
71.如第69或70项的方法,其中所述体外培养模型中与血管 生成相关的细胞是人血管内皮细胞(HUVEC)。
72.如第69项的方法,其中所述角膜血管生成生长因子囊袋模 型、皮下海绵血管生成生长因子植入模型或血管生成生 长因子植入模型中的血管生成生长因子选自FGF-2和VEGF。
73.如第69项的方法,其中所述血管生成模型中的细胞经受环 境扰动,且所述匹配的血管生成模型中的细胞是没有经受环境扰动的 相同细胞。
74.如第73项的方法,其中所述环境扰动包括与试剂的接触、 培养条件的变化、引入的遗传修饰或突变、引起遗传修饰或突变的媒 介和局部缺血的诱导中的一种或多种。
75.如第74项的方法,其中所述试剂是促血管生成剂或抗血管 生成剂。
76.如第75项的方法,其中所述促血管生成剂选自FGF-2和 VEGF。
77.如第75项的方法,其中所述抗血管生成剂选自VEGF抑制 剂、整联蛋白拮抗剂、血管抑素、内皮抑素、肿瘤抑素、阿瓦斯汀、 索拉非尼、舒尼替尼、帕唑帕尼和依维莫司、可溶性VEGF受体、血 管生成素2、血小板反应蛋白1、血小板反应蛋白2、血管形成抑制素、 钙网织蛋白、凝血酶原(kringle结构域-2)、抗凝血酶III片段、血管内 皮生长抑制剂(VEGI)、富含半胱氨酸的酸性分泌蛋白(SPARC)和对应 于蛋白质的卵泡抑素结构域的SPARC肽(FS-E)和辅酶Q10。
78.如第74项的方法,其中所述试剂是酶活性抑制剂。
79.如第74项的方法,其中所述试剂是激酶活性抑制剂。
80.如第61或64项的方法,其中所述第一数据集包括基因组 数据集中多个基因的蛋白质和/或mRNA表达水平。
81.如第61或64项的方法,其中所述第一数据集包括基因组 学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学 数据和单核苷酸多态性(SNP)数据中的两种或更多种。
82.如第61或64项的方法,其中所述第一数据集包括基因组 学数据、脂质组学数据、蛋白质组学数据、代谢组学数据、转录组学 数据和单核苷酸多态性(SNP)数据中的三种或更多种。
83.如第61-64项任一项的方法,其中所述代表与血管生成相 关的细胞的一种或多种功能活性或细胞反应的第二数据集进一步包 括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形 成、酶活性、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的 一种或多种。
84.如第83项的方法,其中所述酶活性是激酶活性。
85.如第83项的方法,其中所述酶活性是蛋白酶活性。
86.如第61-64项任一项的方法,其中步骤(4)通过基于人工智 能(AI)的信息学平台完成。
87.如第86项的方法,其中所述基于AI的信息学平台包括 REFS(TM)。
88.如第86项的方法,其中所述基于AI的信息学平台接受来 自所述第一数据集和第二数据集的所有数据输入而不应用统计截止 点。
89.如第61-64项任一项的方法,其中在步骤(5)之前,在步骤 (4)中建立的所述一致因果关系网络基于输入的数据通过计算机模拟 进一步优化到模拟因果关系网络,以对于一致因果关系网络内的一个 或多个因果关系提供预测的置信水平。
90.如第61-64项任一项的方法,其中所述独特因果关系被确 定为独特地存在于细胞中且不存在于匹配的对照细胞中的差异因果 关系网络的部分。
91.如第61-90项任一项的方法,其中所述确定的独特因果关 系是选自下组的至少一对之间的关系:基因的表达和脂质的水平;基 因的表达和转录物的水平;基因的表达和代谢产物的水平;第一基因 的表达和第二基因的表达;基因的表达和SNP的存在;基因的表达 和功能活性;脂质的水平和转录物的水平;脂质的水平和代谢产物的 水平;第一脂质的水平和第二脂质的水平;脂质的水平和SNP的存 在;脂质的水平和功能活性;第一转录物的水平和第二转录物的水平; 转录物的水平和代谢产物的水平;转录物的水平和SNP的存在;第 一转录物的水平和功能活性的水平;第一代谢产物的水平和第二代谢 产物的水平;代谢产物的水平和SNP的存在;代谢产物的水平和功 能活性;第一SNP的存在和第二SNP的存在;及SNP的存在和功能 活性。
92.如第91项的方法,其中所述功能活性选自生物能量学、细 胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、酶活性、趋化 性、细胞外基质降解和出芽及通过选自ATP、ROS、OXPHOS和 Seahorse分析的功能模型实现的基因型-表型相关性。
93.如第91或92项的方法,其中所述功能活性是激酶活性。
94.如第91或92项的方法,其中所述功能活性是蛋白酶活性。
95.如第61-93项中任一项的方法,其中所述确定的独特因果 关系是至少脂质的水平、基因的表达和一种或多种功能活性之间的关 系,其中所述功能活性是激酶活性。
96.如第61-95项中任一项的方法,进一步包括验证所述鉴别 的血管生成中的独特因果关系。
97.一种用于提供平台方法中使用的血管生成模型的方法,包 括:
使用与血管生成相关的细胞建立血管生成的模型以代表血管生 成的特征性方面,其中所述血管生成的模型可用于生成在平台方法中 使用的数据集;
从而提供在平台方法中使用的血管生成的模型。
98.一种用于从在平台方法中使用的血管生成模型获得第一数 据集和第二数据集的方法,包括:
(1)从在平台方法中使用的血管生成模型获得第一数据集,其 中所述血管生成模型包含与血管生成相关的细胞,和其中所述第一数 据集代表表征所述与血管生成相关的细胞的基因组学数据、脂质组学 数据、蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多 态性(SNP)数据中的一种或多种;
(2)从在平台方法中使用的血管生成模型获得第二数据集,其 中所述第二数据集代表所述与血管生成相关的细胞的一种或多种功 能活性或细胞反应;
从而从在平台方法中使用的所述血管生成模型获得第一数据集 和第二数据集。
99.一种用于鉴别血管生成的调节子的方法,所述方法包括:
(1)用编程的计算设备生成在从血管生成模型获得的第一数据 集和第二数据集之中的一致因果关系网络,其中所述模型包含与血管 生成相关的细胞,和其中所述第一数据集代表表征所述与血管生成相 关的细胞的基因组学数据、脂质组学数据、蛋白质组学数据、代谢组 学数据、转录组学数据和单核苷酸多态性(SNP)数据中的一种或多种; 和所述第二数据集代表所述与血管生成相关的细胞的一种或多种功 能活性或细胞反应,其中所述一致因果关系网络的生成不是基于所述 第一数据集和第二数据集以外的任何已知的生物学关系;
(2)从所述一致因果关系网络鉴别血管生成中独特的因果关系, 其中与所述独特的因果关系相关的基因、脂质、蛋白质、代谢产物、 转录物或SNP中的至少一种被确定为血管生成的调节子;
从而鉴别血管生成的调节子。
100.一种用于鉴别血管生成的调节子的方法,所述方法包括:
1)提供从血管生成的模型生成的一致因果关系网络;
2)从该一致因果关系网络鉴别血管生成中独特的因果关系,其 中与所述独特的因果关系相关的基因、脂质、蛋白质、代谢产物、转 录物或SNP中的至少一种被确定为血管生成的调节子;
从而鉴别血管生成的调节子。
101.如第90项的方法,其中所述一致因果关系网络用编程的计 算设备在从血管生成模型获得的第一数据集和第二数据集之中生成, 其中所述模型包含与血管生成相关的细胞,和其中所述第一数据集代 表表征所述与血管生成相关的细胞的基因组学数据、脂质组学数据、 蛋白质组学数据、代谢组学数据、转录组学数据和单核苷酸多态性 (SNP)数据中的一种或多种;和
所述第二数据集代表与血管生成相关的细胞的一种或多种功能 活性或细胞反应,其中所述一致因果关系网络的生成不是基于所述第 一数据集和第二数据集以外的任何已知的生物学关系。
102.如第97-101项任一项的方法,其中所述血管生成模型选自 体外细胞培养血管生成模型、大鼠主动脉微血管模型、新生小鼠视网 膜模型、鸡胚绒毛尿囊膜(CAM)模型、角膜血管生成生长因子囊袋模 型、皮下海绵血管生成生长因子植入模型、血管生成生 长因子植入模型和肿瘤植入模型;且其中所述血管生成模型任选地进 一步包括包含对照细胞的匹配对照血管生成模型。
103.如第97-102项任一项的方法,其中所述第一数据集包括脂 质组学数据。
104.如第97-103项任一项的方法,其中所述代表与血管生成相 关的细胞的一种或多种功能活性或细胞反应的第二数据集包括与血 管生成相关的细胞中的总体酶学活性和/或总体酶学活性对酶代谢产 物或底物的效应。
105.如第104项的方法,其中所述第二数据集包括激酶活性或 蛋白酶活性。
106.如第97-103项中任一项的方法,其中所述代表与血管生成 相关的细胞的一种或多种功能活性或细胞反应的第二数据集包括生 物能量学谱、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、 激酶活性和蛋白酶活性及通过选自ATP、ROS、OXPHOS和Seahorse 分析的功能模型实现的基因型-表型相关性中的一种或多种。
107.如第61-106项中任一项的方法,其中所述血管生成与疾病 状态相关。
108.一种用于调节哺乳动物受试者的血管生成的方法,所述方 法包括:
向需要的哺乳动物施用治疗有效量的包含生物活性物质的药物 组合物,所述生物活性物质影响通过第61-107项中任一项鉴别的调 节子,从而调节血管生成。
109.一种检测哺乳动物受试者中受调节的血管生成的方法,所 述方法包括:
测定从所述受试者获得的生物样品中通过第61-107项中任一项 鉴别的一种或多种调节子的水平、活性或存在;和
比较所述受试者中的所述水平、活性或存在与对照样品中所述一 种或多种调节子的水平、活性或存在,
其中所述受试者中的所述水平、活性或存在与所述对照样品中所 述一种或多种调节子的水平、活性或存在之间的差异是所述哺乳动物 受试者中血管生成受到调节的指示。
110.一种鉴别用于调节哺乳动物受试者中的血管生成的治疗化 合物的方法,所述方法包括:
使来自哺乳动物受试者的生物样品与测试化合物接触;
测定所述生物样品中通过第61-107项中任一项鉴别的一种或多 种调节子的水平、活性或存在;
将所述生物样品中所述一种或多种调节子的水平、活性或存在与 未接触所述测试化合物的对照样品比较,
选择调节所述生物样品中所述一种或多种调节子的水平、活性或 存在的测试化合物,
从而鉴别用于调节哺乳动物受试者中的血管生成的治疗化合物。
111.一种用于调节哺乳动物受试者中的血管生成的方法,所述 方法包括:
向需要的哺乳动物施用治疗有效量的包含第110项的治疗化合物 的药物组合物,从而治疗所述疾病、改善其症状、抑制其进展或预防、 诊断或预后所述疾病。
应当理解的是,本文所描述的所有实施方式,包括仅在实施例中 描述的那些,是本发明的一般描述的部分,并可以结合本发明的任何 其它实施方式,除非明确排除或不适用。
附图简要说明
本公开的各种实施方式将在本文下面根据附图进行描述,其中:
图1:用于鉴别治疗剂的方法的图解。
图2:癌症系统生物学和整合的多生理相互作用输出调节的结果 的图解。
图3:使用MIMS的生物相关性系统探询的图解。
图4:建模癌症网络以使得能够进行探询式生物学查询的图解。
图5:探询式生物学平台技术的图解。
图6:平台技术中使用的技术的图解。
图7:平台的成分(包括数据采集、数据整合和数据挖掘)的示 意图。
图8:使用MIMS的系统性探询和从“组学”级联收集响应数据的 示意图。
图9:建立表示正常和糖尿病状态的体外模型使用的成分的略图。
图10:用来生成蛋白质的因果网络(因为它们涉及疾病病理生理 学)的信息学平台REFSTM的示意图。
图11:导致生成糖尿病状态对于正常状态以及通过用MIMS治疗 恢复到正常状态的糖尿病节点的差异网络的途径的示意图。
图12:糖尿病状态与正常状态的代表性差异网络。
图13:节点和感兴趣的相关边界(中心的Node1)的示意图。表 示出与每个边界有关的细胞功能性。
图14:根据一些实施方式,示例性方法的高水平流程图。
图15A-15D:可以用于示例性实施方式的基于AI的信息学系统 的成分和过程的高水平示意图。
图16:可以用于示例性实施方式的基于AI的信息学系统中的方 法的流程图。
图17:示意性地描绘了适合于实施本文所教导的示例性实施方式 的示例性计算环境。
图18:实施例1中描述的案例研究设计的图示。
图19:辅酶Q10治疗对下游节点的影响。
图20:辅酶Q10治疗降低癌症细胞系HepG2中的LDHA表达。
图21:基于来自Paca2、HepG2和THLE2细胞系的数据,在70 %片段频率下的示例性蛋白质相互作用一致网络。
图22:使用平台技术鉴别两个癌症细胞系中响应于LDHA表达 模拟的蛋白质。
图23:LDHA-PARK7网络的独创途径协助(Ingenuity Pathway )分析鉴别TP53为上游中枢。
图24:辅酶Q10治疗对SKMEL28癌细胞系中TP53表达水平的 影响。
图25:与SKMEL28癌细胞系中导致细胞凋亡的BCL-2蛋白质的 表达改变相关的TP53的激活和辅酶Q10治疗对SKMEL28中Bcl-2、 Bax和胱天蛋白酶3表达水平的影响。
图26:导致生成Δ-Δ网络的数学途径的图解。
图27:驱动ECAR和OCR的癌症健康差(Δ-Δ)网络。各个驱 动子对边界的厚度代表的终点具有差异效应。Cytoscape中边界的厚 度表示倍数变化的强度。
图28:使用IPA对来自探询式平台技术输出的PARK7及相关节 点作图:灰色的形状包括所有来自输入IPA中的探询生物学输出的与 PARK7相关的节点。未填充的形状(带有名称)是由IPA整合的新 连接以创建完整的图谱。
图29:本发明的探询式平台技术,其展现了与PARK7相关的节 点的新相关性。虚线所示的边界是具有中间节点但在IPA中没有中间 节点的模拟中两个节点之间的连接。点线所示的边界是具有中间节点 但在IPA中有不同的中间节点的模拟中两个节点之间的连接。
图30:导致生成Δ-Δ网络的数学途径的图解。将来自NG∩HGΔ 网络中NG的独特边界与HG∩HGT1Δ网络中的HGT1的独特边界相 比较。NG和HGT1的交集中的边界是利用T1恢复到NG的HG边界。
图31:叠加到NG∩HGΔ网络上的利用辅酶Q10处理恢复到正常 的糖尿病边界的Δ-Δ网络。
图32:叠加在正常血脂∩高血脂Δ网络上的利用辅酶Q10处理恢 复到正常的高血脂边界的Δ-Δ网络。
图33:表示疾病和药物治疗中改变的脂肪酸命运的示意图。利用 游离脂肪酸(FFA)来产生ATP和对膜生物学破坏做出响应的膜重建 之间的平衡牵涉到药物导致的心脏毒性。
图34:表示用于研究糖尿病心肌细胞中药物诱导毒性的实验设计 和建模参数的示意图。
图35:药物治疗(T)导致的糖尿病心肌细胞中人线粒体能量代 谢基因的转录网络和表达的失调:救援分子(R)使基因表达正常化。
图36:A.药物治疗(T)诱导来自高血糖症中条件化的心肌细胞 的线粒体中GPAT1和TAZ的表达。与救援分子结合(T+R),GPAT1 和TAZ水平正常化。B.从G3P合成TAG。
图37:A.药物治疗(T)降低高血糖症条件化的心肌细胞中的线 粒体OCR(耗氧率)。救援分子(T+R)使OCR正常化。B.药物治 疗(T)抑制高血糖症中条件化的心肌细胞中线粒体ATP的合成。
图38:通过药物治疗下调蛋白质的GO注释。用药物治疗下调参 与线粒体能量代谢的蛋白质。
图39:导致生成Δ网络的数学方法的图解。比较来自T与UT的 独特边界,这两个模型均处于糖尿病环境中。
图40:代表驱动药物诱导毒性的病理生理学的潜在蛋白质中枢和 网络的示意图。
图41显示用于鉴别生物系统或疾病过程的调节子的方法。
图42显示用索拉非尼处理的HepG2中ENO1活性而非蛋白质表 达的显著降低。
图43显示用索拉非尼处理的HepG2中PGK1活性而非蛋白质表 达的显著降低。
图44显示用索拉非尼处理的HepG2中LDHA活性的显著降低。
图45显示可以通过使用基于AI的REFSTM系统分析数据集产生 的因果分子相互作用网络。
图46显示采用贝叶斯网络推理算法的多组学数据整合可以如何 导致对肝细胞癌中信号传导途径的更好理解。黄色方块代表转录后修 饰(磷酸化)数据,蓝色三角形代表基于活性(激酶)的数据,和绿 色圆形代表蛋白质组学数据。
图47显示肝细胞癌信号传导途径中的自动调节和逆反馈调节可 以如何通过平台推断。方块代表转录后修饰(磷酸化)数据(灰/黑= 激酶,黄/浅–无激酶活性),方块代表基于活性(激酶)+蛋白质 组学数据(灰/黑=激酶,黄/浅–无激酶活性)。
图48-51显示通过平台推断的信号传导途径中因果相关性的实 例。激酶同工型在代表性的方块和圆形上表示,因果相关性通过连接 体表示。
图52A-B显示在(A)汇合或(B)亚汇合培养物中生长的人脐 静脉内皮细胞(HUVEC)用所示浓度范围的CoQ10处理24小时。汇合 的细胞密切地近似于“正常”细胞而亚汇合的细胞更密切地代表增殖 细胞的血管生成表型。在汇合培养物中,添加提高浓度的CoQ10导 致EC的更密切的关联、延长和排列。5000μM导致圆形细胞的细微 增加。
图53A-C显示HUVEC细胞的汇合(A)或亚汇合(B)培养物 用100或1500μM CoQ10处理24小时并测定碘丙锭阳性凋亡细胞。 CoQ10对汇合时处理的EC是保护性的,而亚汇合的细胞对于是敏感 的且在1500μM CoQ10下显示增加的细胞凋亡。(C)亚汇合的对照 EC(左)、100μM CoQ10(中)和1500μM CoQ10(右)的代表性 柱状图。
图54A-C显示亚汇合的HUVEC细胞培养物用100或1500μM CoQ10处理72小时并使用碘丙锭掺入分析(检测G2/M期DNA)测 定细胞数(A)和增殖(B)。高浓度的CoQ10导致细胞数的显著提 高且对于EC增殖具有剂量依赖性的作用。细胞周期的G2/M期细胞 [对照EC(左)、100μM CoQ10(中)和1500μM CoQ10(右)]的 细胞增殖分选的代表性柱状图显示于(C)中。
图55显示HUVEC细胞生长到汇合以使用“划痕”分析测试迁移。 100或1500μMCoQ10在刻划时施加且清除区域的封闭在48小时内 监测。100μM CoQ10与对照相比延迟内皮封闭。添加1500μM CoQ10 阻止封闭,甚至直到48小时(数据未显示)。
图56显示在3-D基质胶中生长的内皮细胞随时间形成管。观察 到100μM和1500μMCoQ10对管形成的不同效应。受损的细胞-细 胞关联和早期管结构的破坏在1500μM CoQ10下是显著的。显示的 图像在72小时时获取。
图57A-B显示内皮细胞在亚汇合和汇合的培养物中生长,其在正 常和缺氧条件下在CoQ10存在和不存在下生长。评估了响应于CoQ10 和缺氧的一氧化氮(NO)(A)和反应性氧物质(ROS)(B)的产生。
图58A-D显示内皮细胞在亚汇合和汇合的培养物中在CoQ10存 在和不存在下生长以评估在所示生长条件下的线粒体氧消耗。显示了 总OCR(A)、线粒体OCR(B)、ATP产生(C)、ECAR(D)的 评估。
图59A-C显示用于通过CoQ10对内皮细胞功能的调节鉴别关键 生物功能节点的探询式生物学平台的结果。这些节点由完全多组学网 络(A)、富蛋白质网络的中枢(B)及激酶、脂质组学和功能终点 网络的中枢(C)代表。图59B和59C是图59A的分解部分。
发明详述
I、概述
本发明的示例性实施方式中结合了可以使用探询式生物学平台 (“该平台”)实施的方法,该平台是用于理解各种各样的生物学过程 (如疾病病理生理学或血管生成)和作为这种生物学过程基础的关键 分子驱动子(包括使疾病过程得以发生的因子)的工具。一些示例性 实施方式包括可以结合该平台的至少一部分或全部的系统。一些示例 性方法可以采用该平台的至少一部分或全部。涉及该平台的一些示例 性实施方式的目标和目的出于说明性的目的一般地概述如下:
i)建立作为生物学过程(例如,疾病过程、血管生成)的关键组 成的驱动子的特定分子印记,因为它们与总体生物学过程相关;
ii)生成与生物学过程相关的分子印记或差异图谱,这可有助于 鉴别区分一个生物学状态(例如,疾病状态、血管生成状态)与不同 生物学阶段(例如,正常状态)的差异分子印记,和发展对于印记或 分子实体的理解,因为它们裁断两种生物学状态之间的变化(例如, 从正常到疾病状态或血管生成状态)的机制;和
ⅲ)研究分子活性的“中枢”作为用于生物学过程的外部控制的潜 在干预靶标(例如,使用该中枢作为潜在的治疗靶标或血管生成调节 的靶标)或作为所讨论的生物学过程的潜在生物标志物(例如,疾病 特异性生物标志物和血管生成特异性标志物,用于预后和/或治疗诊断 用途中)的作用。
涉及该平台的一些示例性的方法可以包括一个或多个以下特征:
1)在一个或多个模型中,优选在体外模型或实验室模型(例如, CAM模型、角膜囊袋模型、模型)中,使用与生物学 过程相关的细胞对生物学过程(例如,疾病过程、血管生成过程)和/或生物学过程的成分(例如,疾病生理及病理生理学、血管生成的生 理学)建模。例如,细胞可以是人类来源的细胞,其正常地参与所讨 论的生物学过程。该模型可包括对于该生物学过程(例如,疾病、血 管生成)特异性的各种细胞提示/状态/扰动。在理想的情况下,该模 型代表各种(疾病、血管生成)状态和通量成分而不是生物学(疾病、 血管生成)状况的静态评估。
2)使用领域公认的任何手段确定mRNA和/或蛋白质印记的特征。 例如,定量聚合酶链反应(qPCR)和蛋白质组学分析工具如质谱 (MS)。这种mRNA和蛋白质数据集代表对环境/扰动的生物学反应。 在适用和可能的情况下,脂质组学、代谢组学和转录组学数据也可被 整合作为用于所讨论的生物学过程的补充或替代测量值。SNP分析是 在该过程中有时可以使用的另一成分。它可以有助于研究,例如,SNP 或特定突变是否对生物学过程有任何影响。这些变量可以用于描述生 物学过程,无论是作为静态的“瞬象”或作为动态过程的表现。
3)测定对提示和扰动的一个或多个细胞反应,包括但不限于生 物能量学谱、细胞增殖、细胞凋亡和细胞器功能。真正的基因型-表 型相关性是通过采用功能模型(如ATP、ROS、OXPHOS、Seahorse分 析、胱天蛋白酶分析、迁移分析、趋化性分析、管形成分析等等)实现的。这样的细胞反应代表生物学过程(或其模型)中对相应的mRNA/ 蛋白质表达的状态以及上面2)中的任何其他相关状态做出响应的细 胞反应。
4)通过采用基于人工智能(基于AI)的信息学系统或平台,整 合在3)中获得的功能分析数据和在2)中获得的蛋白质组学和其它 数据,并确定由因果关系驱动的蛋白质相关性。这样的基于AI的系 统是基于,优选仅基于,2)和/或3)中得到的数据集,而不采用关于该生物学过程的现有知识。优选地,没有数据点被统计地或人为地 切除。相反,所有得到的数据被送入AI系统中用于确定蛋白质相关 性。整合过程的一个目标或输出是不同生物学状态(例如,疾病对正 常状态)之间的一个或多个差异网络(另外在本文中可称为“Δ网络”, 或者在某些情况下视情况而称为“Δ-Δ网络”)。
5)确定基于AI的信息学平台的输出的特征以考察各活性中枢作 为潜在治疗靶标和/或生物标志物。这样的谱分析可以基于所获得的数 据集完全在计算机中进行而无需采用任何实际的湿式实验室试验 (wet-lab experiment)。
6)通过采用分子和细胞技术验证活性中枢。这种用基于细胞的 湿式实验室实验对输出进行的信息后验证(post-informatic validation) 可以是任选的,但它们有助于建立全循环的探询。
以上概述的任何或所有途径可以用在涉及任何生物学过程的任 何特定应用中,其取决于(至少部分地取决于)具体应用的性质。也 就是说,上文所述的一个或多个途径可以被省略或修改,并且可以采 用一个或多个附加的途径,其取决于具体的应用。
提供了说明该平台的各种图表。特别是,在图1中描述了使用该 平台鉴别治疗剂的示例性途径的图解。图2中描述了癌症的系统生物 学和综合的多生理交互式输出调节的结果的图解。图3中描述了使用 MIMS的生物相关性系统探询的图解。图4中描述了建模癌症网络以 实现探询式生物查询的图解。图5和6中描述了探询式生物学平台和 平台中所使用的技术的图解。图7中描述了包括数据采集、数据整合 和数据挖掘的平台成分的示意图。图8中描述了使用MIMS的系统探 询和来自“组学”级联的响应数据收集的示意图。
图14是示例性方法10的高水平流程图,其中显示了可以被用来 执行该示例性方法的示例性系统的成分。首先,使用通常与生物学过 程相关联的细胞建立生物学过程(例如,疾病过程)和/或生物学过程 的成分(例如,疾病生理学和病理生理学)的模型(例如,体外模型) (步骤12)。例如,细胞可以是通常参与生物学过程(例如,疾病) 的人来源的细胞。细胞模型可包括该生物学过程(例如,疾病)特定 的各种细胞提示、状态和/或扰动。在理想的情况下,细胞模型表示各 种(疾病)状态和生物学过程(例如,疾病)的通量成分而不是生物 学过程的静态评估。对比细胞模型可包括对照细胞或正常(如非病变 的)细胞。细胞模型的附加说明出现在下面的III.A和IV部分中。
第一数据集是使用任何已知的方法或系统(例如,定量的聚合酶 链反应(qPCR)和蛋白质组学分析工具,如质谱(MS))从生物学 过程的细胞模型获得,其包括表示多个基因(例如,mRNA和/或蛋 白质印记)的表达水平的信息(步骤16)。
第三数据集从生物学过程的对比细胞模型获得(步骤18)。第三 数据集包括代表来自对比细胞模型的对比细胞中多个基因的表达水 平的信息。
在本发明方法的某些实施方式中,这些第一和第三数据集在本文 中统称为“第一数据集”,其表示与生物系统相关的细胞(包括对比细 胞的所有细胞)中多个基因的表达水平。
可以从一个或多个mRNA和/或蛋白质印记分析系统得到第一数 据集和第三数据集。第一和第三数据集中的mRNA和蛋白质数据可 以代表对环境和/或扰动的生物反应。在适用和可能的情况下,脂质组 学、代谢组学和转录组学数据也可以被整合作为生物学过程的补充或 替代测量。SNP分析是可以有时使用在该方法中的另一成分。它可以 有助于调查,例如,单核苷酸多态性(SNP)或特定的突变对生物学 过程是否有任何影响。数据变量可以被用于描述生物学过程,无论是 作为静态的“瞬象”,还是作为动态过程的表示。有关获取表示细胞中 多个基因的表达水平的其他描述见以下的III.B部分。
第二数据集从生物学过程的细胞模型获得,其包括表示细胞的功 能活性或反应的信息(步骤20)。类似地,第四数据集从生物学过程 的对比细胞模型获得,其包括表示对比细胞的功能活性或反应的信息 (步骤22)。
在本发明方法的某些实施方式中,这些第二和第四数据集在本文 中统称为“第二数据集”,其表示与生物系统相关的细胞(包括对比细 胞的所有细胞)的功能活性或细胞反应。
可以使用一个或多个功能分析系统以获得有关细胞或对比细胞 的功能活性或反应的信息。关于对提示和扰动的功能性细胞反应的信 息可包括,但不限于,生物能量学谱、细胞增殖、细胞凋亡和细胞器 功能。过程和途径的功能模型(例如,三磷酸腺苷(ATP)、活性氧 物质(ROS)、氧化磷酸化(OXPHOS)、Seahorse分析、胱光蛋白 酶分析、迁移分析、趋化性分析、管形成分析等)可以被用来获得真 正的基因型-表型相关性。功能活性或细胞反应表示在生物学过程(或 其模型)中的细胞响应于mRNA/蛋白质表达的相应状态以及任何其 他相关应用的状态或扰动的反应。在下面III.B部分中提供有关获得 表示细胞的功能活性或反应的信息的附加信息。
该方法还包括在细胞和对照细胞中生成生物学过程的计算机执 行的模型。例如,可对于细胞模型从第一数据集和第二数据集生成在 所述多个基因的表达水平与所述功能活性或细胞反应之间的一个或 多个(例如,一整套)因果关系的贝叶斯网络(“生成的细胞模型网 络”)(步骤24)。生成的细胞模型网络(单独或共同地)包括关于 关系的定量概率定向信息。所生成的细胞模型网络不是基于来自第一 数据集和第二数据集的信息以外的基因表达和/或功能活性或细胞反 应之间的已知生物学关系。一个或多个生成的细胞模型网络可统称为 一致细胞模型网络。
可对于对比细胞模型从第一数据集和第二数据集生成在多个基 因的表达水平与功能活性或细胞反应之间的一个或多个(例如,一整 套)因果关系的贝叶斯网络(“生成的对比细胞模型网络”)(步骤26)。 生成的对比细胞模型网络(单独地或共同地)包括关于关系的定量概 率定向信息。所生成的细胞网络不是基于第一数据集和第二数据集中 的信息以外的基因表达和/或功能活性或细胞反应之间的已知生物学 关系。一个或多个生成的对比模型网络可统称为一致细胞模型网络。
可以使用基于人工智能(基于AI)的信息学平台建立所述生成的 细胞模型网络和生成的对比细胞模型网络。关于建立生成的细胞模型 网络、建立生成的对比细胞模型网络和基于AI的信息学系统的进一 步细节出现在下面III.C部分和图15A-16的描述中。
应当指出的是,可以采用许多不同的基于AI的平台或系统来生 成包括定量概率定向信息的因果关系的贝叶斯网络。虽然本文所描述 的某些实施例采用一个特定的可商业获得的系统,即,来自GNS(剑 桥,MA)的REFSTM(逆向工程/正向模拟),但对于实施方式并没 有限制。适合实施一些实施方式的基于AI的系统或平台采用数学算 法以在输入变量(例如,第一和第二数据集)之间建立因果关系,其 仅仅基于输入的数据而没有考虑到之前存在的关于任何潜在的、已建 立的和/或验证的生物学关系的知识。
例如,基于AI的REFSTM信息学平台利用实验得到的粗的(原始 的)或最少加工的输入生物学数据(如遗传、基因组学、外遗传、蛋 白质组学、代谢组学和临床数据),并迅速执行万亿次计算以确定在 完整系统中分子如何相互作用。基于AI的REFSTM信息学平台执行逆向工程过程,其旨在基于定量表示基础生物系统的输入数据建立计算 机实施的细胞模型(例如,生成的细胞模型网络)。另外,为获得预 测,可以在计算机执行的细胞模型的基础上开发和快速模拟关于基础 生物系统的假设,伴有关于假设的相关的置信水平。
通过这种方式,由定量的计算机实施的细胞模型表示生物系统, 其中模拟“干扰”来了解生物系统(例如,疾病)的详细机制、有效的 干预策略和/或确定哪些患者会对给定的治疗方案做出反应的临床生 物标志物。传统的生物信息学和统计学方法,以及基于已知生物学的 建模的方法,通常不能提供这些类型的见解。
建立了生成的细胞模型网络和生成的对比细胞模型网络后,对它 们进行比较。鉴别至少存在于一些所生成的细胞模型网络中且在生成 的对比细胞模型网络中不存在或具有至少一个显著不同的参数的一 个或多个因果关系(步骤28)。这样的对比可以导致建立差异网络。 可以使用差异网络建立模块进行对比、鉴别和/或差异(Δ)网络建立, 其在下面的III.D部分和针对图26的说明进一步详细描述。
在一些实施方式中,输入数据集是来自一种细胞类型和一种对比 细胞类型,其基于该一种细胞类型建立一套细胞模型网络和基于该一 种对比对照细胞类型建立另一套对比细胞模型网络。可以在该一种细 胞类型的该整套网络和对比细胞类型的该整套网络之间进行差分。
在其它实施方式中,输入数据集是来自多种细胞类型(例如,两 种或更多种癌症细胞类型、两种或更多种不同血管生成状态的细胞类 型,例如通过不同促血管生成刺激诱导的)和多种对比细胞类型(例 如,两种或更多种正常的非癌性细胞类型、两种或更多种非血管生成 和血管生成细胞类型)。可以分别对于每个细胞类型和每个对比细胞 类型单独地生成一整套细胞模型网络,和/或来自多种细胞类型和多种 对比细胞类型的数据可以组合成各自的复合数据集。复合数据集生成 与多种细胞类型(复合数据)对应的一整套网络,和生成与多种对比 细胞类型(对比复合数据)对应的另一整套网络。可以对用于复合数 据的该整套网络对比于用于对比复合数据的该整套网络执行差分。
在一些实施方式中,可以在两个不同的差异网络之间执行差分。 该输出可被称为Δ-Δ网络,并且在下面针对图26进行描述。
可以为生成的细胞模型网络中的每个关系确定定量关系信息(步 骤30)。类似地,可以确定生成的对比细胞模型网络中每个关系的定 量关系信息(步骤32)。有关该关系的定量信息可以包括表示因果关 系的指令、有关该关系的统计不确定性的量度(例如,曲线下面积 (AUC)的统计测量)和/或该关系的强度的定量幅度(例如,一倍) 的表示。可以使用定量关系信息确定生成的细胞模型网络中的各种关 系的特性,来探索网络中作为潜在治疗靶标和/或生物标志物的每个活 性中枢。这样的分析可以完全在计算机中基于来自生成的细胞模型网 络的结果进行而没有采用任何实际的湿式实验室实验。
在一些实施方式中,可以通过采用分子和细胞技术对网络中活性 的中枢进行验证。这种用湿式实验室的基于细胞的实验对输出的信息 后验证不需要执行,但它可以帮助建立探询的完整循环。图15示意 性地描绘了示例性的基于AI的信息学系统(例如,基于AI的REFSTM信息学系统)的功能性和基于AI的系统与探询式生物学平台(“平台”) 的其他成分或部分之间相互作用的简化高水平图示。在图15A中,从 生物学过程的模型(例如,疾病模型)获得的各种数据集,如药物的 剂量、治疗剂量、蛋白质表达、mRNA表达和许多相关功能测量(如 OCR、ECAR)的任何一种被送入基于AI的系统中。如图15B所示, AI系统在被称为贝叶斯片段计数(Bayesian Fragment Enumeration)的 过程中从输入的数据集创建“网络片段”文库,其包括驱动生物学过程 (例如,疾病)中的分子机制的变量(蛋白质、脂质和代谢物)(图 15B)。
在图15C中,基于AI的系统选择文库中的网络片段的子集,并 从该片段构建初始试验网络。基于AI的系统也选择文库中网络片段 的不同子集来构建另一初始试验网络。最终从文库中网络片段的不同 子集建立一整套初始试验网络(例如,1000个网络)。该过程可以被 称为平行总体采样。整体中的各个试验网络通过从文库中增加、减去 和/或替代额外的网络片段进行进化或优化。如果得到附加数据,该附 加数据可被结合到网络文库的网络片段中,并且可以通过各个试验网 络的进化被结合到整套试验网络中。优化/进化过程完成后,整套试验 网络可以被描述为生成的细胞模型网络。
如图15D中所示,整套生成的细胞模型网络可以用来模拟生物系 统的行为。模拟可用于预测生物系统对于条件变化的行为,这可以使 用基于细胞的或基于动物的湿式实验室实验来验证。另外,可以使用 模拟功能,通过向每个节点单独地施加模拟的扰动而同时观察对所生 成的细胞模型网络中其他节点的影响,来得到在所生成的细胞模型网 络中关系的定量参数。在下面的III.C部分中提供进一步的细节。
在图15A-15D中描绘的基于AI的信息学系统的自动化逆向工程 过程建立了一整套生成的细胞模型网络,它是该细胞的无偏的和系统 的基于计算机的模型。
该逆向工程决定了数据中的分子测量之间概率定向网络连接,和 感兴趣的表型结果。分子测量中的变异使得能够学习这些实体和终点 变化之间的概率的原因和效应关系。平台的机器学习特性也使得交叉 训练和不断进化的基于数据集的预测成为可能。
数据中分子测量之间的网络连接是“概率性的”,部分地因为连接 可以基于由计算机算法“学习”的观察数据集之间的相关性。例如,如 果基于数据集的统计分析,蛋白质X和蛋白质Y的表达水平是正相 关或负相关的,则可以分配因果关系以建立蛋白质X和Y之间的网 络连接。这种推定的因果关系的可靠性可以由该连接的似然性进一步 定义,其可以通过p值测定(例如,p<0.1、0.05、0.01等)。
数据中分子测量之间的网络连接是“定向的”,部分地是因为分子 测量之间的网络连接,如由反向工程过程所确定的,反映连接的基因 /蛋白质之间关系的原因和效应,以使得提高一种蛋白质的表达水平可 能导致其他蛋白质的表达水平上升或下降,这取决于该连接是刺激性 的还是抑制性的。
数据中分子测量之间的网络连接是“定量的”,部分地因为分子测 量之间的网络连接,如通过该方法所确定的,可以在计算机中基于现 有的数据集和与其相关的概率测量来模拟。例如,在分子测量之间所 建立的网络连接中,理论上可能会增加或减少(例如,增加或减少1、 2、3、5、10、20、30、50、100倍或更高)给定蛋白质的表达水平(或 在网络中的“节点”),和定量模拟其对网络中其它连接的蛋白质的影 响。
数据中分子测量之间的网络连接是“无偏的”,至少部分地因为没 有数据点被统计地或人为地切除,和部分地因为该网络连接是仅基于 输入的数据,而不涉及关于所讨论的生物学过程的现有知识。
数据中分子测量之间的网络连接是“系统的”和(无偏的),部分 地因为所有输入变量之间的所有潜在连接已被系统地考察,例如,以 成对的方式。执行这种系统性探测的计算能力的可靠性随着输入变量 数的增加而呈指数地提高。
在一般情况下,一整套约1000个网络通常足以预测所有被测实 体之间的概率因果定量关系。该整套网络捕获数据中的不确定性,且 使得对于每个模型预测计算置信度量成为可能。使用该整套网络一起 产生预测,其中整套中单个网络的预测中的差异代表预测的不确定性 程度。此特征使得能够对于从模型生成的临床反应的预测分配置信量 度。
一旦模型进行逆向工程,可以对整套模型进行进一步模拟质询以 确定所讨论的生物学过程如疾病状态的关键分子驱动子。
图9中描述了用于建立代表正常和糖尿病状态的示例性体外模型 的成分的略图。图10描述了用来生成蛋白质(因为它们涉及到疾病 的病理生理学)的因果网络的示例性信息学平台REFSTM的示意图。 图11中描述了导致生成糖尿病与正常状态的差异网络的示例性方法 和通过用MIMS治疗恢复到正常状态的糖尿病节点的示意图。图12 描述了糖尿病与正常状态的代表性差异网络。图13中描述了感兴趣 的节点和相关边界(中心的Node1)以及与各个边界相关的细胞功能 性的示意图。
已在上面概述了本发明,下面的章节中提供了结合可以使用本发 明的方法分析的一个或多个特定的生物系统对于总体发明的各个方 面或元素的更详细描述。然而,应当指出,对以下仅供说明之用的特 定的生物系统没有限制。与此相反,其意图是可以同样使用所述的平 台技术分析包括任何的替代、修改及其等同物的其他不同的生物系 统。
II、定义
如本文所用的,旨在特别地定义但在本说明书的其他部分中尚未 定义有某些术语在此进行定义。
在本文中使用的冠词“一”和“一个”指一个或一个以上的(即,至 少一个)该冠词的语法对象。通过举例的方式,“一元素”是指一个元 素或一个以上的元素。
本文所用的术语“包括”的意思是短语“包括但不限于”并可与之互 换使用。
本文所使用的术语“或”的意思是术语“和/或”,并可与之互换使 用,除非上下文另有明确说明。
本文所用的术语“例如”是指短语“例如但不限于”,并可与之互换 使用。
“代谢途径”指的是将一种化合物转化为另一种化合物并为细胞功 能提供中间体和能量的酶介导的反应序列。代谢途径可以是直链的或 环状的或支链的。
“代谢状态”是指在给定时间点,通过各种化学和生物指标(因为 它们涉及健康或疾病的状态)测量的特定细胞、多细胞或组织环境的 分子含量。
“血管生成”指的是涉及从预先存在的血管生长新血管的生理过 程。血管生成包括至少血管内皮细胞的增殖、(通常响应于趋化剂的) 血管内皮细胞的迁移、(通常通过基质金属蛋白酶产生导致的)细胞 外基质的降解、基质金属蛋白酶产生、管形成、血管内腔形成、血管 出芽、粘附分子表达(通常整联蛋白表达)和分化。取决于培养系统 (例如,一维对三维)和细胞类型,血管生成的各个方面可以在体外 以及体内生长的细胞中观察到。血管生成细胞或呈现血管生成细胞的 至少一种特性的细胞表现出如上所述的1、2、3、4、5、6、7、8、9 种或更多种特性。血管生成的调节子提高或降低至少一种本文中提供 的特性。血管生成不同于作为血管的自发形成的血管发生 (vasculogenesis)或者套迭是通过现有血管的分裂形成新血管的术语。
术语“微阵列”指的是在基材,如纸、尼龙或其他类型的膜、过滤 器、芯片、玻璃载片或任何其它合适的固体支持物上合成的不同多核 苷酸、寡核苷酸、多肽(例如,抗体)或肽的阵列。
术语“紊乱”和“疾病”包含地使用且指与身体的任何部分、器官或 系统(或它们的任意组合)的正常结构或功能的任何偏离。特定的疾 病是通过特征性症状和体征表现的,包括生物的、化学的和物理的变 化,并往往与多种其他因素相关,包括但不限于,人口统计学、环境、 职业、遗传和医疗史因素。可以通过多种方法量化一定的特征性体征、 症状及相关因素以得到重要的诊断信息。
术语“表达”包括通过其从多核苷酸,如DNA产生多肽的过程。 该过程可以包括基因转录成mRNA,和该mRNA翻译成多肽。根据 其使用的上下文,“表达”可以指RNA、蛋白质或两者的产生。
术语“基因的表达水平”或“基因表达水平”是指在细胞中由该基因 编码的mRNA以及前mRNA新生转录本、转录加工中间体、成熟 mRNA和降解产物的水平,或蛋白质的水平。
术语“调节”指反应的上调(即,激活或刺激)、下调(即,阻遏 或抑制),或其组合或分开的两者。“调节子”是调节的化合物或分子, 并且可以是,例如,激动剂、拮抗剂、活化剂、刺激剂、阻遏物或抑 制剂。
短语“影响调节子”理解为改变调节子的表达、改变调节子的水 平或改变调节子的活性。
如本文所用的术语“三乙醇胺(Trolamine)”是指Trolamine NF、Triethanolamine、TEAlan 99%、Triethanolamine 99%、Triethanolamine NF或Triethanolamine 99%NF。这些术语在本文中可 互换使用。
术语“基因组”是指生物实体(细胞、组织、器官、系统、生物体) 的遗传信息的全部。它是以DNA或RNA(例如,在某些病毒中)编 码的。基因组包括基因和DNA的非编码序列。
术语“蛋白质组”是指由基因组、细胞、组织或生物体在给定时间 表达的蛋白质的整个集合。更具体地说,它可以指在限定的状态下在 给定时间给定类型的细胞或生物体中表达的蛋白质的整个集合。蛋白 质组可以包括由于例如,基因的选择性剪接和/或翻译后修饰(如糖基 化或磷酸化)导致的蛋白质变体。
术语“转录组”是指在给定的时间一个或一群细胞中产生的转录 RNA分子的整个集合,包括mRNA、rRNA、tRNA、微RNA、dicer 底物RNA和其他非编码RNA。该术语可被应用于给定的生物体中转 录本的总集,或应用于在特定细胞类型中存在的转录本的特定子集。 与对于给定的细胞系大致固定(不包括突变)的基因组不同,转录组 可以随外部环境条件而变化。因为细胞中包括了所有的mRNA转录 物,转录组反映了在任何给定的时间活跃地表达的基因,除了mRNA 降解现象,如转录弱化。
转录组学的研究(也被称为表达谱)考察给定的细胞群中mRNA 的表达水平,通常采用基于DNA微阵列技术的高通量技术。
术语“代谢组”是指在给定状态下在给定时间在生物样品内,如单 一有机体中,发现的小分子代谢物(如代谢中间体、激素和其他信号 分子和次级代谢产物)的完整集合。代谢组是动态的,且可以随时地 (from second to second)改变。
术语“脂质组”是指在给定状态下在给定时间在生物样品(如单一 生物体中)发现的脂质的完整集合。脂质组是动态的,且可以随时改 变。
术语“相互作用组(interactome)”是指在研究中的生物系统(例如, 细胞)中分子相互作用的整个集合。它可以被显示为定向的图形。分 子相互作用可以发生在属于不同的生物化学家族(蛋白质、核酸、脂 质、碳水化合物等)且也在给定家族内的分子之间发生。当在蛋白质 组学方面来说,相互作用组是指蛋白质-蛋白质相互作用网络(PPI), 或蛋白质相互作用网络(PIN)。另一个广泛研究的相互作用组类型 是蛋白质-DNA相互作用组(转录因子形成的网络(和DNA或染色 质调节蛋白质)和其靶基因)。
术语“细胞输出”包括涉及细胞状态的参数的集合,优选可测量的 参数,所述细胞的状态包括(不限于):一个或多个基因的转录水平 (例如,通过RT-PCR、qPCR、微阵列等可测量的)、一种或多种蛋 白质的表达水平(例如,通过质谱法或蛋白质印迹等可测量的)、一种或多种酶或蛋白质的绝对活性(例如,作为底物转化率可测量的) 或相对活性(例如,作为与最大活性相比的%值可测量的)、一种或 多种代谢物或中间体的水平、氧化磷酸化水平(例如,通过耗氧率或 OCR可测量的)、糖酵解水平(例如,通过细胞外酸化率或ECAR 可测量的)、配体-靶结合或相互作用的程度、细胞外分泌分子的活 性等。细胞输出可以包括预先确定数的靶基因或蛋白质等的数据,或 者可以包括对所有可检测的基因或蛋白质的整体评估。例如,可使用 质谱法来确定和/或定量在给定的样品或细胞群体中表达的所有可检 测的蛋白质,而没有在样品或细胞群体是否可以表达任何特定蛋白质 的先前知识。
如本文所用的“细胞系统”包括同质的或异质的细胞群体。在系统 内的细胞可以在自然的或生理的环境下在体内生长,或者可以在体外 生长,例如,在受控的组织培养环境中。在系统内的细胞可以是相对 同质的(例如,不低于70%、80%、90%、95%、99%、99.5%、99.9 %同质的),或者可以包含两种或更多种细胞类型,如通常发现在体 内密切接近生长的细胞类型,或可以通过例如旁分泌或其他长距离细 胞间通讯在体内彼此相互作用的细胞类型。细胞系统内的细胞可以源 自建立的细胞系,包括癌细胞系、永生细胞系或正常细胞系,或可以 是原代细胞或新从活组织或器官分离的细胞。
细胞系统中的细胞通常与可以提供营养物、气体(氧气或二氧化 碳等)、化学品或蛋白质性的/非蛋白质性的刺激物(其可以限定影响 细胞行为的条件)的“细胞环境”接触。细胞环境可以是具有限定的化 学成分和/或不太明确限定的组织提取物或血清成分的化学介质,并且 可以包括细胞在其中生长的特定pH、CO2含量、压力和温度。或者, 细胞环境可以是在体内发现的对于特定细胞系统的天然的或生理的 环境。
在某些实施方式中,细胞环境包括模拟生物系统或过程的方面的 条件,例如,模拟疾病状态、过程或环境。这样的培养条件包括,例 如,高血糖、缺氧或富乳酸条件。本文描述了许多其他此类条件。
在某些实施方式中,特定细胞系统的细胞环境还包括细胞系统的 某些细胞表面特征,如细胞表面上的受体或配体的类型和它们各自的 活性、碳水化合物或脂质分子的结构、膜极性或流动性、某些膜蛋白 质的成簇状态等。这些细胞表面特征可以影响附近细胞的功能,如属 于不同细胞系统的细胞。然而,在某些其它实施方式中,细胞系统的 细胞环境不包括细胞系统的细胞表面特征。
细胞环境可以被改变成为“改变的细胞环境”。变化可以包括在细 胞环境中发现的任何一个或多个成分的改变(例如,增加或减少), 包括向细胞环境添加一种或多种“外部刺激成分”。环境扰动或外部刺 激成分可以是细胞环境内源的(例如,细胞环境包含了某些水平的刺 激物,和添加更多相同的刺激物以提高其水平),或者可以是细胞环 境外源的(例如刺激物大多不存在于改变前的细胞环境中)。细胞环 境还可以通过添加外部刺激成分导致的继发性变化而改变,由于外部 刺激成分可以改变细胞系统的细胞输出,包括通过细胞系统分泌到细 胞环境中的分子。
如本文所用的“外部刺激成分”,在这里也称为“环境扰动”,包括 可能影响细胞功能的任何外部的物理和/或化学刺激。这可以包括任何 大或小的有机或无机分子、天然或人工合成的化学物质、温度转变、 pH变化、辐射、光(UVA,UVB等)、微波、声波、电流、调制的或未调制的磁场等。
术语“多维细胞内分子(MIM)”是身体自然产生的和/或存在于人 的至少一个细胞中的内源性分子的分离形式或合成产生的形式。MIM 能够进入细胞,且进入细胞包括完全或部分进入细胞,只要分子的生 物活性部分整体进入细胞。MIM能够诱导细胞内的信号转导和/或基 因表达机制。MIM是多维的,因为分子具有治疗剂和载体(例如, 药物递送)效果两者。MIM是多维的,还因为分子在疾病状态中以 一种方式起作用和在正常状态中以不同方式起作用。例如,在辅酶 Q10的情况下,在VEGF存在下向黑色素瘤细胞施用辅酶Q10导致Bcl2水平下降,这随之导致黑色素瘤细胞的致癌潜力降低。与此相反, 在正常的成纤维细胞中,共同施用辅酶Q-10和VEFG对Bcl2水平没 有影响。
在一个实施方式中,MIM也是表观代谢转变剂。在另一个实施方 式中,MIM不是表观代谢转变剂。在另一个实施方式中,MIM特征 在于一个或多个上述功能。在另一个实施方式中,MIM特征在于两 个或更多个上述功能。在进一步的实施方式中,MIM特征在于三个 或更多个上述功能。而在另一实施方式中,MIM特征在于上述的所 有功能。本领域技术人员将会理解,本发明的MIM还意图包括两种 或更多种内源性分子的混合物,其中所述混合物特征在于一个或多个 上述功能。在该混合物中的内源性分子以一定比率存在以使得该混合物作为MIM发挥功能。
MIM可以是基于脂质或非基于脂质的分子。MIM的例子包括, 但不限于,辅酶Q10、乙酰Co-A、棕榈酰Co-A、左旋肉碱、氨基酸 如,例如,酪氨酸、苯丙氨酸和半胱氨酸。在一个实施方式中,MIM 是小分子。在本发明的一个实施方式中,MIM不是辅酶Q10。本领域 技术人员可以使用本文中详细描述的任何分析方法常规在鉴别MIM。 在US 12/777,902(US 2011-0110914)中进一步详细描述了MIM,其全 部内容明确地并入本文作为参考。
如本文所用的“表观代谢转变剂”(表观转换剂)是调节从健康(或 正常)的状态转变为疾病状态(反之亦然)的代谢转换的分子,从而 在人体内保持或重建细胞、组织、器官、系统和/或宿主健康。表观代 谢转变剂能够完成组织微环境的正常化。例如,表观代谢转变剂包括 当被添加到细胞中或从细胞耗尽时能够影响细胞的微环境(例如,代 谢状态)的任何分子。本领域技术人员将会理解,本发明的表观代谢 转变剂还意图包括两种或更多种分子的混合物,其中所述混合物特征 在于一个或多个上述功能。该混合物中的分子以一定比例存在以使得 该混合物作为表观代谢转变剂发挥功能。表观代谢转变剂的实例包 括,但不限于,辅酶Q10;维生素D3;ECM成分如纤连蛋白;免疫 调节剂,如TNFα或任何白细胞介素,如IL-5、IL-12、IL-23;血管 生成因子和细胞凋亡因子。
在一个实施方式中,表观代谢转变剂也是MIM。在一个实施方式 中,表观代谢转变剂不是辅酶Q10。本领域技术人员可以使用本文中 详细描述的任何分析常规地鉴别表观代谢转变剂。US 12/777,902(US 2011-0110914)中进一步详细描述了表观代谢转变剂,其全部内容明 确地并入本文作为参考。
其他在本申请中未明确定义的术语具有与本领域普通技术人员 所理解的相同的含义。
III、平台技术的示例性步骤和成分
仅用于说明目的,所述平台技术的以下步骤可以在下文作为用于 整合从定制的癌模型获得的数据和用于鉴别驱动癌症发病的新蛋白 质/途径的示例性用途被描述。从这一分析所得的关系图谱提供癌症治 疗靶标以及与癌症相关的诊断/预后标志物。然而,所述平台技术具有 对于任何生物系统或过程的普遍适用性,并不限于任何特定的癌症或 其他特定的疾病模型。
此外,虽然下面的描述在某些部分中作为离散的步骤呈现,但它 是用于说明的目的和简单的原因,因此,在现实中,这并不意味着这 样的严格的步骤顺序和/或分界。此外,本发明的步骤可以独立地进行, 且此处提供的本发明意图单独地包含各单个步骤,以及所述平台技术 的一个或多个步骤(例如,任何一个、两个、三个、四个、五个、六 个或所有七个步骤)的组合,其可以独立于其余的步骤而进行。
本发明还意图包括作为本发明的独立成分和实施方式的平台技 术的所有方面。例如,所生成的数据集意图是本发明的实施方式。作 为进一步的例子,生成的因果关系网络、生成的一致因果关系网络和 /或生成的模拟因果关系网络也意图是本发明的实施方式。确定为生物 系统中独特的因果关系意图是本发明的实施方式。另外,对于特定生 物系统定制的模型也意图是本发明的实施方式。例如,用于疾病状态 或过程定制的模型,如,例如,血管生成模型、癌症、肥胖症/糖尿病 /心血管疾病的细胞模型或者药物的毒性(如心脏毒性)的定制模型也 意图是本发明的实施方式。
A、定制模型构建
平台技术的第一步是建立用于生物系统或过程的模型。
1.血管生成模型
体外和体内血管生成模型是已知的。例如,在实施例中详细地提 供了使用人脐带血管内皮细胞(HUVEC)的体外模型。简而言之,当 HUVEC在亚汇合培养物中生长时,它们呈现血管生成细胞的特性。 当HUVEC在汇合培养物中生长时,它们不呈现血管生成细胞的特性。 血管生成级联中的大多数步骤可以在体外分析,包括内皮细胞增殖、 迁移和分化。增殖研究是基于细胞计数、胸苷掺入或细胞增殖(通过 测量PCNA)或细胞死亡(通过末端脱氧核苷酸转移酶介导的dUTP 缺刻末端标记或Tunel分析)的免疫组织化学染色。趋化性可以在由 滤膜分隔的上孔和下孔组成的博伊登室中检验。趋化性溶液置于下孔 中,细胞添加到上孔,且在孵育期后,已经朝向趋化刺激迁移的细胞 在膜的下表面上计数。细胞迁移也可以使用在以下实施例中提供的 “划痕”分析进行研究。分化可以在体外通过在不同ECM成分(包 括二维和三维纤维蛋白凝块、胶原凝胶和基质胶)中培养内皮细胞诱 导。微血管也已证明从嵌入三维纤维蛋白凝胶中的大鼠主动脉环生 成。基质金属蛋白酶表达可以通过酶原分析方法进行分析。
视网膜脉管系统在小鼠中在出生时未完全形成。血管生长和血管 生成已在这一模型中详细研究。分段的视网膜可以用于分析作为正常 生物学过程的血管生成。
鸡绒毛尿囊膜(CAM)分析是本领域中公知的。鸡幼胚缺乏成熟的 免疫系统且因此用于研究肿瘤诱导的血管生成。组织移植物通过蛋壳 中形成的窗口置于CAM上。这引起血管朝向移植物的典型径向重排 和植入后四天内移植物周围血管的明显增加。进入移植物的血管在立 体显微镜下计数。为评估测试物质的抗血管生成和血管生成活性,化 合物在慢释聚合物药丸中制备,通过明胶海绵吸附或在塑料盘上空气 干燥且随后植入到CAM上。已经描述了CAM分析的几种变型,包 括无壳胚在皮氏皿中的培养和不同定量方法(即,使用放射标记的脯 氨酸测量基底膜生物合成的速率、在显微镜下计数血管数目或成像分 析)。
角膜呈现体内无血管位点。因此,从边缘穿透到角膜基质中的任 何血管可以确定为新形成的。为诱导血管生成反应,缓释聚合物药丸[即,聚-2-羟基乙基-甲基丙烯酸酯(Hydron)或乙烯-乙酸乙烯酯共聚物 (ELVAX)](包含血管生成物质(即,VEGF的FGF-2))植入在兔的角 膜基质中形成的“囊袋”中。并且,多种多样的组织、细胞、细胞提 取物和条件化培养基已经检验其对角膜中血管生成的作用。血管反应 可以在用India墨水灌注角膜后通过计算机图像分析进行定量。角膜 可以使用本文中提供的平台方法收获和分析。
是称为Engelbreth-Holm-Swarm鼠肉瘤的小鼠基底 膜肿瘤的基质。它是基底膜蛋白质(包括层粘连蛋白、IV型胶原蛋 白、硫酸乙酰肝素、纤维蛋白)和生长因子(包括EGF、TGF-b、PDGF 和IGF-1)的复杂混合物。其先前开发用于研究体外内皮细胞分化。 但是,含FGF-2的可以皮下注射到小鼠中。在4℃下是液体但在37℃下形成固体凝胶,其封闭生长因子以使其 缓慢释放。通常,在10天后,塞除去且血管生成在塞 切片中通过组织学或形态测量方式定量。塞可以使用本 文中提供的平台方法收获和分析。
2.体外疾病模型
生物系统或过程的实例是癌症。如任何其他复杂的生物学过程或 系统一样,癌症是复杂的病理状态,其特征在于多个独特的方面。例 如,由于其高生长率,许多癌细胞适应于在缺氧状态下生长、具有上 调的糖酵解和降低的氧化磷酸化代谢途径。其结果是,与正常细胞响 应于相同处理的反应相比较,癌细胞可以对环境的扰动(例如潜在药 物的治疗)做出不同的反应。因此,与正常细胞的反应相比,破译癌 症对药物治疗的独特反应是有利的。为此,可以建立定制的癌症模型 以通过建立与癌症细胞在体内癌症中的条件非常接近的细胞培养条 件(例如,在体内的肿瘤内)模拟癌细胞的环境,或通过分离癌细胞 的不同生长条件模仿癌生长的各个方面。
一个这样的癌症“环境”或生长应激状态是缺氧状态,这是通常在 实体瘤内发现的状态。缺氧可以使用该领域公认的方法在细胞中诱 导。例如,缺氧可以通过将细胞系统放置在模块化培养箱(MIC-101, Billups-Rothenberg Inc.Del Mar,CA)中诱发,其可以用含5%CO2、2 %O2和93%氮的工业气体混合物冲洗。可以在预先确定的时期后, 如在缺氧处理后24小时,在具有或没有额外的外部刺激成分(例如, 0、50或100μM的辅酶Q10)的情况下测量效果。
同样,细胞的乳酸处理模仿其中糖酵解活性高的细胞环境,如体 内癌症环境中存在的。可以在预先确定的时间,例如,在24小时时, 在具有或没有额外的外部刺激成分(例如,0、50或100μM的辅酶 Q10)的情况下在约12.5mM的最终乳酸浓度下调查乳酸诱导的应激。
高血糖是通常见于糖尿病中的状态,然而,高血糖也在一定程度 上模仿癌生长的一个方面,因为许多癌细胞依赖于葡萄糖作为其主要 的能量来源。将所述细胞暴露于典型的高血糖条件可包括向合适的培 养基加入10%的培养级的葡萄糖,以使得培养基中的葡萄糖的终浓度 为约22mM。
可以在定制的癌症模型中独立地研究反映癌生长的不同方面的 单独情况,和/或可以结合在一起研究。在一个实施方式中,在定制的 癌模型中研究了至少2、3、4、5、6、7、8、9、10、15、20、25、30、 40、50或更多的反映或模拟癌的生长/状态的不同方面的状态的组合。在一个实施方式中,在定制的癌模型中研究反映或模拟癌生长/状态的 不同方面的状态的单个状态和另外地至少2、3、4、5、6、7、8、9、 10、15、20、25、30、40、50或更多状态的组合。在前述列表中给出 的所有值也可以是范围的上限或下限,其意图是本发明的部分,例如, 1至5、1至10、1至20、1至30、2至5、2至10、5至10、1至20、 5至20、10至20、10至25、10至30或10至50个不同的状态。
本文下面列出的是一些示例性的状态组合,其可用于处理细胞。 其它组合可以很容易地根据进行的特定探询式生物学评估而制订。
1、仅培养基
2、50μM CTL辅酶Q10(CoQ10)
3、100μM CTL辅酶Q10
4、12.5mM乳酸
5、12.5mM乳酸+50μM CTL辅酶Q10
6、12.5mM乳酸+100μM CTL辅酶Q10
7、缺氧
8、缺氧+50μM CTL辅酶Q10
9、缺氧+100μM CTL辅酶Q10
10、缺氧+12.5mM乳酸
11、缺氧+12.5mM乳酸+50μM CTL辅酶Q10
12、缺氧+12.5mM乳酸+100μM CTL辅酶Q10
13、培养基+22mM葡萄糖
14、50μM CTL辅酶Q10+22mM葡萄糖
15、100μM CTL辅酶Q10+22mM葡萄糖
16、12.5mM乳酸+22mM葡萄糖
17、12.5mM乳酸+22mM葡萄糖+50μM CTL辅酶Q10
18、12.5mM乳酸+22mM葡萄糖+100μM CTL辅酶Q10
19、缺氧+22mM葡萄糖
20、缺氧+22mM葡萄糖+50μM CTL辅酶Q10
21、缺氧+22mM葡萄糖+100μM CTL辅酶Q10
22、缺氧+12.5mM乳酸+22mM葡萄糖
23、缺氧+12.5mM乳酸+22mM葡萄糖+50μM CTL辅酶Q10
24、缺氧+12.5mM乳酸+22mM葡萄糖+100μM CTL辅酶Q10
作为对照,在类似的状态下培养一个或多个正常细胞系(例如, THLE2和HDFa),以便确定癌症独特的蛋白质或途径(见下文)。 对照可以是上述的对比细胞模型。
相同或不同起源的多个癌细胞(例如,癌细胞系PaCa2、HepG2、 PC3和MCF7),而不是单一癌细胞类型,可以被包括在癌症模型中。 在某些情况下,不同的癌细胞(例如,HepG2和PaCa2)之间的交互 式或ECS实验可以针对几种相互关联的目的而进行。
在一些涉及交互的实施方式中,在定义的处理条件下(例如,高 血糖,缺氧(缺血)),在细胞模型上进行的实验设计为通过另一个 细胞系统或群体(如胰腺癌PaCa2)确定一个细胞系统或群体(如肝 癌细胞HepG2)的细胞状态或功能的调制。根据典型的设置,第一细 胞系统/群体接触外部刺激成分,如候选分子(例如,小的药物分子、 蛋白质)或候选条件(例如,缺氧、高糖环境)。作出响应,第一细 胞系统/群体改变其转录组、蛋白质组、代谢组和/或相互作用组,从 而导致可以很容易地在细胞内和细胞外检测的变化。例如,转录的变 化可以通过多个目标mRNA的转录水平测量;蛋白质组的变化可以 通过多个目标蛋白质的表达水平测量;以及代谢组的变化可以通过对 给定代谢物特别设计的分析通过多个目标代谢物的水平测量。可选择 地,上述所指的代谢组和/或蛋白质组(至少关于某些分泌的代谢物或 蛋白质)的变化也可以通过他们对第二细胞系统/群体的效应进行测 量,包括第二细胞系统/群体的转录组、蛋白质组、代谢组、相互作用 组的调节。因此,该实验可用于确定第一细胞系统/群体分泌的目标分 子在不同处理条件下对第二细胞系统/群体的影响。该实验也可以用于 通过,例如,蛋白质组学差分筛选用来鉴别作为第一细胞系统(响应于外部刺激成分处理)对另一细胞系统的信号传导的结果而调节的任 何蛋白质。相同实验设置也可以适应于反向设置,以至于也可以评估 两个细胞系统间的相互影响。通常,对于这种类型的实验,细胞系对 的选择主要是基于例如来源、疾病状态和细胞功能的因素。
虽然双细胞系统通常包括在这种类型的实验设置中,但类似的实 验也可以被设计用于两个以上的细胞系统,例如,通过在单独的固相 支持物上固定各个不同的细胞系统。
定制的模型一旦建立,可以将一个或多个“扰动”应用到该系统, 如从病人与病人之间的遗传变异,或具有/没用某些药物或前药的处 理。见图15D。可以使用本领域公认的或专有的各种方法测量这种扰 动对系统的影响,包括对疾病相关的癌症细胞和疾病相关的正常对照 细胞的影响,如下文III.B节中所描述的。
在示例性的实验中,癌细胞系PaCa2、HepG2、PC3和MCF7及 正常细胞系THLE2和HDFa在高血糖、缺氧、富乳酸条件的各种条 件中以及在这些条件中两种或三种条件的所有组合中,并且另外在具 有或没有环境扰动(特别是辅酶Q10的治疗)的情况下适应。
通过实施本文中所描述的步骤,可以在本发明的平台技术的整个 步骤中建立和使用定制的细胞模型以最终确定在该生物系统中独特 的因果关系。但是,本领域技术人员可以理解,用来生成生物学过程 的初始的“第一代”一致因果关系网络的定制建立的细胞模型可以随 着时间不断地进化或扩展,例如,通过引入另外的癌症或正常细胞系 和/或另外的癌症条件。可以收集来自进化的细胞模型的另外的数据, 即来自细胞模型的新增加部分的数据。然后可以将从扩展或进化的细 胞模型(即,从细胞模型的新增加部分)收集的新数据引入先前用来 生成“第一代”一致因果关系网络的数据集,以便生成更强大的“第二代”一致因果关系网络。然后可以从“第二代”一致因果关系网络确 定该生物系统独特的新因果关系。以这种方式,细胞模型的进化提供 了一致因果关系网络的演变,从而提供对于该生物系统的调节子的新 的和/或更可靠的深入了解。
本文中详细描述了定制的细胞模型的其他实例。
B、数据收集
在一般情况下,可从任何定制的模型系统收集两种类型的数据。 一种类型的数据(例如,第一数据集,第三数据集)通常涉及某些大 分子的水平,如DNA、RNA、蛋白质、脂质等,此类别的示例性数 据集是蛋白质组学数据(例如,涉及来自样品的所有或基本上所有可 测量蛋白质的表达的定性和定量数据)。其他类型的数据一般是功能 数据(例如,第二数据集,第四数据集),其反映了第一类型数据中 的变化导致的表型改变。
对于第一类型的数据,在一些示例性实施方式中,进行定量聚合 酶链反应(qPCR)和蛋白质组学分析来通过定量聚合酶链反应(qPCR) 和蛋白质组学确定细胞mRNA和蛋白质表达的变化的特征。可以使 用市售的RNA分离试剂盒分离总RNA。cDNA合成后,可以使用用于疾病区域或细胞过程(如血管生成、细胞凋亡和糖尿病)的特定市 售qPCR阵列(例如,那些购自SA Biosciences的),按照制造商的 说明来确定一组预定基因的特征。例如,BioradCFX-384扩增系统可 用于所有的转录谱分析实验。数据收集(Ct)后,可以使用如制造商 的说明中列出的δCt方法确定相对于对照的最终倍数变化。可以按后 续章节中所描述的进行蛋白质组学样品分析。
所述方法可以采用数百个具有类似性质的样品的大规模高通量 的定量蛋白质组学分析,并提供用于确认细胞输出差异所必需的数 据。
有许多适合这一目的本领域公认的技术。下面简要地描述示例性 的技术,与质谱结合的iTRAQ分析。
定量蛋白质组学方法是基于采用8-重iTRAQ试剂的稳定同位素 标记和用于肽鉴别和定量的2D-LC MALDI MS/MS。使用这种技术的 定量是相对的:肽和蛋白质被赋予相对于参比样品的丰度比。多重 iTRAQ实验中常用的参比样品有利于整个多重iTRAQ实验中样品的 对比。
例如,要实施这种分析方案,可以按照制造商的建议将6个初始 样品和两个对照池样品组合成一个8-重iTRAQ混合物。然后可以由 二维液相色谱法将这一8样品的混合物分离,第一维度中的强阳离子 交换(SCX)和第二维度中的反相HPLC,然后可以进行质谱分析。
本文提供了可以使用的示例性实验室程序的简要概述。
蛋白质的提取:可以用8 M尿素裂解缓冲液与蛋白酶抑制剂(不 含EDTA的ThermoScientific Halt蛋白酶抑制剂)裂解细胞,并在冰 上孵育30分钟,每10分钟涡旋(vertex)5秒。可以以5秒的脉冲通过 超声波完成裂解。可以将细胞裂解物在14000×g下离心15分钟(4 ℃)以除去细胞碎片。可以进行Bradford分析以确定蛋白质的浓度。 取自各个样品的100ug蛋白质可以还原(10mM的二硫苏糖醇 (DTT),55℃,1小时)、烷基化(25mM的碘乙酰胺,室温,30 分钟)和用胰蛋白酶消化(1:25w/w,200mM三乙基碳酸氢铵 (TEAB),37℃,16小时)。
分泌组样品的制备:1)在一个实施方式中,可以将细胞培养在 无血清培养基中:可以通过冷冻干燥器浓缩条件化的培养基、还原(10 mM的二硫苏糖醇(DTT),55℃,1小时)、烷基化(25mM的碘 乙酰胺,在室温下,孵育30分钟)和然后用丙酮沉淀脱盐。可以用 胰蛋白酶(1:25w/w,200mM三乙基碳酸氢铵(TEAB),37℃,16 小时)消化来自浓缩的条件化培养基的等量蛋白质。
在一个实施方式中,细胞可以培养在含血清培养基中:可以使用 3k MWCOVivaspin柱(GE Healthcare Life Sciences)减小培养基的体 积,然后可以用1xPBS(Invitrogen)重构。可以按照制造商的说明使 用带有缓冲交换的改进以优化条件培养基应用的AlbuVoid柱 (Biotech Support Group,LLC)从所有样品中耗尽血清白蛋白质。
iTRAQ 8重标记:可以将来自各实验组中各个胰蛋白酶消化的试 样汇集在一起以建立汇集的对照样品。可以根据制造商的方案(AB Sciex)将来自各个样品和汇集的对照样品的相等试样用iTRAQ 8重 试剂标记。反应物可以组合,真空至干,通过添加0.1%甲酸再悬浮, 并通过LC-MS/MS进行分析。
2D-NanoLC-MS/MS:所有的标记肽混合物可以通过在线 2D-nanoLC分离并通过电喷雾串联质谱进行分析。实验可以在与配备 有纳米电喷射离子源(Thermo Electron,Bremen,Germany)的LTQ Orbitrap Velos质谱仪连接的Eksigent 2D nanoLC Ultra系统上进行。
可以将肽混合物以4μL/分钟的流量注入5厘米SCX柱(300μm ID,5μm,聚SULFOETHYL Aspartamide柱,来自PolyLC列,哥伦 比亚,MD),和在10个离子交换洗脱片段中洗脱到C18捕获柱(2.5 厘米,100μm ID,5μm,300埃ProteoPepII,来自New Objective,Woburn,MA)中并用H2O/0.1%FA洗涤5分钟。然后可以进一步用 2-45%B(H2O/0.1%FA(溶剂A)和ACN/0.1%FA(溶剂B))梯度 在15厘米熔融石英柱(75μm ID,5μm,300埃ProteoPepII,来自New Objective,Woburn,MA)上以300nL/分钟进行分离120分钟。
可以在Orbitrap中以30,000分辨率获得全扫描MS谱(m/z 300-2000)。可以对于使用高能C-阱解离(HCD)的片段化顺序地分 离最强的离子(最多10个)和动态排除(dynamically exclude)30秒。 可以用1.2 Da的分离宽度进行HCD。可以在分辨率为7500的Orbitrap 中扫描所产生的碎片离子。可以通过Xcalibur 2.1用foundation 1.0.1 控制LTQ Orbitrap Velos。
多肽/蛋白质鉴定和定量:可以通过使用Proteome Discoverer软件 (ThermoElectron)用Mascot搜索引擎对SwissProt数据库的自动数 据库检索鉴别多肽和蛋白质。检索参数可以包括对于MS公差(MS tolerance)的10ppm、对于MS2公差的0.02 Da和完全胰蛋白酶消化, 从而允许最多2个缺失的裂隙。脲基甲基化(C)可以设置为固定的 修饰。氧化(M)、TMT6和脱酰胺化(NQ)可以设置为动态的修饰。 肽和蛋白质的鉴定可以用Mascot显著性阈值(P<0.05)过滤。过滤 器可以容许蛋白质鉴别的99%置信水平(1%FDA)。
Proteome Discoverer软件可以对报告离子应用校正因子,且如果 不是所有定量通道都存在,可以拒绝所有的定量值。可以通过平均强 度的标准化获得相对蛋白质定量。
关于第二类型的数据,在一些示例性实施方式中,癌和正常模型 的生物能量学谱分析可以采用SeahorseTMXF24分析仪来实现对糖酵 解和氧化磷酸化成分的理解。
具体而言,可以将细胞以最佳密度接种在Seahorse培养板上。这 些细胞可以被接种在100μl的培养基或处理溶液中并置于含5%CO2的37℃培养箱中。两小时后,当细胞附着到24孔板上,可以添加另 外的150μl的培养基或处理溶液且板可留在培养温育箱内过夜。这一 两步接种程序允许细胞在培养板中均匀分布。包含氧和pH传感器的 Seahorse盒可以在37℃的无二氧化碳培养箱中在校准流体中水化过 夜。通常将三个线粒体药物加载到该盒的三个端口上。可以将寡霉素 (复合体III抑制剂)、FCCP(解偶联剂)和鱼藤酮(复合体I抑制 剂)分别加载到该盒的端口A、B和C中。可以在非缓冲的DMEM 培养基中以10倍浓度制备所有药物原液。在测定前,可以先将盒与线 粒体化合物在无CO2培养箱中孵育约15分钟。可以在含有在正常的 生长培养基中发现的浓度的葡萄糖的DMEM基非缓冲培养基中洗涤Seahorse培养板。细胞可以用630μl非缓冲培养基成层,并可以在将 其置于具有预校准盒的Seahorse仪中之前在无CO2培养箱中平衡。可 以在通过端口启动药物注射前,将该仪器运行具有混合、等待和测量 周期的三四个循环以获得基线。在引入下一药物之前可以有两个循 环。
OCR(耗氧率)和ECAR(细胞外酸化率)可以通过电极在7μl 室中记录且可以用推靠seahorse培养板的盒来建立。
C、数据整合与计算机模型生成
一旦已获得相关的数据集,可以使用基于AI的信息学系统或平 台(例如,REFSTM平台)进行数据集的整合和计算机执行的统计模 型的生成。例如,示例性的基于AI的系统可以产生蛋白质相关性的 基于模拟的网络作为代谢终点(ECAR/OCR)的关键驱动子。见图15。关于REFSTM系统的一些背景细节可见于Xing等,“Causal Modeling Using NetworkEnsemble Simulations of Genetic and Gene Expression Data Predicts GenesInvolved in Rheumatoid Arthritis”,PLoS Computational Biology,vol.7,issue.3,1-19(2011年3月)(e100105)和Periwal的 7,512,497号美国专利,其各自的全部内容以其整体明确地通过引用并 入本文。在本质上,如前面所述,REFSTM系统是基于AI的系统,它 采用数学算法来建立输入变量(例如,蛋白质表达水平、mRNA表达 水平以及相应的功能数据,如在Seahorse培养板上测量的OCR/ECAR 值)之间的因果关系。这个过程只基于单独的输入数据,而没有考虑 之前存在的关于任何潜在的、已建立的和/或验证的生物学关系的知 识。
特别是,本发明的平台的显著优势是,基于AI的系统是基于从 细胞模型获得的数据集,而不诉诸于或考虑涉及该生物学过程的本领 域中的任何现有的知识。此外,优选地,没有统计地或人为地切除数 据点,而是所有获得的数据被送入用于确定蛋白质相关性的AI系统 中。因此,从平台产生的所得统计模型是无偏的,因为他们不考虑任 何已知的生物学关系。
具体来说,可以将来自蛋白质组学和ECAR/OCR的数据输入到基 于AI的信息系统中,其如上所述地基于数据关联构建统计模型。然 后使用以下方法对各种疾病与正常情况(包括处理和条件)得到蛋白 质相关性的基于模拟的网络。
在下面相对于图16呈现用于构建生成的(例如,优化或进化的) 网络的示例性过程的详细描述。如上所述,将来自蛋白质组学的数据 和功能细胞数据输入到基于AI的系统中(步骤210)。预处理输入 数据(其可能是原始数据或最低处理的数据),其可以包括标准化(例 如,使用分位函数或内部标准)(步骤212)。预处理还可以包括输 入缺失的数据值(例如,通过使用K最近邻(K-NN)算法)(步骤 212)。
预处理的数据用来构建网络片段文库(步骤214)。网络片段定 义测量的变量(输入数据)的所有可能的小集合(如2-3个成员集合 或2-4个成员集合)之间的定量的、连续的关系。在片段中变量之间 的关系可以是线性的、逻辑的、多项的、显性或隐性纯合的等。各个 片段中的关系被赋以反映候选关系可能如何给予输入数据的贝叶斯 概率得分,且还对于其数学复杂性而惩罚该关系。通过为从输入数据 推断的所有可能的成对和三元关系(且在一些实施方式中,还有四元 关系)评分,可以识别文库中最有可能的片段(很可能片段)。也基 于输入的数据计算关系的定量参数并对于各个片段进行储存。可以在 片段列举中使用各种模型类型,包括但不限于线性回归、逻辑回归分 析、(方差分析)ANOVA模型、(协方差分析)ANCOVA模型、 非线性/多项式回归模型和甚至非参数回归。对模型参数的先验假定可以假设与模型中使用的参数的数目相关的Gull分布或贝叶斯信息标 准(BIC)罚分。在网络推论过程中,从片段文库中的片段子集构建 在一套初始试验网络中的各个网络。该套初始试验网络中的各个初始 试验网络用片段文库中不同片段子集构建(步骤216)。
构成贝叶斯网络和网络片段的基础的数学表达式的概述介绍如 下,其基于Xing等,“Causal Modeling Using Network Ensemble Simulations of Genetic and GeneExpression Data Predicts Genes Involved in Rheumatoid Arthritis,”PLoSComputational Biology,vol.7,issue.3,1-19 (2011年3月)(e100105)。
具有随机变量X=X1,...,Xn的多元系统可以以多元概率分布函数 P(X1,...,Xn;Θ)为特征,其包括了大量的参数Θ。该多元概率分布函数 可以分解为因数并由局部条件概率分布的积表示:
其中各个变量Xi独立于给出其Ki父变量(parent variable)(其是 )的其非派生变量。分解为因数后,各个局部概率分布具有其 自己的参数Θi。
多元概率分布函数可以以不同的方式利用各特定因数分解和相 应的作为不同概率模型的参数来分解因数。各特定的因数分解(模型) 可以由具有各个变量Xi的顶点和表示局部条件分布中 变量之间的相关性的顶点之间的有向边的有向非循环图(DAC)表示。 各包括顶点和相关有向边的DAG子图是网络片段。
通过确定最可能的因数分解和给出输入数据的最可能的参数对 模型进行进化或优化。这可以被描述为“学习贝叶斯网络”,或者换 句话说,给出输入数据的训练集,找到最佳匹配输入数据的网络。这 是通过使用相对于输入数据评估各网络的评分函数完成的。
贝叶斯框架被用于确定给出输入数据的因数分解的可能性。贝叶 斯定律阐明,模型M的后验概率P(D|M),给定数据D,是与给定模 型假设的数据的后验概率P(D|M)的积乘以模型的先验概率(P(M)) 的积成比例的,假定数据的概率(P(D))在模型间是恒定的。这由下面的公式表示:
假设模型的数据的后验概率是参数先验分布上数据似然性的积 分:
P(D|M)=∫P(D|M(Θ))P(Θ|M)dΘ。
假设所有模型是等可能的(即,P(M)是恒定的),给定数据D 的模型M的后验概率可以因数分解成各个局部网络片段Mi的参数积 分的积,如下所示:
请注意,在上述等式中,主要的常数项已被略去。在一些实施方 式中,可以将取模型P(D|M)的后验概率的负对数的贝叶斯信息标准 (BIC)用于如下所示地对各个模型“评分”:
其中模型M的总评分Stot是各个网络片段的局部评分的和。BIC 进一步给出用来确定各单个网络片段的评分的表达式:
其中κ(Mi)是模型Mi中拟合参数的数目和N是样品(数据点)的 数目。SMLE(Mi)是网络片段的似然函数的负对数,其可以从用于各个 网络片段的函数关系计算出来。对于BIC评分,得分越低,模型越有 可能拟合输入数据。
整套试验网被全局地优化,它可以被描述为优化或进化网络(步 骤218)。例如,试验网络可以根据Metropolis Monte Carl采样算法 进化和优化。模拟退火可用于通过局部转化来优化或进化整体中的各 个实验网络。在一个示例的模拟退火过程中,通过从文库中添加网络 片段,通过从试验网络删除网络片段,通过取代网络片段或通过以其 他方式改变网络的拓扑结构来改变各个试验网络,且然后计算网络的 新评分。一般来讲,如果评分改善,则保持这种变化,和如果评分恶 化,则拒绝该变化。“温度”参数允许保持恶化评分的一些局部变化, 这有助于在避免一些局部极小值的优化过程。“温度”参数随着时间降 低,以允许优化/进化过程会聚。
所有或部分网络推理过程也可以与不同试验网络平行进行。各个 网络可以在单独的处理器和/或在单独的计算设备上平行优化。在一些 实施方式中,优化过程可以在包括并行操作的数百到数千个处理器的 超级计算机上进行。可以在并行处理器上进行的优化过程之间共享信 息。
优化过程可以包括从整体中放弃无法满足总体评分的阈值标准 的任何网络的网络过滤器。放弃的网络可被新的初始网络代替。此外, 任何不是“无尺度”的网络可以从整体中放弃。整套网络已被优化或进 化后,其结果可被称一整套生成的细胞模型网络,它可以被统称为生 成的一致网络。
D、模拟以提取定量关系信息和用于预测
模拟可以被用来提取关于生成的细胞模型网络中的各关系的定 量参数信息(步骤220)。例如,用于定量信息提取的模拟可以涉及 扰动(增加或减少)网络中的各个节点10倍,并计算模型中的其他 节点(例如,蛋白质)的后验分布。通过t检验比较终点与每组100个样品的假设和0.01显著性截止值。t检验统计值是100个t检验的 中值。通过使用这种模拟技术,为整套网络中的各个关系生成代表预 测强度的AUC(曲线下面积)和代表驱动终点的节点的计算机计算 幅度的倍数变化。
可采用本地计算机系统的关系量化模块来指导基于AI的系统进 行扰动及提取AUC信息和倍数信息。提取的定量信息对于连接父节 点与子节点的各个边界可包括倍数变化和AUC。在一些实施方式中, 定制的R程序可用于提取定量信息。
在一些实施方式中,可以使用整套生成的细胞模型网络来通过模 拟预测对条件变化的反应,其可以随后通过基于细胞的,或基于动物 的湿式实验室实验证实。
基于AI的系统的输出可以是定量关系参数和/或其他的模拟预测 (222)。
E、生成差异(Δ)网络
也可以使用差异网络建立模块来产生在生成的细胞模型网络和 生成的对比细胞模型网络之间的差异(Δ)网络。如上所述,在一些 实施方式中,差异网络比较所生成的细胞模型网络和生成的对比细胞 模型网络中关系的所有定量参数。在差异网络中用于各个关系的定量 参数是基于该对比。在一些实施方式中,可以在各种差异网络之间执 行差分,这可称为Δ-Δ网络。在下面的实施例部分中相对于图26描 述了Δ-Δ网络的例子。差异网络创建模块可以是程序或用PERL编写 的脚本。
F、网络的可视化
用于整套网络和差异网络的关系值可以使用网络可视化程序(例 如,来自Cytoscape consortium的用于复杂的网络分析和可视化的 Cytoscape开源平台)而可视化。在网络的视觉描绘中,各个边界的 厚度(例如,连接蛋白质的各条线)表示倍数变化的强度。边界也是 有向的以表明因果性,和各个边界有相关的预测置信水平。
G、示例性的计算机系统
图17示意性地描述了可以在一些实施方式中用于与基于AI的信 息学系统进行通讯以生成差异网络、用于可视化网络、用于保存和存 储数据和/或用于与用户进行交互的示例性计算机系统/环境。如上面 所解释的,用于基于AI的信息学系统的计算可以在拥有数百或数千 个直接或间接地与示例性计算机系统交互的并行处理器的单独超级 计算机上进行。该环境包括具有相关外周设备的计算设备100。计算 设备100是可编程的以实施用于执行本文所教导的各种方法或方法部 分的可执行代码150。计算设备100包括存储装置116,如硬盘驱动 器、CD-ROM或其他的非临时性计算机可读介质。存储设备116可以 存储操作系统118和其他相关软件。计算设备100还可以包括存储器 106。存储器106可包括计算机系统存储器或随机存取存储器,例如 DRAM、SRAM、EDO RAM等。存储器106还可以包括其它类型的 存储器,或它们的组合。计算设备100可以在存储设备116和/或存储 器106中存储用于执行和处理可执行代码150的各个部分的指令。
可执行代码150可以包括用于与基于AI的信息学系统190通讯、 用于生成差异网络(例如,差异网络创建模块)、用于从基于AI的 信息学系统提取定量关系信息(例如,关系定量模块)和用于可视化 网络(例如,Cytoscape)的代码。
在一些实施方式中,计算设备100可以直接或间接地与基于AI 的信息学系统190(例如,用于执行REFS的系统)通讯。例如,计 算设备100可以通过利用网络将数据文件(例如,数据帧)传送到基 于AI的信息学系统190而与基于AI的信息学系统190通讯。另外, 计算设备100可以具有可执行代码150,其提供了基于AI的信息学 系统190的接口和指令。
在一些实施方式中,计算设备100可以直接或间接地与一个或多 个为输入数据集提供数据的实验系统180通讯。用于生成数据的实验 系统180可以包括用于基于质谱的蛋白质组学、微阵列基因表达、 qPCR基因表达、基于质谱的代谢组学和基于质谱的脂质组学、SNP 微阵列、功能分析组和其他体外生物学平台和技术的系统。
计算设备100还包括处理器102,并且可包括一个或多个附加的 处理器102',用于执行存储在存储器106中的软件和用于控制系统硬 件、外周设备和/或外周硬件的其他程序。处理器102和处理器102' 各自可以是单核处理器或多核(104和104')处理器。可以在计算设 备100中采用虚拟化,以便计算设备中的基础结构和资源可动态共享。 虚拟化处理器也可以与可执行代码150和存储装置116中的其他软件 一起使用。可提供虚拟机114来操纵在多个理器上运行的过程,以使 得该过程表现为只使用一个计算资源而不是多个。多个虚拟机也可以 用于一个处理器。
用户可以通过可以显示用户界面124或任何其他界面的可视显示 装置122,如计算机监视器,与计算设备100互动。显示装置122的 用户界面124可用于显示原始数据、网络的可视化表现等。可视显示 装置122也可以显示示例性实施方式的其他的方面或元件(例如,用 于存储装置116的图标)。计算设备100可以包括其他I/O设备,例 如键盘或多点触控界面(例如,触摸屏)108和点击设备110(例如, 鼠标、轨迹球和/或触控板),以用于从用户接收输入。键盘108和点 击设备110可通过有线和/或无线连接与可视显示装置122和/或计算 设备100连接。
计算设备100可以包括经由局域网(LAN)、广域网(WAN)或 互联网,通过多种连接(包括但不限于,标准电话线、局域网或广域 网连接(例如,802.11,T1,T3,56kb,X.25)、宽带连接(如ISDN、 帧中继、ATM)、无线连接、控制器局域网络(CAN)或一些上述中 任何或所有连接的组合)的与网络设备126的网络接口112。网络接 口112可以包含内置的网络适配器、网络接口卡、PCMCIA网卡、卡 式总线网络适配器(card bus network adapter)、无线网络适配器、 USB网络适配器、调制解调器或适用于实现计算设备100与能够通讯 的任何类型的网络接口和执行在此描述的操作的任何其他设备。
此外,计算设备100可以是任何计算机系统,如工作站、台式计 算机、服务器、笔记本电脑、手持式计算机或其他形式的能够通讯和 并具有足够的处理器能力和存储容量以执行本文所描述的操作的计 算或通讯装置。
计算设备100可以运行任何操作系统118如任何版本的微软 Windows操作系统、不同版本的Unix和Linux操作系统、用于 Macintosh电脑的任何版本的MACOS、任何嵌入式操作系统、任何实 时操作系统、任何开源操作系统、任何专有操作系统、任何用于移动 计算设备的操作系统或能够运行在计算设备上并执行本文描述的操 作的任何其他操作系统。操作系统可以以原始模式或仿真模式运行。
IV、生物系统的模型及其用途
A、建立生物系统的模型
实质上所有的生物系统或过程都涉及不同细胞类型和/或器官系 统之间复杂的相互作用。在一个细胞类型或器官中关键功能的扰动可 以导致对其他相互作用的细胞类型和器官的次生效应,且这样的下游 变化可以随之反馈于初始变化并导致进一步的复杂化。因此,将给定 生物系统或过程解析为其组成成分(如细胞或器官对之间的相互作 用)并系统地探查这些成分之间的相互作用以获得该生物系统或过程 的更完整的、全面的认识是有利的。
因此,本发明提供了用于生物系统的细胞模型。为此,申请人已 构建了用于在所述的发现平台技术中的几个示例性生物系统的细胞 模型。申请人使用所述的发现平台技术用该细胞模型进行实验以生成 一致因果关系网络,包括生物系统中独特的因果关系,并因此确定对 特定生物系统或程序重要的“调节子”或关键分子“驱动子”。
平台技术及其成分(例如,定制的细胞模型和从细胞模型获得的 数据集)的一个显著的优势是,为生物系统或过程生成的初始的“第 一代”一致因果关系网络可以随着时间不断进化或扩展,例如,通过 引入另外的细胞系/类型和/或另外的条件。可以收集来自进化的细胞 模型的另外的数据,即来自细胞模型的新增加部分的数据。然后可以 将从扩展或进化的细胞模型(即,从细胞模型的新增加部分)收集的 新数据引入先前用来生成“第一代”一致因果关系网络的数据集中,以 便生成更强力的“第二代”一致因果关系网络。然后可以从“第二代”一 致因果关系网络确定生物系统独特的新因果关系。以这种方式,细胞模型的进化提供了一致因果关系网络的进化,从而提供新的和/或更可 靠的对于生物系统的调节子的理解。以这种方式,细胞模型、来自细 胞模型的数据集和通过使用平台技术方法从细胞模型生成的因果关 系网络都能够不断进化和构建在先前从平台技术获得的知识上。
因此,本发明提供了从平台技术中采用的细胞模型生成的一致因 果关系网络。这些一致因果关系网络可以是第一代的一致因果关系网 络,或者可以是多代一致因果关系网络,例如,第2代、第3代、第 4代、第5代、第6代、第7代、第8代、第9代、第10代、第11 代、第12代、第13代、第14代、第15代、第16代、第17代、第 18代、第19代、第20代或更高代的一致因果关系网络。另外,本发 明提供了从平台技术中采用的细胞模型生成的模拟一致因果关系网 络。这些模拟一致因果关系网络可以是第一代模拟一致因果关系网 络,或可以是多代模拟一致因果关系网络,例如,第2代、第3代、 第4代、第5代、第6代、第7代、第8代、第9代、第10代、第 11代、第12代、第13代、第14代、第15代、第16代、第17代、 第18代、第19代、第20代或更高代的模拟一致因果关系网络。本 发明还提供从本发明的任何一致因果关系网络生成的Δ网络和Δ-Δ 网络。
生物系统或过程的定制细胞模型包括与生物系统相关的一种或 多种细胞。通过建立模仿生物系统或过程的特征性方面的条件(例如, 细胞培养条件)可以建立用于生物系统/过程的模型来模拟生物系统的 环境,例如,癌细胞在体内的环境。
在细胞模型中可包括相同或不同来源的多种细胞,而不是单一的 细胞类型。在一个实施方式中,至少1、2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、 50或更多种不同的细胞系或细胞类型被包括在细胞模型中。在一个实 施方式中,细胞全是相同的类型,例如,全部乳腺癌细胞或植物细胞, 但是是确立的不同细胞系,例如,乳腺癌细胞或植物细胞的确立的不 同细胞系。在前述列表中给出的所有值也可以是范围的上限或下限, 其意图属于本发明的部分,例如,1至5、1至10、2至5、或5至15 种不同的细胞系或细胞类型。
可以被包括在本发明的细胞模型中的细胞类型的实例,包括但不 限于,人体细胞、动物细胞、哺乳动物细胞、植物细胞、酵母、细菌 或真菌。在一个实施方式中,细胞模型的细胞可以包括病变细胞,如 癌细胞或者细菌或病毒感染的细胞。在一个实施方式中,细胞模型的 细胞可以包括疾病相关的细胞,如涉及糖尿病、肥胖症或心血管疾病 状态的细胞,例如,主动脉平滑肌细胞或肝细胞。技术人员会认识到 涉及特定的生物状态/过程或与其相关的那些细胞,例如,疾病状态/ 过程,且任何此类细胞可包括在本发明的细胞模型中。
本发明的细胞模型可以包括一种或多种“对照细胞”。在一个实施 方式中,对照细胞可以是未处理的或无扰动的细胞。在另一个实施方 式中,“对照细胞”可以是正常的,例如,非病变的细胞。在一个实施 方式中,细胞模型中包括至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50 种或更多种不同的对照细胞。在前述列表中给出的所有值也可以是范 围的上限或下限,其意图属于本发明的部分,例如,1至5、1至10、 2至5、或5至15种不同的对照细胞系或对照细胞类型。在一个实施 方式中,对照细胞全部是相同的类型,但是是该细胞类型的确立的不 同细胞系。在一个实施方式中,作为对照,将一种或多种正常的,例 如,非病变的,细胞系培养在类似的条件下和/或暴露于相同的扰动, 作为细胞模型的原代细胞,以便确定生物状态或过程独特的蛋白质或 途径。
本发明的定制细胞模型也可以包含模仿生物状态或过程的特征 性方面的条件。例如,可以选择密切近似于体内肿瘤环境中的癌细胞 的条件,或患心血管疾病的患者的主动脉平滑肌细胞的条件的细胞培 养条件。在某些情况下,所述条件是应激条件。本发明的细胞模型中 可以采用各种不同的条件/应激源。在一个实施方式中,这些应激源/ 条件可以构成细胞系统的“扰动”,例如,外部刺激。一个示例性的应 激条件是缺氧,例如,通常在实体癌症中发现的状态。缺氧可使用本 领域内公认的方法诱导。例如,可以通过将细胞系统置于模块化培养 箱(MIC-101,Billups-Rothenberg Inc.Del Mar,CA)中诱发缺氧,该模块化培养箱可以用含5%CO2、2%O2和93%的氮的工业气体混合 物填充。可以在预定的时间后,如在缺氧处理后24小时时,在有或 没有额外的外部刺激成分(例如,0、50或100μM辅酶Q10)的情 况下,测量其效果。同样,乳酸处理模拟糖酵解活性高的细胞环境。 可以在预定的时间处,如在24小时时,在有或没有额外的外部刺激 成分(例如,0、50或100μM辅酶Q10)的情况下,在约12.5mM 的最终乳酸浓度下研究乳酸诱导的应激。高血糖是在糖尿病以及在癌 症中发现的状态。可以用来处理所述细胞的典型高血糖条件包括加入 到合适培养基中的10%培养级葡萄糖以产生培养基中约22mM的最 终葡萄糖浓度。高脂血症是在例如,在肥胖症和心血管疾病中发现的 状态。可以通过在含有0.15mM棕榈酸钠的培养基中培养细胞来提供 高脂血条件。高胰岛素血症是在例如,糖尿病中发现的状态。可以通 过在含有1000nM胰岛素的培养基中培养细胞来诱导高胰岛素条件。
可以在本发明的定制细胞模型中单独地研究单个条件,和/或可以 结合在一起研究。在一个实施方式中,在定制的细胞模型中研究至少 2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或更多种反 映或模拟生物系统的不同特征性方面的条件。在一个实施方式中,在定制的细胞模型中研究单个条件和另外地至少2、3、4、5、6、7、8、 9、10、11、12、13、14、15、20、25、30、35、40、45、50种或更 种反映或模拟生物系统的不同特征性方面的条件的组合。在前述列表 中给出的所有值也可以是范围的上限或下限,其意图属于本发明的部 分,例如,1至5、1至10、2至5、2至10、5至10、1至20、5至 20、10至20、10至25、10至30或10至50种不同条件。
一旦建立定制的细胞模型,可以将一种或多种“扰动”应用于系 统,如病人与病人之间的遗传变异或者有/无某些药物或前药的治疗。 见图15D。可以使用各种本领域认可的或专有的方式测量这种扰动对 细胞模型系统的影响,如在下文的III.B节中所描述的。
可以将定制的细胞模型暴露于扰动,例如,“环境扰动”或“外 部刺激成分”。“环境扰动”或“外部刺激成分”可以是细胞环境内 源性的(例如,细胞环境包含了一些水平的刺激物,和添加更多的刺 激物以提高其水平),或可以是细胞环境外源性的(例如,刺激物/扰动改变前基本不存在于细胞环境中)。可以通过由添加环境扰动或 外部刺激成分而导致的继发性改变进一步改变细胞环境,因为外部刺 激成分可以改变细胞系统的细胞输出,包括由细胞系统分泌到细胞环 境中的分子。环境扰动或外部刺激成分可包括可以影响细胞功能的任 何外部的物理和/或化学刺激。这可以包括任何大或小的有机或无机分 子、天然或合成的化学物质、温度变换、pH值变化、辐射、光(UVA、 UVB等)、微波、声波、电流、调制的或未调制的磁场等。环境扰 动或外部刺激成分还可以包括引入的遗传修饰或突变或者导致遗传 修饰/突变的媒介(例如,载体)。
(i)交互细胞系统
在其中需要研究两个或更多个细胞系统之间的相互作用的某些 情况下,可以通过,例如,使第一细胞系统的改变的细胞环境与第二 细胞系统接触以影响第二细胞系统的细胞输出而形成“交互细胞系 统”。
如本文所用的“交互细胞系统”包含两个或更多个细胞系统,其 中至少一个细胞系统的细胞环境接触到第二细胞系统,使得第二细胞 系统中至少一个细胞输出被改变或受影响。在某些实施方式中,交互 细胞系统内的细胞系统可以彼此直接接触。在其它实施方式中,没有 细胞系统彼此直接接触。
例如,在某些实施方式中,交互细胞系统可以是侵袭实验装置的 形式,其中第一细胞系统生长在插入物中和第二细胞系统生长在相应 的小室隔间中。该两个细胞系统可以接触相同的或不同的培养基,并 可以交换部分或全部的培养基成分。添加到一个细胞系统的外部刺激 成分可以基本上被一个细胞系统吸收和/或在它有机会扩散到其他细 胞系统之前降解。或者,外部刺激成分最终可以在两个细胞系统内接 近或达到平衡。
在某些实施方式中,交互细胞系统可采取单独培养的细胞系统的 形式,其中各个细胞系统可以有其自身的培养基和/或培养条件(温度、 CO2含量、pH值等)或者类似或相同的培养条件。可以通过例如, 从一个细胞系统获取条件化的培养基并使其与另一个细胞系统接触 来使两个细胞系统形成接触。如果需要的话,也可以在两个细胞系统 之间实现直接的细胞-细胞接触。例如,如果需要的话,可在任何点 上共培养两个细胞系统的细胞,且当至少一个细胞系统中的细胞具有 可分选标志物或标记(如稳定表达的荧光标记蛋白GFP)时,可以随 后通过,例如,FACS分选分离共培养的细胞系统。
类似地,在某些实施方式中,交互细胞系统可以仅仅是共培养。 对一个细胞系统中的细胞的选择性处理可以通过在培养与另一个细 胞系统的细胞共培养的处理细胞之前,首先处理该细胞系统中的细胞 来实现。当需要研究,例如,由第一细胞系统受外部刺激成分的刺激 后在第一细胞系统中的细胞表面变化引起的对第二细胞系统的效应 时,共培养的交互细胞系统设置可能是有用的。
本发明的交互细胞系统特别适合于探索某些预先确定的外部刺 激成分对一个或两个细胞系统的细胞输出的影响。这样的刺激物对第 一细胞系统(其与刺激物直接接触)的初级影响可以通过比较在第一 细胞系统与外部刺激接触之前和之后的细胞的输出(例如,蛋白质表 达水平)而确定,其如本文所用的可以称为“(显著的)细胞输出差 异”。通过第一细胞系统的改变的细胞环境(如其分泌组)介导的这 样的刺激物对第二细胞系统的次生效应也可以类似地测定。可以在具 有对第一细胞系统的外部刺激处理的第二细胞系统的蛋白质组和没 有对第一细胞系统的外部刺激处理的第二细胞系统的蛋白质组之间 进行,例如,第二细胞系统的蛋白质组的对比。观察到的任何显著的 变化(在蛋白质组或任何其它目标细胞输出中)可被称为“显著的细 胞交互差异”。
在进行细胞输出测量(如蛋白质表达)中,可使用绝对表达量或 相对表达水平。例如,为测定第二细胞系统的相对蛋白质表达水平, 第二细胞系统中任何给定的蛋白质的量(有或没有对第一细胞系统的 外部刺激)可以与合适的对照细胞系和细胞系的混合物对比,并给出 倍数增加或倍数减少值。可以使用对于这种倍数增加(例如,至少1.2、 1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、2.5、3、3.5、4、4.5、5、6、 7、8、9、10、15、20、25、30、35、40、45、50、75或100或更多 倍增加)或倍数减少(例如,至少0.95、0.9、0.8、0.75、0.7、0.6、 0.5、0.45、0.4、0.35、0.3、0.25、0.2、0.15、0.1或0.05倍,或90 %、80%、75%、70%、65%、60%、55%、50%、45%、40%、35 %、30%、25%、20%、15%、10%或5%或更少的减少)的预先确定的阈值水平来选择显著的细胞交互差异。在前述列表中给出的所有 值也可以是范围的上限或下限,例如,在1.5至5倍之间、在2至10 倍之间、在1至2倍之间或在0.9至0.7倍之间,其意图属于本发明 的部分。
在整个本申请中,在列表中显示的所有值,例如,如上述的那些, 也可以是意图属于本发明的部分的范围的范围的上限或下限。
为了进行说明,在建立用来模仿心血管疾病模型的方面的一个示 例性的两细胞系统中,可以用缺氧条件(外部刺激成分)处理心平滑 肌细胞系(第一细胞系统),且可以使用常规的定量质谱法测定将肾 细胞与心平滑肌的条件化培养基接触导致的肾细胞系(第二细胞系 统)中蛋白质组变化。在与适当的对照(例如,与来自没有经过缺氧 条件处理的类似培养的心平滑肌细胞的条件化培养基接触的类似培 养的肾细胞)相比较的基础上,可以确定这些肾细胞中显著的细胞交 互差异。
并不是每一个观察到的显著的细胞交互差异都可以具有有生物 学意义。对于应用所述探询式生物学评估的任何给定的生物系统,一 些(或者可能全部)显著的细胞交互差异对于讨论的特定生物学问题 可能是“确定性的”,例如,引起疾病状态的原因(治疗性干预的潜 在靶标),或者作为疾病状态的生物标志物(潜在的诊断或预后因子)。
这样的确定性交互差异可以由所述方法的最终用户进行选择,或 者它可以通过生物信息学软件程序,如DAVID可执行的比较途径分 析程序或KEGG通路分析程序选择。在某些实施方式中,使用一个以 上的生物信息学软件程序,且来自两个或更多个生物信息学软件程序 的一致结果是优选的。
如本文所用的,细胞输出“差异”包括细胞输出中的任何一种或 多种参数的差异(例如,提高或降低的水平)。例如,就蛋白质表达 水平而言,两个细胞输出之间的差异可以通过使用本领域公认的技 术,如基于质谱的分析(例如,iTRAQ、2D-LC-MS-MS等)测量和 定量,例如,与外部刺激成分处理之前和之后的细胞系统相关的输出。
(ii)癌症特异性模型
生物系统或过程的实例是癌症。像任何其他复杂的生物学过程或 系统一样,癌症是复杂的病理状态,其特征在于多个独特的方面。例 如,由于其高生长速率,许多癌细胞适应于在缺氧条件下生长,具有 上调的糖酵解和降低的氧化磷酸化代谢途径。其结果是,与正常细胞 对相同处理的反应相比,癌细胞可以对环境的扰动(例如潜在药物的 治疗)有不同的反应。因此,破译癌症与正常细胞的反应相比独特的 对药物治疗的反应是有意义的。为此,可以通过选择合适的癌细胞系 和建立仿真疾病状态或过程的特征性方面的细胞培养条件来建立定 制的癌症模型以模拟癌细胞的环境,例如,在体内的肿瘤中。例如, 可以选择密切近似于癌细胞在体内肿瘤环境中的状态的细胞培养条 件,或通过分离癌细胞的不同生长条件模仿癌生长的各个方面。
相同的或不同起源的多种癌细胞(例如,癌细胞系PaCa2、HepG2、 PC3和MCF7)而不是单一的癌细胞类型可以被包括在癌症模型中。 在一个实施方式中,至少2、3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、25、30、35、40、45、50种或更多种 不同的癌症细胞系或癌症细胞类型被包括在癌症模型中。在前述列表 中给出的所有值也可以是范围的上限或下限,其意图属于本发明的部 分,例如,1至5、1至10、2至5或5至15个之间的不同癌症细胞 系或细胞类型。
在一个实施方式中,癌细胞都是相同的类型,例如,全部乳腺癌 细胞,但是为确立的不同细胞系,例如,乳腺癌的确立的不同细胞系。
可以被包括在癌症模型中的癌症细胞类型的实例包括,但不限 于,肺癌、乳腺癌、前列腺癌、黑色素瘤、鳞状细胞癌、结肠直肠癌、 胰腺癌、甲状腺癌、子宫内膜癌、膀胱癌、肾癌、实体肿瘤、白血病、 非霍奇金淋巴瘤。在一个实施方式中,药物抗性的癌细胞可被包括在 癌症模型中。可以被包括在癌症模型中的细胞系的具体实例包括但不 限于,PaCa2、HepG2、PC3和MCF7细胞。众多的癌细胞系在本领 域中是已知的,并且任何这样的癌细胞系可以被包括在本发明的癌症 模型中。
本发明的细胞模型可以包括一种或多种“对照细胞”。在一个实 施方式中,对照细胞可以是未处理的或未扰动的癌细胞。在另一个实 施方式中,“对照细胞”可以是正常的非癌性细胞。许多正常的非癌性 细胞系中的任何一种可以被包括在细胞模型中。在一个实施方式中, 正常细胞是THLE2和HDFa细胞中的一种或多种。在一个实施方式 中,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、 16、17、18、19、20、25、30、35、40、45、50种或更多种不同的正 常细胞类型被包括在癌症模型中。在前述列表中给出的所有值也可以 是意图属于本发明的部分的范围的上限或下限,例如,1至5、1至 10、2至5或5至15个不同的正常细胞系或细胞类型。在一个实施方 式中,正常细胞全都是相同的类型,例如,所有健康的上皮细胞或乳 腺细胞,但是为确立的不同细胞系,例如,上皮细胞或乳腺细胞的确 立的不同细胞系。在一个实施方式中,作为对照,一种或多种正常的 非癌性细胞系(例如,THLE2和HDFa)被培养在与细胞模型的癌细 胞类似的条件下和/或暴露于相同的扰动,以便确定癌症特有的蛋白质 或途径。
定制的癌症模型也可以包含模仿癌性状态或过程的特征性方面 的细胞培养条件。例如,可以选择密切近似癌细胞在体内肿瘤环境中 的状态的细胞培养条件,或通过分离癌细胞的不同生长条件而模拟癌 生长的各个方面。在某些情况下,细胞培养条件是应激状态。
一种这样的癌症“环境”或应激条件是缺氧,一种通常在实体肿瘤 内发现的状态。可以使用本领域公认的方法在细胞中诱导缺氧。例如, 缺氧可以通过将细胞系统置于模块化培养箱(MIC-101, Billups-Rothenberg Inc.Del Mar,CA)中诱导,该培养箱可以充满含5 %CO2、2%O2和93%氮的工业气体混合物。可以在预定的时间后, 如在缺氧处理后24小时时,在具有或没有另外的外部刺激成分(例 如,0、50或100μM的辅酶Q10)的情况下测量其效应。
同样,细胞的乳酸处理模仿其中糖酵解活性高的细胞环境,如存 在于体内肿瘤环境中一样。可以在预先确定的时间,例如,在24小 时时,在具有或没有另外的外部刺激成分(例如,0、50或100μM 的辅酶Q10)的情况下在约12.5mM的最终乳酸浓度下研究乳酸诱导 的应激。
高血糖症是通常见于糖尿病中的状态,然而,高血糖也在一定程 度上模拟癌生长的一个方面,因为许多癌细胞依赖于葡萄糖作为其主 要的能量来源。将所述细胞暴露于典型的高血糖条件可包括向合适的 培养基加入10%的培养级葡萄糖,以使得培养基中葡萄糖的终浓度为 约22mM。
可以在定制的癌症模型中单独地研究反映癌生长的不同方面的 单个条件,和/或可以结合在一起研究。在一个实施方式中,在定制的 癌模型中研究至少2、3、4、5、6、7、8、9、10、15、20、25、30、 40、50或更多种反映或模拟不同的癌生长方面/条件的条件的组合。 在一个实施方式中,在定制的癌模型中研究反映或模拟不同的癌生长 方面/条件的单个条件和另外地至少2、3、4、5、6、7、8、9、10、 15、20、25、30、40、50或更多个条件的组合。在前述列表中给出的 所有值也可以是范围的上限或下限,其意图属于本发明的部分,例如, 1至5、1至10、1至20、1至30、2至5、2至10、5至10、1至20、 5至20、10至20、10至25、10至30或10至50个不同的条件。
一旦定制细胞模型建立,可以将一种或多种“扰动”应用于系统, 如病人与病人之间的遗传变异,或有/没有某些药物或前药的治疗。见 图15D。可以使用各种本领域公认的或专有的手段测量这种扰动对系 统的影响,包括对疾病相关癌症细胞和疾病相关的正常对照细胞的影 响,如下文III.B节中所描述的。
在示例性的实验中,癌细胞系PaCa2、HepG2、PC3和MCF7及 正常细胞系THLE2和HDFa在高血糖、缺氧和富乳酸条件中各种条 件中以及在这些条件的两种或三种的所有组合中,且在另外具有或没 有环境扰动(特别是辅酶Q10的治疗)的情况下条件化。本文下面列 出的是条件的这种示例性组合,有或没有扰动(辅酶Q10处理),其 可用于处理癌症细胞模型中的癌细胞和/或对照(例如,正常)细胞。 根据所进行的特定探询式生物学评估,可以很容易地得到其它组合。
1、仅培养基
2、50μM CTL辅酶Q10(CoQ10)
3、100μM CTL辅酶Q10
4、12.5mM的乳酸
5、12.5mM的乳酸+50μM CTL辅酶Q10
6、12.5mM的乳酸+100μM CTL辅酶Q10
7、缺氧
8、缺氧+50μM CTL辅酶Q10
9、缺氧+100μM CTL辅酶Q10
10、缺氧+12.5mM乳酸
11、缺氧+12.5mM乳酸+50μM CTL辅酶Q10
12、缺氧+12.5mM乳酸+100μM CTL辅酶Q10
13、培养基+22mM葡萄糖
14、50μM CTL辅酶Q10+22mM葡萄糖
15、100μM CTL辅酶Q10+22mM葡萄糖
16、12.5mM的乳酸+22mM葡萄糖
17、12.5mM乳酸+22mM葡萄糖+50μM CTL辅酶Q10
18、12.5mM乳酸+22mM葡萄糖+100μM CTL辅酶Q10
19、缺氧+22mM葡萄糖
20、缺氧+22mM葡萄糖+50μM CTL辅酶Q10
21、缺氧+22mM葡萄糖+100μM CTL辅酶Q10
22、缺氧+12.5mM乳酸+22mM葡萄糖
23、缺氧+12.5mM乳酸+22mM葡萄糖+50μM CTL辅酶Q10
24、缺氧+12.5mM乳酸+22mM葡萄糖+100μM CTL辅酶Q10
在某些情况下,也可以几种相关联的目的进行不同癌细胞(例如, HepG2和PaCa2)之间的交互式或ECS实验。在一些涉及交互的实 施方式中,设计在细胞模型上进行的实验以确定在确定的处理条件 (例如,高血糖、缺氧(缺血))下,另一个细胞系统或群体(例如,胰腺癌PaCa2)对细胞系统或群体(例如,肝癌细胞HepG2)的细胞 状态或功能的调节。根据典型的设置,第一细胞系统/群体与外部刺激 成分接触,如候选分子(例如,小的药物分子、蛋白质)或候选条件 (例如,缺氧、高葡萄糖环境)。作为回应,第一细胞系统/群体改变 其转录组、蛋白质组、代谢组和/或相互作用组,从而导致可以很容易 地在细胞内和外检测的变化。例如,转录组的变化可以通过多个目标 mRNA的转录水平测定;蛋白质组的变化可以通过多个目标蛋白质的 表达水平测量;以及可以通过对于给定代谢物特别设计的分析通过多 个目标代谢物的水平测量代谢组的变化。可选地,上述所指的代谢组 和/或蛋白质组的变化,至少对于某些分泌的代谢物或蛋白质,也可以 通过他们对第二细胞系统/群体的效应(包括对第二细胞系统/群体的 转录组、蛋白质组、代谢组和相互作用组的调节)测量。因此,该实 验可用于确定第一细胞系统/群体分泌的目标分子在不同处理条件下 对第二细胞系统/群体的效应。该实验也可以通过,例如,蛋白质组的 差分筛选用来鉴别作为从第一细胞系统(响应于外部刺激成分处理) 到另一个细胞系统的信号传导的结果而调节的任何蛋白质。相同的实 验设置也可以适应于反向设置,以使得也可以评估两个细胞系统间的相互效应。通常,对于这种类型的实验,细胞系对的选择主要是基于 例如起源、疾病状态和细胞功能的因素。
虽然双细胞系统通常包括在这种类型的实验设置中,类似的实验 也可以被设计用于两个以上的细胞系统,通过例如在单独的固相支持 物上固定各个不同的细胞系统。
定制的癌症模型可以建立并用在本发明的平台技术的整个步骤 中以通过实施本文中所描述的步骤最终确定在生物系统中独特的因 果关系。但是,本领域技术人员能理解,例如,通过引入另外的癌或 正常细胞系和/或另外的癌症条件,用来生成初始的“第一代”一致因果 关系网络的定制癌症模型可以随着时间不断地进化或扩展。来自进化 的癌症模型的另外的数据,即来自癌症模型的新增加部分的数据,可 以被收集。然后可以将从扩展或进化的癌症模型(即,从癌症模型的 新增加部分)收集的新数据引入先前用来生成“第一代”一致因果关系 网的数据集中,以便生成更稳定的“第二代”一致因果关系网络。然后 可以从第二代”一致因果关系网络鉴别癌症状态独特的(或对于癌症 状态对扰动的响应独特的)新因果关系。以这种方式,癌症模型的进 化提供了一致因果关系网络的进化,从而提供新的和/或更可靠的对癌 症状态的确定性驱动子(或调节子)的理解。
(iii)糖尿病/肥胖症/心血管疾病细胞模型
生物系统或过程的其它实例是糖尿病、肥胖症和心血管疾病。与 癌症一样,糖尿病、肥胖症、心血管疾病的相关疾病状态是复杂的病 理状态,其特征在于多个独特的方面。确定驱动糖尿病/肥胖症/心血 管疾病的疾病发生的蛋白质/途径是有意义的。破译与糖尿病/肥胖症/ 心血管疾病相关的细胞相比于正常细胞反应的对药物治疗的独特反 应是有意义的。为此,可以通过选择合适的细胞系和建立仿真疾病状 态或过程的特征性方面的细胞培养条件来建立定制的糖尿病/肥胖症/ 心血管疾病模型以模拟疾病相关细胞所经历的环境。例如,可以选择 密切近似于高血糖、高血脂、高胰岛素血、缺氧或富乳酸条件的细胞培养条件。
与糖尿病/肥胖症/心血管疾病有关的任何细胞都可以包括在糖尿 病/肥胖症/心血管疾病模型中。与糖尿病/肥胖症/心血管疾病相关的细 胞的实例包括,例如,脂肪细胞、肌管、肝细胞、主动脉平滑肌细胞 (HASMC)和近端肾小管上皮细胞(例如,HK2)。相同或不同起 源的多种细胞类型,而不是单一细胞类型,可包括在糖尿病/肥胖症/ 心血管疾病模型中。在一个实施方式中,至少2、3、4、5、6、7、8、 9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、 40、45、50种或更多种不同的细胞类型被包括在糖尿病/肥胖症/心血 管疾病模型中。在前述列表中给出的所有值也可以是范围的上限或下 限,其意图属于本发明的部分,例如,1至5、1至10、2至5或5 至15种不同细胞类型。在一个实施方式中,细胞都是相同类型的, 例如,全部是脂肪细胞,但是属于已确立的不同细胞系,例如,确立 的不同脂肪细胞系。糖尿病/肥胖症/心血管疾病状态中所涉及的众多 的其他细胞类型在本领域中是已知的,且任何这样的细胞可以被包括 在本发明的糖尿病/肥胖症/心血管疾病模型中。
本发明的糖尿病/肥胖症/心血管疾病细胞模型可包括一种或多种 “对照细胞”。在一个实施方式中,对照细胞可以是未处理的或未扰 动的疾病相关细胞,例如,未暴露于高血脂或高胰岛素条件的细胞。 在另一个实施方式中,“对照细胞”可以是非疾病相关细胞,如上皮细 胞。许多非疾病相关细胞中的任一种可以被包括在细胞模型中。在一 个实施方式中,至少2、3、4、5、6、7、8、9、10、11、12、13、14、 15、16、17、18、19、20、25、30、35、40、45、50种或更多种不同 的非疾病相关细胞类型被包括在细胞模型中。在前述列表中给出的所有值也可以是意图属于本发明的部分的范围的上限或下限,例如,1 至5、1至10、2至5或5至15种不同的非疾病相关细胞系或细胞类 型。在一个实施方式中,非疾病相关细胞都是相同的类型,例如,全 部健康的上皮细胞或乳腺细胞,但是属于已确立的不同细胞系,例如, 上皮细胞或乳腺细胞的确立的不同细胞系。在一个实施方式中,作为 对照,一个或多个非疾病相关细胞系被培养在与细胞模型的疾病相关 细胞类似的条件下,和/或暴露于相同的扰动,以便确定糖尿病/肥胖 症/心血管疾病独特的蛋白质或途径。
定制的糖尿病/肥胖症/心血管疾病模型也可以包括模仿糖尿病/肥 胖症/心血管疾病的状态或过程的特征性方面(代表其病理生理)的细 胞培养条件。例如,可以选择密切近似于糖尿病/肥胖症/心血管疾病 相关细胞在体内环境中的状态的细胞培养条件,或模仿糖尿病/肥胖症 /心血管疾病的各个方面的状态。在某些情况下,细胞培养条件是应激条件。
代表糖尿病/肥胖症/心血管疾病的病理生理的示例性条件包括, 例如,缺氧、富乳酸条件、高血糖、高血脂和高胰岛素血中的任何一 个或多个。可以使用本领域公认的方法在细胞中诱导缺氧。例如,缺 氧可以通过将细胞系统置于模块化培养箱(MIC-101,Billups-Rothenberg Inc.Del Mar,CA)中诱导,该培养箱可以充满含5 %CO2、2%O2和93%氮的工业气体混合物。可以在预定的时间后, 如在缺氧处理后24小时时,在具有或没有额外的外部刺激成分(例 如,0、50或100μM的辅酶Q10)的情况下,测量其效应。
同样,细胞的乳酸处理模仿糖酵解活性高的细胞环境。可以在预 定的时间,例如,在24小时时,在具有或不具有额外的外部刺激成 分(例如,0、50或100μM的辅酶Q10)的情况下,在约12.5mM 的最终乳酸浓度下研究乳酸诱导的应激。高血糖是通常见于糖尿病的 状态。将所述细胞暴露于典型的高血糖条件可包括向合适的培养基加 入10%的培养级葡萄糖,使得培养基中葡萄糖的终浓度为约22mM。 高脂血症是在肥胖症和心血管疾病中存在的状态。可以通过在含有 0.15mM棕榈酸钠的培养基中培养细胞来提供高血脂状态。高胰岛素血症是在糖尿病中发现的状态。可以通过在含有1000nM的胰岛素的 培养基中培养细胞诱导高胰岛素状态。
表示糖尿病/肥胖症/心血管疾病的病理生理的另外的条件包括, 例如,炎症、内质网应激、线粒体应激和过氧化物酶体应激中的任何 一个或多个。在细胞中建立炎症样状态的方法在本领域中是已知的。 例如,可以通过在TNFα和/或IL-6存在下培养细胞模拟炎症状态。 用于建立模拟内质网应激的状态的方法在本领域中也是已知的。例 如,可以通过在毒胡萝卜素和/或衣霉素存在下培养细胞建立模拟内质 网应激的状态。用于建立模拟线粒体应激的方法在本领域中也是已知 的。例如,可以通过在雷帕霉素和/或半乳糖存在下培养细胞建立模拟 线粒体应激的状态。用于建立模拟过氧化物酶体应激的方法在本领域中也是已知的。例如,可以通过在脱落酸存在下培养细胞建立模拟过 氧化物酶体应激的状态。
可以在定制的糖尿病/肥胖症/心血管疾病模型中单独研究反映糖 尿病/肥胖症/心血管疾病的不同方面的单个条件,和/或可以结合在一 起研究。在一个实施方式中,在定制的糖尿病/肥胖症/心血管疾病模 型中研究至少2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或更多种反映或模拟糖尿病/肥胖症/心血管疾病的不同方面的条件 的组合。在一个实施方式中,在定制的糖尿病/肥胖症/心血管疾病模 型中研究反映或模拟糖尿病/肥胖症/心血管疾病的不同方面的单个条 件,和另外地,至少2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或更多个条件的组合。在前述列表中给出的所有值也可以是范 围的上限或下限,该范围意图属于本发明的部分,例如,1至5、1 至10、1至20、1至30、2至5、2至10、5至10、1至20、5至20、 10至20、10至25、10至30或10至50个不同的条件。
一旦建立定制的细胞模型,可以将一种或多种“扰动”应用于系 统,如病人与病人之间的遗传变异或有/没有某些药物或前药的治疗。 见图15D。可以使用各种本领域认可的或专有的手段测量这种扰动对 系统的影响,包括对糖尿病/肥胖症/心血管疾病相关细胞的影响,如 在下文的III.B节中所描述的。
在示例性的实验中,将脂肪细胞、肌管、肝细胞、主动脉平滑肌 细胞(HASMC)和近端肾小管细胞(HK2)各自在高血糖、缺氧、 高血脂、高胰岛素血和富乳酸条件的各种条件下,以及在两种、三种、 四种和所有五种条件的所有组合中,以及另外有或没有环境扰动(特 别是辅酶Q10的治疗)的情况下条件化。除了在癌模型的上下文中描 述的条件的示例性组合,本文以下列出的是另外的一些示例性的条件 组合,有或没有可用于处理糖尿病/肥胖症/心血管疾病模型的糖尿病/ 肥胖症/心血管疾病相关细胞(和/或对照细胞)的扰动,例如辅酶Q10 的治疗。这些仅仅意图是示例性的,本领域技术人员将会理解,代表 糖尿病/肥胖症/心血管疾病的病理生理的任何单个的上述条件和/或 组合可以用在细胞模型中以产生输出数据集。根据进行的具体探询式 生物学评估,可以很容易地制订其它组合。
1、仅培养基
2、50μM CTL辅酶Q10(CoQ10)
3、100μM CTL辅酶Q10
4、0.15mM棕榈酸钠
5、0.15mM棕榈酸钠+50μM CTL辅酶Q10
6、0.15mM棕榈酸钠+100μM CTL辅酶Q10
7、1000nM胰岛素
8、1000nM胰岛素+50μM CTL辅酶Q10
9、1000nM胰岛素+100μM CTL辅酶Q10
10、1000nM胰岛素+0.15mM棕榈酸钠
11、1000nM胰岛素+0.15mM棕榈酸钠+50μM CTL辅酶Q10
12、1000nM胰岛素+0.15mM棕榈酸钠+100μM CTL辅酶Q10
在某些情况下,也可以为了几种相关的目的在不同的疾病相关细 胞(例如,HASMC和HK2细胞或者肝细胞和脂肪细胞)之间进行交 互式或ECS实验。在一些涉及交互的实施方式中,设计了在细胞模 型上进行的实验以确定在明确的处理条件(例如,高血糖、缺氧、高血脂、高胰岛素)下,另一个细胞系统或群体(例如,脂肪细胞)对 一个细胞系统或群体(如肝细胞)的细胞状态或功能的调节。根据典 型的设置,第一细胞系统/群体与外部刺激成分接触,如候选分子(例 如,小的药物分子、蛋白质)或候选条件(例如,缺氧、高糖环境)。 作为响应,第一细胞系统/群体改变其转录组、蛋白质组、代谢组和/ 或相互作用组,从而导致可以很容易地在细胞内和细胞外检测的变 化。例如,转录组的变化可以通过多个目标mRNA的转录水平测量; 蛋白质组的变化可以通过多个目标蛋白质的表达水平测量;代谢组的变化以及可以通过对给定代谢物特别设计的分析根据多个目标代谢 物的水平测量。可选地,上述所指的代谢组和/或蛋白质组的变化,至 少关于某些分泌的代谢物或蛋白质,也可以通过他们对第二细胞系统 /群体的影响测量,包括第二细胞系统/群体的转录组、蛋白质组、代 谢组和相互作用组的调节。因此,该实验可用于确定第一细胞系统/ 群体分泌的目标分子在不同处理条件下对第二细胞系统/群体的影响。 该实验也可以通过,例如,蛋白质组学的差异筛选来鉴别作为从第一 细胞系统(响应于外部刺激成分处理)对另一细胞系统的信号传导的 结果而调节的任何蛋白质。相同实验设置也可以适应于反向设置,以 至于也可以评估两个细胞系统间的相互影响。通常,对于这种类型的 实验,细胞系对的选择主要是基于如起源、疾病状态和细胞功能的因 素。
虽然双细胞系统通常包括在这种类型的实验设置中,但类似的实 验也可以被设计用于两个以上的细胞系统,例如通过在单独的固相支 持物上固定各个不同的细胞系统。
通过实施本文中所描述的步骤,定制的糖尿病/肥胖症/心血管疾 病模型可以在本发明的平台技术的整个步骤中建立和使用以最终确 定对于糖尿病/肥胖症/心血管疾病状态独特的因果关系。但是,本领 域技术人员能理解,正如癌症模型一样,用来生成初始的“第一代”一 致因果关系网络的定制糖尿病/肥胖症/心血管疾病模型可以随着时间 不断地进化或扩展,例如,通过引入另外的疾病相关细胞系和/或另外 的疾病相关条件。来自进化的糖尿病/肥胖症/心血管疾病模型的另外 的数据,即来自癌症模型的新增加部分的数据,可以被收集。然后可 以将来自扩展或进化的模型,即,来自模型的新增加的部分的新数据 引入先前用来生成“第一代”一致因果关系网络的数据集中,以便产生 更稳定的“第二代”一致因果关系网络。然后可以从“第二代”一致因 果关系网络确定对于糖尿病/肥胖症/心血管疾病状态独特的(或对于 糖尿病/肥胖症/心血管疾病状态对扰动的响应独特的)新因果关系。 以这种方式,糖尿病/肥胖症/心血管疾病模型的进化提供了一致因果 关系网络的进化,从而提供新的和/或更可靠的对于糖尿病/肥胖症/心 血管疾病状态的确定性驱动子(或调节子)的认识。
B、细胞模型用于探询式生物学评估的用途
在本发明中提供的方法和细胞模型可用于或应用于多种“探询式 生物学评估”。本发明的用于探询式生物学评估的方法的使用有利于 生物系统的“调节子”或确定性细胞过程“驱动子”的鉴别。
如本文所用的,“探询式生物学评估”可包括鉴别生物系统的一个 或多个调节子,例如,与环境扰动或外部刺激成分相关的确定性的细 胞过程“驱动子”(例如,生物途径的活性的提高或降低,或者途径的 主要成员,或途径成员的主要调节子),或者确定生物系统或过程中 独特的因果关系。它可以进一步包括设计用于测试或验证所鉴别的确 定性细胞过程驱动子对于与环境扰动或外部刺激成分相关的下游事 件是否是必要和/或充分的额外步骤,包括体内动物模型和/或体外组 织培养实验。
在某些实施方式中,探询式生物学评估是疾病状态的诊断或分 期,其中鉴别的生物系统的调节子,例如确定性的细胞过程驱动子(例 如,生物系统或过程中的交互差异或独特的因果关系)代表可经历治 疗干预的疾病标志物或者治疗靶标。所述的探询式生物学评估在理论 上适合于任何疾病状况,但可能发现在如肿瘤/癌症生物学、糖尿病、 肥胖症、心血管疾病和神经系统疾病(尤其是神经退行性疾病,例如 但不限于,阿尔茨海默氏病、帕金森氏病、亨廷顿氏病、肌萎缩性脊 髓侧索硬化症(ALS)和衰老相关的神经退行性疾病)的领域中特别 有用。
在某些实施方式中,探询式生物学评估是对药物疗效的确定,其 中确定的生物系统调节子,例如,确定性的细胞过程驱动子(例如, 生物系统或过程中的交互差异或独特的因果关系)可以是成功的药物 的标志,并可以相应地用于鉴别用于治疗相同疾病状态的另外的药 剂,如MIM或表观代谢转变剂。
在某些实施方式中,探询式生物学评估是鉴别用于预防或治疗感 染(例如,细菌或病毒感染)的药物靶标,其中所鉴别的确定性细胞 过程驱动子(例如,生物系统或过程中的细胞交互差异或独特的因果 关系)可以是引起感染状态的标志物/指示剂或关键的生物分子,且可 以相应地被用来鉴别抗感染剂。
在某些实施方式中,探询式生物学评估是药剂(例如,药物)对 给定疾病谱的分子效应的评价,其中鉴别的生物系统的调节子,例如 确定性的细胞过程驱动子(例如,生物系统或过程中的细胞交互差异 或独特的因果关系),可以是一个或多个生物途径的活性提高或降低, 或者途径的关键成员,或途径成员的关键调节子,且可相应地用于, 例如,预测药剂对于给定疾病的疗效。
在某些实施方式中,探询式生物学评估是药剂(例如,药物)对 细胞、组织、器官或有机体的毒理特性的评价,其中鉴别的生物系统 的调节子,例如确定性的细胞过程驱动子(例如,生物系统或过程中 的细胞交互差异或独特的因果关系),可以是毒性(例如,细胞毒性) 的指示物,且可以相应地被用来预测或确定试剂的毒理特性。在一个 实施方式中,鉴别的生物系统的调节子,例如确定性的细胞过程驱动 子(例如,生物系统或过程中的细胞交互差异或独特的因果关系)是 药物或药物候选者的心脏毒性的指示物,并可相应地用来预测或确定 药物或药物候选者的心脏毒性特性。
在某些实施方式中,探询式生物学评估是用于预防或治疗由生物 武器(如导致疾病的原生动物、真菌、细菌、病菌、病毒或毒素)引 起的疾病或病症的药物靶标的鉴定,其中鉴别的生物系统调节子,例 如,确定性的细胞过程驱动子(例如,生物系统或过程中的细胞交互 差异或独特的因果关系)可以是所述疾病或病症的标志物/指示剂或引 起所述疾病或病症的关键生物分子,且可以相应地用于鉴别生物防御 剂。
在某些实施方式中,探询生物评价是鉴别用于抗老化剂(如抗老 化化妆品)的靶标,其中鉴别的生物系统调节子,例如,确定性的细 胞过程驱动子(例如,生物系统或过程中的细胞交互差异或独特的因 果关系)可以是老化过程的标志物或指示剂,特别是皮肤的老化过程, 并可以相应地用于鉴别抗老化剂。
在用于本发明方法中用来鉴别用于抗衰老化妆品的靶标的一个 示例性的老化细胞模型中,该细胞模型包含老化的上皮细胞(其例如 用UV光处理(环境扰动或外部刺激成分))和/或新生细胞(其也任 选地用UV光处理)。在一个实施方式中,用于老化的细胞模型包含 细胞交互系统。在一个为了鉴别抗衰老化妆品的靶标而建立的示例性 的双细胞交互系统中,可以用UV光(外部刺激成分)处理老化的上 皮细胞(第一细胞系统),和可以测量将新生细胞(第二细胞系统) 中由于与处理的老化上皮细胞的条件化培养基相接触而产生的新生 细胞的变化,例如,蛋白质组和/或功能变化,例如,可以使用常规的 定量质谱法测定蛋白质组的变化,或者可以从由数据生成的因果关系 网络中确定老化的独特的因果关系。
V.蛋白质组学样品分析
在某些实施方式中,所述方法采用具有相似性质的数百个样品的 大规模高通量定量蛋白质组学分析,并提供确定细胞输出差异所需的 数据。
有许多本领域认可的技术适合于这一目的。下面简要地介绍一个 示例性的技术,与质谱相结合的iTRAQ分析。
为了用iTRAQ技术提供用于相对定量的参比样品,创建了多个 QC池。从Cell#1和Cell#2样品产生由各个样品的等分试样组成的 两个独立的QC池,这些样品对于上清液和沉淀分别记为QCS1和 QCS2及QCP1和QCP2。为了允许在两个细胞系间进行蛋白质浓度比较,来自如上所述的QC池的细胞沉淀等份试样以等体积混合以产生 参比样品(QCP)。
定量蛋白质组学方法是基于用8-重iTRAQ试剂的稳定同位素标 记和用于肽识别和定量的2D-LC MALDI MS/MS。使用这种技术的定 量是相对的:肽和蛋白质被赋予相对于参比样品的丰度比率。多重 iTRAQ实验中的共同参比样品有助于多个iTRAQ实验之间的样品的 比较。
要实施这个分析方案,根据制造商的说明,将6个原始样品和两 个对照池样品组合成8-重iTRAQ混合物,对照池样品用113和117 试剂标记。然后,将这一8样品的混合物通过二维液相色谱法分离; 第一维度中的强阳离子交换(SCX)和第二维度中的反相HPLC。将HPLC洗脱液直接分馏到MALDI板上,并在MDS SCIEX/AB 4800 MALDI TOF/TOF质谱仪分析上分析该板。
在没有附加信息的情况下,假定蛋白质表达中的最重要变化是在 不同处理条件下的相同细胞类型内的那些变化。出于这个原因,在单 独的iTRAQ混合物中对来自Cell#1和Cell#2的原始样品进行分析。 为了便于比较Cell#1与Cell#2样品中的蛋白质表达,在没被原始 或细胞系特异性的QC样品(QC1和QC2)占用的可用“iTRAQ槽” 中分析通用QCP样品。
本文提供使用的实验室程序的简要概述。
A、从细胞上清液样品提取蛋白质
对于细胞上清液样品(CSN),培养基的蛋白质的存在量大大超 过由培养的细胞所分泌的蛋白质。为了试图降低这一背景,实施丰富 蛋白质的前期耗减。由于没有可用于牛或马血清蛋白质的特定亲和 柱,因此使用了抗-人IgY14柱。尽管抗体是针对人蛋白质的,但预 计由该抗体的多克隆性质所提供的广谱特异性以完成存在于所使用 的细胞培养基中的牛和马蛋白质的耗减。
在研究开始之前,在10毫升IgY14耗减柱上加载200μl等分的 CSN QC材料以测定流过材料中的总蛋白质浓度(二喹啉甲酸(BCA) 分析)。然后选择加载体积以实现含约40μg总蛋白质的贫化级分。
B、从细胞沉淀提取蛋白质
Cell#1和Cell#2的等份试样在用于BGM的组织样品分析的“标 准”裂解缓冲液中裂解,并通过BCA法测定总蛋白质含量。在确定了 这些代表性细胞裂解物的蛋白质含量后,将所有的细胞沉淀样品(包 括1.1节中所描述的QC样品)处理成细胞裂解物。将约40μg总蛋白质的裂解物量在处理流程中继续。
C、用于质谱的样品制备
样品制备遵循标准操作程序,并由如下构成:
·蛋白质的还原和烷基化
·反相柱上的蛋白质清洁(仅细胞沉淀)
·用胰蛋白酶消化
·iTRAQ标记
·强阳离子交换色谱-六个级分的收集(Agilent 1200系统)
·HPLC分离和点样至MALDI板(Dionex Ultimate3000/Probot系 统)
D、MALDI
MS和MS/MS
HPLC-MS通常采用在线ESI MS/MS策略。BG Medicine使用离 线的LC-MALDI MS/MS平台,其导致在原始样品间观察到的蛋白质 集合的更好的一致性,而不需要注射同一样品多次。在所有iTRAQ 混合物第一手数据收集之后,因为肽部分保留在MALDI目标板上, 可以第二次使用定向的MS/MS采集模式(其来自在第一次采集中获 得的知识)分析样品。以这种方式,完成所有识别的蛋白质的最大观 测频率(理想情况下,应当在每一个iTRAQ混合中测量每一个蛋白 质)。
E、数据处理
在BGM蛋白质组学工作流程内的数据处理过程可以被分成如初 步肽识别和定量的那些程序(其对于每个iTRAQ混合物单独地完成) (1.5.1节)和如将肽最终分配至蛋白质和蛋白质的最后定量的那些过 程(其直到项目数据采集完成时才完成)(1.5.2节)。
BGM蛋白质组学工作流程中的主要数据处理步骤是:
·使用Mascot(Matrix Sciences)数据库搜索引擎识别肽
·Mascot ID的自动内部验证
·肽的定量和蛋白质的初步定量
·最终数据集的专家监护
·使用自动化PVT工具最终分配各个混合物的肽到一组共同的蛋 白质中
·消除离群点和蛋白质的最终定量
(i)单个iTRAQ混合物的数据处理
由于各个iTRAQ混合物是通过工作流程处理的,MS/MS谱使用 专有的BGM软件工具分析以用于肽和蛋白质的鉴别以及定量信息的 初步评估。基于这一初步分析的结果,针对一组BGM性能量度来判 断用于混合物中各原始样品的工作流程的质量。如果给定的样品(或 混合物)没通过指定的最小性能量度,且可获得另外的材料,该样品 以其整体重复,且它是被并入最后的数据集中的来自该二次实施的工 作流程的数据。
(ii)肽识别
MS/MS谱针对包含被常见的污染序列(如猪胰蛋白酶)增强的人、 牛、马序列的UniProt蛋白质序列数据库进行检索。在表3中给出了 Mascot检索参数的细节,包括修饰的完整列表。
表3:Mascot检索参数
Mascot检索完成后,使用自动验证程序来促进(即验证)特定 Mascot肽匹配。有效和无效匹配之间的区分是基于相对于预期的 Mascot得分达到的Mascot得分及等级1的肽和等级2的肽的Mascot 得分的差异。如果肽是与iTRAQ混合物中单一蛋白质相匹配的几个之一,或者如果肽存在于之前验证的肽的目录中,验证所需的标准有 所放松。
(iii)肽和蛋白质定量
用于各个混合物的一组验证的肽被用来计算各混合物的初步蛋 白质量化量度。通过从用于各个验证肽的iTRAQ标记(例如,m/z 114、 115、116、118、119或121)的峰面积除以通过参比池(QC1或QC2) 的峰面积的最佳表示计算肽比率。此峰面积是113和117峰的平均值, 条件是两个样品都通过QC接受标准。通过计算与该蛋白质相匹配的 所有“有用的”验证肽的中位比率来确定初步蛋白质比率。“有用的”肽 是完全iTRAQ标记的(所有的N-端用赖氨酸或PyroGlu标记)和完 全半胱氨酸标记的(即所有Cys残基用脲基甲基或N-端Pyro-cmc烷 基化)。
(iv)获取后处理
一旦对于项目中的每一个组合物完成所有轮的MS/MS数据采集, 则使用如下讨论的三个步骤校对数据,其目的是使来自各原始样品的 结果能够简单地和有意义地与另一个样品的结果比较。
(v)肽序列到蛋白质的总体分配
通过专有的蛋白质验证工具(PVT)进行肽序列到蛋白质登录号 的最终分配。该PVT程序确定最好的、最小的非冗余蛋白质组以描 述在方案中识别的肽的整个集合。这是已被优化以处理来自同种分类 的数据的自动程序。
人工监护用于上清液实验的蛋白质分配以便处理在数据库中混 合分类的复杂性。由于自动范式对于在牛和马血清补充的培养基中生 长的细胞培养物是无效的,所以需要大量的人工监护以使任何给定蛋 白质的来源的不确定性最小化。
(vi)肽比率的标准化
基于Vandesompele等人,Genome Biology,2002,3(7),research 0034.1-11中的方法对各个样品的肽比率标准化。这一程序仅用于细胞 沉淀的测量。对于上清液样品,考虑到来自培养基的对肽识别的最大 影响,定量数据没有标准化。
(vii)蛋白质比率的最终计算
使用标准统计离群消除过程从各蛋白质中位比率周围去除离群 值,对数变换的数据集中超出1.96σ水平。该去除过程之后,(再) 计算蛋白质比率的最终集合。
VI、本发明的标志物及其用途
本发明是基于(至少部分地)与生物系统(如疾病过程)相关的 新生物标志物或生物系统对扰动(例如治疗剂)的反应的鉴别。
特别地,本发明涉及在实施例中所描述的标志物(以下简称为“标 志物”或“本发明的标志物”)。本发明提供被标志物编码的或与标志 物对应的核酸和蛋白质(以下分别简称为“标志物核酸”和“标志物蛋 白质)。这些标志物在诊断疾病状态,预后疾病状态,开发用于不同 疾病状态的药物靶标,筛选毒性的存在(优选药物引起的毒性,例如, 心脏毒性),鉴别引起或具有引起毒性的风险的试剂,鉴别可以降低 或防止药物引起的毒性的试剂,缓解、降低或防止药物引起的心脏毒 性和鉴别预测药物引起的心脏毒性中是特别有用的。
“标志物”是其表达水平相比于正常或健康的组织或细胞中的表达 水平发生改变的与疾病状态(如癌症、糖尿病、肥胖症、心血管疾病 或毒性状态,如药物引起的毒性,如心脏毒性)相关的基因。“标志 物核酸”是由本发明的标志物编码的或与其对应的核酸(例如mRNA, cDNA)。这种标志物核酸包括DNA(如cDNA),其包含作为本发 明的标志物的任何基因的全部或部分序列或者这样的序列的互补序 列。这样的序列是本技术领域的技术人员已知的且可以在,例如,NIH 的政府PubMed网站上找到。标志物核酸还包括包含本发明的任何基 因标志物的全部或部分序列或者这样的序列的互补序列的RNA(其 中所有胸苷残基被尿苷残基取代)。“标志物蛋白质”是本发明的标志 物编码的或与之对应的蛋白质。标志物蛋白质包含本发明的任何标志 物蛋白质的全部或部分序列。这样的序列是本技术领域的技术人员已 知的且可以在,例如,NIH的政府PubMed网站上找到。术语“蛋白 质”和“多肽”可以互换使用。
“疾病状态或毒性状态相关的”体液是当在病人体内时,其接触或 经过肉瘤细胞或从肉瘤细胞脱落的细胞或蛋白质能够进入其中的流 体。示例性的疾病状态或毒性状态相关的体液包括血液流体(如全血、 血清、去除血小板的血液),并在下面更详细地描述。疾病状态或毒 性状态相关的体液不限于,全血、去除血小板的血液、淋巴、前列腺 液、尿液和精液。
标志物的“正常”表达水平是标志物在没有遭受疾病状态或毒性状 态的人类受试者或患者的细胞中的表达水平。
标志物的“过表达”或“较高的表达水平”指的是测试样品中大于用 来评估表达的分析法的标准误差的表达水平,且优选至少是对照样品 (例如,没有与疾病状态或毒性状态,例如,癌症、糖尿病、肥胖症、 心血管疾病和心脏毒性相关的标志物的来自健康受试者的样品)中标 志物表达水平和优选地,几个对照样品中标志物的平均表达水平的两 倍,更优选为三、四、五、六、七、八、九或十倍。
标志物的“较低表达水平”是指测试样品中的表达水平,其比对照 样品(例如,没有与疾病状态或毒性状态,例如,癌症、糖尿病、肥 胖症、心血管疾病和心脏毒性相关的标志物的来自健康受试者的样 品)中的标志物表达水平,和优选地几个对照样品中标志物的平均表 达水平低至少两倍,更优选三、四、五、六、七、八、九或十倍。
“转录的多核苷酸”或“核苷酸转录物”是与通过本发明标志物的转 录和RNA转录物的正常转录后加工(如剪接)(如果有的话)及RNA 转录物的反转录产生的成熟mRNA的全部或一部分互补或同源的多 核苷酸(例如,mRNA、hnRNA、cDNA,或这种DNA或cDNA的 类似物)。
“互补”是指两条核酸链的区域之间或同一核酸链的两个区域之间 的序列互补性的广义概念。已知第一核酸区域的腺嘌呤残基能够与反 平行于第一区域的第二核酸区域的残基(如果该残基是胸腺嘧啶或尿 嘧啶)形成特定氢键(“碱基配对”)。类似地,已知第一核酸区域的 胞嘧啶残基能够与反平行于第一区域的第二核酸区域的残基(如果该 残基是鸟嘌呤)配对。如果当两个区域以反平行的方式排列时,第一 区域的至少一个核苷酸残基能够与第二区域的残基碱基配对,那么核 酸的第一区域互补于相同或不同核酸的第二区域。优选地,第一区域 包含第一部分和第二区域包含第二部分,由此,当第一和第二部分以反平行方式排列时,第一部分的至少约50%和优选至少约75%、至 少约90%或至少约95%的核苷酸残基能够与第二部分中的核苷酸残 基碱基配对。更优选地,第一部分的所有核苷酸残基能够与第二部分 中的核苷酸残基碱基配对。
如本文所用的“同源的”是指相同核酸链的两个区域之间或两个不 同核酸链的区域之间的核苷酸序列相似性。当两个区域中的核苷酸残 基位置被相同的核苷酸残基占据,那么该区域在那个位置是同源的。 如果各个区域的至少一个核苷酸残基位置被相同的残基占据,则第一 区域与第二区域是同源的。两个区域之间的同源性以被相同的核苷酸 残基所占据的两个区域的核苷酸残基位置的比例表示。举例来说,具 有核苷酸序列5'-ATTGCC-3'的区域和具有核苷酸序列5'-TATGGC-3' 的区域有50%的同源性。优选地,第一区域包含第一部分和第二区域 包含第二部分,由此,各个部分的至少约50%,优选至少约75%、 至少约90%或至少约95%的核苷酸残基位置被相同的核苷酸残基所 占据。更优选的是,各个部分的所有核苷酸残基位置被相同的核苷酸 残基占据。
“本发明的蛋白质”包含标志物蛋白质及其片段、变体标志物蛋白 质及其片段、含有标志物或变体标志物蛋白质的至少15个氨基酸的 片段的肽和多肽和含有标志物或变体标志物蛋白质或者标志物或变 体标志物蛋白质的至少15个氨基酸的片段的融合蛋白质。
本发明进一步提供了与本发明的标志物蛋白质和标志物蛋白质 的片段特异性结合的抗体、抗体衍生物和抗体片段。除非其中另有规 定,术语“抗体”和“多个抗体”广义地包含天然存在的抗体形式(例如, IgG、IgA、IgM、IgE)和重组抗体(如单链抗体、嵌合抗体和人源化 抗体及多特异性抗体)以及所有上述形式的片段和衍生物,该片段和 衍生物至少具有抗原结合位点。抗体衍生物可以包含与抗体偶联的蛋 白质或化学部分。
在某些实施方式中,本发明的标志物包括选自于HSPA8、FLNB、 PARK7、HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、 LGALS1、DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、 PARP1、HADHA、PHB2、ATP5A1、CANX、GRP78、GRP75、TIMP1、 PTX3、HSP76、PDIA4、PDIA1、CA2D1、GPAT1和TAZ的一种或多 种基因(或蛋白质)。在一些实施方式中,标志物是上述基因(或蛋 白质)中的至少两个、三个、四个、五个、六个、七个、八个、九个、 十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、 十八个、十九个、二十个、二十五个、三十个或更多个的组合。在前 述列表中给出的所有值也可以是意图属于本发明的部分的范围的上 限或下限,例如,1至5、1至10、1至20、1至30、2至5、2至10、 5至10、1至20、5至20、10至20、10至25、10至30个上述基因 (或蛋白质)。
在一个实施方式中,本发明的标志物是与癌症相关的或涉及癌症 的基因或蛋白质。这样的涉及癌症的基因或蛋白质包括,例如,HSPA8、FLNB、PARK7、HSPA1A/HSPA1B、ST13、TUBB3、MIF、 KARS、NARS、LGALS1、DDX17、EIF5A、HSPA5、DHX9、HNRNPC、 CKAP4、HSPA9、PARP1、HADHA、PHB2、ATP5A1和/或CANX。 在一些实施方式中,本发明的标志物是上述基因(或蛋白质)中至少 两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、 十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九 个、二十个或更多个的组合。在前述列表中给出的所有值也可以是意 图属于本发明的部分的范围的上限或下限,例如,1至5、1至10、1至20、1至30、2至5、2至10、5至10、1至20、5至20、10至20、 10至25、10至30个上述基因(或蛋白质)。
在一个实施方式中,本发明的标志物是与药物引起的毒性相关的 或涉及药物引起的毒性的基因或蛋白质。这样的涉及药物引起的毒性 的基因或蛋白质包括,例如,GRP78、GRP75、TIMP1、PTX3、HSP76、 PDIA4、PDIA1、CA2D1、GPAT1和/或TAZ。在一些实施方式中, 本发明的标志物是上述基因(或蛋白质)中至少两个、三个、四个、 五个、六个、七个、八个、九个、十个的组合。在前述列表中给出的 所有值也可以是意图属于本发明的部分的范围的上限或下限,例如, 1至5、1至10、1至20、1至30、2至5、2至10、5至10、1至20、 5至20、10至20、10至25、10至30个上述基因(或蛋白质)。
A、心脏毒性相关的标志物
本发明是基于(至少部分地)与药物诱导的心脏毒性相关的新型 生物标志物的鉴别。本发明进一步基于(至少部分地)辅酶Q10能够 减少或防止药物诱导的心脏毒性的发现。
因此,本发明提供用于鉴别引起或具有引起毒性的风险的试剂的 方法。在一个实施方式中,该试剂是药物或药物候选物。在一个实施 方式中,该毒性是药物诱导的毒性,例如,心脏毒性。在一个实施方 式中,该试剂是用于治疗糖尿病、肥胖症或心血管疾病的药物或药物 候选物。在这些方法中,对一对样品(第一样品没有经历药物治疗和 第二样品经历了药物治疗)中的一个或多个生物标志物/蛋白质的量进 行评估。与第一样品相比,第二样品中一个或多个生物标志物的表达 水平中的调节是药物引起导致药物诱导的毒性(例如,心脏毒性)或 者具有导致药物诱导的毒性(例如,心脏毒性)的风险的指示。在一 个实施方式中,所述一个或多个生物标志物选自于GRP78、GRP75、 TIMP1、PTX3、HSP76、PDIA4、PDIA1、CA2D1、GPAT1和TAZ。 本发明的方法可以与熟练技术人员使用的任何其他方法结合实施以鉴别具有引起药物诱导的心脏毒性的风险的药物。
因此,在一个方面中,本发明提供了一种用于鉴别导致药物诱导 的毒性(例如,心脏毒性)或具有导致药物诱导的毒性(例如,心脏 毒性)的风险的药物的方法,其包括:比较(i)在用药物处理前得到 的第一细胞样品中存在的一个或多个生物标志物的表达水平与(ii) 在用药物处理后得到的第二细胞样品中存在的该一个或多个生物标 志物的表达水平,其中该一个或多个生物标志物选自于GRP78、 GRP75、TIMP1、PTX3、HSP76、PDIA4、PDIA1、CA2D1、GPAT1 和TAZ;其中与第一样品相比,第二样品中该一个或多个生物标志物 的表达水平的调节是药物导致或具有导致药物诱导的毒性(例如,心 脏毒性)的风险的指示。
在一个实施方式中,药物诱导的毒性是药物诱导的心脏毒性。在 一个实施方式中,所述细胞是心血管系统的细胞,例如,心肌细胞。 在一个实施方式中,所述细胞是糖尿病患者的心肌细胞。在一个实施 方式中,药物是用于治疗糖尿病、肥胖症或心血管疾病的药物或候选 药物。
在一个实施方式中,与第一样品相比,第二样品中选自于GRP78、 GRP75、TIMP1、PTX3、HSP76、PDIA4、PDIA1、CA2D1、GPAT1 和TAZ的一个、两个、三个、四个、五个、六个、七个、八个、九 个或全部十个生物标志物的表达水平的调节(例如,提高或降低)是 药物导致或者具有导致药物诱导的毒性的风险的指示。
本发明也提供了用于鉴别可以减少或防止药物诱导的毒性的试 剂的方法。在一个实施方式中,药物诱导的毒性是心脏毒性。在一个 实施方式中,药物是用于治疗糖尿病、肥胖症或心血管疾病的药物或 药物候选物。在这些方法中,对三个样品(第一样品未经历药物处理, 第二样品经历药物处理,和第三样品经历药物和试剂两者的处理)中 一个或多个生物标志物的量进行评估。第三样品中与第一样品相比一 个或多个生物标志物的大致相同的表达水平是该试剂可以减少或防 止药物诱导的毒性,例如,药物诱导的心脏毒性的指示。在一个实施 方式中,所述一个或多个生物标志物选自于GRP78、GRP75、TIMP1、 PTX3、HSP76、PDIA4、PDIA1、CA2D1、GPAT1和TAZ。
使用本文所述的方法,可筛选多种分子,特别地包括足够小以能 够跨过细胞膜的分子,以便鉴别调节(例如,增加或减少)本发明标 志物的表达和/或活性的分子。可以向受试者提供如此鉴别的化合物以 减少、减轻或防止受试者中药物诱导的毒性。
因此,在另一个方面中,本发明提供了一种用于鉴别可以减少或 防止药物诱导毒性的试剂的方法,其包括:(i)测定在用毒性诱导药 物处理之前获得的第一样品中存在的一个或多个生物标志物的表达 水平,(ii)测定在用毒性诱导药物处理后获得的第二样品中存在的 一个或多个生物标志物的表达水平,(iii)测定在用毒性诱导药物和 所述试剂处理后获得的第三样品中存在的一个或多个生物标志物的 表达水平,以及(iv)比较第一样品中与第三样品中存在的一个或多 个生物标志物的表达水平,其中所述一个或多个生物标志物选自于 GRP78、GRP75、TIMP1、PTX3、HSP76、PDIA4、PDIA1、CA2D1、 GPAT1和TAZ,且其中第三样品中与第一样品相比一个或多个生物 标志物的大致相同的表达水平表明该试剂可以减少或防止药物诱导 的毒性。
在一个实施方式中,药物诱导的毒性是药物诱导的心脏毒性。在 一个实施方式中,所述细胞是心血管系统的细胞,例如,心肌细胞。 在一个实施方式中,所述细胞是糖尿病患者的心肌细胞。在一个实施 方式中,药物是用于治疗糖尿病、肥胖症或心血管疾病的药物或候选 药物。
在一个实施方式中,与第一样品相比,第三样品中选自于GRP78、 GRP75、TIMP1、PTX3、HSP76、PDIA4、PDIA1、CA2D1、GPAT1 和TAZ中的一个、两个、三个、四个、五个、六个、七个、八个、 九个或全部十个生物标志物的大约相同的表达水平是该试剂可以减 少或防止药物诱导的毒性的指示。
本发明还提供了用于在需要的受试者中缓解、减轻或防止药物诱 导的心脏毒性的方法,其包括向受试者(例如,哺乳动物、人或非人 类动物)施用由本文提供的筛选方法鉴别的试剂,从而减少或防止受 试者中药物诱导的心脏毒性。在一个实施方式中,所述试剂被施用给 已经用心脏毒性诱导药物治疗的受试者。在一个实施方式中,在心脏 毒性诱导药物治疗受试者的同时将该试剂施用于受试者。在一个实施 方式中,在用心脏毒性诱导药物治疗受试者之前将该试剂施用于受试 者。
本发明还提供了用于在需要的受试者中缓解、减轻或防止药物诱 导的心脏毒性的方法,其包括向受试者(例如,哺乳动物、人或非人 类动物)施用辅酶Q10,从而减少或防止受试者中药物诱导的心脏毒 性。在一个实施方式中,辅酶Q10被施用给已经用心脏毒性诱导药物 治疗的受试者。在一个实施方式中,在用心脏毒性诱导药物治疗受试 者的同时将辅酶Q10施用于受试者。在一个实施方式中,在用心脏毒 性诱导药物治疗受试者之前将辅酶Q10施用于受试者。在一个实施方 式中,药物诱导的心脏毒性与选自于GRP78、GRP75、TIMP1、PTX3、 HSP76、PDIA4、PDIA1、CA2D1、GPAT1和TAZ的一个、两个、 三个、四个、五个、六个、七个、八个、九个或全部十个生物标志物 的表达水平的调节相关。在前述列表中给出的所有值也可以是意图属 于本发明的部分的范围的上限或下限,例如,1至5、1至10、2至5、 2至10或5至10个上述基因(或蛋白质)。
本发明还提供了可用作心脏毒性(例如,药物诱导的心脏毒性) 的预测标志物的生物标志物(例如,基因和/或蛋白质)。这些生物标 志物包括GRP78、GRP75、TIMP1、PTX3、HSP76、PDIA4、PDIA1、 CA2D1、GPAT1和TAZ。但是,普通技术人员能够通过采用本文所 述的方法(例如,通过进行实施例3中描述的方法)但使用已知诱导 心脏毒性的不同药物来鉴别预测药物诱导的心脏毒性的另外的生物 标志物。下面进一步描述本发明的示例性的药物诱导心脏毒性生物标 志物。
GRP78和GRP75也被称为葡萄糖反应蛋白质。这些蛋白质与心 肌细胞的内/肌质网应激(ER应激)相关。SERCA或肌/内质网钙ATP 酶调控心肌细胞中的Ca2+动态平衡。这些ATP酶的任何破坏可导致 心功能不全和心力衰竭。根据本文提供的数据,GRP75和GRP78及 他们周围的边界是药物诱导的心脏毒性的新预测子。
TIMP1,也被称为TIMP金属蛋白质酶抑制剂1,参与细胞外基 质与MMP结合的重建。TIMP1的表达与心脏纤维化相关联,且血管 内皮细胞的缺氧也诱导TIMP1表达。根据本文所提供的数据,TIMP1 是药物诱导的心脏毒性的新预测子。
PTX3,也称为穿透素(Pentraxin)3,属于C反应蛋白质(CRP) 家族且是心脏的炎症状态的良好标志物。然而,血浆PTX3也可能是 由于败血症或其他医学状态产生的全身性炎症反应的表现。根据本文 所提供的数据,PTX3可以是心功能或心脏毒性的新标志物。此外,网络中与PTX3相关的边界可以形成新的生物标志物小组。
HSP76,也被称为HSPA6,仅已知在内皮细胞和B淋巴细胞中表 达。这种蛋白质在心脏功能没有已知的作用。根据本文所提供的数据, HSP76可以是药物诱导的心脏毒性的新的预测子。
PDIA4,PDIA1,也被称为蛋白质二硫键异构酶家族A蛋白,与 ER应激反应相关,如GRP一样。这些蛋白质在心脏功能中没有已知 的作用。根据本文提供的数据,这些蛋白质可以是药物诱导的心脏毒 性的新的预测子。
CA2D1也称为钙通道、电压依赖性、α-2/δ亚基。电压依赖性钙 通道的α-2/δ亚基调节钙通道的钙电流密度和活化/灭活动力学。CA2D1在心脏中的兴奋收缩偶联中起着重要的作用。这种蛋白质在 心脏功能没有已知的作用。根据本文提供的数据,CA2D1是药物诱 导的心脏毒性的新预测子。
GPAT1是四个已知的甘油-3-磷酸酰基转移酶同功型之一,且位 于线粒体外膜上,从而允许与肉碱棕榈酰转移酶1的相互调节。 GPAT1由胰岛素和SREBP-1c转录上调和由AMP-活化蛋白激酶急性 下调,与三酰基甘油合成中的作用一致。根据本文提供的数据,GPAT1 是药物诱导的心脏毒性的新的预测子。
TAZ,也被称为Tafazzin,在心脏和骨骼肌中高度表达。TAZ参 与心磷脂的代谢并作为磷脂-溶血磷脂转酰基酶发挥功能。Tafazzin负 责磷脂心磷脂(CL)(线粒体内膜的标志脂质)的重建。基于本文所 提供的数据,TAZ是药物诱导的心脏毒性的新的预测子。
B、癌症相关标志物
本发明是基于(至少部分地)与癌症相关的新型生物标志物的鉴 别。这样的与癌症相关的标志物包括,例如,HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和/或CANX。在一些实施方式中,本发明 的标志物是至少两个、三个、四个、五个、六个、七个、八个、九个、 十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、 十八个、十九个、二十个或更多个上述标志物的组合。
因此,本发明提供用于鉴别引起或具有引起癌症的风险的试剂的 方法。在一个实施方式中,该试剂是药物或药物候选物。在这些方法 中,对一对样品(第一样品没有经历药物处理和第二样品经历了药物 处理)中一个或多个生物标志物/蛋白质的量进行评估。与第一样品相 比,第二样品中一个或多个生物标志物的表达水平的调节是药物导致 或者具有导致癌症的风险的指示。在一个实施方式中,所述一个或多 个生物标志物选自于HSPA8、FLNB、PARK7、HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、DDX17、EIF5A、 HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、HADHA、 PHB2、ATP5A1和CANX。本发明的方法可以与熟练技术人员使用 的任何其他方法结合使用以鉴别具有导致癌症的风险的药物。
在一个方面中,本发明提供了用于评估在受试者中治疗癌症的疗 法的效力的方法,该方法包括:比较在向受试者施用至少一部分治疗 方案前从受试者得到的第一样品中存在的一个或多个标志物的表达 水平与施用至少一部分治疗方案后从受试者得到的第二样品中存在 的一个或多个标志物的表达水平,其中所述一个或多个标志物选自于 HSPA8、FLNB、PARK7、HSPA1A/HSPA1B、ST13、TUBB3、MIF、 KARS、NARS、LGALS1、DDX17、EIF5A、HSPA5、DHX9、HNRNPC、 CKAP4、HSPA9、PARP1、HADHA、PHB2、ATP5A1和CANX,其 中与第一样品相比,第二样品中一个或多个生物标志物的表达水平的 调节表明该疗法对于在受试者中治疗癌症是有效的。
在一个实施方式中,样品包括从受试者得到的流体。在一个实施 方式中,该流体选自于血液流体、呕吐物、唾液、淋巴液、囊液、尿、 从支气管肺泡灌洗收集的流体、从腹腔清洗收集的流体和妇科液体。 在一个实施方式中,样品是血液样品或其组分。
在另一个实施方式中,样品包括获自受试者的组织或成分。在一 个实施方式中,该组织选自于骨、结缔组织、软骨、肺、肝脏、肾脏、 肌肉组织、心脏、胰腺和皮肤。
在一个实施方式中,受试者是人。
在一个实施方式中,在生物样品中的所述一个或多个标志物的表 达水平是通过分析样品中转录的多核苷酸或其一部分来确定的。在一 个实施方式中,其中分析转录的多核苷酸包括扩增转录的多聚核苷 酸。
在一个实施方式中,受试者样品中标志物的表达水平是通过分析 样品中的蛋白质或其一部分而确定的。在一个实施方式中,使用与该 蛋白质特异性结合的试剂分析该蛋白质。
在一个实施方式中,样品中所述一个或多个标志物的表达水平是 使用选自于所述样品的聚合酶链反应(PCR)扩增反应、逆转录酶PCR 分析、单链构象多态性分析(SSCP)、错配切割检测、异源双链分 析、DNA印迹分析、RNA印迹分析、蛋白质印迹分析、原位杂交、阵列分析、脱氧核糖核酸测序、限制性片段长度多态性分析及其组合 或子组合的技术测定的。
在一个实施方式中,样品中标志物的表达水平是使用选自于免疫 组织化学、免疫细胞化学、流式细胞术、ELISA法和质谱法中的技术 测定的。
在一个实施方式中,测定多个标志物的表达水平。
在一个实施方式中,受试者正在用选自于环境影响剂化合物、外 科手术、放射、激素治疗、抗体治疗、生长因子疗法、细胞因子、化 疗、同种异体干细胞疗法中的疗法治疗。在一个实施方式中,环境影 响剂化合物是辅酶Q10分子。
本发明进一步提供了用于评估受试者是否患有癌症的方法,所述 方法包括:测定获自受试者的生物样品中存在的一个或多个标志物的 表达水平,其中所述一个或多个标志物选自于HSPA8、FLNB、 PARK7、HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、 LGALS1、DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、 HSPA9、PARP1、HADHA、PHB2、ATP5A1和CANX;和对比获自 受试者的生物样品中存在的一个或多个标志物的表达水平与对照样 品中存在的一个或多个标志物的表达水平,其中相对于对照样品中一 个或多个标志物的表达水平,从受试者获得的生物样品中所述一个或 多个标志物的表达水平的调节表明受试者患有癌症,从而评定受试者 是否患有癌症。
在一个实施方式中,所述样品包括从受试者得到的流体。在一个 实施方式中,流体选自于血液流体、呕吐物、唾液、淋巴液、囊液、 尿、从支气管肺泡灌洗收集的流体、从腹腔清洗收集的流体和妇科液 体。在一个实施方式中,样品是血液样品或其组分。
在另一个实施方式中,样品包括获自受试者的组织或成分。在一 个实施方式中,该组织选自于骨、结缔组织、软骨、肺、肝脏、肾脏、 肌肉组织、心脏、胰腺和皮肤。
在一个实施方式中,受试者是人。
在一个实施方式中,在生物样品中所述一个或多个标志物的表达 水平是通过分析样品中转录的多核苷酸或其一部分来确定的。在一个 实施方式中,其中分析转录的多核苷酸包括扩增转录的多聚核苷酸。
在一个实施方式中,受试者样品中标志物的表达水平是通过分析 样品中的蛋白质或其一部分而确定的。在一个实施方式中,使用与该 蛋白质特异性结合的试剂分析蛋白质。
在一个实施方式中,样品中所述一个或多个标志物的表达水平是 使用选自于所述样品的聚合酶链反应(PCR)扩增反应、逆转录酶PCR 分析、单链构象多态性分析(SSCP)、错配切割检测、异源双链分 析、DNA印迹分析、RNA印迹分析、蛋白质印迹分析、原位杂交、阵列分析、脱氧核糖核酸测序、限制性片段长度多态性分析及其组合 或子组合的技术测定的。
在一个实施方式中,样品中标志物的表达水平是通过使用选自于 免疫组织化学、免疫细胞化学、流式细胞术、ELISA法和质谱法的技 术测定的。
在一个实施方式中,测定多个标志物的表达水平。
在一个实施方式中,受试者正在用选自于环境影响剂化合物、外 科手术、放射、激素治疗、抗体治疗、生长因子疗法、细胞因子治疗、 化疗、同种异体干细胞疗法的疗法进行治疗。在一个实施方式中,环 境影响剂化合物是辅酶Q10分子。
本发明还提供了预测受试者是否易于发生癌症的方法,所述方法 包括:测定获自受试者的生物样品中存在的一个或多个标志物的表达 水平,其中所述一个或多个标志物选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、HADHA、PHB2、ATP5A1和CANX;和比较获自受试者的生物样品 中存在的一个或多个标志物的表达水平与对照样品中存在的一个或多个标志物的表达水平,其中相对于对照样品中的一个或多个标志物 的表达水平,从受试者获得的生物样品中所述一个或多个标志物的表 达水平的调节表明受试者易于发生癌症,从而预测受试者是否易于发 生癌症。
在一个实施方式中,所述样品包括从受试者得到的流体。在一个 实施方式中,该流体选自于血液流体、呕吐物、唾液、淋巴液、囊液、 尿、从支气管肺泡灌洗收集的流体、从腹腔清洗收集的流体和妇科液 体。在一个实施方式中,样品是血液样品或其组分。
在另一个实施方式中,样品包括获自受试者的组织或成分。在一 个实施方式中,该组织选自于骨、结缔组织、软骨、肺、肝脏、肾脏、 肌肉组织、心脏、胰腺和皮肤。
在一个实施方式中,受试者是人。
在一个实施方式中,在生物样品中的所述一个或多个标志物的表 达水平是通过分析样品中转录的多核苷酸或其一部分来确定的。在一 个实施方式中,其中分析转录的多核苷酸包括扩增转录的多聚核苷 酸。
在一个实施方式中,受试者样品中标志物的表达水平是通过分析 样品中的蛋白质或其一部分而确定的。在一个实施方式中,使用与蛋 白质特异性结合的试剂分析该蛋白质。
在一个实施方式中,样品中所述一个或多个标志物的表达水平是 使用选自于所述样品的聚合酶链反应(PCR)扩增反应、逆转录酶PCR 分析、单链构象多态性分析(SSCP)、错配切割检测、异源双链分 析、DNA印迹分析、RNA印迹分析、蛋白质印迹分析、原位杂交、阵列分析、脱氧核糖核酸测序、限制性片段长度多态性分析及其组合 或子组合的技术测定的。
在一个实施方式中,样品中标志物的表达水平是使用选自于免疫 组织化学、免疫细胞化学、流式细胞术、ELISA法和质谱法的技术测 定的。
在一个实施方式中,测定多个标志物的表达水平。
在一个实施方式中,受试者正在用选自于环境影响剂化合物、外 科手术、放射、激素治疗、抗体治疗、生长因子疗法、细胞因子治疗、 化疗、同种异体干细胞疗法的疗法进行治疗。在一个实施方式中,环 境影响剂化合物是辅酶Q10分子。
本发明进一步提供了预测受试者中癌症复发的方法,该方法包 括:测定获自受试者的生物样品中存在的一个或多个标志物的表达水 平,其中所述一个或多个标志物选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX;和比较获自受试者的生物样品 中存在的一个或多个标志物的表达水平与对照样品中存在的一个或多个标志物的表达水平,其中相对于对照样品中的一个或多个标志物 的表达水平,从受试者获得的生物样品中所述一个或多个标志物的表 达水平的调节是癌症复发的指示,从而预测受试者中癌症的复发。
在一个实施方式中,所述样品包括从受试者得到的流体。在一个 实施方式中,流体选自于血液流体、呕吐物、唾液、淋巴液、囊液、 尿、从支气管肺泡灌洗收集的流体、从腹腔清洗收集的流体和妇科液 体。在一个实施方式中,样品是血液样品或其组分。
在另一个实施方式中,样品包括获自受试者的组织或成分。在一 个实施方式中,该组织选自于骨、结缔组织、软骨、肺、肝脏、肾脏、 肌肉组织、心脏、胰腺和皮肤。
在一个实施方式中,受试者是人。
在一个实施方式中,在生物样品中的所述一个或多个标志物的表 达水平是通过分析样品中转录的多核苷酸或其一部分来确定的。在一 个实施方式中,其中分析转录的多核苷酸包括扩增转录的多聚核苷 酸。
在一个实施方式中,受试者样品中标志物的表达水平是通过分析 样品中的蛋白质或其一部分而确定的。在一个实施方式中,使用与蛋 白质特异性结合的试剂分析该蛋白质。
在一个实施方式中,样品中所述一个或多个标志物的表达水平是 使用选自于所述样品的聚合酶链反应(PCR)扩增反应、逆转录酶PCR 分析、单链构象多态性分析(SSCP)、错配切割检测、异源双链分 析、DNA印迹分析、RNA印迹分析、蛋白质印迹分析、原位杂交、阵列分析、脱氧核糖核酸测序、限制性片段长度多态性分析及其组合 或子组合的技术测定的。
在一个实施方式中,样品中标志物的表达水平是通过使用选自于 免疫组织化学、免疫细胞化学、流式细胞术、ELISA法和质谱法中的 技术测定的。
在一个实施方式中,测定多个标志物的表达水平。
在一个实施方式中,受试者正在用选自于环境影响剂化合物、外 科手术、放射、激素治疗、抗体治疗、生长因子疗法、细胞因子治疗、 化疗、同种异体干细胞疗法的疗法进行治疗。在一个实施方式中,环 境影响剂化合物是辅酶Q10分子。
本发明还提供了预测患有癌症的受试者的生存的方法,该方法包 括:测定获自受试者的生物样品中存在的一个或多个标志物的表达水 平,其中所述一个或多个标志物选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX;和比较获自受试者的生物样品 中存在的一个或多个标志物的表达水平与对照样品中存在的一个或多个标志物的表达水平,其中相对于对照样品中的一个或多个标志物 的表达水平,从受试者获得的生物样品中所述一个或多个标志物的表 达水平的调节是受试者生存的指示,从而预测患有癌症的受试者的生 存。
在一个实施方式中,样品包括从受试者得到的流体。在一个实施 方式中,该流体选自于血液流体、呕吐物、唾液、淋巴液、囊液、尿、 从支气管肺泡灌洗收集的液体、从腹腔清洗收集的流体和妇科液体。 在一个实施方式中,样品是血液样品或其组分。
在另一个实施方式中,样品包括获自受试者的组织或成分。在一 个实施方式中,该组织选自于骨、结缔组织、软骨、肺、肝脏、肾脏、 肌肉组织、心脏、胰腺和皮肤。
在一个实施方式中,受试者是人。
在一个实施方式中,在生物样品中的所述一个或多个标志物的表 达水平是通过分析样品中转录的多核苷酸或其一部分来确定的。在一 个实施方式中,其中分析转录的多核苷酸包括扩增转录的多聚核苷 酸。
在一个实施方式中,受试者样品中标志物的表达水平是通过分析 样品中的蛋白质或其一部分而确定的。在一个实施方式中,使用与蛋 白质特异性结合的试剂分析该蛋白质。
在一个实施方式中,样品中所述一个或多个标志物的表达水平是 使用选自于所述样品的聚合酶链反应(PCR)扩增反应、逆转录酶PCR 分析、单链构象多态性分析(SSCP)、错配切割检测、异源双链分 析、DNA印迹分析、RNA印迹分析、蛋白质印迹分析、原位杂交、阵列分析、脱氧核糖核酸测序、限制性片段长度多态性分析及其组合 或子组合的技术测定的。
在一个实施方式中,样品中标志物的表达水平是使用选自于免疫 组织化学、免疫细胞化学、流式细胞术、ELISA法和质谱法的技术测 定的。
在一个实施方式中,测定多个标志物的表达水平。
在一个实施方式中,受试者正在用选自于环境影响剂化合物、外 科手术、放射、激素治疗、抗体治疗、生长因子疗法、细胞因子治疗、 化疗、同种异体干细胞疗法的疗法进行治疗。在一个实施方式中,环 境影响剂化合物是辅酶Q10分子。
本发明还提供了监测受试者中癌症的进展的方法,该方法包括: 比较在向受试者施用至少一部分治疗方案前从受试者得到的第一样 品中存在的一个或多个标志物的表达水平与施用至少一部分治疗方 案后从受试者得到的第二样品中存在的一个或多个标志物的表达水 平,其中所述一个或多个标志物选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX,从而监测受试者中癌症的进展。
在一个实施方式中,样品包括从受试者得到的流体。在一个实施 方式中,该流体选自于血液流体、呕吐物、唾液、淋巴液、囊液、尿、 从支气管肺泡灌洗收集的液体、从腹腔清洗收集的流体和妇科液体。 在一个实施方式中,样品是血液样品或其组分。
在另一个实施方式中,样品包括获自受试者的组织或成分。在一 个实施方式中,该组织选自于骨、结缔组织、软骨、肺、肝脏、肾脏、 肌肉组织、心脏、胰腺和皮肤。
在一个实施方式中,受试者是人。
在一个实施方式中,在生物样品中的所述一个或多个标志物的表 达水平是通过分析样品中转录的多核苷酸或其一部分来确定的。在一 个实施方式中,其中分析转录的多核苷酸包括扩增转录的多聚核苷 酸。
在一个实施方式中,受试者样品中标志物的表达水平是通过分析 样品中的蛋白质或其一部分而确定的。在一个实施方式中,使用与蛋 白质特异性结合的试剂分析该蛋白质。
在一个实施方式中,样品中所述一个或多个标志物的表达水平是 使用选自于所述样品的聚合酶链反应(PCR)扩增反应、逆转录酶PCR 分析、单链构象多态性分析(SSCP)、错配切割检测法、异源双链 分析、DNA印迹分析、RNA印迹分析、蛋白质印迹分析、原位杂交、阵列分析、脱氧核糖核酸测序、限制性片段长度多态性分析及其组合 或子组合的技术测定的。
在一个实施方式中,样品中标志物的表达水平是使用选自于免疫 组织化学、免疫细胞化学、流式细胞术、ELISA法和质谱法的技术测 定的。
在一个实施方式中,测定多个标志物的表达水平。
在一个实施方式中,受试者正在用选自于环境影响剂化合物、外 科手术、放射、激素治疗、抗体治疗、生长因子疗法、细胞因子治疗、 化疗、同种异体干细胞疗法的疗法进行治疗。在一个实施方式中,环 境影响剂化合物是辅酶Q10分子。
本发明进一步提供鉴别用于在受试者中治疗癌症的化合物的方 法,该方法包括:从受试者获得生物样品;将生物样品与测试化合物 相接触,测定获自受试者的生物样品中存在的一个或多个标志物的表 达水平,其中所述一个或多个标志物选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX,其具有正倍数变化和/或负倍数变化;将生物样品中多个标志物之一的表达水平与适合的对照比较; 和选择以负倍数变化降低生物样品中存在的一个或多个标志物的表 达水平和/或以正倍数变化提高生物样品中存在的一个或多个标志物 的表达水平的测试化合物,从而鉴别在受试者中用于治疗癌症的化合 物。
在一个实施方式中,样品包括从受试者得到的流体。在一个实施 方式中,流体选自于血液流体、呕吐物、唾液、淋巴液、囊液、尿、 从支气管肺泡灌洗收集的液体、从腹腔清洗收集的流体和妇科液体。 在一个实施方式中,样品是血液样品或其组分。
在另一个实施方式中,样品包括获自受试者的组织或成分。在一 个实施方式中,该组织选自于骨、结缔组织、软骨、肺、肝脏、肾脏、 肌肉组织、心脏、胰腺和皮肤。
在一个实施方式中,受试者是人。
在一个实施方式中,在生物样品中的所述一个或多个标志物的表 达水平是通过分析样品中转录的多核苷酸或其一部分来确定的。在一 个实施方式中,其中分析转录的多核苷酸包括扩增转录的多聚核苷 酸。
在一个实施方式中,受试者样品中标志物的表达水平是通过分析 样品中的蛋白质或其一部分而确定的。在一个实施方式中,使用与蛋 白质特异性结合的试剂分析该蛋白质。
在一个实施方式中,样品中所述一个或多个标志物的表达水平是 使用选自于所述样品的聚合酶链反应(PCR)扩增反应、逆转录酶PCR 分析、单链构象多态性分析(SSCP)、错配切割检测、异源双链分 析、DNA印迹分析、RNA印迹分析、蛋白质印迹分析、原位杂交、阵列分析、脱氧核糖核酸测序、限制性片段长度多态性分析及其组合 或子组合的技术测定的。
在一个实施方式中,样品中标志物的表达水平是使用选自于免疫 组织化学、免疫细胞化学、流式细胞术、ELISA法和质谱法的技术测 定的。
在一个实施方式中,测定多个标志物的表达水平。
在一个实施方式中,受试者正在用选自于环境影响剂化合物、外 科手术、放射、激素治疗、抗体治疗、生长因子疗法、细胞因子治疗、 化疗、同种异体干细胞疗法的疗法进行治疗。在一个实施方式中,环 境影响剂化合物是辅酶Q10分子。
本发明还提供了用于评估用于治疗癌症的疗法的疗效的试剂盒, 该试剂盒包括用于测定至少一个选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX的标志物的表达水平的试剂,和 使用该试剂盒来评估用于治疗癌症的疗法的疗效的说明。
本发明还提供了一种用于评估受试者是否患有癌症的试剂盒,该 试剂盒包括用于测定至少一个选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX的标志物的表达水平的试剂,和 使用该试剂盒来评估受试者是否患有癌症的说明。
本发明还提供了一种用于预测受试者是否易于发生癌症的试剂 盒,该试剂盒包括用于测定至少一个选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX的标志物的表达水平的试剂,和 使用该试剂盒来预测受试者是否易于发生癌症的说明。
本发明还提供了一种用于预测癌症在受试者中的复发的试剂盒, 该试剂盒包括用于评估至少一个选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX的标志物的表达水平的试剂,和 使用该试剂盒来预测癌症的复发的说明。
本发明还提供了一种用于预测癌症复发的试剂盒,该试剂盒包括 用于测定至少一个选自于HSPA8、FLNB、PARK7、HSPA1A/HSPA1B、 ST13、TUBB3、MIF、KARS、NARS、LGALS1、DDX17、EIF5A、 HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、HADHA、 PHB2、ATP5A1和CANX的标志物的表达水平的试剂,和使用该试 剂盒来预测癌症复发的说明。
本发明进一步提供用于预测患有癌症的受试者的生存的试剂盒, 该试剂盒包括用于测定至少一个选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1和CANX的标志物的表达水平的试剂,和 使用该试剂盒来预测患有癌症的受试者的生存的说明。
本发明还提供了一种用于监测受试者中癌症进展的试剂盒,该试 剂盒包括用于测定至少一个选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、HADHA、PHB2、ATP5A1和CANX的标志物的表达水平的试剂,和 使用该试剂盒来预测受试者中癌症的进展的说明。
本发明的试剂盒可以进一步包含用于从受试者获取生物样品的 装置、对照样品和/或环境影响剂化合物。
用于测定至少一个标志物的表达水平的手段可以包括用于分析 样品中转录的多核苷酸或其一部分的手段和/或用于分析样品中蛋白 质或其一部分的手段。
在一个实施方式中,试剂盒包含用于测定多个标志物的表达水平 的试剂。
本发明的各方面在下面的小节中进一步详细描述。
C、分离的核酸分子
本发明的一个方面涉及分离的核酸分子,包括编码标志物蛋白质 或其一部分的核酸。本发明的分离的核酸还包括足以用作杂交探针来 确定标志物核酸分子及标志物核酸分子的片段的核酸分子,例如,那 些适合用作标志物核酸分子的扩增或突变的PCR引物的核酸分子。 如本文所用的术语“核酸分子”旨在包括DNA分子(例如,cDNA或 基因组DNA)和RNA分子(例如,mRNA)及使用核苷酸类似物产 生的DNA或RNA的类似物。核酸分子可以是单链的或双链的,但优 选为双链DNA。
“分离的”核酸分子是与存在于该核酸分子的天然来源中的其他核 酸分子分离的核酸分子。在一个实施方式中,“分离的”核酸分子不含 核酸所来源的生物体的基因组DNA中自然侧邻该核酸的序列(即, 位于该核酸的5'和3'端的序列)(优选蛋白质编码序列)。例如,在 各种实施方式中,分离的核酸分子可以包含少于约5kB、4kB、3kB、 2kB、1kB、0.5kB或0.1kB的该核酸所来源的细胞的基因组DNA 中自然侧邻该核酸分子的核苷酸序列。在另一个实施方式中,“分离 的”核酸分子,如cDNA分子,可以基本上不含其他细胞物质,或当 通过重组技术产生时基本上不含培养基,或当化学合成时基本上不含 化学前体或其他化学物质。基本上不含细胞物质的核酸分子包括具有 小于约30%、20%、10%或5%的异源核酸(这里也称为“污染核酸”) 的制剂。
可以使用标准的分子生物学技术和本文所描述的数据库记录中 的序列信息分离本发明的核酸分子。使用这样的核酸序列的全部或一 部分,可以使用标准杂交和克隆技术(例如,如Sambrook等编辑, Molecular Cloning:A Laboratory Manual,2nd ed.,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY,1989中所描述的)分离本发明的核酸分子。
可以使用作为模板的cDNA、mRNA或基因组DNA和适当的寡 核苷酸引物根据标准PCR扩增技术来扩增本发明的核酸分子。如此 扩增的核酸可以被克隆到合适的载体中,和通过DNA序列分析鉴定。 此外,对应于本发明的核酸分子的全部或一部分的核苷酸可以通过标 准合成技术,例如,使用自动DNA合成仪制备。
在另一个优选的实施方式中,本发明的分离的核酸分子包含的核 酸分子具有与标志物核酸的核苷酸序列或与编码标志物蛋白质的核 酸的核苷酸序列互补的核苷酸序列。与给定的核苷酸序列互补的核酸 分子是与给定的核苷酸序列充分互补的核酸分子,它可以与给定的核 苷酸序列杂交从而形成稳定的双链体。
此外,本发明的核酸分子可以只包含核酸序列的一部分,其中全 长核酸序列包含标志物核酸或它编码标志物蛋白质。这样的核酸可用 作,例如,探针或引物。该探针/引物通常作为一个或多个基本上纯化 的寡核苷酸使用。该寡核苷酸典型地包含在严格条件下与本发明核酸 的至少约7个、优选约15个、更优选为约25、50、75、100、125、 150、175、200、250、300,350或400个或更多个连续核苷酸杂交的 核苷酸序列的区域。
基于本发明核酸分子的序列的探针可用于检测对应于本发明的 一个或多个标志物的转录本或基因组序列。该探针包含连接在其上的 标记基团,例如,放射性同位素、荧光化合物、酶或酶辅因子。这样 的探针可用作用于识别错误表达蛋白质的细胞或组织的诊断测试试 剂盒的部分,如通过测量来自受试者的细胞样品中编码蛋白质的核酸 分子的水平,例如,检测mRNA水平或测定编码该蛋白质的基因是 否已突变或缺失。
本发明还包含由于遗传密码的简并性而与编码标志物蛋白质的 核酸的核苷酸序列不同的并因此编码相同的蛋白质的核酸分子。
本领域技术人员将能理解,导致氨基酸序列变化的DNA序列多 态性可能存在于群体(例如,人类群体)中。由于自然等位基因变异, 这种基因多态性可能存在于群体内的个体之间。等位基因是在给定的 基因座处交替出现的一组基因之一。此外,应该理解的是,影响RNA 表达水平的DNA多态性也可以存在,其可以影响该基因的整体表达 水平(例如,通过影响调节或降解)。
如本文所用的,术语“等位基因变异体”是指存生于给定基因座处 的核苷酸序列,或指由核苷酸序列编码的多肽。
如本文所用的,术语“基因”和“重组基因”指含有编码与本发明的 标志物对应的多肽的开放阅读框的核酸分子。通常,这样的天然等位 基因变异可以导致给定基因的核苷酸序列中1-5%的变异。可选等位 基因可以通过测序多个不同个体中的目标基因来识别。这可以通过使 用杂交探针很容易地进行以识别多个个体中的相同基因座。任何及所 有这样的核苷酸变异及所产生的氨基酸多态性或变异(其为天然等位 基因变异的结果且不改变功能活性)意图在本发明的范围之内。
在另一个实施方式中,本发明的分离核酸分子长度是至少7、15、 20、25、30、40、60、80、100、150、200、250、300、350、400、 450、550、650、700、800、900、1000、1200、1400、1600、1800、 2000、2200、2400、2600、2800、3000、3500、4000、4500或更多个 核苷酸,且在严格条件下与标志物核酸或与编码标志物蛋白质的核酸 杂交。如本文所用的,术语“在严格条件下杂交”意图描述用于杂交 和洗涤的条件,其中在该条件下,至少60%(65%、70%、优选75 %)彼此相同的核苷酸序列通常保持彼此杂交。这种严格条件是本技 术领域的技术人员已知的,并且可以在Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989)的6.3.1-6.3.6节中发现。严格 杂交条件的优选的非限制性的例子是在约45℃下6X的氯化钠/柠檬 酸钠(SSC)中杂交,然后在0.2X SSC,0.1%SDS中于50-65℃下洗 涤一次或多次。
除了可以存在于群体中的天然存在的本发明核酸分子的等位基 因变异体,本领域技术人员将进一步理解,序列变化可以由突变引入, 从而导致所编码的蛋白质的氨基酸序列的变化,而不改变由此编码的 蛋白质的生物学活性。例如,一种变化可以导致在“非必需”氨基酸残 基处的氨基酸置换的核苷酸取代。“非必需”氨基酸残基是可以在不改 变生物活性的情况下从野生型序列发生改变的残基,而“必需”氨基酸 残基是生物活性所必需的。例如,各种不同物种的同源物之间非保守 的或仅半保守的氨基酸残基对于活性可能是非必需的且因此很可能 是进行改变的目标。或者,在各种不同物种(例如,鼠和人)的同源物之间保守的氨基酸残基可能是活性必需的,且因此不太可能是改变 的目标。
因此,本发明的另一个方面涉及到编码包含对于活性非必需的氨 基酸残基中的变化的变异标志物蛋白质的核酸分子。这样的变异标志 物蛋白质与天然存在的标志物蛋白质的氨基酸序列不同,但仍保留生 物活性。在一个实施方式中,这样的变异标志物蛋白质具有与标志物 蛋白质的氨基酸序列至少约40%相同的、50%、60%、70%、80%、 90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相 同的氨基酸序列。
通过向标志物核酸的核苷酸序列中引入一个或多个核苷酸取代、 添加或缺失可以产生编码变异标志物蛋白质的分离的核酸分子,以使 得一个或多个氨基酸残基置换、添加或缺失被引入到编码的蛋白质 中。突变可以通过标准技术(如定点诱变和PCR介导的诱变)引入。 优选地,在一个或多个预测的非必需氨基酸残基处进行保守氨基酸置 换。“保守氨基酸置换”是在其中氨基酸残基用具有类似侧链的氨基酸 残基代替的置换。具有类似侧链的氨基酸残基的家族已在本领域中定 义。在这些家族包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸、 组氨酸)、具有酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)、具有 不带电荷的极性侧链的氨基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、 丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、具有非极性侧链的氨基酸(例 如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、蛋氨酸、 色氨酸)、具有β-分支侧链的氨基酸(例如苏氨酸、缬氨酸、异亮氨 酸)和具有芳族侧链的氨基酸(例如,酪氨酸、苯丙氨酸、色氨酸、 组氨酸)。或者,突变可以沿全部或部分编码序列随机引入,例如通 过饱和诱变,且得到的突变体可进行生物活性的筛选以鉴别保留活性 的突变体。诱变后,可重组表达编码的蛋白质并可测定蛋白质的活性。
本发明包括反义核酸分子,即与本发明的正义核酸互补的分子, 例如,与双链标志物cDNA分子的编码链互补的或与标志物mRNA 序列互补的。因此,本发明的反义核酸可以与本发明的正义核酸氢键 结合(即与之退火)。反义核酸可与整个编码链互补,或者只与其一 部分互补,例如,蛋白质编码区的全部或部分(或开放阅读框)。反 义核酸分子也可以与编码标志物蛋白质的核苷酸序列的编码链的全 部或部分非编码区是反义的。非编码区(“5'和3'非翻译区”)是侧 邻编码区的5'和3'序列且未被翻译成氨基酸。
反义寡核苷酸长度可以是,例如,约5、10、15、20、25、30、 35、40、45或50个或更多个核苷酸。可以使用本领域中已知的方法 利用化学合成和酶促连接反应构造本发明的反义核酸。例如,可以使 用天然存在的核苷酸或设计用于提高分子的生物稳定性或提高反义和正义的核酸之间形成的双链体的物理稳定性的不同地修饰的核苷 酸来化学合成反义核酸(例如,反义寡核苷酸),例如,可以使用硫 代磷酸酯衍生物和吖啶取代的核苷酸。可用于产生反义核酸的修饰核 苷酸的例子包括5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、 次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧羟基甲基)尿嘧啶、5-羧甲基 氨基甲基-2-硫尿核苷、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D- 半乳糖基Q核苷、肌苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲 基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞 嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿 嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、β-D-甘露糖基Q核苷、5'-甲氧 基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-N6-异戊烯腺嘌呤、尿 嘧啶-5-氧基乙酸(v)、wybutoxosine、假尿嘧啶、Q核苷、2-硫代胞 嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、 尿嘧啶-5-氧基乙酸甲酯、尿嘧啶-5-氧基乙酸(v)、5-甲基-2-硫尿嘧 啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、(acp3)w和2,6-二氨基嘌呤。 或者,可以使用核酸已经按反义方向(即,由所插入的核酸转录的 RNA将是所需靶核酸的反义方向,在以下小节进一步描述)亚克隆 至其中的表达载体以生物方法产生反义核酸。
如本文中所用的“核酸”抑制剂是任何基于核酸的抑制剂,其通 过与来自靶基因的RNA转录物的至少一部分杂交引起靶标表达的下 降以导致靶标表达的下降。核酸抑制剂包括,例如,单链核酸分子(例 如,反义核酸)和双链核酸(如siRNA、shRNA、dsiRNA)(参见,例如美国专利申请20070104688)。如本文中所用的,双链核酸分子 设计为在至少12、优选至少15个核苷酸上是双链的。双链核酸分子 可以是设计为与其本身杂交的单核酸链,例如shRNA。据理解,靶标 的核酸抑制剂可以作为分离的核酸施用。或者,核酸抑制剂可以作为表达构建体施用以在细胞中产生抑制剂。在某些实施方式中,核酸抑 制剂包括一个或多个化学修饰以提高核酸抑制剂的活性和/或稳定性。 这类修饰是本领域中公知的。例如,待使用的特定修饰将取决于核酸 抑制剂的类型。
反义核酸治疗剂单链核酸疗法,长度通常约16-30个核苷酸且与 靶细胞(在培养物中或在生物体中)中的靶核酸序列互补。
针对反义核酸、化学修饰和治疗用途的专利提供在例如涉及包含 化学修饰的RNA的治疗化合物的美国专利No.5,898,031和涉及作为 治疗剂使用这些化合物的方法的美国专利No.6,107,094中。美国专利No.7,432,250涉及通过施用单链的化学修饰RNA样化合物治疗患者 的方法和美国专利No.7,432,249涉及包含单链的化学修饰RNA样化 合物的药物组合物。美国专利No.7,629,321涉及使用具有多个RNA 核苷和至少一个化学修饰的单链寡核苷酸切割靶mRNA的方法。本 段落中所列的各专利通过引用并入本文。
在许多实施方式中,双链体区域长度是15-30个核苷酸对。在一 些实施方式中,双链体区域长度是17-23个核苷酸对,长度是17-25 个核苷酸对,长度是23-27个核苷酸对,长度是19-21个核苷酸对或 长度是21-23个核苷酸对。
在某些实施方式中,各链具有15-30个核苷酸。
可用于本发明的方法中的RNAi剂包括如例如2011年11月18 日提交的美国临时申请No.61/561,710、2010年9月15日提交的国际 申请No.PCT/US2011/051597和PCT公开WO2009/073809中公开的 具有化学修饰的试剂,上述各专利申请的内容通过引入并入本文。
“RNAi剂”、“双链RNAi剂”、双链RNA(dsRNA)分子也称 为“dsRNA剂”、“dsRNA”、“siRNA”、“iRNA剂”,如在本 文中可互换使用的,指的是核糖核酸分子的复合物,其具有包含两条 反平行的和如以下定义的基本互补的核酸链的双链体结构。如本文中 使用的,RNAi剂也可以包括dsiRNA(参见,例如美国专利公开 20070104688,通过引用并入本文)。一般地,各链的大多数核苷酸 是核糖核苷酸,但如本文中描述的,各链或两条链也可以包括一个或 多个非-核糖核苷酸,例如脱氧核糖核苷酸和/或修饰的核苷酸。另外, 如本说明书中使用的,“RNAi剂”可以包括具有化学修饰的核糖核 苷酸;RNAi剂可以包括多个核苷酸处的实质修饰。这类修饰可以包 括本文中公开的或本领域中已知的所有类型的修饰。任何这类修饰 (如siRNA类型的分子中使用的)为本说明书和权利要求的目的涵盖 在“RNAi剂”内。
形成双链体结构的两条链可以是一个较大的RNA分子的不同部 分,或者它们可以是单独的RNA分子。在两条链是一个较大分子的 部分且因此通过形成双链体结构的一条链的3’末端和相应的另一条 链的5’末端之间的非间断核苷酸链连接的情况下,连接的RNA链称 为“发夹环”。在两条链通过形成双链体结构的一条链的3’末端和相 应的另一条链的5’末端之间的非间断核苷酸链以外方式共价连接的 情况下,连接的结构称为“接头”。RNA链可以具有相同或不同数 目的核苷酸。最大碱基对数目是dsRNA的最短链中核苷酸的数目减去双链体中存在的任何悬端。除了双链体结构外,RNAi剂可以包含 一个或多个悬端。在本文中使用的术语“siRNA”也指上文描述的RNAi 剂。
在另一个方面,试剂是单链反义RNA分子。反义RNA分子与靶 mRNA内的序列互补。反应RNA可以通过与mRNA碱基配对和物理 阻碍翻译机制以化学计量的方式抑制翻译,参见Dias,N.等,(2002) Mol Cancer Ther 1:347-355。反义RNA分子可以具有与靶mRNA互补 的约15-30个核苷酸。例如,反义RNA分子可以具有来自表1的一 个反义序列的至少15、16、17、18、19、20或更多个连续核苷酸的 序列。术语“反义链”指的是包括与靶序列基本上互补的区域的双链 RNAi剂的链。如本文中使用的,术语“与编码目标蛋白质的部分互 补的区域”是指与编码蛋白质的靶mRNA序列的部分基本上互补的 反义链上的区域。在互补性区域不与靶序列完全互补的情况下,失配 在末端区域中且(如果存在的话)一般在一个或多个末端区域中是最 耐受的,例如在5’和/或3’末端的6、5、4、3或2个核苷酸内。
如本文中使用的术语“反义链”指的是包括与反义链的区域基本 上互补的区域的dsRNA的链。
在各种实施方式中,可以在碱基部分、糖基部分或磷酸骨架处修 饰本发明的核酸分子以改善,例如,分子的稳定性、杂交或溶解性。 例如,核酸的脱氧核糖磷酸酯骨架可以被修饰以产生肽核酸(参见 Hyrup等,1996,Bioorganic&Medicinal Chemistry 4(1):5-23)。如本文 所用的,术语“肽核酸”或“PNA”是指核酸模拟物,例如,DNA模拟物, 其中脱氧核糖磷酸酯骨架被假肽骨架替换,且只有四种天然核碱基被 保留。PNA的中性骨架已被证明允许在低离子强度的条件下与DNA 和RNA特异性杂交。可使用标准的固相肽合成方案进行PNA寡聚体 的合成,如Hyrup等,(1996),同上;Perry-O'Keefe等(1996)Proc.Natl.Acad.Sci.USA 93:14670-675中所描述的。
PNA可用于治疗和诊断应用中。例如,PNA可被用作反义或反基 因剂而用于基因表达的序列特异性调节,例如,通过诱导转录或翻译 抑止或抑制复制。PNA也可以用于,例如,基因中单碱基对突变的分 析,例如通过PNA定向的PCR夹钳,当与其他酶(例如,S1核酸酶)组合使用时作为人工限制性内切酶(Hyrup(1996),同上);或作 为探针或引物用于DNA测序和杂交(Hyrup,1996年,同上; Perry-O'Keefe等人,1996,Proc.Natl.Acad.Sci.USA 93:14670-675)。
在另一个实施方式中,可以通过将亲脂性的或其他辅助基团连接 到PNA上,通过形成PNA-DNA嵌合体或通过使用脂质体或本领域 中已知的其它药物递送技术修饰PNA,例如,为提高它们的稳定性或 细胞摄取。例如,可以生成PNA-DNA嵌合体,其可以结合PNA和DNA的有利性质。这种嵌合体允许DNA识别酶(例如,RNA酶H 和DNA聚合酶)与DNA部分相互作用,而PNA部分将提供高结合 亲和力和特异性。可以使用根据碱基堆积、核碱基之间的键数和定向 选择的具有适当长度的接头来连接PNA-DNA嵌合体(Hyrup,1996, 同上)。PNA-DNA嵌合体的合成可以如Hyrup(1996),同上和Finn 等(1996)Nucleic Acids Res.24(17):3357-63中所描述的进行。例如,可 使用标准的亚磷酰胺偶联化学作用和修饰的核苷类似物在固体载体 上合成DNA链。化合物如5'-(4-甲氧基三苯甲基)氨基-5'-脱氧-胸 腺嘧啶亚磷酰胺可以被用作PNA与DNA的5'末端之间的连接(Mag 等,1989,Nucleic AcidsRes.17:5973-88)。然后PNA单体以逐步的方式 偶合以产生带有5'PNA片段和3'DNA片段的嵌合分子(Finn等人, 1996,Nucleic Acids Res.24(17):3357-63)。或者,可以合成带有5'DNA 片段和3'PNA片段的嵌合分子(Peterser等,1975,Bioorganic Med. Chem.Lett.5:1119-11124)。
在其它实施方式中,寡核苷酸可以包括其他附接的基团,如肽(例 如,用于体内靶向宿主细胞受体),或有助于运输穿过细胞膜(见, 例如,Letsinger等,1989,Proc.Natl.Acad.Sci.USA 86:6553-6556; Lemaitre等,1987,Proc.Natl.Acad.Sci.USA84:648-652;PCT公开号 WO 88/09810)或血脑屏障(见例如,PCT公开号WO 89/10134)的 试剂。此外,寡核苷酸可以用杂交触发的裂解剂(见,例如,Krol等, 1988,Bio/Techniques 6:958-976)或嵌入剂(见,例如Zon,1988,Pharm. Res.5:539-549)修饰。为此,该寡核苷酸可以与另一种分子偶联,例 如,肽、杂交触发交联剂、运输剂、杂交触发的裂解剂等。
本发明还包括具有至少一个与本发明的核酸互补的区域的分子 信标核酸,以使得该分子信标可用于定量样品中本发明核酸的存在。 “分子信标”核酸是包含一对互补区域并具有荧光团和与其相关的荧 光淬灭剂的核酸。荧光团和淬灭剂与核酸的不同部分相结合,其方向 使得当互补区域彼此退火时,荧光团的荧光被淬灭剂淬灭。当核酸的 互补区域未与彼此退火时,荧光团的荧光以较小程度淬灭。分子信标 核酸在例如5,876,930号美国专利中描述。
D、分离的蛋白质和抗体
本发明的一个方面涉及分离的标志物蛋白质及其生物活性部分, 以及适合用作免疫原以产生针对标志物蛋白质或其片段的抗体的多 肽片段。在一个实施方式中,可以使用标准的蛋白质纯化技术通过适 当的纯化方案从细胞或组织来源分离原始的标志物蛋白质。在另一个 实施方式中,通过重组DNA技术产生含有标志物蛋白质的全部或片 段的蛋白质或肽。替代重组表达,这样的蛋白质或肽可以使用标准的 肽合成技术化学合成。
“分离的”或“纯化的”蛋白质或其生物活性部分基本上不含来自于 该蛋白质所来源的细胞或组织源的细胞物质或其它污染蛋白质,或当 化学合成时基本上不含化学前体或其他化学物质。词语“基本上不含 细胞物质”包括其中蛋白质与它所分离或重组产生的细胞的细胞组分 分离的蛋白质制剂。因此,基本上不含细胞物质的蛋白质包括具有小 于约30%、20%、10%或5%(以干重计)的异源蛋白质(这里也称 为“污染蛋白质”)的蛋白质制剂。当重组产生蛋白质或其生物活性部 分时,也优选基本上不含培养基,即培养基占蛋白质制剂的小于约20 %、10%或5%的体积。当通过化学合成制备蛋白质时,优选基本上不含化学前体或其他化学物质,即,它与参与蛋白质合成的化学前体 或者其他化学物质分离。因此,这类蛋白质的制剂具有少于约30%、 20%、10%、5%(以干重计)的化学前体或目标多肽以外的化合物。
标志物蛋白质的生物活性部分包括包含与标志物蛋白质的氨基 酸序列足够相同的或者是源自于标志物蛋白质的氨基酸序列的氨基 酸序列的多肽,其包括比全长蛋白质较少的氨基酸并表现相应的全长 蛋白质的至少一种活性。通常情况下,生物活性部分包含具有相应的 全长蛋白质的至少一种活性的结构域或基序。本发明的标志物蛋白质 的生物活性部分可以是,例如,长度10、25、50、100或更多个氨基 酸的多肽。此外,其中标志物蛋白质的其他区域被删除的其它生物活 性部分可以通过重组技术制备并评价天然形式的标志物蛋白质的一 个或多个功能活性。
优选的标志物蛋白质是由含有编码实施例中所述的任何基因的 序列的核苷酸序列编码的。其它有用的蛋白质与这些序列之一基本上 相同的(例如,至少约40%,优选50%、60%、70%、80%、90%、 91%、92%、93%、94%、95%、96%、97%、98%或99%)并保持 相应的天然存在的标志物蛋白质的功能活性,但由于天然的等位基因 变异或诱突而在氨基酸序列上不同。
为了确定两个氨基酸序列或两个核酸的百分同一性,序列为最佳 比较的目的而进行比对(例如,空位可以被引入第一氨基酸或核酸序 列的序列中以与第二氨基酸或核酸序列最优比对)。然后比较相应的 氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一序列中的 位置由与第二序列中的相应位置中的相同氨基酸残基或核苷酸占据 时,则分子在该位置上是相同的。优选地,使用全局比对计算两个序 列之间的百分同一性。或者使用局部比对计算两个序列之间的百分同 一性。在两个序列之间的百分同一性是序列所共有的相同位置数的函 数(即,%同一性=相同位置#/总的位置#(例如,重叠的位置)×100)。 在一个实施方式中,两个序列是相同的长度。在另一个实施方式中, 两个序列是不相同的长度。
可以使用数学算法来完成两个序列之间的百分同一性的确定。用 于比较两个序列的数学算法的一种优选的非限制性的例子是Karlin 和Altschul(1990)Proc.Natl.Acad.Sci.USA 87:2264-2268的算法,其 在Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877中 改进。这样的算法被整合入Altschul等(1990)J.Mol.Biol.215:403-410 的BLASTN和BLASTX程序中。可以用BLASTN(得分=100,字长 =12)程序执行BLAST核苷酸检索以得到与本发明的核酸分子同源的 核苷酸序列。可以用BLASTP程序(得分=50,字长=3)进行BLAST 蛋白质检索以得到与本发明的蛋白质分子同源的氨基酸序列。为了获 得用于比较目的的带空位比对,可以使用称为带空位BLAST的新版 BLAST算法,如Altschul等(1997)Nucleic Acids Res.25:3389-3402中所 描述的,其能够执行用于程序BLASTN、BLASTP和BLASTX的带 空位局部比对。或者,可以使用PSI-Blast执行迭代搜索,其检测分 子之间的远缘关系。当利用BLAST、带空位BLAST和PSI-Blast程 序时,可以使用的相应程序(例如,BLASTX和BLASTN)的默认参 数。见http://www.ncbi.nlm.nih.gov。用于序列比较的数学算法的另一 个优选的非限制性的例子是Myers和Miller,(1988)CABIOS 4:11-17 的算法。这样的算法被整合到ALIGN程序(版本2.0)中,这是GCG 序列比对软件包的部分。当将ALIGN程序用于比较氨基酸序列时, 可以使用PAM120权重残差表(weight residue table),12的空位长 度罚分和4的空位罚分。用于确定局部序列相似性和比对的区域的再 另一种有用的算法是FASTA算法,如Pearson和Lipman(1988)Proc. Natl.Acad.Sci.USA 85:2444-2448中所描述的。当将FASTA算法用于比较核苷酸或氨基酸序列时,PAM120权重残差表可以与,例如,2 的k-重值使用。
可以使用与上述类似的技术在有或没有允许的空位的情况下确 定两个序列之间的百分同一性。在计算百分同一性中,仅计算精确的 匹配。
本发明还提供了包含标志物蛋白质或其片段的嵌合的或融合的 蛋白质。如本文所用的,“嵌合蛋白质”或“融合蛋白质”包含可操作地 与异源多肽(即,标志物蛋白质以外的多肽)连接的标志物蛋白质的 全部或部分(优选生物活性部分)。在融合蛋白质中,术语“可操作 地连接”是为了表明标志物蛋白质或其片段与异源多肽彼此同框融 合。异源多肽可以与标志物蛋白质或片段的氨基末端或羧基末端融 合。
一种有用的融合蛋白质是其中的标志物蛋白质或片段融合于 GST序列的羧基末端的GST融合蛋白质。这样的融合蛋白质可以帮 助本发明的重组多肽的纯化。
在另一个实施方式中,融合蛋白质在其氨基末端包含异源信号序 列。例如,标志物蛋白质的天然信号序列可以被移除和被来自另一个 蛋白质的信号序列替换。例如,杆状病毒包膜蛋白的gp67分泌序列 可以被用作异源信号序列(Ausubel等编辑,CurrentProtocols in Molecular Biology,John Wiley&Sons,NY,1992)。真核异源信号序列 的其他例子包括蜂毒肽和人类胎盘碱性磷酸酶的分泌序列(Stratagene; La Jolla,California)。在再另一个示例中,可使用的原核异源信号序 列包括phoA分泌信号(Sambrook等,同上)和蛋白A分泌信号 (Pharmacia Biotech;Piscataway,New Jersey)。
在再另一个实施方式中,融合蛋白质是其中标志物蛋白质的全部 或部分与来自免疫球蛋白家族成员的序列融合的免疫球蛋白融合蛋 白。本发明的免疫球蛋白融合蛋白可合并到药物组合物中,并向受试 者施用以抑制配体(可溶的或膜结合的)与细胞表面上的蛋白质(受 体)之间的相互作用,从而在体内抑制信号转导。免疫球蛋白融合蛋 白可用于影响标志物蛋白质的同源配体的生物利用度。配体/受体相互 作用的抑制可以是治疗上有用的,用于治疗增殖性和分化性障碍和用 于调节(例如,促进或抑制)细胞的存活。此外,本发明的免疫球蛋 白融合蛋白可以被用作免疫原而产生针对受试者中的标志物蛋白质的抗体以纯化配体,并在筛选试验中,以鉴别抑制标志物蛋白质与配 体的相互作用的分子。
可通过标准的重组DNA技术产生本发明的嵌合和融合蛋白质。 在另一个实施方式中,可以通过常规技术(包括自动DNA合成仪) 来合成融合基因。或者,可以使用锚定引物进行基因片段的PCR扩 增,其中锚定引物导致两个连续的基因片段之间产生互补悬端,其可随后进行退火并重新扩增以产生嵌合的基因序列(见,例如,Ausubel 等人,同上)。此外,许多表达载体是市售的,其已编码融合部分(例 如,GST多肽)。编码本发明多肽的核酸可以被克隆到这样的表达载 体中以至于融合部分被与本发明的多肽同框地连接。
可以使用信号序列来促进标志物蛋白质的分泌和分离。信号序列 通常特征是疏水性氨基酸的核心,其一般在一个或多个裂解事件中从 分泌过程中的成熟蛋白上被切割。这种信号肽包含加工位点,其允许 在成熟蛋白通过分泌途径时信号序列从成熟蛋白切割。因此,本发明 涉及具有信号序列的标志物蛋白质、融合蛋白或其片段,以及信号序 列已经从其上中被蛋白水解地裂解的这种蛋白质(即,切割产物)。 在一个实施方式中,编码信号序列的核酸序列可以被可操作地连接于 表达载体中的目标蛋白质,例如标志物蛋白质或其片段。信号序列指 导蛋白质的分泌,如从表达载体转化到其中的真核宿主分泌,和随后或同时切割信号序列。然后可以通过本领域公知的方法从细胞外培养 基中很容易地纯化蛋白质。或者,可以使用有利于纯化的序列(如用 GST结构域)将信号序列连接到目标蛋白质上。
本发明还涉及到标志物蛋白质的变体。这样的变体具有改变的氨 基酸序列,其可以作为激动剂(模拟物)或拮抗剂发挥功能。变体可 以通过诱变产生,例如,离散的点突变或截短。激动剂可以保留天然 存在形式的蛋白质的基本相同的生物活性或生物活性的子集。蛋白质 的拮抗剂可以抑制天然存在形式的蛋白质的一个或多个活性,例如, 竞争结合于其中包括目标蛋白质的细胞信号级联中的下游或上游成 员。因此,特定的生物效应可通过用具有有限功能的变体处理而引起。 相对于用天然存在形式的蛋白质进行治疗,用具有蛋白质天然存在形 式的一部分生物活性的变体治疗受试者可以在受试者中有较少的副作用。
可以通过针对激动剂或拮抗剂活性筛选本发明的蛋白质的突变 体(例如,截短的突变体)的组合文库鉴别作为激动剂(模拟物)或 作为拮抗剂发挥功能的标志物蛋白质的变体。在一个实施方式中,变 体的杂色文库(variegated library)是通过核酸水平的组合诱变产生的, 且由杂色基因文库编码。变体的杂色文库可以通过,例如,将合成寡 核苷酸的混合物酶促接合至基因序列中而产生,以使得潜在蛋白质序 列的简并集可作为单个多肽或可选地作为一组较大的融合蛋白质(例 如,对于噬菌体展示)表达。有很多种方法可用于从简并寡核苷酸序 列产生标志物蛋白质的潜在变体的文库。合成简并寡核苷酸的方法在 本领域中是已知的(参见,例如,Narang,1983,Tetrahedron 39:3;Itakura 等,1984,Annu.Rev.Biochem.53:323;Itakura等,1984,Science 198:1056; Ike等,1983 NucleicAcid Res.11:477)。
此外,标志物蛋白质片段的文库可用于产生多肽的杂色群体以用 于筛选和随后选择变体标志物蛋白或其片段。例如,可以通过在其中 每个分子只存在一个切口(nicking)的条件下用核酸酶处理目的编码序 列的双链PCR片段,而使双链DNA变性,使DNA复性以形成其可 以包括来自不同的切口产物的正义/反义对的双链DNA,通过用S1 核酸酶处理从改组的双链体去除单链部分,和将所获得的片段文库接 合至表达载体中来产生编码序列片段的文库。通过该方法,可以得到 编码目标蛋白质的氨基末端和各种尺寸的内部片段的表达文库。
本领域中已知用于筛选通过点突变或截短产生的组合文库的基 因产物和用于筛选具有选定的属性的基因产物的cDNA文库的几种 技术。用于筛选大基因文库的适合于高通量分析的最广泛使用的技术 通常包括将基因文库克隆到可复制的表达载体中,用得到的载体文库 转化适当的细胞,和在检测所需的活性有利于分离编码其产物被检测 的基因的载体的条件下表达该组合基因。递归集合诱变(REM),一 种提高功能突变在文库中的频率的技术,可以结合筛选分析使用以鉴 别本发明蛋白质的变体(Arkin和Yourvan,1992,Proc.Natl.Acad.Sci. USA 89:7811-7815;Delgrave等,1993,Protein Engineering 6(3):327- 331)。
本发明的另一个方面涉及针对本发明蛋白质的抗体。在优选的实 施方式中,所述抗体特异性结合标志物的蛋白质或其片段。本文中可 互换使用的术语“抗体”和“多个抗体”指免疫球蛋白分子及包含免疫球 蛋白分子的免疫学活性部分的其片段和衍生物(即,这样的部分含有 特异性结合抗原如标志物蛋白质(例如标志物蛋白质的表位)的抗原 结合位点)。特异性结合本发明蛋白质的抗体是结合该蛋白质但基本 上不结合天然含有该蛋白质的样品(例如,生物样品)中的其它分子 的抗体。免疫球蛋白分子的免疫活性部分的例子包括,但不限于,单 链抗体(scAb)、F(ab)和F(ab')2片段。
本发明的分离的蛋白质或其片段可用作免疫原以产生抗体。可以 使用全长蛋白质,或可替代地,本发明提供用作免疫原的抗原性肽片 段。本发明蛋白质的抗原性肽包含本发明的蛋白质之一的氨基酸序列 的至少8个(优选为10、15、20或30个或更多个)氨基酸残基,和 包括至少一个蛋白质的表位,以至于针对该肽产生的抗体与该蛋白质 形成特异性的免疫复合物。抗原性肽所包含的优选表位是位于蛋白质 表面上的区域,例如,亲水性区域。可以使用疏水性序列分析、亲水 性序列分析或类似分析来识别亲水性区域。在优选的实施方式中,分 离的标志物蛋白质或其片段用作免疫原。
免疫原通常用来通过免疫合适的(即具有免疫能力的)主体如兔 子、山羊、小鼠或其他哺乳动物或脊椎动物制备抗体。合适的免疫原 性制剂可以包含,例如,重组表达或化学合成的蛋白质或肽。该制剂 还可以包括佐剂,如弗氏完全或不完全佐剂,或类似的免疫刺激剂。 优选的免疫原组合物是不含其他人类蛋白质的那些,诸如,例如,使 用非人类宿主细胞重组表达本发明蛋白质而形成的免疫原组合物。以 这样的方式,获得的抗体组合物具有减少或没有本发明蛋白质之外的 人类蛋白质的结合。
本发明提供了多克隆抗体和单克隆抗体。本文所用的术语“单克隆 抗体”或“单克隆抗体组合物”是指抗体分子群体,其只包含能够与特 定表位免疫反应的一类抗原结合位点。优选的多克隆抗体和单克隆抗 体组合物是已被选择为针对本发明蛋白质的抗体的组合物。特别优选 的多克隆抗体和单克隆抗体制剂是只含有针对标志物蛋白质或其片 段的抗体的制剂。
可以通过使用本发明蛋白质作为免疫原对合适的主体进行免疫 来制备多克隆抗体。可以通过标准技术,如用酶联免疫吸附试验 (ELISA),使用固定化多肽随着时间监测免疫主体中的抗体效价。 在免疫后的适当时间,例如,当特定的抗体效价最高时,可以从受试者获得产生抗体的细胞,并通过标准技术,例如最初由Kohler和 Milstein(1975)Nature256:495-497描述的杂交瘤技术、人B细胞杂 交瘤技术(参见Kozbor等,1983,Immunol.Today 4:72)、EBV-杂交 瘤技术(见Cole等,第77-96页,Monoclonal Antibodiesand Cancer Therapy,Alan R.Liss,Inc.,1985)或三元杂交瘤技术,来制备单克隆抗 体(mAb)。用于产生杂交瘤的技术是众所周知的(一般参见Current Protocols inImmunology,Coligan等编辑,John Wiley&Sons,New York, 1994)。产生本发明的单克隆抗体的杂交瘤细胞是通过,例如,使用 标准的ELISA分析筛选用于结合目标多肽的抗体的杂交瘤培养物上 清液进行检测的。
作为用于制备分泌单克隆抗体的杂交瘤的可选方式,可以通过用 目标多肽筛选重组组合免疫球蛋白文库(例如,抗体噬菌体展示文库) 来鉴别和分离针对本发明蛋白质的单克隆抗体。用于产生和筛选噬菌 体展示文库的试剂盒是市售可得的(例如,PharmaciaRecombinant Phage Antibody System,Catalog No.27-9400-01和Stratagene SurfZAPPhage Display Kit,Catalog No.240612)。此外,特别适合产生和筛选 抗体展示文库的方法和试剂的例子可以在例如,5,223,409号美国专 利、PCT公开号WO 92/18619、PCT公开号WO 91/17271;PCT公开 号WO 92/20791、PCT公开号WO 92/15679、PCT公开号WO 93/01288、PCT公开号WO 92/01047、PCT公开号WO 92/09690、PCT 公开号WO 90/02809;Fuchs等(1991)Bio/Technology 9:1370-1372;Hay 等(1992)Hum.Antibod.Hybridomas 3:81-85;Huse等,(1989)Science 246:1275-1281;Griffiths等,(1993)EMBO J.12:725-734中找到。
本发明还提供了特异性结合本发明蛋白质的重组抗体。在优选的 实施方式中,重组抗体特异性结合标志物蛋白质或其片段。重组抗体 包括但不限于,嵌合和人源化单克隆抗体(其包含人和非人部分)、 单链抗体和多特异性抗体。嵌合抗体是其中不同部分是来自于不同动 物物种的分子,如具有源自于鼠mAb的可变区和人免疫球蛋白恒定 区的那些(见,例如,Cabilly等,4,816,567号美国专利和Boss等, 4,816,397号美国专利,其全文通过引用的方式并入本文)。单链抗体 具有抗原结合位点和由单一多肽组成。它们可以通过本领域中已知的 技术产生,例如,使用Ladner等,4,946,778号美国专利(通过引用 将其全部并入本文);Bird等,(1988)Science 242:423-426;Whitlow 等,(1991)Methods inEnzymology 2:1-9;Whitlow等,(1991)Methods in Enzymology 2:97-105和Huston等,(1991)Methods in Molecular Design and Modeling:Concepts and Applications 203:46-88k描述的方法。多特 异性抗体是具有至少两个特异性结合不同抗原的抗原结合位点的抗 体分子。这样的分子可以通过本领域已知的技术生产,例如使用在 Segal,4,676,980号美国专利(其公开的内容通过引用全部并入本文), Holliger等,(1993)Proc.Natl.Acad.Sci.USA 90:6444-6448;Whitlow等, (1994)Protein Eng.7:1017-1026和6,121,424号美国专利中描述的方法。
人源化抗体是具有一个或多个来自非人类物种的互补性决定区 (CDR)和来自人免疫球蛋白分子的框架区的来自非人类物种的抗体 分子(见,例如,Queen,5,585,089号美国专利,通过引用将其全部 并入本文)。人源化单克隆抗体可以通过本领域中已知的重组DNA 技术生产,例如,使用PCT公开号WO 87/02671、欧洲专利申请 184,187、欧洲专利申请171,496、欧洲专利申请173,494、PCT公开号 WO 86/01533、4,816,567号美国专利、欧洲专利申请125,023、Better 等(1988)Science 240:1041-1043;Liu等(1987)Proc.Natl.Acad.Sci.USA 84:3439-3443;Liu等(1987)J.Immunol.139:3521-3526;Sun等(1987) Proc.Natl.Acad.Sci.USA 84:214-218;Nishimura等(1987)Cancer Res. 47:999-1005;Wood等(1985)Nature 314:446-449和Shaw等(1988)J. Natl.Cancer Inst.80:1553-1559);Morrison(1985)Science 229:1202-1207; Oi等(1986)Bio/Techniques 4:214;5,225,539号美国专利;Jones等(1986) Nature 321:552-525;Verhoeyan等(1988)Science239:1534和Beidler等 (1988)J.Immunol.141:4053-4060中所述的方法。
更具体地,人源化抗体可以例如,使用不能表达内源性免疫球蛋 白重链和轻链基因但是可以表达人重链和轻链基因的转基因小鼠产 生。用所选择的抗原(例如,对应于本发明标志物的多肽的全部或部 分)以正常的方式免疫转基因小鼠。针对该抗原的单克隆抗体可以使 用常规杂交瘤技术获得。转基因小鼠携带的人免疫球蛋白转基因在B 细胞分化过程中重新排列,并随后发生类别转换和体细胞突变。因此, 使用这样的技术,有可能产生治疗上有用的IgG、IgA和IgE抗体。 对于用于产生人抗体的这项技术的综述,参见Lonberg和Huszar (1995)Int.Rev.Immunol.13:65-93。对于用于产生人抗体和人单克隆 抗体的这种技术和用于产生这样的抗体的方案的详细讨论,参见,例 如,5,625,126号美国专利、5,633,425号美国专利、5,569,825号美国 专利、5,661,016号美国专利和5,545,806号美国专利。此外,公司如 Abgenix Inc.(Freemont,CA)可从事于使用类似上述的技术提供针对选择的抗原的人类抗体。
可以使用被称为“导向选择”的技术产生识别选定的表位的完全的 人抗体。在这种方法中,选定的非人单克隆抗体,例如,鼠抗体,被 用于指导选择识别相同表位的完全的人抗体(Jespers等,1994, Bio/technology 12:899-903)。
可以在生产(例如,从受试者的血液或血清)或合成后分离本发 明的抗体和通过熟知的技术进一步纯化。例如,可以使用蛋白A色谱 纯化IgG抗体。可以通过,例如,亲和层析选择(例如,部分纯化) 或纯化对本发明的蛋白质特异性的抗体。例如,如本文所述的产生本 发明的重组表达和纯化(或部分纯化)的蛋白质,和共价或非共价地 结合到固体支持物(如,例如,层析柱)上。然后该柱可以用于从含 有针对大量的不同表位的抗体的样品中亲和纯化对本发明的蛋白质 特异性的抗体,从而产生基本上纯化的抗体组合物,即基本上不含污 染抗体的抗体组合物。在上下文中,基本上纯化的抗体组合物是指抗 体样品中含有至多仅30%(以干重计算)的针对本发明所需蛋白质的 表位以外的表位的污染抗体,且优选最多20%,还更优选最多10%, 并且最优选最多5%(以干重计算)的样品是污染的抗体。纯化的抗 体组合物是指组合物中至少99%的抗体是针对本发明的所需蛋白质。
在优选的实施方式中,本发明的基本上纯化的抗体可特异性地结 合本发明蛋白质的信号肽、分泌序列、胞外结构域、跨膜或胞质域或 者胞质膜。在特别优选的实施方式中,本发明的基本上纯化的抗体特 异性结合本发明蛋白质的氨基酸序列的分泌序列或胞外结构域。在更 优选的实施方式中,本发明的基本上纯化的抗体特异性结合标志物蛋 白质的氨基酸序列的分泌序列或胞外结构域。
通过标准技术,如亲和色谱法或免疫沉淀,可以将针对本发明蛋 白质的抗体用于分离该蛋白质。此外,这样的抗体可用于检测标志物 蛋白质或其片段(例如,在细胞溶解产物或细胞上清液中),以评估 标志物的表达水平和表达谱。该抗体也可在诊断上被用于监测组织或 人体体液中(例如,疾病或毒性状态相关的体液中)的蛋白质水平而 作为临床检验的部分,例如用于,例如,测定给定的治疗方案的疗效。 通过使用抗体衍生物可以有助于检测,其中该抗体衍生物包含与可检 测物质偶联的本发明的抗体。可检测物质的例子包括各种酶、辅基、 荧光材料、发光材料、生物发光材料和放射性材料。合适的酶的例子 包括辣根过氧化物酶、碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶; 合适的辅基复合体的例子包括抗生蛋白链菌素/生物素和抗生物素蛋 白/生物素;合适的荧光材料的例子包括伞形酮、荧光素、异硫氰酸荧 光素、若丹明、二氯三嗪基胺荧光素、丹磺酰氯或藻红蛋白;发光材 料的例子包括鲁米诺;生物发光材料的例子包括萤光素酶、萤光素和 水母蛋白;合适的放射性物质的例子包括125I、131I、35S或3H。
本发明的抗体也可以用作治疗癌症的治疗剂。在优选的实施方式 中,将本发明的完全人抗体用于治疗性治疗人类癌症患者,特别是那 些患有癌症的患者。在另一个优选的实施方式中,特异性结合标志物 蛋白质或其片段的抗体被用于治疗性治疗。另外,这样的治疗性抗体 可以是抗体衍生物或免疫毒素,其包含与治疗性基团如细胞毒素、治 疗剂或放射性金属离子偶联的抗体。细胞毒素或细胞毒性剂包括任何 对细胞有害的试剂。其实例包括紫杉醇、细胞松弛素B、短杆菌肽D、 溴化乙锭、吐根碱、丝裂霉素、依托泊苷,替尼泊苷、长春新碱、长 春碱、秋水仙素、阿霉素、柔红霉素、二羟基蒽二酮(dihydroxy anthracindione)、米托蒽醌、光辉霉素、放线菌素D、1-脱氢睾酮、糖皮质激 素、普鲁卡因、丁卡因、利多卡因、心得安和嘌呤霉素及其类似物或 同源物。治疗剂包括但不限于,抗代谢物(例如,氨甲喋呤、6-巯基 嘌呤、6-硫鸟嘌呤、阿糖胞苷、5-氟尿嘧啶、氮烯唑胺)、烷基化剂 (如氮芥、塞替派(thioepa)、苯丁酸氮芥、美法仑、卡莫司汀(BSNU) 和洛莫司汀(CCNU)、环磷酰胺(cyclothosphamide)、白消安、二溴甘 露醇、链脲佐菌素、丝裂霉素C和顺二氯二胺铂(II)(DDP)顺铂)、蒽 环类抗生素(如,道诺红霉素(原道诺霉素)和阿霉素)、抗生素(如放 线菌素D(原放线菌素)、博莱霉素、光神霉素和氨茴霉素(AMC)) 和抗有丝分裂剂(例如,长春新碱和长春花碱)。
本发明的偶联抗体可用于改变给定的生物反应,因为药物部分不 应理解为限于经典的化学治疗剂。例如,该药物部分可以是具有所需 的生物学活性的蛋白质或多肽。这些蛋白质可以包括,例如,毒素如 核糖体抑制蛋白质(参见Better等,6,146,631号美国专利,在此全部 引入其公开内容)、相思豆毒蛋白、蓖麻蛋白质A、假单胞菌外毒素 或白喉毒素;蛋白质如肿瘤坏死因子、α-干扰素、β-干扰素、神经生 长因子、血小板源生长因子、组织纤溶酶原激活剂或生物反应调节剂; 或生物反应调节剂如,例如,淋巴因子、白介素1(“IL-1”)、白 细胞介素2(“IL-2”)、白细胞介素6(“IL-6”)、粒细胞巨噬细 胞集落刺激因子(“GM-CSF”)、粒细胞集落刺激因子(“G-CSF”)或 其它生长因子。
用于将这些治疗部分与抗体相偶联的技术是众所周知的,见例 如,Arnon等,"Monoclonal Antibodies For Immunotargeting Of Drugs In Cancer Therapy",Monoclonal Antibodies And Cancer Therapy,Reisfeld等 (eds.),pp.243-56(AlanR.Liss,Inc.1985);Hellstrom等,"Antibodies For Drug Delivery",Controlled DrugDelivery(2nd Ed.),Robinson等(eds.),pp. 623-53(Marcel Dekker,Inc.1987);Thorpe,"Antibody Carriers Of Cytotoxic Agents In Cancer Therapy:A Review",Monoclonal Antibodies '84:Biological And Clinical Applications,Pinchera等(eds.),pp.475-506 (1985);"Analysis,Results,And Future Prospective Of TheTherapeutic Use Of Radiolabeled Antibody In Cancer Therapy",MonoclonalAntibodies For Cancer Detection And Therapy,Baldwin等(eds.),pp.303-16(Academic Press 1985)和Thorpe等,"The Preparation And Cytotoxic Properties OfAntibody-Toxin Conjugates",Immunol.Rev.,62:119-58(1982)。
因此,在一个方面,本发明提供了基本上纯化的抗体、抗体片段 和衍生物,其全部特异性结合本发明的蛋白质和优选地标志物蛋白 质。在各种实施方式中,本发明的基本上纯化的抗体或它们的片段或 衍生物可以是人抗体、非人抗体、嵌合抗体和/或人源化抗体。在另一 个方面,本发明提供了非人抗体、抗体片段和衍生物,其全部特异性 结合本发明的蛋白质和优选标志物蛋白质。这种非人抗体可以是山 羊、小鼠、绵羊、马、鸡、兔或大鼠抗体。或者,本发明的非人抗体 可以是嵌合的和/或人源化的抗体。此外,本发明的非人抗体可以是多 克隆抗体或单克隆抗体。在再进一步的方面,本发明提供了单克隆抗 体、抗体片段和衍生物,其全部特异性结合本发明的蛋白质和优选标 志物蛋白质。该单克隆抗体可以是人抗体、人源化抗体、嵌合抗体和 /或非人抗体。
本发明还提供了含有与可检测物质相结合的本发明抗体及其使 用说明的试剂盒。本发明的再另一个方面是药物组合物,其含有本发 明的抗体。在一个实施方式中,该药物组合物包含本发明的抗体和药 学上可接受的载体。
E、预测医学
本发明涉及预测医学领域,其中诊断分析、预后分析、药物基因 组学和监测临床试验被用于预后(预测)的目的,从而预防性地治疗 个体。因此,本发明的一个方面涉及用于测定一种或多种标志物蛋白 质或核酸的表达水平的诊断分析,以确定个体是否有发生某种疾病或 药物诱导的毒性的危险。这些分析可用于预后或预测的目的,从而在 疾病发病前预防性地治疗个体。
本发明的再另一个方面涉及在临床试验中监测试剂(例如,施用 以抑制或者以治疗或预防疾病或药物诱导的毒性的药物或其他化合 物{即,为了了解这种治疗可能有的任何药物诱导的毒性效应})对本 发明的标志物的表达或活性的影响。在下面的章节中更详细地描述这 些和其它试剂。
F、诊断分析
用于检测在生物样品中标志物蛋白质或核酸存在或不存在的示 例性方法包括从测试对象获得生物样品(例如,毒性相关的体液或组 织样品)和将生物样品与能够检测多肽或核酸(例如,mRNA、基因 组DNA或cDNA)的化合物或试剂相接触。因此,本发明的检测方法可以用于,例如,在体外生物样品中和在体内检测mRNA、蛋白质、 cDNA或基因组DNA。例如,用于检测mRNA的体外技术包括RNA 杂交和原位杂交。用于检测标志物蛋白质的体外技术包括酶联免疫吸 附分析(ELISA法)、蛋白质印迹、免疫沉淀和免疫荧光。用于检测 基因组DNA的体外技术包括DNA杂交。用于检测mRNA的体内技 术包括聚合酶链反应(PCR)、RNA杂交和原位杂交。此外,用于检 测标志物蛋白质的体内技术包括向受试者体内引入针对该蛋白质或 其片段的标记抗体。例如,可以用其在受试者中的存在和位置可以通 过标准的成像技术检测的放射性标记来标记该抗体。
这种诊断和预后分析的一般原理涉及在适当条件下和经过足够 允许标志物和探针相互作用和结合的时间制备其中可以包含标志物 和探针的样品或反应混合物,从而形成可以从反应混合物中被去除和 /或检测的复合物。可以以各种不同的方式进行这些分析。
例如,进行这样的分析的一种方法涉及将标志物或探针锚定在固 相载体(也称为基底)上,和在反应结束时检测锚定固相上的目标标 志物/探针复合物。在这样的方法的一个实施方式中,可以将用来测定 标志物的存在和/或浓度的来自受试者的样品锚定到载体或固相支持 物上。在另一个实施方式中,相反的情况是可能的,其中探针可以被 锚定到固相上和可以允许来自受试者的样品作为该分析的未锚定组 分进行反应。
有许多已建立的方法用于将测定组分锚定到固相上。这些包括, 但不限于,通过生物素和抗生蛋白链菌素的偶联被固定的标志物或探 针分子。可以使用本领域中已知的技术(例如,生物素化试剂盒,Pierce Chemicals,Rockford,IL)从生物素-NHS(N-羟基琥珀酰亚胺)制备 这样的生物素化分析成分,并固定在抗生蛋白链菌素涂布的96孔板 (PierceChemical)的孔中。在某些实施方式中,可以预先制备并存 储具有固定的分析成分的表面。
用于这些分析的其它合适的载体或固相支持物包括能够结合标 志物或探针所属的分子种类的任何材料。众所周知的支持物或载体包 括,但不限于,玻璃、聚苯乙烯、尼龙、聚丙烯、尼龙、聚乙烯、葡 聚糖、淀粉酶、天然和改性的纤维素、聚丙烯酰胺、辉长岩和磁铁矿。
为了用上述的方法进行分析,将非固定的成分添加到第二成分被 锚定于其上的固相上。反应完成后,可以在使得所形成的任何复合物 将保持固定在固相上的条件下移除(例如,通过洗涤)未复合的成分。 检测锚定在固相上的标志物/探针复合物可以通过本文中概述的多种 方法来完成。
在优选的实施方式中,当探针是未锚定的分析成分时,其可以用 本文所讨论的并且是本领域技术人员公知的可检测标记直接或间接 地标记以用于检测和分析读出的目的。
也可能不经过任一成分(标志物或探针)的进一步操作或标记而 直接检测标志物/探针复合物形成,例如,通过利用荧光能量转移的技 术(参见,例如,Lakowicz等,5,631,169号美国专利;Stavrianopoulos 等,4,868,103号美国专利)。第一“供体”分子上的荧光团标记经选 择以使得在用适当波长的入射光激发时,其发射的荧光能量将被第二“受体”分子上的荧光标记吸收,其随之能够由于所吸收的能量而发 荧光。可选地,“供体”蛋白质分子可以简单地利用色氨酸残基的自 然荧光能量。选择发射不同光波长的标记,这样可以将“受体”分子 标记与“供体”的标记区分开来。由于标记之间的能量转移效率与分隔分子的距离有关,可以对分子之间的空间关系进行评估。在分子间 发生结合的情况下,在分析中“受体”分子标记的荧光发射应该是最 大的。可以通过本领域中公知的标准荧光检测装置(例如,使用荧光 计)很方便地测量FET结合事件。
在另一个实施方式中,可以通过利用如实时生物分子相互作用分 析(BIA)的技术在不标记任何分析成分(探针或标志物)的情况下 完成探针识别标志物的能力的测定(见,例如,Sjolander,S.和 Urbaniczky,C.,1991,Anal.Chem.63:2338-2345和Szabo等,1995,Curr. Opin.Struct.Biol.5:699-705)。如本文所用的“BIA”或“表面等离子体激 元共振”是用于研究实时生物特异性相互作用而不标记任何的相互作 用物的技术(例如,BIAcore)。在结合表面处的质量变化(结合事 件的表示)导致表面附近的光的折射率的改变(表面等离激元共振 (SPR)的光学现象),从而产生可检测的信号,该信号可以用作生 物分子之间的实时反应的指示。
或者,在另一个实施方式中,可以用标志物和探针作为液相中的 溶质进行类似的诊断和预测分析。在这样的分析中,通过多种标准技 术中的任何一种(包括但不限于:差速离心法、色谱法、电泳和免疫 沉淀)将复合的标志物和探针与未复合的成分分离。在差速离心中, 由于复合物根据其不同尺寸和密度而具有的不同的沉降平衡,可通过 一系列的离心步骤将标志物/探针复合物与未复合的分析成分分离(参 见,例如,Rivas,G.和Minton,A.P.,1993,Trends Biochem Sci. 18(8):284-7)。也可以利用标准的色谱技术将复合的分子与未复合的 分子分离。例如,凝胶过滤色谱法基于大小分离分子,并例如,通过 利用柱形式的适当凝胶过滤树脂,可以将相对较大的成分与相对较小 的未复合的成分分离。类似地,可利用与未复合的成分相比标记/探针 复合物相对不同的电荷性质将复合物与未复合的成分区分开,例如, 通过利用离子交换色谱树脂。这样的树脂和色谱技术是本领域的技术 人员众所周知的(见,例如,Heegaard,NH,1998,J.Mol.Recognit. Winter 11(1-6):141-8;Hage,D.S.和Tweed,S.A.J Chromatogr B Biomed Sci Appl 1997 Oct 10;699(1-2):499-525)。也可以使用凝胶电泳将复合 的分析成分与未结合的成分分离(见,例如,Ausubel等编辑,Current Protocols in Molecular Biology,John Wiley&Sons,NewYork, 1987-1999)。在该技术中,例如,根据大小或电荷分离蛋白质或核酸 复合物。为了在电泳过程中维持结合相互作用,非变性凝胶基质材料 和没有还原剂存在的条件通常是优选的。对于特定的分析适当的条件 和其成分是本领域的技术人员众所周知的。
在特定实施方式中,可以使用在本领域中已知的方法,通过原位 和体外形式在生物样品中测定标志物mRNA的水平。术语“生物样品” 意在包括从受试者分离的组织、细胞、生物流体及其分离物,以及受 试者中存在的组织、细胞和流体。许多表达检测方法使用分离的RNA。 对于体外方法,可以利用任何不是针对mRNA的分离而选择的RNA 分离技术用于从细胞中纯化RNA(见,例如,Ausubel等编辑,Current Protocols in Molecular Biology,John Wiley&Sons,New York 1987-1999)。此外,可以通过在本技术领域的技术人员公知的技术很 容易地处理大量的组织样品,如,例如,Chomczynski(1989,4,843,155 号美国专利)的单步RNA分离方法。
分离的mRNA可被用于杂交或扩增分析中,其包括,但不限于, DNA印迹或RNA印迹分析、聚合酶链反应分析和探针阵列。用于 mRNA水平检测的一个优选的诊断方法包括将分离的mRNA与核酸 分子(探针)接触,该核酸分子(探针)可以与待检测的基因所编码 的mRNA杂交。该核酸探针可以是,例如,全长cDNA或其一部分, 如长度至少为7、15、30、50、100、250或500个核苷酸和足以在严 格条件下与编码本发明标志物的mRNA或基因组DNA特异性杂交的 寡核苷酸。此处描述了本发明的诊断分析法中使用的其它合适的探 针。mRNA与探针的杂交表明所关注的标志物正被表达。
在一种形式中,mRNA被固定在固体表面上并与探针接触,例如 通过在琼脂糖凝胶上运行分离的mRNA和将mRNA从凝胶中转移到 膜(如硝酸纤维素)上。在替代的形式中,探针被固定在固体表面上, 并且mRNA与探针接触,例如,在Affymetrix基因芯片阵列中。本 领域技术人员可以很容易地将已知的mRNA检测方法适应用于检测 本发明的标志物所编码的mRNA的水平。
用于测定样品中的mRNA标志物的水平的替代方法涉及核酸扩 增的过程,例如,通过RT-PCR(试验性实施方式在Mullis,1987, 4,683,202号美国专利中给出)、连接酶链反应(Barany,1991,Proc.Natl. Acad.Sci.USA,88:189-193)、自持序列复制(Guatelli等,1990,Proc. Natl.Acad.Sci.USA 87:1874-1878)、转录扩增系统(Kwoh等,1989,Proc.Natl.Acad.Sci.USA 86:1173-1177)、Q-β复制酶(Lizardi等,1988, Bio/Technology 6:1197)、滚环复制(Lizardi等,5,854,033号美国专利) 或任何其他的核酸扩增方法,随后用本领域技术人员熟知的技术检测 扩增的分子。如果这样的分子以非常低的数量存在,这些检测方案对 核酸分子的检测是特别有用的。如本文所用的,扩增引物被定义为可 以与基因的5'或3'区域(分别是正负链,或反之亦然)退火并包含其 间的短区域的一对核酸分子。在一般情况下,扩增引物长度是从约10 至30个核苷酸且和侧邻约50至200个核苷酸长度的区域。在适当条 件下和使用适当的试剂,这样的引物允许扩增含有引物侧邻的核苷酸 序列的核酸分子。
对于原位方法,不需要在检测前分离mRNA。在这样的方法中, 使用已知的组织学方法制备/处理细胞或组织样品。然后将样品固定在 支持物上,通常是载玻片上,和然后与可以与编码标志物的mRNA 杂交的探针接触。
作为基于标志物的绝对表达水平进行测定的一种替代方法,可以 基于标志物的标准化表达水平进行测定。通过将其表达水平与非标志 物的基因(例如,组成型表达的管家基因)的表达进行比较来校正标 志物的绝对表达水平而使表达水平标准化。用于标准化的合适的基因 包括管家基因,例如肌动蛋白基因或上皮细胞特异性基因。这种标准 化允许在一个样品(例如,患者样品)与另一样品(例如,非疾病或 非毒性样品)中或者来自不同来源的样品之间表达水平的比较。
或者表达水平可提供为相对表达水平。为确定标志物的相对表达 水平,在测定关注的样品的表达水平之前,测定10个或更多个样品, 优选50个或更多个样品的正常与疾病或毒性细胞分离物的标志物表 达水平。测定在该多个样品中分析的各个基因的平均表达水平,且将 其用作标志物的基线表达水平。然后将对于测试样品测定的标志物的 表达水平(绝对表达水平)除以对该标志物获得的平均表达值。这提 供了相对表达水平。
优选地,在基线测定中所用的样品来自非疾病或非毒性的细胞。 细胞来源的选择取决于相对表达水平的用途。使用在正常组织中建立 的表达作为平均表达评分有助于验证分析的标志物是否是疾病或毒 性特异性的(相对于正常细胞)。此外,随着更多的数据被积累,平 均表达值可以被修正,从而提供基于累积的数据的改进的相对表达 值。来自疾病细胞或毒性细胞的表达数据提供了用于分级疾病或毒性 状态的严重程度的手段。
在本发明的另一个实施方式中,检测标志物蛋白质。用于检测本 发明的标志物蛋白质的一种优选的试剂是能够结合这种蛋白质或其 片段的抗体,优选具有可检测标记的抗体。抗体可以是多克隆的,或 更优选单克隆的。可以使用完整的抗体或者其片段或衍生物(例如, Fab或F(ab')2)。关于探针或抗体的术语“标记的”意图包括通过将 可检测物质与探针或抗体偶联(即物理连接)直接标记探针或抗体, 以及通过与直接标记的另一种试剂的反应性而间接标记探针或抗体。 间接标记的实例包括用荧光标记的第二抗体检测第一抗体和用生物 素末端标记DNA探针以使得其可以用荧光标记的抗生蛋白链菌素检 测。
可以使用本领域的技术人员公知的技术从细胞分离蛋白质。所使 用的蛋白质分离方法可以是,例如,如Harlow和Lane(Harlow和 Lane,1988,Antibodies:A LaboratoryManual,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York)中所描述的那些。
可以采用多种形式来检测样品是否含有结合给定抗体的蛋白质。 这些形式的例子包括,但不限于,酶免疫分析法(EIA)、放射免疫 分析(RIA)、蛋白质印迹分析和酶联免疫吸附试验(ELISA)。技 术人员可以很容易地将已知的蛋白质/抗体检测方法适应用于测定细 胞是否表达了本发明的标志物。
在一种形式中,可以在如蛋白质印迹或免疫荧光技术的方法中使 用抗体或者抗体片段或衍生物来检测所表达的蛋白质。在这类用途 中,通常优选的是在固体载体上固定抗体或蛋白质。合适的固相支持 物或载体包括能结合抗原或抗体的任何支持物。众所周知的支持物或 载体包括玻璃、聚苯乙烯、聚丙烯、聚乙烯、葡聚糖、尼龙、淀粉酶、 天然和修饰的纤维素、聚丙烯酰胺、辉长岩和磁铁矿。
本领域技术人员知道用于结合抗体或抗原的许多其它合适的载 体,且能够使这样的支持物适应用于本发明。例如,可以在聚丙烯酰 胺凝胶电泳上运行从疾病或毒性细胞中分离的蛋白质,并固定到固相 支持物如硝酸纤维素上。然后,可以用合适的缓冲液洗涤支持物,接 着用可检测地标记的抗体进行处理。然后可以用缓冲液第二次洗涤固 相支持物以除去未结合的抗体。然后,可以通过常规方法检测固体支 持物上的结合标记的量。
本发明还包括用于检测生物样品中标志物蛋白质或核酸的存在 的试剂盒。这种试剂盒可用于测定患者是否患有某些疾病或药物诱导 的毒性或存在增高的风险。例如,该试剂盒可以包含能够检测生物样 品中的标志物蛋白质或核酸的标记的化合物或试剂,以及用于测定样 品中蛋白质或mRNA量的手段(例如,结合蛋白质或其片段的抗体, 或结合编码该蛋白质的DNA或mRNA的寡核苷酸探针)。试剂盒还 可以包括解释使用试剂盒获得的结果的说明。
对于基于抗体的试剂盒,试剂盒可以包括,例如:(1)结合于 标志物蛋白质的第一抗体(例如,连接于固体支持物),以及任选地, (2)结合蛋白质或第一抗体且与可检测的标记偶联的不同的第二抗 体。
对于基于寡核苷酸的试剂盒,该试剂盒可以包含,例如:(1) 寡核苷酸,例如可检测地标记的寡核苷酸,其与编码标志物蛋白质的 核酸序列杂交,或(2)用于扩增标志物核酸分子的一对引物。该试 剂盒还可以包含,例如,缓冲剂、防腐剂或蛋白质稳定剂。该试剂盒 可以进一步包含用于检测可检测标记所需的成分(例如,酶或底物)。 该试剂盒还可以包含可进行测定和与测试样品比较的对照样品或一 系列对照样品。试剂盒中的各种成分可以封闭在单个容器中,且所有 的各种不同容器可以与用于解释使用试剂盒进行分析的结果的说明 一起置于单一包装内。
G、药物基因组学
本发明的标志物也可用作药物基因组学标志物。如本文所用的, “药物基因组学标志物”是其表达水平与特定的临床药物反应或在患 者体内的易感性相关的客观生化标志物(参见,例如,McLeod等(1999) Eur.J.Cancer 35(12):1650-1652)。药物基因组学标志物表达的存在或 量与患者的预测响应和更具体地与患者的疾病或毒性细胞对特定的 药物或药物种类的治疗的预测响应相关。通过评估在患者体内一种或 多种药物基因组学标志物的存在或表达量,最适合患者的或预计将有 更大程度的成功的药物治疗可以被选择。例如,基于在患者中特异性 癌症标志物所编码的RNA或蛋白质的存在或量,可以选择被优化用 于很可能存在于患者中的特定肿瘤的治疗的药物或治疗过程。因此利 用药物基因组学标志物允许选择或设计对于各个癌症患者的最适合 治疗而不用尝试不同的药物或方案。
药物基因组学的另一个方面涉及改变身体作用于药物的方式的 遗传学状态。这些药物遗传学状态可作为罕见的缺陷或作为多态性存 在。例如,葡萄糖-6-磷酸脱氢酶(G6PD)缺陷是一种常见的遗传性 酶病,其中主要临床并发症是摄入氧化剂药物(抗疟疾药物、磺胺类 药物、止痛药、硝基呋喃)和食用蚕豆后的溶血。
作为说明性的实施方式,药物代谢酶的活性是药物作用的强度和 持续时间的主要决定因素。药物代谢酶(如N-乙酰基转移酶2(NAT2) 和细胞色素P450酶CYP2D6和CYP2C19)的基因多态性的发现已经 给为什么有些患者在服用了标准和安全剂量的药物后无法获得预期 的药物效果或表现出过大的药物反应和严重的毒性提供了一个解释。 这些多态性在人群中表现为两种表型,强代谢者(EM)和弱代谢者 (PM)。PM的患病率在不同人群中不同。例如,编码CYP2D6的基 因是高度多态性的,并已在PM中确定了几种突变,其中所有这些都 导致功能性CYP2D6的缺失。当他们接受标准剂量时,CYP2D6和 CYP2C19弱代谢者非常经常地发生过大的药物反应和副作用。如果 代谢产物是活性的治疗成分,PM不显示治疗效应,如由CYP2D6形 成的可待因代谢产物吗啡介导的可待因镇痛效果所证明的。另一个极端是所谓的超快代谢者,其对标准剂量无反应。最近,超快代谢的分 子基础已被确定为是由于CYP2D6基因的扩增。
因此,可以测定在个体中本发明的标志物的表达水平,从而选择 用于该个体的治疗或预防性治疗的适当药剂。此外,药物遗传学研究 可用于将编码药物代谢酶的多态性等位基因的基因分型应用于识别 个体的药物反应表型。当这一知识被应用至剂量定量或药物选择时, 可避免不良反应或治疗失败,且因此当治疗具有本发明标志物的表达 的调节子的受试者时提高治疗或预防的效率。
H、监测临床试验
监测药剂(如,药物化合物)对本发明的标志物的表达水平的影 响不仅可以被应用于基本的药物筛选,而且可以应用于临床试验。例 如,可以在接受某些疾病(如癌症、糖尿病、肥胖症、心血管疾病和 心脏毒性)或药物诱导毒性的治疗的受试者的临床试验中,监测试剂 影响标志物的表达的有效性。在优选的实施方式中,本发明提供了用 于监测用药剂(例如,激动剂、拮抗剂、拟肽、蛋白质、肽、核酸、 小分子或其他的药物候选物)治疗受试者的有效性的方法,包括以下 步骤:(i)在施用药剂前,从受试者获得给药前样品;(ii)检测给 药前样品中本发明的一个或多个选择的标志物的表达水平;(iii)从 受试者获得一个或多个给药后样品;(iv)检测给药后样品中标志物 的表达水平;(v)将给药前样品中标志物的表达水平与一个或多个 给药后样品中标志物的表达水平相比较;及(vi)相应地改变药剂对 受试者的施用。例如,在治疗过程中增加的标志物基因的表达可以表 明无效的剂量和需要提高剂量。相反,标志物基因的表达下降可以表 明有效的治疗和无需改变剂量。
H、阵列
本发明还包括含有本发明的标志物的阵列。该阵列可用于分析在 阵列中的一个或多个基因的表达。在一个实施方式中,该阵列可以用 于分析在组织中的基因表达以确定阵列中的基因的组织特异性。以这 种方式,高达约7600个基因可以被同时用于表达的分析。这允许开 发显示在一种或多种组织中特异性表达的一组基因的图谱。
除了这样的定性测定,本发明还允许基因表达定量。因此,不仅 组织特异性,而且在组织中一组基因的表达水平是可确定的。因此, 基因可以基于其本身的组织表达和在该组织中的表达水平被分组。这 可用于,例如,确定组织之间或组织中的基因表达的关系。因此,一 个组织可以被扰动,且可确定对第二组织中基因表达的影响。在这方 面,响应于生物刺激的一种细胞类型对另一种细胞类型的影响可以被 确定。这样的确定可用于,例如,了解基因表达水平上细胞-细胞相 互作用的影响。如果药剂被治疗性地施用以处理一种细胞类型,但对 另一种细胞类型具有不希望的效应,则本发明提供了用于确定不希望 的效应的分子基础的分析方法并因此提供共同施用对抗试剂或以其 他方式处理不希望的效应的机会。类似地,即使在单一的细胞类型中, 可以在分子水平上确定不希望的生物效应。因此,可以确定试剂对靶 基因以外的表达的影响和抵消该影响。
在另一个实施方式中,阵列可以用来监测阵列中一个或多个基因 的表达的时间过程。这可能发生在各种生物背景下发生,如本文所公 开的,例如药物诱导的毒性的发生,药物诱导的毒性的发展,以及过 程,如与药物诱导的毒性相关的细胞转化。
阵列也可用于确定基因的表达对同一细胞中或不同细胞中的其 他基因的表达的影响。这提供了例如,用于治疗干预的可选分子靶标 的选择,如果不能调节最终或下游的靶标。
阵列也可用于确定在正常和异常的细胞中的一种或多种基因的 差异表达模式。这提供了可以作为诊断或治疗性干预的分子靶标的一 组基因。
VII、获取样品的方法
在本发明的方法中有用的样品包括表达本发明的标志物的任何 组织、细胞、组织活检或体液样品。在一个实施方式中,样品可以是 组织、细胞、全血、血清、血浆、口腔刮取物、唾液、脑脊液、尿、 大便或支气管肺泡灌洗液。在优选的实施方式,组织样品是疾病状态或毒性状态样品。在更优选的实施方式中,组织样品是癌症样品、糖 尿病样品、肥胖症样品、心血管样品或药物诱导毒性样品。
可以通过多种本领域中已知的技术从受试者获得身体样品,包 括,例如,通过使用活组织检查或通过刮取或擦拭一个区域或通过利 用针头吸取体液。收集各种身体样品的方法在本领域中是众所周知 的。
适用于检测和定量本发明的标志物的组织样品可以是新鲜的、冷 冻的或根据本技术领域的技术人员已知的方法固定的。合适的组织样 品优选被切片和置于显微镜载片上作进一步分析。另外,固体样品, 即,组织样品,可以被溶解和/或均质化,并随后作为可溶性提取物进 行分析。
在一个实施方式中,使用,例如,液态氮或二氟二氯甲烷冷冻新 得到的组织活检样品。冷冻样品被安装用于使用例如OCT切片,并 在低温恒温器中连续切片。连续的切片被收集在玻璃显微镜载片上。 对于免疫组化染色,切片可涂覆有,例如,铬明矾、明胶或聚-L-赖氨 酸以确保切片粘着到载片上。在另一个实施方式中,在切片之前固定 和包埋样品。例如,组织样品可以在例如福尔马林中固定,连续脱水, 并包埋在例如石蜡中。
一旦得到样品,可以使用在本领域中已知适合用于检测和定量分 析本发明的标志物的任何方法(无论是在核酸或在蛋白质水平上)。 这类方法是众所周知的,且包括但不限于蛋白质印迹、RNA杂交、 DNA杂交、免疫组织化学、ELISA例如,扩增的ELISA、免疫沉淀、免疫荧光、流式细胞术、免疫细胞化学、质谱分析例如,MALDI-TOF 和SELDI-TOF、核酸杂交技术、核酸逆转录方法和核酸扩增方法。在 特定的实施方式中,使用例如,与这些蛋白质特异性结合的抗体在蛋 白质水平上检测本发明标志物的表达。
样品可能需要被改变以使本发明的标志物易于被抗体结合。在免 疫细胞化学或免疫组织化学方法的特定方面,载片可被转移到预处理 缓冲液中和任选地加热以增加抗原可达性。加热预处理缓冲液中的样 品迅速地破坏了细胞的脂质双层,和使得抗原(可以是新鲜标本中的 情况,但通常不是发生在固定标本中的情况)更易于为抗体结合。本 文中可互换地使用术语“预处理缓冲液”和“制备缓冲液”,其指用于制 备用于免疫染色的细胞学或组织学样品,尤其是通过提高本发明标志 物用于抗体结合的可达性的缓冲液。预处理缓冲液可以包含pH特异 性的盐溶液、聚合物、洗涤剂或者非离子或阴离子表面活性剂,例如, 乙氧基化的阴离子型或非离子型表面活性剂、链烷酸或烷氧基化物或 甚至这些表面活性剂的共混物或甚至使用胆汁盐。预处理缓冲液可以 是,例如,0.1%至1%的脱氧胆酸、钠盐的溶液、或月桂醇醚-13-羧 酸酯钠(例如,Sandopan LS)或和乙氧基化的阴离子复合物的溶液。 在一些实施方式中,预处理缓冲液也可以被用作载片存储缓冲液。
使本发明的标志物蛋白质更易于为抗体结合的任何方法可以被 用在本发明的实践中,包括本领域中已知的抗原修复方法。参见,例 如,Bibbo等(2002)Acta.Cytol.46:25-29;Saqi等(2003)Diagn. Cytopathol.27:365-370;Bibbo等(2003)Anal.Quant.Cytol.Histol. 25:8-11,其各自的全部内容通过引用并入本文。
在预处理以增加标志物蛋白质的可达性之后,可以使用合适的封 闭剂,例如,如过氧化物酶封闭剂,如过氧化氢来封闭样品。在一些 实施方式中,可以使用蛋白质封闭剂封闭样品以防止抗体的非特异性 结合。蛋白质封闭剂可以包含,例如,纯化的酪蛋白。然后将抗体(特 别是特异性结合本发明的标志物的单克隆抗体或多克隆抗体)与样品 一起孵育。本领域的技术人员将会理解,在某些情况下,可以通过检 测患者样品中本发明的标志物蛋白质上的多个表位而得到更准确的 诊断或预后。因此,在具体的实施方式中,使用针对本发明标志物的 不同表位的至少两个抗体。在使用超过一个抗体时,可以依次将这些抗体作为单独的抗体试剂添加到单一样品中,或作为抗体混合物同时 加入。或者,可以将各单个抗体添加到来自同一病人的单独样品中, 并汇集所得到的数据。
用于检测抗体结合的技术在本技术领域是众所周知的。可以通过 使用产生可检测信号的化学试剂检测结合本发明标志物的抗体,其中 该可检测的信号对应于抗体结合的水平,和因此对应于标志物蛋白质 的表达水平。在本发明的免疫组织化学或免疫细胞化学方法中,通过 使用与标记的聚合物偶联的第二抗体来检测抗体结合。标记的聚合物 的例子包括但不限于聚合物-酶偶联物。这些复合物中的酶通常被用 于催化发色团沉积在抗原-抗体结合位点处,从而导致对应于目的生 物标志物的表达水平的细胞染色。特别感兴趣的酶包括,但不限于, 辣根过氧化物酶(HRP)和碱性磷酸酶(AP)。
在本发明的特定免疫组织化学或免疫细胞化学方法中,通过使用 与第二抗体偶联的HRP-标记的聚合物检测抗体与本发明标志物的结 合。也可以通过使用结合单克隆抗体或多克隆抗体的物种特异性探针 试剂以及结合物种特异性探针试剂的与HRP偶联的聚合物检测抗体 结合。使用任何发色团对载片进行抗体结合的染色,例如,发色团3,3- 二氨基联苯胺(DAB),然后用苏木精和任选地上蓝剂(例如氢氧化 铵或TBS/Tween-20)复染。其它合适的发色团包括,例如,3-氨基-9- 乙基咔唑(AEC)。在本发明的一些方面,通过细胞学技师和/或病理 学家显微镜检验载片以评估细胞染色,例如,荧光染色(即,标志物 表达)。或者,可以通过自动显微镜检或借助于帮助识别阳性染色细 胞的计算机软件人工检验样品。
可以通过将抗标志物抗体与可检测物质偶联来促进抗体结合的 检测。可检测物质的实例包括各种酶、辅基、荧光材料、发光材料、 生物发光材料和放射性材料。合适的酶的例子包括辣根过氧化物酶、 碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶;合适的辅基复合体的例 子包括抗生蛋白链菌素/生物素和抗生物素蛋白/生物素;合适的荧光 材料的例子包括伞形酮、荧光素、异硫氰酸荧光素、若丹明、二氯三 嗪基胺荧光素、丹磺酰氯或藻红蛋白;发光材料的例子包括鲁米诺; 生物发光材料的例子包括萤光素酶、虫萤光素和水母发光蛋白;且合 适的放射性物质的例子包括125I、131I、35S、14C或3H。
在本发明的一个实施方式中,按上述方法制备冷冻样品,和随后 用针对本发明标志物的抗体染色,该抗体使用,例如,Tris-缓冲盐水 (TBS)稀释至适当的浓度。通过将载片在生物素化的抗免疫球蛋白 中温育检测初级抗体。这个信号可以任选地放大和用抗原的二氨基联 苯胺沉淀使其可视化。此外,载片可以任选地用,例如,苏木精复染 以使细胞可视化。
在另一个实施方式中,用针对本发明标志物的抗体染色经固定和 包埋的样品,并对冰冻切片如上所述进行复染。此外,可任选地用试 剂处理样品以放大信号,从而可视化抗体染色。例如,可利用生物素 -酪胺(tyramide)的过氧化物酶催化的沉积,生物素-酪胺随后与过氧 化物酶偶联的抗生蛋白链菌素反应(催化信号放大(CSA)系统, DAKO,Carpinteria,CA)。
基于组织的分析(即,免疫组织化学)是检测和定量本发明标志 物的优选的方法。在一个实施方式中,可以通过免疫组织化学确定是 否存在本发明的标志物。在一个实施方式中,免疫组织化学分析使用 低浓度的抗标志物抗体,以使得缺乏标志物的细胞不染色。在另一个 实施方式中,本发明的标志物是否存在使用利用了高浓度的抗标志物 抗体的免疫组织化学方法测定,以使得缺乏标志物蛋白质的细胞重度 染色。不染色的细胞包含突变的标志物而不能产生可抗原识别的标志 物蛋白质,或者是其中调节标志物水平的途径失调的细胞,从而导致 可忽略的标志物蛋白质的稳态表达。
本领域的技术人员将认识到,用于实施本发明方法的特定抗体的 浓度将取决于如结合时间、抗体对于本发明标志物的特异性水平和样 品制备方法等因素而变化。此外,当使用多个抗体时,所需要的浓度 可能受样品被施用于抗体上的顺序影响,例如,作为混合物同时施加 或作为单独的抗体试剂顺序地施加。此外,用于可视化抗体与本发明 标志物的结合的检测化学作用还必须进行优化以产生所需的信噪比。
在本发明的一个实施方式中,将蛋白质组学的方法,例如,质谱 法,用于检测和定量本发明的标志物蛋白质。例如,其中涉及将生物 样品(如血清)应用于蛋白质结合芯片的基质辅助激光解析/电离飞行 时间质谱法(MALDI-TOF MS)或表面增强激光解析/电离飞行时间 质谱法(SELDI-TOF MS)(Wright,G.L.,Jr.等(2002)Expert Rev Mol Diagn 2:549;Li,J.等(2002)Clin Chem 48:129;Laronga,C.等(2003)Dis Markers 19:229;Petricoin,E.F.等(2002)359:572;Adam,B.L.等(2002) Cancer Res 62:3609;Tolson,J.等(2004)LabInvest 84:845;Xiao,Z.等 (2001)Cancer Res 61:6029)可用于检测和定量PY-Shc和/或p66-Shc 蛋白。质谱方法被描述于,例如,5,622,824、5,605,798和5,547,835 号美国专利中,其各自的全部内容并入本文作为参考。
在其它实施方式中,在核酸水平检测本发明标志物的表达。用来 评估表达的基于核酸的技术在本领域中是众所周知的,并包括,例如, 测定来自受试者样品中标志物mRNA的水平。许多表达检测方法使 用分离的RNA。任何不是针对mRNA的分离选择的RNA分离技术可 以用于从表达本发明标志物的细胞纯化RNA(参见,例如,Ausubel 等编,(1987-1999)Current Protocols in Molecular Biology(John Wiley& Sons,New York))。此外,可以使用那些本领域的技术人员熟知的技 术如,例如,Chomczynski(1989,4,843,155号美国专利)的单步RNA 分离过程,很容易地处理大量组织样品。
术语“探针”是指能够选择性地结合本发明标志物(例如,核苷酸 转录物和/或蛋白质)的任何分子。探针可以由本技术领域的技术人员 合成,或来自于适当的生物制剂。探针可以特别地设计为被标记的。 可以被用作探针的分子的实例包括,但不限于,RNA、DNA、蛋白质、 抗体和有机分子。
分离的mRNA可以被用在杂交或扩增分析中,其包括但不限于, DNA或RNA印迹分析、聚合酶链反应分析和探针阵列。用于检测 mRNA水平的一种方法涉及将分离的mRNA与可以与标志物mRNA 杂交的核酸分子(探针)相接触。该核酸探针可以是,例如,全长cDNA 或其一部分,如至少为7、15、30、50、100、250或500个核苷酸长 度和足以在严格条件下与标志物基因组DNA特异性杂交的寡核苷 酸。
在一个实施方式中,mRNA被固定在固体表面上,并与探针接触, 例如通过在琼脂糖凝胶上运行分离的mRNA,和将mRNA从凝胶转 移到膜上,如硝酸纤维素。在替代的实施方式中,探针被固定在固体 表面上,并将mRNA与探针接触,例如,在Affymetrix基因芯片阵列中。熟练的技术人员可以很容易地将已知的mRNA检测方法适应 用于检测标志物mRNA的水平。
用于确定样品中标志物mRNA的水平的替代方法涉及核酸扩增 的过程,例如,通过RT-PCR(Mullis,1987年,4,683,202号美国专 利中公开的实验实施方式)、连接酶链反应(Barany(1991)Proc.Natl. Acad.Sci.USA 88:189-193)、自持的序列复制(Guatelli等(1990)Proc. Natl.Acad.Sci.USA 87:1874-1878)、转录扩增系统(Kwoh等(1989)Proc.Natl.Acad.Sci.USA 86:1173-1177)、Q-β复制(Lizardi等(1988) Bio/Technology 6:1197)、滚环复制(Lizardi等人,5,854,033号美国专 利)或任何其他的核酸扩增方法,随后使用本领域的技术人员熟知的 技术检测扩增的分子。如果这样的分子以非常低的数量存在,则这些 检测方案对于核酸分子的检测是特别有用的。在本发明的特定方面 中,通过定量荧光RT-PCR(即,TaqManTM系统)评估标志物的表达。 这类方法通常利用对于本发明的标志物特异性的寡核苷酸引物对。设 计对于已知序列特异性的寡核苷酸引物的方法是本领域中众所周知 的。
可以使用膜印迹(如用于杂交分析中的,例如RNA印迹、DNA 印迹、点印迹等)或微孔、样品管、凝胶、珠或纤维(或任何包含结 合的核酸的固体支持物)监测本发明标志物的表达水平。见5,770,722、 5,874,219、5,744,305、5,677,195和5,445,934号美国专利,其通过引 用的方式并入本文。检测标志物的表达也可包括使用在溶液中的核酸 探针。
在本发明的一个实施方式中,微阵列被用于检测本发明标志物的 表达。因为不同的实验之间的可重复性,微阵列特别适合用于此目的。 DNA微阵列提供了一种用于同时测量大量基因的表达水平的方法。 各个阵列由可附着到固体支持物上的捕获探针的重复图案组成。标记 的RNA或DNA与在阵列上的互补探针杂交,然后通过激光扫描检测。 阵列上各个探针的杂交强度被确定并转换为代表相对基因表达水平 的定量值。见6,040,138、5,800,992和6,020,135、6,033,860和6,344,316 号美国专利,本文通过引用引入。高密度寡核苷酸阵列对于测定样品 中大量RNA的基因表达谱是特别有用的。
使用本发明的方法,其中可包括本领域技术人员已知的回归分析 的方法,可以利用本发明标志物的量和/或标志物量的数学关系来计算 在进行疾病状态或毒性状态治疗的受试者中疾病状态(例如,癌症、 糖尿病、肥胖症、心血管疾病或毒性状态,例如,药物诱导的毒性或 心脏毒性)复发的风险,对于疾病状态或毒性状态正在接受治疗的受 试者的生存,疾病状态或毒性状态是否是侵袭性的、治疗方案对于治 疗疾病状态或毒性状态的功效等。例如,适当的回归模型包括但不限 于,CART(例如,Hill,T和Lewicki,P.(2006)“STATISTICS Methods and Applications”StatSoft,Tulsa,OK)、Cox(例如,www.evidence-based-medicine.co.uk)、指数、正态和对数正态(例如,www.obgyn.cam.ac.uk/mrg/statsbook/stsurvan.html)、逻辑(例如,www.en.wikipedia.org/wiki/Logistic_regression)、参数、非参数、半参数 (例如,www.socserv.mcmaster.ca/jfox/Books/Companion)、线性(例如,www.en.wikipedia.org/wiki/Linear_regression)或加性(例如,www.en.wikipedia.org/wiki/Generalized_additive_model)。
在一个实施方式中,回归分析包括标志物的量。在另一个实施方 式中,回归分析包括标志物数学关系。在再另一实施方式中,标志物 的量和/或标志物数学关系的回归分析可以包括附加的临床和/或分子 协变量。这种临床协变量包括但不限于,淋巴结状态、肿瘤阶段、肿 瘤分级、肿瘤大小、治疗方案,如化疗和/或放射治疗、临床结果(例 如,复发、疾病特异性生存率、治疗失败)和/或随诊断后时间变化的 临床结果、治疗开始后的时间和/或完成治疗后的时间。
VIII、试剂盒
本发明还提供了组合物和试剂盒,其用于预后疾病状态(如癌症、 糖尿病、肥胖病、心血管疾病或毒性状态,例如,药物诱导的毒性或 心脏毒性)、疾病状态或毒性状态的复发或正在接受疾病状态或毒性 状态治疗的受试者的生存。这些试剂盒包括以下的一种或多种:特异 性结合本发明的标志物的可检测抗体、特异性结合本发明的标志物的 可检测抗体、用于获得和/或制备受试者目标组织样品用于染色的试剂 和使用说明。
本发明的试剂盒可任选地包含可用于执行本发明的方法的附加 成分。举例来说,试剂盒可以包含适于退火互补的核酸或用于将抗体 与其特异性结合的蛋白质相结合的流体(如SSC缓冲液)、一个或多 个样品室、说明材料(其描述了本发明方法的性能)和组织特异性的 对照/标准品。
IX、筛选分析
本发明的靶标包括,但不限于,本文中所列的基因和/或蛋白质。 基于本文中申请人所描述的实验结果,可以将疾病状态或毒性状态中 调节的关键蛋白质与不同的途径或分子组相关联或分类到不同的途 径或分子组中,包括细胞骨架成分、转录因子、凋亡反应、戊糖磷酸 途径、生物合成途径、氧化应激(促氧化剂)、膜改变和氧化磷酸化 代谢。因此,在本发明的一个实施方式中,标志物可以包括一个或多 个基因(或蛋白质),其选自于HSPA8、FLNB、PARK7、 HSPA1A/HSPA1B、ST13、TUBB3、MIF、KARS、NARS、LGALS1、 DDX17、EIF5A、HSPA5、DHX9、HNRNPC、CKAP4、HSPA9、PARP1、 HADHA、PHB2、ATP5A1、CANX、GRP78、GRP75、TIMP1、PTX3、HSP76、PDIA4、PDIA1、CA2D1、GPAT1和TAZ。在一个实施方式 中,标志物可以包括一个或多个基因(或蛋白质),其选自于GRP78、 GRP75、TIMP1、PTX3、HSP76、PDIA4、PDIA1、CA2D1、GPAT1和TAZ。在一些实施方式中,标志物是上述基因或蛋白质中至少两个、 三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二 个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、 二十个、二十五个、三十个或更多个的组合。
用于鉴别所鉴定的标志物的调节子的筛选分析描述如下。
本发明还提供了用于鉴别调节子,即,候选或测试化合物或试剂 (如蛋白质、肽、拟肽、类肽、小分子或其他药物)的方法(在此也 称为“筛选分析”),该调节子用于通过调节本发明标志物的表达和/ 或活性来治疗或预防疾病状态或毒性状态。这些分析典型地包括本发 明的标志物和一个或多个分析成分之间的反应。其它成分可以是测试 化合物本身,或测试化合物和本发明标志物的天然结合伴体的组合。 通过试验(如本文所述的那些)鉴别的化合物可能例如,用于调节(例 如,抑制、缓解、治疗或预防)疾病状态或毒性状态的侵袭性。
可以从任何可得来源得到用于本发明的筛选试验中的测试化合 物,包括天然和/或合成化合物的系统的文库。测试化合物也可以通过 本领域中已知的组合文库方法中的众多途径中的任何一种获得,包 括:生物学文库、类肽文库(具有肽的功能,但具有新型的非肽主链 的分子的文库,该非肽主链具有对酶降解的抗性但仍然保持活性;见, 例如,Zuckermann等,1994,J.Med.Chem.37:2678-85);可空间定址 的平行固相或液相文库;需要去卷积的合成文库方法;“一珠一化合 物”文库方法;和采用亲和层析选择的合成文库方法。生物学文库和 类肽文库途径限于肽文库,而其他四个途径适用于肽、非肽低聚物或 化合物的小分子文库(Lam,1997,Anticancer Drug Des.12:145)。
可以在现有技术中找到用于合成分子文库的方法的例子,例如: DeWitt等(1993)Proc.Natl.Acad.Sci.U.S.A.90:6909;Erb等(1994)Proc. Natl.Acad.Sci.USA 91:11422;Zuckermann等(1994).J.Med.Chem. 37:2678;Cho等(1993)Science 261:1303;Carrell等(1994)Angew.Chem. Int.Ed.Engl.33:2059;Carell等(1994)Angew.Chem.Int.Ed.Engl.33:2061;和Gallop等(1994)J.Med.Chem.37:1233。
化合物的文库可以存在于溶液中(例如,Houghten,1992 Biotechniques 13:412-421)或珠(Lam,1991,Nature 354:82-84)、芯片 (Fodor,1993,Nature 364:555-556)、细菌和/或孢子(Ladner的5,223,409 号美国专利)、质粒(Cull等1992,Proc Natl Acad SciUSA 89:1865-1869) 或噬菌体(Scott和Smith,1990,Science 249:386-390;Devlin,1990,Science 249:404-406;Cwirla等,1990,Proc.Natl.Acad.Sci.87:6378-6382; Felici,1991,J.Mol.Biol.222:301-310;Ladner,同上)上。
本发明的筛选方法包括将疾病状态细胞或毒性状态细胞与测试 化合物接触,并确定测试化合物调节细胞中本发明的标志物的表达和 /或活性的能力。可如本文所述地测定本发明的标志物的表达和/或活 性。
在另一个实施方式中,本发明提供了用于筛选候选物或测试化合 物的分析方法,其是本发明标志物或其生物活性部分的底物。在再另 一实施方式中,本发明提供用于筛选候选物或测试化合物的分析方 法,该候选物或测试化合物结合本发明的标志物或其生物活性部分。 可以例如,通过将测试化合物与放射性同位素或酶标记偶联以使得化 合物与标志物的结合可以通过检测复合物中标记的标志物化合物而 测定,从而完成测试化合物直接结合标志物的能力的测定。例如,可 以用131I、125I、35S、14C或3H直接或间接地标记化合物(例如,标志 物底物),并通过射电辐射的直接计数或通过闪烁计数检测放射性同 位素。或者,可以用,例如,辣根过氧化物酶、碱性磷酸酶或荧光素 酶酶学标记分析成分,并通过测定适当的底物向产物的转化而检测酶 标记。
本发明还涉及由上述筛选分析鉴别的新型药剂。因此,进一步在 适当的动物模型中使用如本文所述的鉴别的试剂在本发明的范围之 内。例如,可以在动物模型中使用如本文所述地鉴别的能够调节本发 明标志物的表达和/或活性的试剂,以确定用该试剂进行治疗的疗效、 毒性或副作用。或者,可以在动物模型中使用如本文所述被鉴别的试 剂以确定这种试剂的作用机制。此外,本发明涉及通过如上所述的方 法鉴别的新型药剂用于如上所述的治疗。
本发明的示例
实施例1:采用平台技术来建立癌症一致网络和模拟网络
在这个实施例中,采用在上面详细描述的平台技术来整合从定制 的体外肿瘤模型获得的数据,从而确定驱动癌症发病的新的蛋白质/ 途径。从该分析得到的关系图谱已经提供了癌症治疗靶标以及与癌症 相关的诊断/预后标志物。
在图18中描绘了研究设计。简单地说,使2个癌症细胞系(PaCa2、 HepG2)和一个正常的细胞系(THLE2)经历模拟体内癌细胞所经历 的环境的七种条件之一。具体而言,将细胞暴露于高血糖条件、低氧 条件、乳酸条件、高血糖+低氧组合条件、高血糖+乳酸组合条件、低 氧+乳酸组合条件或高血糖+缺氧+乳酸组合条件。不同的条件如下所 示建立:
-高血糖条件通过在含有22mM的葡萄糖的培养基中培养细胞建 立。
-低氧条件通过将细胞置于模块化培养箱(MIC-101, Billups-RothenbergInc.Del Mar,CA)中而诱导,该模块化培养箱充满 含有5%的CO2,2%的O2和93%的氮的工业气体混合物。
-乳酸条件通过将细胞培养在含有12.5mM的乳酸的培养基中而 建立。
-高血糖+低氧组合条件通过在含有22mM的葡萄糖的培养基中 培养细胞和将细胞置于其中充满含有5%的CO2、2%的O2和93%的 氮的工业气体混合物的模块化培养箱中建立。
-高血糖+乳酸组合条件通过将细胞培养在含有22mM的葡萄糖 和12.5mM的乳酸的培养基中建立。
-低氧+乳酸组合条件通过在含有12.5mM的乳酸的培养基中培养 细胞和将细胞置于其中充满含有5%的CO2、2%的O2和93%的氮的 工业气体混合物的模块化培养箱中建立。
-高血糖+低氧+乳酸组合条件通过将细胞培养在含有22mM的葡 萄糖和12.5mM的乳酸的培养基中和将细胞置于其中充满含有5%的 CO2、2%的O2和93%的氮的工业气体混合物的模块化培养箱中建立。
含有上述细胞的细胞模型通过将暴露于上述各条件的细胞用辅 酶Q10处理而暴露于环境扰动另外地探询。具体而言,用0、50μM 或100μM的辅酶Q10处理细胞。
在处理后的不同时间收集细胞样品以及具有各种条件和各辅酶 Q10处理的各个细胞系的培养基样品,包括处理的24小时和48小时 后。
此外,进行两种不同的癌细胞(PaCa2和HepG2细胞)之间的交 互实验,其中PaCa2和HepG2细胞是共培养的。此共培养方法被称 作为细胞外分泌组(ECS)实验。第一细胞系统(PaCa2)首先接种 在侵袭实验型生长室的孔的插入体中。使用6孔板来实现更好的统计 分析。在插入体中接种第一细胞系统时,插入体被置于单独的6孔板 中。第二细胞系统(HepG2细胞)接种于主盘上。包含所述第一细胞 系统的插入盘和包含所述第二细胞系统的主盘在37℃孵育过夜。各 细胞系统都生长在特定的细胞特异性培养基中(其中可选地,各个细 胞系统可以生长在适应于支持两种细胞类型的生长的培养基中),在 第二天,通过培养基更换进行预定的处理。具体而言,包含所述第一 细胞系统的插入体被放置到包含第二细胞系统的主盘中。然后将盘孵 育预定的时间段,例如,24小时或48小时。设置具有相同的条件的重复孔,并合并细胞以产生足够的材料用于2D分析。收获培养基(1 毫升等份)、来自插入体的细胞和来自主盘的孔的细胞作为单独的样 品。实验一式三份进行以便提供更好的统计分析能力。
还通过“培养基交换”实验进行交互实验。具体而言,在如上所述 的扰动或条件化后的24小时或48小时之后,收集来自所述第一细胞 系统(PaCa2)的经过培养的培养基或“分泌组”并然后加入到第二细 胞系统(HepG2)中24-48小时。然后收集来自第二细胞系统的最终 经过培养的培养基或“分泌组”。对所有最终分泌组进行蛋白质组学分 析。
使用上述的发明详述中所描述的技术,对于各种条件下和具有各 种“环境扰动”(即,辅酶Q10处理)的各细胞系所收集的细胞和培养 基样品进行通过定量蛋白质组学的总细胞蛋白质表达变化的 iProfiling分析。同样地对在各种条件下具有各种处理的各共培养细胞 系收集的细胞和培养基样品进行通过定量蛋白质组学的总细胞蛋白 质表达变化的iProfiling分析。
此外,基本上按制造商推荐的通过使用Seahorse分析仪生成暴露 于各种条件和具有或不具有辅酶Q10扰动的癌症、正常细胞和交互实 验中的细胞的生物能量学谱型分析。在用推靠Seahorse培养板的盒产 生的7微升室中的电极记录OCR(耗氧率)和ECAR(细胞外酸化率)。
将为在各种条件下和经受各种扰动的各细胞系(包括交互实验中 的细胞)收集的蛋白质组学数据及为在各种条件下和经受各种扰动的 各细胞系收集的生物能量学谱型数据全部通过REFSTM系统输入和处 理。然后使用标准化的命名法将Paca2、HepG2、THLE2和交互实验 的原始数据组合。滤出具有15%以上的蛋白质组学数据丢失的基因。 制定了数据归集策略。例如,使用内重复误差模型(within replicates error model)来归结来自具有重复的实验条件的数据。基于10个邻近 的K-NN算法被用来归结没有重复的数据。对于三个生物系统一起建 立不同的REFSTM模型,仅Paca2系统或仅HepG2系统关联于表型数 据。
使用R编程语言,通过定制的程序对于在模拟网络中连接父节点 和子节点的各个边界提取曲线下面积和倍数变化,其中R编程语言是 用于统计计算和制图的开源软件环境。
将来自R程序的输出输入到Cytoscape(一种开源程序)中,以 生成一致网络的可视化表示。
在所有的构建的模型之间,70%片段频率的示例性蛋白质相互作 用REFS一致网络显示在图21中。
通过增加或减少LDHA的表达4倍以使用REFSTM生成模拟网络 而模拟图21中所示的一致网络中的各个节点,如在上面的发明详述 中所详细描述的。
研究在图21所示的示例性一致网络中模拟的LDHA表达的变化 对PARK7和以高水平与PARK7相关的节点(notes)中的蛋白质的影 响。使用REFSTM(参见图22)识别两个癌症细胞系(即Paca2和HepG2) 中响应于LDHA模拟的蛋白质。数字表示特定的蛋白质表达水平的倍 数变化。
为了用上面的方法验证识别的蛋白质联系,被识别为在模拟网络 中直接接近LDHA的标志物被输入IPA(一种基于以前出版的文献利 用神经网络来确定输出到网络的实验输出之间的分子连接的软件程 序)。IPA程序的输出如图23中所示,其中灰色形状中的标志物被 确定为平台生成的模拟网络中直接接近LDHA,且未填充形状中的标 志物是基于先前发表的文献中的公知的知识由IPA确定的连接。
观察到来自探询生物学平台技术(如图21所示)的输出中鉴别 的标志物(即DHX9、HNRNPC、CKAP4、HSPA9、PARP1、HADHA、 PHB2、ATP5A1和CANX)与公知的癌症标志物关联,如IPA生成 网络内(如图23所示)的TP53和PARK7。通过使用探询生物学平 台确定的因子与科学文献中发表的已知因子共有连接性的事实证实 了通过使用探询生物学平台创建的网络的精确度。此外,通过使用探 询生物学平台输出创建的LDHA子网络内的网络相关性证明了各因 子的定向影响的存在,这与IPA网络相反(其中分子实体之间的连接 不提供相互作用节点之间的功能定向性)。因此,通过采用一种无偏 的方法来生成数据,集成和逆向工程来创建计算模型,然后进行模拟 和差分网络分析,探询生物学发现平台使得能够了解迄今在癌症病理 生理学中未知的机制,其与已为大家接受的对疾病病理生理的科学认 识一致。
图19显示了在来自iProfiling分析的蛋白质表达数据基础上辅酶 Q10处理对下游节点(在图19中列出了PubMed蛋白质检索号)的 影响。蛋白质检索号P00338是LDHA。对HepG2细胞中LDHA表达 进行蛋白质组学数据的湿式实验室验证(见图20)。如图20中所示,当用50uM的辅酶Q10或100uM的辅酶Q10处理HepG2 24或48 小时时,LDHA表达水平降低。
用于众所周知的癌症标志物TP53、BCL-2、Bax和Caspase3,进 行辅酶Q10处理对SKMEL28细胞中这些标志物的表达水平的影响的 湿式实验室验证(参见图24和图25)。
实施例2:采用平台技术建立癌症Δ-Δ网络
在此实施例中,采用在上面详细描述的平台技术整合从定制体外 癌症模型获得的数据,并从而鉴别驱动癌症发病的新蛋白质/途径。从 这样的分析得到的关系图谱已经提供了癌症的治疗靶标以及与癌症 相关的诊断/预后标志物。
简单地说,使四种癌细胞系(PaCa2、HepG2、PC3和MCF7)和 两种正常细胞系(THLE2和HDFa)经受模拟癌症细胞在体内所经历 的环境的各种条件。具体而言,细胞独立地暴露于高血糖条件、低氧 条件和乳酸处理中的各条件。例如,高血糖条件是通过在含有22mM 的葡萄糖的培养基中培养细胞建立的。低氧条件是通过将细胞置于模 块化培养箱(MIC-101,Billups-Rothenberg Inc.Del Mar,CA)(其中 充满含有5%的CO2、2%的O2和93%的氮的工业气体混合)中而诱 导的。对于乳酸处理,用0或12.5mM的乳酸处理各个细胞系。除了 将细胞单独地暴露于上述三个条件中的各条件外,也将细胞暴露于这 些条件中的两个或全部三个的组合(即,高血糖和低氧条件、高血糖 条件和乳酸、低氧条件和乳酸及高血糖和低氧条件和乳酸)。
此外,通过将细胞暴露于用辅酶Q10处理的环境扰动探询其中各 类型的细胞暴露于上述的各个条件的包含上述细胞的细胞模型。具体 而言,用0、50μM或100μM的辅酶Q10处理细胞。
在处理后的不同时间(包括处理后24小时和48小时)收集在有 或没有辅酶Q10处理的情况下对于暴露于各个条件(或条件组合)的 细胞系的细胞样品以及含有来自细胞的分泌组的培养基样品。
此外,进行两种不同的癌细胞(PaCa2和HepG2细胞)之间的交 互实验,在其中PaCa2和HepG2细胞是共培养的。此共培养方法被 称作为细胞外分泌组(ECS)实验。第一细胞系统(PaCa2)首先接 种在侵袭实验型生长室的孔的插入体中。一般使用6孔板来实现更好 的统计分析。在第一细胞系统接种在插入体中时,插入体被放置在单 独的6孔板中。第二细胞系统(HepG2)接种于主盘中。包含含有所 述第一细胞系统的插入体和含有所述第二细胞系统的主盘的6孔板在 37℃下孵育过夜。各细胞系统生长在其相应的细胞特异性培养基中 (其中可选地,各细胞系统可以生长在适应于支持两种细胞类型的生 长的培养基中)。在第二天,通过培养基更换进行预定的处理。具体 而言,将包含所述第一细胞系统的插入体和第一细胞系统的相应培养 基置于包含第二细胞系统和第二细胞系统的相应培养基的主盘中。然 而,在所有共培养的情况中,共培养细胞在共培养前的第一天中已经 暴露于相同的“癌症条件”(例如,高血糖、低氧、乳酸或它们的组合), 尽管是单独地。即是说,将插入体中的第一细胞系统和盘内的第二细 胞系统暴露于相同的条件,然后被移动到“共培养”设置中。然后将盘 孵育预先确定的时间,例如,24小时或48小时。用相同的条件建立 重复的孔,并且汇合细胞以产生足够的材料进行随后的蛋白质组学分 析。收获含分泌组的培养基(1毫升等份)、来自插入体的细胞和来 自主盘的孔的细胞作为单独的样品。实验一式三份地进行以便提供更 好的统计分析能力。
还通过“培养基交换”实验进行交互实验。具体而言,在如上所述 的扰动或条件化后的24小时或48小时之后,收集来自所述第一细胞 系统(PaCa2)的经培养的培养基或“分泌组”,且然后加入到第二细 胞系统(HepG2)中24-48小时。然后收集来自第二细胞系统的最终 的经过培养的培养基或“分泌组”。对所有最终分泌组进行蛋白质组学 分析。
在将细胞系统暴露于如上所述的“癌症条件”之后,通过分析来自 细胞系统的各种读数分析扰动(即,辅酶Q10处理)和/或来自共培 养实验的成对细胞的分泌组中产生的条件、细胞的响应。读数包括蛋 白质组学数据,特别是细胞内蛋白质表达以及分泌到细胞培养基中的 蛋白质和功能的数据,特别是细胞生物能量学。
使用上面发明详述中所描述的技术,对有或没有“环境扰动”(即, 辅酶Q10处理)的情况下暴露在各种条件(或条件组合)的各种细胞 系(正常和癌症细胞系)收集的细胞和培养基样品进行通过定量蛋白 质组学的总细胞蛋白质表达变化的iProfiling分析。
此外,基本上按制造商推荐的通过使用Seahorse分析仪生成在有 或没有“环境扰动”(即,辅酶Q10处理)的情况下,暴露于各种条件(或 条件组合)的各种细胞系(正常和癌症细胞系)的生物能量学谱。用 推靠Seahorse培养板的盒形成的7微升室中的电极记录OCR(耗氧 率)和细胞外酸化率(ECAR)。
然后通过REFSTM系统处理在各种条件下和有或没有各种扰动的 情况下对各种细胞系收集的蛋白质组学数据及各种条件下和有或没 有各种扰动的情况下对各细胞系收集的生物能量学谱数据。“复合癌 症摄动网络”从对于所有的癌症细胞系获得的组合数据生成,其中各 癌症细胞系已暴露于各特定的条件(和条件组合),且进一步暴露于 扰动(辅酶Q10)。“复合癌症未扰动网络”从对于所有的癌症细胞 系获得的组合数据生成,其中各癌症细胞系暴露于各特定的条件(和 条件的组合)而没有扰动(没有辅酶Q10)。类似地,“复合正常扰 动网络”从对于所有的正常细胞系获得的组合数据生成,其中各正常 细胞系暴露于各特定的条件(和条件的组合),且另外地暴露于扰动 (辅酶Q10)。“复合正常未扰动网络”从对于所有的正常细胞系获 得的组合数据生成,其中各正常细胞系暴露于各特定的条件(和条件 的组合)而没有扰动(没有辅酶Q10)。
接着使用REFSTM对于如上所述的四个复合网络中的各个网络生 成“模拟复合网络”(在这里也被称为“模拟网络”)。为此,模拟了给 定的一致复合网络中的各个节点(通过增加或减少10倍)以使用 REFSTM生成模拟网络,如在上面的发明详述中所详细描述的。
使用R编程语言,通过定制的程序提取对于在模拟网络中连接父 节点和子节点的各个边界的曲线下面积和倍数变化,其中R编程语言 是用于统计计算和制图的开源软件环境。
最后,生成Δ网络,其中该Δ网络代表两个模拟复合网络之间的 差异。Δ网络从模拟复合网络生成。为生成响应于辅酶Q10的癌症对 正常的差异网络(Δ-网络),如图26中所示的用PERL编程语言通过定 制的程序进行连续的比较步骤。
首先,使用R程序对比未处理的癌症(T0)和处理的癌症(T1) 网络,和分离独特的癌症处理T1网络(参见图26中的深灰色的月牙 形状)。这代表癌症T1∩(交集)癌症T0“Δ”网络。这个Δ网络中 的蛋白质相互作用/相关性可以被看作是代表对辅酶Q10处理的独特癌症反应。
类似地,使用R程序比较未处理的正常(T0)和处理的正常(T1) 网络,和分离独特的处理的正常T1网络(参见图26中浅灰色的月牙 形状)。这代表正常T1∩正常T0“Δ”网络。这个Δ网络中的蛋白质相 互作用/相关性可以被看作是代表对辅酶Q10处理的独特的正常细胞 反应。
最后,使用R程序比较独特的癌症T1网络(参见图26中深灰色 的月牙形状)和独特的正常T1网络(参见图26中浅灰色的月牙形状), 和生成响应于辅酶Q10的仅对癌症独特的而不存在于正常细胞中的 网络(参见图26)。蛋白质相互作用/相关性的这个集合代表癌细胞 内的独特途径,其在辅酶Q10处理时不存在于正常细胞中。蛋白质相 互作用/相关性的这个集合被称为“Δ-Δ网络”,因为它是由来自癌症细 胞的差异图谱和来自正常对照细胞的差异图谱的比较产生的差异图 谱。
将来自PERL和R程序的输出输入到Cytoscape(一种开源程序) 中以生成Δ-Δ网络的可视化表示。
使用本文所述的方法确定的Δ-Δ网络对于鉴别用于癌症治疗的靶 标是非常有用的。例如,根据图27中所示的Δ-Δ网络,蛋白A抑制 OCR3(氧化应激磷酸化的量度)和增强ECAR3(糖酵解的量度)。 由于这种相互作用是癌细胞中独特的(因为Δ-Δ网络已减去辅酶Q10 处理时通常存在于正常细胞中的任何相互作用),预计抑制蛋白A的 表达将减少基于糖酵解的能量代谢(这是癌症代谢途径的标志)和将 细胞朝基于氧化磷酸化的能量代谢(这是与正常细胞更紧密地相关的 表型)切换。因此,预期使用辅酶Q10和蛋白A抑制剂的联合治疗 对于治疗癌症是有效的,至少部分地通过将癌细胞的能量代谢谱切换 至类似于正常细胞的情况。
通过使用实质性的示例进一步说明了本发明的探询式生物学平 台技术的优点,其中来自因果关系网络的子网络与使用IPA的分子网 络相比较,IPA是利用神经网络来基于先前发表的文献确定到网络的 实验输出之间的分子联系的软件程序。使用探询式生物学平台(如图 29中所示)生成的包含PARK7的因果关系子网络被用作实质性的示 例。来自探询式生物学平台的PARK7网络的所有分子印记被整合到 IPA中以生成基于已知/现有文献证据的网络。然后对比探询生物学输 出与通过使用IPA生成的输出之间的网络输出。
观察到通过来自探询式生物学平台技术的输出鉴别的六个标志 物(如图29中所示),即在图27-29中的A、B、C、X、Y和Z,与 IPA生成网络内的TP53(图28)关联。在六个标志物中,文献中已 经报道A、B和C与癌症以及HSPA1A/HSPA1B相关。X、Y和Z被 确定为癌症状态的“枢纽”或关键驱动子,且因此被确定为新的癌症标 志物。此外,MIF1和KARS也被确定为癌症状态的“枢纽”或关键驱 动子,且因此被确定为新的癌症标志物。通过使用探询式生物学平台 识别的因子与在科学文献中公布的已知因子共有连接性的事实证实 了通过使用探询式生物学平台创建的网络的精确度。此外,通过使用 探询式生物学平台输出创建的PARK7子网络内的网络关联(如图29 所示)表明存在各因子的定向影响,这与IPA网络(如图28所示) 相反(其中分子实体之间的关联不提供相互作用节点之间的功能定向 性)。此外,来自探询式生物学平台的输出(如图29中的虚线所示) 展示了这些成分的关联,导致通过PARK7的潜在机制。蛋白C、蛋 白A和PARK7的其他节点被观察为癌症代谢的关键驱动子(图27)。
如本实施例所表明的,通过采用无偏的途径进行数据生成、集成 和逆向工程以建立计算模型,然后通过模拟和差异网络分析,探询式 生物学发现平台使得能够理解在癌症病理生理学中迄今未知的机制, 其与对疾病的病理生理的已确立的科学认识一致。
实施例3:采用平台技术建立糖尿病/肥胖症/心血管疾病的Δ-Δ 网络
在这个实施例中,使用在上面的发明详述中详细描述的平台技术 整合从定制的糖尿病/肥胖症/心血管疾病(CVD)模型获得的数据, 和鉴别驱动糖尿病/肥胖症/CVD的发病的新蛋白质/途径。从这一分析 所得的关系图谱已经提供了糖尿病/肥胖症/CVD的治疗靶标以及与糖 尿病/肥胖症/CVD相关的诊断/预后标志物。
使五个原代人类细胞系,即脂肪细胞、肌管、肝细胞、主动脉平 滑肌细胞(HASMC)和近端肾小管细胞(HK2)经历模拟这些疾病 相关的细胞在体内所经历的环境中的五种条件之一。具体而言,将五 个细胞系各自暴露于下列条件:高血糖条件、高血脂条件、高胰岛素 血症条件、低氧条件和乳酸暴露。高血糖条件是通过在含有22mM 的葡萄糖的培养基中培养细胞诱导的。高血脂条件是通过将细胞培养 在含有0.15mM的棕榈酸钠的培养基中诱导的。高胰岛素血条件是通 过将细胞培养在含有1000nM的胰岛素的培养基中诱导的。低氧状态 是通过将细胞置于模块化培养箱(MIC-101,Billups-Rothenberg Inc. Del Mar,CA)(其中充满含有5%的CO2、2%的O2和93%的氮的工 业气体混合物)中而诱导的。还用0或12.5mM的乳酸处理各个细胞 系。
此外,在两个不同的细胞对,HASMC(细胞系统1)和HK2细 胞(细胞系统2)或者肝细胞(细胞系统1)和脂肪细胞(细胞系统2) 之间进行交互实验,其中成对的细胞被共培养。此共培养方法被称为 细胞外分泌组(ECS)实验。第一细胞系统(例如,HASMC)首先 接种在侵袭实验型生长室的孔的插入体中。使用6孔板来实现更好的 统计分析。在用第一细胞系统接种插入体时,插入体被置于单独的6 孔板中。第二细胞系统(例如,HK2)接种于主盘上。包含所述第一 细胞系统的插入盘和包含所述第二细胞系统的主盘在37℃下孵育过 夜。各个细胞系统生长在特定的细胞特异性培养基中(其中可选地, 各细胞系统可以生长在适应于支持两种细胞类型的生长的培养基 中)。在第二天,通过培养基交换进行预定的处理。具体而言,包含 所述第一细胞系统的插入体被置于包含第二细胞系统的主盘中。然后 将盘孵育预定的时间段,例如,24小时或48小时。用相同的条件设 置重复的孔,并合并细胞以产生足够的材料用于2D分析。收获培养 基(1毫升等份)、来自插入体的细胞和来自主盘的孔的细胞作为单 独的样品。实验一式三份地进行以便提供更好的统计分析能力。
还通过“培养基交换”实验进行交互实验。具体而言,在扰动或条 件化后的24小时或48小时后,收集来自第一细胞系统HASMC的经 培养的培养基或“分泌组”,然后加入到第二细胞系统脂肪细胞中 24-48小时。然后收集来自第二细胞系统的最终经过培养的培养基或 “分泌组”。对所有最终分泌组进行蛋白质组学分析。
通过将细胞暴露于用辅酶Q10处理的“环境扰动”另外地“探询” 包含上述细胞的细胞模型,其中细胞暴露于上面所描述的各个条件。 具体而言,用0、50μM或100μM的辅酶Q10处理细胞。
在处理后不同的时间(包括处理后24小时和48小时)收集对于 各个细胞系、条件和辅酶Q10处理的细胞样品。对于特定细胞且在一 定的条件下,还收集和分析培养基样品。
使用上面的发明详述中所描述的技术对在各种条件下和具有各 “环境扰动”(即,辅酶Q10处理)的各细胞系收集的细胞和培养基样 品进行通过定量蛋白质组学的总细胞蛋白质表达变化的iProfiling分 析。
然后通过REFSTM系统处理在各个条件和具有每种扰动的上面列 出的各细胞系收集的蛋白质组学数据及在各个条件和具有各种扰动 的各细胞系收集的生物能量学谱数据。复合扰动网络从对于暴露于扰 动(辅酶Q10)的一个特定条件(例如,高血糖)的所有细胞系获得 的组合数据生成。复合未扰动网络从对于相同的一个特定的条件(例 如,高血糖)而没有扰动(没有辅酶Q10)的所有细胞系获得的组合 数据生成。类似地,复合扰动网络从对于暴露于扰动(辅酶Q10)的 第二对照条件(例如,正常血糖)的所有细胞系获得的组合数据生成。 复合未扰动网络从对于相同的第二对照条件(例如,正常血糖)而没 有扰动(没有辅酶Q10)的所有细胞系获得的组合数据生成。
如在上面的发明详述中所详细描述的,模拟上述的一致复合网络 中的各个节点(通过增加或减少10倍)以使用REFSTM生成模拟网络。
使用R编程语言通过定制的程序提取在模拟网络中连接父节点和 子节点的各个边界的曲线下面积和倍数变化,其中R编程语言是用于 统计计算和制图的开源软件环境。
从模拟复合网络生成Δ网络。为生成响应于辅酶Q10的糖尿病/ 肥胖症/心血管疾病状态对正常状态的差异网络(Δ-Δ网络),使用 PERL编程语言通过定制的程序如图30中所示地进行对比的步骤。
具体而言,如图30所示,处理T1指的是辅酶Q10处理且NG和 HG指的是正常和高血糖作为条件。来自NG∩HGΔ网络中的NG的 独特边界与HG∩HGT1Δ网络中HGT1的独特边界对比。NG和HGT1 的交集中的边界是恢复到T1的NG的HG边界。恢复到T1的NG的 HG边界被叠加到NG∩HGΔ网络上(图31中的较暗颜色的圆圈所 示)。
具体来说,使用定制的Perl程序对比正常血糖(NG)条件的模 拟复合图谱与高血糖(HG)条件的模拟复合图谱以产生正常血糖条 件的独特边界。使用定制的Perl程序对比没有辅酶Q10处理的高血 糖条件(HG)的模拟复合图谱与具有辅酶Q10处理的高血糖状态条件(HGT1)的模拟复合图谱以产生具有辅酶Q10处理的高血糖条件 (HGT1)的独特边界。使用Perl程序识别来自正常血糖条件(NG) 的独特边界与具有辅酶Q10处理的高血糖条件(HGT1)的独特边界 的交集的边界。这些边界代表通过辅酶Q10处理从高血糖状态恢复到正常血糖状态的因子/网络。经过辅酶Q10处理恢复到正常的高血糖 边界的Δ-Δ网络被叠加到正常血糖∩高血糖Δ网络。叠加的网络的样 品如图31中所示。图31是示例性的响应于辅酶Q10处理的糖尿病/ 肥胖症/心血管疾病状态与正常状态的差异网络(Δ-Δ网络)。在图 31中较深色的圆圈被确定为通过辅酶Q10处理从高血糖状态恢复到 正常血糖状态的边界。图31中的较浅色圆圈被确定为独特的正常血 糖边界。
将来自PERL和R程序的输出输入到Cytoscape(一种开源程序) 中以生成Δ-Δ网络的可视化表示。
与上述的用于高血糖对正常血糖状态的实验相似,使用Perl程序 对比没有辅酶Q10处理的高脂血症状态的模拟复合网络(如上所述来 自所有的糖尿病/肥胖症/心血管疾病相关细胞的组合数据)和具有辅 酶Q10处理的高脂血状态的模拟复合网络(如上所述来自所有的糖尿 病/肥胖症/心血管疾病相关细胞的组合数据)以产生具有辅酶Q10处 理的独特的高脂血状态的边界。使用Perl程序确定来自正常血脂状态 的独特边界和来自具有辅酶Q10处理的高血脂状态的独特边界的交 集的边界。这些边界代表通过辅酶Q10处理从高血脂状态恢复到正常 血脂状态的因子/网络。经过辅酶Q10处理恢复到正常的高血脂边界 的Δ-Δ网络被叠加到正常血脂∩高血脂Δ网络上。叠加的网络的样本 如图32所示。图32中较深色圆圈被确定为通过辅酶Q10处理从高血 脂状态恢复到正常血脂状态的边界。图32中的较浅色圆圈被确定为 独特的正常血脂边界。FASN被确定为调节辅酶Q10的将高血脂恢复 到正常血脂状态的效应的信号传导途径中的一个重要因子。
脂肪酸合酶-脂肪酸合成酶如FASN牵涉到人体代谢改变的几乎 所有方面,如肥胖症、胰岛素抵抗或血脂异常。FASN抑制剂已被提 议作为治疗肥胖症的首要分子,虽然其分子机制是未知的(Mobbs等 人2002)。浅蓝菌素和合成化合物C75-FASN抑制剂已被证明具有减 少食物摄入量的效果和实现体重减轻(Loftus等人,2000)。
如图32中所示的,FASN被本文所描述的平台技术确定为调节辅 酶Q10将糖尿病恢复到正常状态的效应的信号传导途径中的一个重 要因子的事实验证了该Δ-Δ网络的准确性。因此,在这个Δ-Δ网络中 鉴别的其他新的因子将是用于进一步研究的潜在的治疗因子或药物 靶标。
实施例4:采用平台技术建立药物诱导心脏毒性的模型
在这个实施例中,使用在上面的发明详述中所详细描述的平台技 术整合从定制的心脏毒性模型得到的数据并确定驱动发病机制/药物 毒性的新蛋白质/途径。从这样的分析所得的关系图谱提供了毒性生物 标志物。
健康心脏中,收缩功能取决于脂肪酸和碳水化合物氧化的平衡。 摄取、利用、细胞器生物合成和非脂肪组织(心脏和肝脏)中的分泌 的慢性失调被认为是线粒体损伤和功能障碍的核心和药物诱导的心 脏毒性中的关键角色。申请人在此描述了将蛋白质和脂质印记与专门 着眼于细胞生物能量学和线粒体膜功能的功能终点分析相结合的系 统途径。用一组药物处理补充有过度脂肪酸和高血糖的包含糖尿病和 正常心肌细胞的体外模型以创建毒性的印记和潜在机制。申请人证实 了药物在通过在各种水平上破坏能量代谢成分使线粒体失稳中的变 化的效应,包括:(i)控制线粒体能量代谢基因的表达的转录网络的 失调;(ii)诱导糖尿病心肌细胞中的GPAT1和taffazin,从而开始 磷脂的从头合成和在线粒体膜中改造;及(iii)糖尿病心肌细胞中脂 肪酸的命运改变,从而影响摄取、脂肪酸氧化和ATP合成。此外, 申请人将湿式实验室生物学的能力与基于人工智能的数据挖掘平台 相结合以生成基于贝叶斯模型的因果网络。导致正常细胞功能丧失的 蛋白质和脂肪的网络被用来分辨诱导药物毒性的机制与细胞保护机 制。这种新途径将作为强大的新工具来了解毒性的机制,同时允许开 发校正改变的表型的更安全的疗法。
人心肌细胞经受模拟疾病相关细胞在体内经历的糖尿病环境的 条件。具体而言,将细胞暴露于高血糖条件和高血脂条件。高血糖条 件是通过在含有22mM的葡萄糖的培养基中培养细胞诱导的。高血 脂条件是通过将细胞培养在含有1mM L-肉碱,0.7mM的油酸和0.7 mM的亚油酸的培养基中诱导的。
通过将细胞暴露于用已知导致心脏毒性的糖尿病药物(T)、救 援分子(R)或者糖尿病药物和救援分子两者(T+R)处理的“环境 扰动”,另外地“探询”含有上述细胞的细胞模型,其中该细胞暴露 于上面所描述的各种条件。具体而言,细胞用糖尿病的药物处理或用0、50μM或100μM的救援分子辅酶Q10处理;或用糖尿病药物和救 援分子辅酶Q10两者处理。
在治疗后的不同的时间(包括在处理6个小时后)收集来自具有 各种扰动处理的各个条件的细胞样品。对于某些条件,还收集和分析 培养基样品。
使用上面的发明详述中详细描述的技术,对于为各个条件和具有 各种“环境扰动”(即,糖尿病药物处理、辅酶Q10处理或两者)收集 的细胞和培养基样品进行通过定量蛋白质组学的总细胞蛋白质表达 变化的iProfiling分析。使用Biorad CFX-384扩增系统进行转录谱实 验。数据收集(Ct)后,使用如制造商的说明中列出的δCt方法测定 相对于对照的最终倍数变化。用质谱进行脂质组学实验。基本上按制 造商推荐的通过使用Seahorse分析仪测定功能分析,如耗氧率OCR。 通过由推靠Seahorse培养板墨形成的7微升室中的电极记录OCR。
如图35所示,对比了扰动和未扰动处理之间糖尿病心肌细胞(高 血糖和高血脂条件化的心肌细胞)中的人线粒体能量代谢基因的转录 网络和表达。具体而言,比较用糖尿病药物处理的糖尿病心肌(T) 与未经治疗的糖尿病心肌细胞样品(UT)之间人线粒体能量代谢基 因的转录网络和表达的数据。比较用糖尿病药物和救援分子辅酶Q10 两者处理的糖尿病心肌细胞(T+R)和未经处理的糖尿病心肌细胞样 品(UT)之间人线粒体能量代谢基因的转录网络和表达的数据。与 来自未处理的糖尿病心肌细胞的数据相比,当用糖尿病药物处理糖尿 病心肌细胞时,某些基因的表达和转录发生改变。证明救援分子辅酶 Q10逆转糖尿病药物的毒性作用并使基因表达和转录正常化。
如图36A所示,心肌细胞在正常血糖(NG)或高血糖(HG)条 件中培养,和用单独的糖尿病药物(T)或糖尿病药物和救援分子辅 酶Q10两者(T+R)进行处理。用蛋白质印迹测试各种条件和各个治 疗的GPAT1和TAZ的蛋白质表达水平。在高血糖条件化的和糖尿病 药物处理的心肌细胞中GPAT1和TAZ均上调。当用糖尿病药物和救 援分子辅酶Q10两者处理高血糖条件化的心肌细胞时,GPAT1和TAZ 的上调的蛋白质表达水平被正常化。
如图37A所示,对高血糖条件化的心肌细胞样品进行线粒体耗氧 率(%)实验。高血糖条件化的心肌细胞未进行处理(UT)、用已 知引起心脏毒性的糖尿病药物T1处理、用已知引起心脏毒性的糖尿 病药物T2处理、用糖尿病药物T1和救援分子辅酶Q10两者处理 (T1+R)或者用糖尿病药物T2和救援分子辅酶Q10两者处理 (T2+R)。与未处理的对照样品相比,当用糖尿病药物T1或T2处 理高血糖条件化的心肌细胞时,线粒体OCR下降。然而,当用糖尿病药物和救援分子辅酶Q10两者(T1+R或T2+R)处理高血糖条件 化的心肌细胞时,线粒体OCR正常化。
如图37B所示,对高血糖条件化的心肌细胞样品进行线粒体ATP 合成实验。高血糖条件化的心肌细胞未经处理(UT)、用糖尿病药 物处理(T)或用糖尿病药物和救援分子辅酶Q10两者(T+R)处理。 与未处理的对照样品相比,当用糖尿病药物(T)处理高血糖条件化 的心肌细胞时,线粒体ATP合成被抑制。
如图38所示,根据收集的蛋白质组学数据,通过药物处理下调 的蛋白质由术语GO注释。当用已知导致心脏毒性的糖尿病药物处理 高血糖条件化的心肌细胞时,参与线粒体能量代谢的蛋白质被下调。
然后由REFSTM系统处理为各种条件和具有各个扰动收集的蛋白 质组学、脂质组学、转录谱分析、功能分析和蛋白质印迹数据。从对 于暴露于各个扰动(例如,糖尿病药物、辅酶Q10或两者)的一种特 定条件(例如,高血糖或高血脂)获得的组合数据生成复合扰动网络。 从对于没有扰动(未处理的)的相同的一种特定条件(例如,高血糖 或高血脂)获得的组合数据生成复合未扰动网络。类似地,从对于暴 露于各个扰动(例如,糖尿病药物、辅酶Q10或两者)的第二对照条 件(例如,正常血糖)获得的组合数据生成复合扰动网络。从对于无 扰动(未处理)的相同的第二对照条件(例如,正常血糖)获得的组 合数据生成复合未扰动网络。
如在上面的发明详述中所详细描述的,模拟(通过增加或减少10 倍)上述一致复合网络中的各个节点以使用REFSTM生成模拟网络。
使用R编程语言通过定制的程序提取在模拟网络中连接父节点和 子节点的各个边界的曲线下面积和倍数变化,其中R编程语言是用于 统计计算和制图的开源软件环境。
从模拟的复合网络生成Δ网络。为生成响应于糖尿病药物的药物 诱导毒性条件与正常条件的差异网络(Δ网络),使用PERL编程语 言通过定制的程序如图39中所说明的进行比较步骤。
具体而言,如图39中所示,UT是指在高血糖条件下未处理的对 照心肌细胞的蛋白质表达网络。处理T是指在高血糖条件下糖尿病药 物处理的心肌细胞的蛋白质表达网络。来自UT∩TΔ网络中T的独特 边界如图40所示。
具体来说,使用定制的Perl程序对比高血糖条件下未处理的心肌 细胞的模拟复合图谱与高血糖条件下经糖尿病药物处理的心肌细胞 的模拟复合图谱以生成高血糖条件下糖尿病药物处理的心肌细胞的 独特边界。将来自PERL和R程序的输出输入到Cytoscape(一种开 源程序)中以生成Δ网络的可视化表示。如图40中所示,该网络代 表高血糖条件下心肌细胞/心脏毒性模型中糖尿病药物相对于未处理 所驱动的Δ网络。
从图40所示的药物诱导毒性条件对正常条件的差异网络中,鉴 别了驱动药物诱导心脏毒性的病理生理的蛋白质,如GRP78、GRP75、 TIMP1、PTX3、HSP76、PDIA4、PDIA1、CA2D1。这些蛋白质可以 充当用于鉴别其他心脏毒性诱导药物的生物标志物。这些蛋白质也可 以用作用于鉴别可以减轻心脏毒性的试剂的生物标志物。
在本实施例中所描述的实验表明,在暴露于药物处理的糖尿病心 肌细胞中扰动的膜生物学和改变的游离脂肪酸的命运代表药物诱导 毒性的中心部分。数据集成和网络生物学使人们更好地了解心脏毒性 和鉴别预测心脏毒性的新的生物标志物。
实施例5:采用平台技术实现多蛋白质组学模型以阐明酶活性
一般,上述实施例-4中描述的平台技术可以适应于实施用于鉴别 生物系统或疾病过程的调节子的进一步方法。该方法利用了使用与生 物系统相关的细胞的生物系统的模型以代表生物系统的特征性方面。 模型用于获得至少三个水平的数据,即(i)代表与生物系统相关的细 胞中的总体酶学活性的第一数据集,(ii)代表总体酶学活性对与生物 系统相关的细胞中的酶代谢产物或底物的效应的第二数据集,和(iii) 代表与生物系统相关的细胞中的总体蛋白质组学改变的第三数据集。 该数据用于生成总体酶学活性、总体酶学活性的效应和总体蛋白质组 学改变之中的一致因果关系网络。一致因果关系网络是仅基于使用编 程的计算装置的第一、第二和第三数据集(即,不基于任何其它已知 的生物学关系)。一致因果关系网络然后用于鉴别生物系统独特的因 果关系,其中与独特的因果关系相关的至少一种基因或蛋白质确定为 生物系统或疾病过程的调节子。
在该实施例中,平台技术适应于实施用于测量酶活性和该活性对 蛋白质组的直接效应的多蛋白质组学技术,从而提供可以用于在细胞 蛋白质组总体改变的情况中理解酶与其代谢产物/底物之间的因果关 系的系统。这种技术可以提供有价值的理解,因为如本实施例中证明 的,酶活性可以与酶表达正交(例如,下调的活性和上调的表达)。 由这种分析得到的关系图谱可以提供疾病治疗靶标以及与疾病相关 的诊断/预后标志物。这类靶标和标志物可以提供治疗组合物和方法。 用于建立模型、获得数据集、生成一致因果关系网络和鉴别生物系统 独特的因果关系的技术在以上发明概述、发明详述和实施例中讨论。用于建立模型和获得代表总体酶学活性和总体酶学活性对酶代谢产 物或底物的效应的数据集的进一步技术在以下提供。
图41A显示用于鉴别生物系统或疾病过程的调节子的方法,其采 用了用于阐明酶(例如,激酶)活性的多蛋白质组技术。首先,模型 按照平台技术建立,其中细胞系经历模拟疾病的条件并通过暴露于环 境扰动(例如,在以下提供的肝细胞癌的特定实施例中暴露于索拉非 尼)进行探询。提供对照用于对比。其次,酶活性及其下游效应在总 体蛋白质组学改变的情况中通过分析(i)总体酶学活性,(ii)酶学活性 对蛋白质组(例如,酶活性的代谢产物/底物)的特定效应和(iii)对 细胞蛋白质组的总体效应来追踪。第三,数据集按照平台技术进行分 析以鉴别目标调节子。例如,癌症模型可以通过已知的抗癌症药物激 酶抑制剂探询;系统的这种扰动对总体激酶活性的效应可以与对磷酸 化蛋白质组和全蛋白质组的最终效应一起进行分析;且数据集可以通 过基于AI的REFSTM系统进行分析。
在该实施例中,选择肝细胞癌(HCC)以提供平台技术的说明性实 施方式。HCC是全世界的癌症相关死亡的主要原因,列为肺癌和胃癌 之后的第三大致死性癌症。多样的病因、高发病率/致死率、缺乏用于 早期诊断的诊断标志物及HCC的高度可变的临床过程阻碍诊断和治 疗的进展。在多年研究HCC后,对HCC中运行的分子机制的理解仍 然是不完全的。基因组、转录组和对比蛋白质组谱产生了对于HCC 研究的一些重要的见解。但是,许多研究集中于与HCC相关的细胞 改变的单一方面,从而妨碍了对生物系统的真正复杂性和动态方面的 完全理解。
这一说明性实施例结合了(i)细胞生物学、(ii)集成的蛋白质组学 平台和生成因果蛋白质网络的信息学平台的能力以描绘翻译后修饰 (例如磷酸化)和参与这种机制的酶(例如,激酶)在HCC的病理 生理学中的作用。特别地,这种途径采用ATP结合结构域富集探针 和HCC细胞模型中总蛋白质的磷酸化蛋白质组图谱而结合基于活性 的蛋白质组学。
多重激酶抑制剂索拉非尼(用于晚期HCC患者的一线化疗剂) 用于探测总体激酶活性和与这种治疗相关的蛋白质磷酸化改变的作 用。HepG2(ATCC登录号HB-8065)细胞系选择以形成HCC细胞模型 和THLE2(ATCC登录号CRL-10149)细胞系选择以形成正常肝细胞模 型。
图41B显示用于总体酶(例如,激酶)富集谱分析的方法。首先, 制备包括所靶向的酶(例如,激酶)的细胞裂解产物。第二步是探针 结合(例如,激酶情况中的ATP探针)。然后酶被消化且捕获探针 结合的片段。这些片段可以进行分析(例如,通过LC-MS/MS)且因 此相应的蛋白质被鉴别(例如,通过LC-MS/MS数据的数据库检索)。
THERMO激酶富集试剂盒和探针(可从THERMO和Biotechnology www.thermoscientific.com/pierce获得的说明书)用于总体酶活性分析。 简而言之,这些试剂盒和类似的试剂盒使得能够选择性标记和富集 ATP酶(包括激酶)、伴侣蛋白和代谢酶。ATP和ADP探针一般是 核苷酸衍生物,其共价修饰在核苷酸结合位点中具有保守的赖氨酸残 基的酶活性位点。例如,脱硫生物素-ATP和-ADP的结构由通过不稳 定的酰基-磷酸酯键连接于核苷酸的修饰生物素组成。取决于酶活性 位点内赖氨酸的位置,脱硫生物素-ATP或-ADP可以优选用于标记特定的ATP酶。
脱硫生物素-ATP和-ADP都可以选择性地对样品中的靶酶类别进 行富集、鉴别和分型或评估酶抑制剂的特异性和亲和力。许多ATP 酶和其它核苷酸结合蛋白质结合核苷酸或抑制剂,甚至在它们被酶促 失活时;这些试剂结合复杂样品中的无活性或活性酶两者。样品与竞 争活性位点探针的小分子抑制剂预孵育可以用于测定抑制剂结合亲 和力和靶标特异性。
活性位点标记的评估可以通过蛋白质印迹或质谱(MS)完成。对于 蛋白质印迹工作流程,脱硫生物素标记的蛋白质富集用于SDS-PAGE 分析和利用特定抗体的后续检测。对于MS工作流程,脱硫生物素标 记的蛋白质被还原、烷基化和酶促消化成为肽。仅脱硫生物素标记的 活性位点肽被富集用于通过LC-MS/MS的分析。两种工作流程都可以 用于测定抑制剂靶标结合,但仅MS工作流程可以鉴别总体抑制剂靶 标和脱靶。
THERMOTiO2磷肽富集和清洁试剂盒 (可从THERMO和Biotechnology www.thermoscientific.com/pierce获得的说明书)用于磷酸化蛋白质组 分析。简而言之,这些试剂盒和类似的试剂盒可以使得能够有效地从 复杂的和分级的蛋白质消化物分离磷酸化的肽用于通过质谱(MS)进 行分析。与优化的缓冲液组合的球形多孔二氧化钛以最低非特异性结 合提供增强的磷肽富集和鉴别。离心柱形式是快速的和方便使用的且 可以从300-1000μg的消化蛋白质样品富集最多100μg的磷肽。试剂 盒的优化方案、缓冲液成分和石墨离心柱获得高产率的清洁磷肽样品 准备用于MS分析。
磷酸化是对于生物功能(如细胞信号传导、生长、分化和分裂及 程序化细胞死亡)关键的蛋白质修饰。但是,磷肽具有高亲水性且丰 度较低,从而导致不良的色谱、离子化和片段化。磷肽富集因此对于 成功的MS分析是关键的。磷肽富集和清洁试剂盒可以与裂解、还原、 烷基化、消化和石墨离心柱相容以提供用于磷肽富集和鉴别的完整工 作流程。
对比的蛋白质学、磷酸化蛋白质组和酶活性数据集成到基于AI 的REFSTM信息学平台中。然后生成特别地从功能性观点(即激酶/酶 活性和激酶可以磷酸化的潜在靶标)的蛋白质相互作用的因果网络。 另外,使用细胞功能读数,确定调节靶标的磷酸化和机械地驱动病理 生理学细胞行为的酶/激酶。本文中概述的说明性实施方式有利于对细 胞反应、对化学灵敏性机制的认识和HCC临床控制的潜在靶标/生物 标志物的总体表征。
材料和方法
细胞按照以下方案培养。第1天:HepG2/Hep3B–在T-75培养 瓶中接种3.2x106个细胞;在T-175培养瓶中接种7.4x106个细胞;或 在T-225培养瓶中接种9.5x106个细胞。THLE-2–在T-75培养瓶中接 种1.3x106个细胞。第2天:16-24小时后,50-70%汇合时,添加处理。对照:终浓度0.01%的DMSO。EGF:10mM乙酸中500ng/mL。索 拉非尼:DMSO中0.1%体积的1μM。第3天:处理后24小时,通 过胰蛋白酶消化收获细胞。在冷冻前用PBS洗涤细胞团2次。
总体酶活性分析按照以下方案进行。
细胞裂解:
新制备的裂解缓冲液-5 M尿素,50mM Tris-HCL pH 8.4,0.1% SDS,1%蛋白酶抑制剂混合物,1%磷酸酶抑制剂混合物
1)通过以2000g离心5分钟在1.5-2mL Eppendorf微管中沉淀细 胞并除去上清液。
2)通过在PBS中重悬细胞团洗涤细胞。重复洗涤一次。
3)添加适宜量的裂解缓冲液到各样品中并涡旋。
4)在冰上孵育10分钟,伴有定期混合。
5)超声处理各样品直到裂解完成。
6)以最高速度离心15分钟。
7)转移溶解产物(上清液)到新管中。
裂解缓冲液-交换:
使用Pierce’s预制反应缓冲液。
反应缓冲液–20mM HEPES pH 7.4,150mM NaCl,0.1% TritonX-100
1)拧开Zeba离心脱盐柱的底封并松开盖子。
2)置于15mL锥形管中。
3)室温下以1000g离心柱2分钟以除去储存溶液。
4)添加3mL反应缓冲液到柱中。以1000g离心2分钟以除去缓 冲液。再重复2次,弃去缓冲液。
a.如果在最后洗涤时存在过量缓冲液,另外1000g离心2-3 分钟。
5)转移柱到新锥形管。
6)缓冲施加整个裂解产物到树脂床的中心。
7)以1000g离心2分钟以收集样品。弃去柱。
8)添加1:100蛋白酶/磷酸酶抑制剂混合物到样品并置于冰上。
a.样品可以在-80℃冰箱中冷冻。
终止点
用探针的样品标记:
使用来自Pierce的预制1 M MgCl2。
制备新鲜的1 M MnCl2。
1)使用Bradford分析测定蛋白质浓度。
2)用水稀释裂解产物至2mg/mL(2μg/μL),如果可能。
3)转移2mg到新的微离心管。
4)添加20μL的1 M MgCl2到各样品,混合,在室温下孵育1min。
注:终浓度是0.02 M MgCl2
5)添加10μL的1 M MgCl2到各样品,混合,在室温下孵育1min。
注:终浓度是10mM MgCl2
6)用干燥剂平衡ATP/ADP试剂到室温。储存残留物在-80℃下。
7)对于20μM反应-添加10μL的超纯水到试剂中以制备1mM 原液。
8)添加20μL的ATP/ADP原液到各样品并在室温下孵育1小时。
标记的蛋白质的还原和烷基化:
制备新鲜的10 M尿素/50mM Tris-HCl pH 8.4。
1)添加1mL的10 M尿素/50mM Tris-HCl到各反应中。
2)添加100μL的200mM TCEP到各样品中。在55℃下孵育1 hr。
3)添加100μL的375mM碘乙酰胺到各样品中。在室温下黑暗 中孵育30分钟。
缓冲液交换:
制备新鲜的消化缓冲液–2 M尿素,200mM Tris-HCL pH 8.4。
1)拧开Zeba离心脱盐柱的底封并松开盖子。
2)置于15mL锥形管中。
3)在室温下以1000g离心柱2分钟以除去储存溶液。
4)添加3mL的消化缓冲液到柱中。以1000g离心2分钟以除去 缓冲液。再重复2次,弃去缓冲液。
a.如果在最后洗涤时存在过量的缓冲液,以1000g再离心2-3 分钟。
5)转移柱到新的锥形管中。
6)缓慢施加整个样品到树脂床的中心。
7)以1000g离心2分钟以收集样品。弃去柱。
标记的蛋白质的消化:
1)以1:50的比率(胰蛋白酶:蛋白质)添加胰蛋白酶。
2)在37℃下伴随振摇孵育过夜。
标记的肽的捕获和洗脱:
制备新鲜的洗脱缓冲液(50%CAN;0.1%甲酸)。
1)添加50μL的浆料到各消化的样品中。在室温下稳定搅拌情况 下孵育1.5小时。
2)将样品转移到Pierce离心柱。以1000g离心1分钟。收集穿 流液并保存。
3)每次洗涤以1000g离心1分钟。
a.用500μL的4 M尿素/50mM Tris-HCl pH 8.4洗涤树脂3次。
b.用500μL的PBS洗涤树脂4次。
c.用500μL的水洗涤树脂4次。
4)用75μL的洗脱缓冲液洗脱肽并孵育3分钟。再重复2次,合 并洗脱液级分。
5)在真空浓缩器中冻干样品。
无标记的1-D分离用于LCMSMS分析
1)一旦样品通过冻干干燥,重悬各样品在25μL的0.1%甲酸中。
2)转移10μL到小瓶中用于LCMSMS。
iTRAQ标记
1)剩余的15μL样品完全干燥。
2)重悬样品在30μL的200mM TEAB中。
3)15μL的样品用30μL的iTRAQ试剂标记并在室温下孵育2小 时。
a.每样品6μL汇合用于QCP。
4)标记后,添加8μL的5%羟胺用于在4℃下淬灭15分钟。
5)所有MP汇合在一起,干燥,脱盐并重悬在20μL的0.1%甲 酸中。
Eksigent/LTQ Orbitrap仪存在问题,因此MP干燥并重悬在18μL 的20mM甲酸铵中。
每样品的残留物:
-在-80℃下200mM TEAB中的9μL洗脱液
-仪器上20mM甲酸铵中的MP
磷蛋白分析按照以下方案进行。
样品制备方案:
1.细胞裂解
a.裂解缓冲液–5 M尿素,50mM Tris-HCL,0.1%SDS,1%蛋 白酶抑制剂混合物,1%磷酸酶抑制剂混合物。
b.重悬细胞团在适宜量的裂解缓冲液中。
c.涡旋并在冰上孵育10分钟。重复。
d.超声处理并在冰上孵育10分钟。
e.以最高速度离心15分钟。
f.如果溶解产物仍是粘性/粘稠的,则再超声处理。
g.转移溶解产物到新管中。
2.进行Bradford分析以测定蛋白质浓度。
3.转移700μg的蛋白质(对于THLE-2为400μg)到具有45μL 的200mM TEAB的新微管中。
4.55℃下以5μL TCEP:100μL体积用200mM TCEP还原1小 时。
5.室温下以5μL碘:100μL体积用375mM碘乙酰胺在黑暗中烷 基化30分钟。
6.在-20℃下以7X体积丙酮沉淀。
7.以50μg/μL将蛋白质重悬在200mM TEAB中。37℃下用胰 蛋白酶以1:40(胰蛋白酶:蛋白质)消化过夜。
在柱制备过程中,重悬肽样品在150μL的缓冲液B中。
柱制备:
1.将离心柱连接器置于收集管中并将TiO2旋转尖头插入连接器 中。
2.添加20μL的缓冲液A。以3000g离心2分钟。弃去FT。
3.添加20μL的缓冲液B。以3000g离心2分钟。弃去FT。
磷肽结合:
1.转移旋转尖头到清洁微管。
2.施加悬浮的样品到旋转尖头。以1000g离心10分钟。
3.重施加样品到旋转尖头并以1000g离心10分钟。保存FT。
4.转移旋转尖头到新的微管。
5.通过添加20μL的缓冲液B洗涤柱。以3000g离心2分钟。
6.通过添加20μL的缓冲液A洗涤柱。以3000g离心2分钟。 再重复一次。
洗脱:
1.将旋转尖头置于新的收集管中。添加50μL的洗脱缓冲液1。 以1000g离心5分钟。
2.使用相同的收集管,添加50μL的洗脱缓冲液2到旋转尖头。 以1000g离心5分钟。
3.通过添加100μL的2.5%甲酸酸化洗脱级分。
磷肽的石墨清洁
**用甲酸取代TFA,因为这是LC/MS/MS分析之前的最终清洁。
柱准备:
1.从石墨离心柱除去顶盖和底盖。将柱置于1.5mL微管中。以 2000g离心1分钟以除去储存缓冲液。
2.添加100μL的1 M NH4OH。以2000g离心1分钟。弃去FT。 再重复一次。
3.通过添加100μL的丙酮活化石墨。以2000g离心1分钟。弃 去FT。
4.添加100μL的1%甲酸。以2000g离心1分钟。弃去FT。再 重复一次。
样品结合和洗脱:
洗脱=0.1%FA+50%CAN
1.将柱置于新的收集管中。将样品施加于树脂床的顶部。允许在 周期性涡旋混合的情况下结合10分钟。
2.以1000g离心3分钟。弃去FT。
3.将柱置于新的收集管中。通过添加200μL的1%FA洗涤柱。 以2000g离心1分钟。弃去FT。再重复一次。
4.将柱置于新的收集管中。添加100μL的1%FA/50%CAN以 洗脱样品。以2000g离心1分钟。再重复3次以达到总洗脱400μL。
5.在真空蒸发器(SpeedVac)中干燥样品。
HepG2和Hep3B:
·用700μg的蛋白质开始
·在TiO2富集和石墨清洁后,磷肽在400μL的0.1%甲酸 /50%ACN中洗脱。
·从洗脱液获取(400/700)*400μL等份的比率并完全干 燥。其重悬在20μL的200mM TEAB中用于iTRAQ标记。
·在标记后,样品脱盐、干燥和重悬在20μL的0.1%甲酸中。
·剩余的等份试样完全干燥并重悬在20μL的0.1%甲酸中。
·10μL转移到小瓶中用于无标记LCMSMS分析。
THLE-2:
·仅收获400μg的蛋白质。
·所有蛋白质用TiO2柱富集并用石墨柱清洁。
·洗脱液干燥,重悬在20μL的200mM TEAB中用于 iTRAQ标记。
·在标记后,样品脱盐、干燥和重悬在20μL的0.1%甲酸中。
样品残留物:
iTRAQ样品–仪器上20mM甲酸铵中
无标记HepG2/Hep3B–-80℃下0.1%甲酸中10μL;仪器上0.1% 甲酸中10μL
结果
图42显示用索拉非尼处理的HepG2中ENO1活性而非蛋白质表 达的显著降低。图43显示用索拉非尼处理的HepG2中PGK1活性而 非蛋白质表达的显著降低。图44显示用索拉非尼处理的HepG2中 LDHA活性的显著降低。在各种情况中,ENO1表达以相对于QC样 品的单位计量且ENO1活性改变以相对于对照的未处理样品的单位计 量。
图42-44中的数据表明,对于HCC疾病模型中的ENO1、LDHA 和PGK1,细胞用索拉非尼处理导致蛋白质表达的上调和蛋白质的酶 活性的伴随下调。因此,磷酸化蛋白质组提供另外的信息层次,其可 用于阐明细胞外信号(例如,药物分子)对激酶活性的效应与总细胞蛋白质之间的复杂关系,从而有助于疾病治疗靶标以及与疾病相关的 诊断/预后标志物的鉴别。
图45显示可以通过使用基于AI的REFSTM系统分析所得数据集 产生的因果性分子相互作用网络(参见左图)。该网络可用于例如鉴 别在正常和癌细胞中差异地调节的目的网络(分别参见中图和右图)。 这类信息可以用于提供HCC治疗靶标以及与HCC相关的诊断/预后 标志物。
图46-51显示致癌系统的二维化学探询和印记的多组学探询可以 如何揭示参与癌症的病理生理学的新型信号传导途径,从而鉴别治疗 靶标、相关标志物和/或治疗剂。特别地,图46-51显示图41中所示 的且按照本文描述的各种方法的一般方法的实施。如图41中显示的, 该途径通过“二维化学探询”推动,其中体外癌症和对照模型通过第 一维的激酶抑制剂(索拉非尼)探询。激酶活性的整体改变通过采用 基于活性的激酶富集探针的第二维的化学探询捕获。激酶通过LC-MS 鉴别。另外,磷酸化蛋白质组响应于激酶抑制剂的暴露的改变使用磷 蛋白富集方法捕获,接着进行用于蛋白质鉴别的LC-MS。最后,获得 总蛋白质表达的定量改变。所得的多组学数据使用基于AI的信息学 整合,从而导致生成代表驱动蛋白质磷酸化的差异激酶活性的数据驱 动的因果网络,其在癌症模型中是起作用的但在“正常”模型中则否。 这些补充分析的整合显示于图46和47的推导途径中。该技术导致与癌症的病理生理学机制相关的新激酶和关系的发现(例如,图48-50)。
图46显示采用贝叶斯网络推理算法的多组学数据的整合可以如 何导致对肝细胞癌中信号传导途径的更好理解。黄色方块代表转录后 修饰(磷酸化)数据,蓝色三角形代表基于活性的(激酶)数据,和 绿色圆形代表蛋白质组学数据。图47显示肝细胞癌信号传导途径中 的自动调节和逆反馈调节可以如何通过平台推导。方块代表PMT(磷 酸化)数据(灰色/黑色=激酶,黄色/浅色–无激酶活性),方块代 表基于活性的(激酶)+蛋白质组学数据(灰色/黑色=激酶,黄色/ 浅色–无激酶活性)。这些分析使用如上所述和图41中概述的三层 多蛋白质组学方法进行。这些分析的结果显示于图48-51中并在以下 更详细地讨论。
图48-50显示通过平台推导的信号传导途径中因果相关性的实 例。激酶名称在代表性的方块和圆形上表示,因果相关性通过连接体 表示。图48鉴定CLTCL1、MAPK1、NME1、HIST1H2BA、RPS5、 TMED4和MAP4激酶同工型并显示其间推导的关系。图49鉴定 HNRPDL、HNRNPK、RAB7A、RPL28、HSPA9、MAP2K2、RPS6、 FBL、TCOF1、PGK1、SLTM、TUBB、PGK2、CDK1、MARCKS、 HDLBP和GSK3B激酶同工型并显示其间推导的关系。图50鉴定 RPS5、TNRCBA、CLTCL1、NME1、MAPK1、RPL17、CAMK2A、 NME2、UBE21、CLTCL1、HMGB2和NME2激酶同工型并显示其间 推导的关系。这些激酶同工型呈现潜在的治疗靶标、标志物和治疗方 法。
图51显示由平台导出的因果相关性。特别地,图51鉴定EIF4G1、 MAPK1和TOP2A激酶同工型并显示其间推导的关系。这一关系提供 模型和方法的验证,因为它与EIF、MAPK和TOP激酶之间公布的关 系一致。
总之,酶(例如,激酶)活性的基于多组学的分析代表用于确定 随细胞行为变化的代谢物和底物之间的下游因果关系的有用方法。同 样地,响应于治疗性处理的总体酶活性变化的基于活性的蛋白质组监 测与仅监测蛋白质(例如,酶)的总体细胞表达相比可以提供对细胞 信号传导动力学的关键认识。此外,已证明平台可以稳定地推导信号 传导途径和致癌环境相对正常环境的逆反馈调节,且因此鉴定致癌信 号传导途径中的新型因果相关性。因此,该技术提供新激酶的鉴定和 破译激酶抑制剂作用机制。
实施例6:血管生成的体外模型和CoQ10的调节
引言:大于2-5mm的肿瘤尺寸的进展需要诱导血管生成以向肿 瘤供应氧和营养物。血管生成由于内皮有丝分裂因子响应于缺氧或遗 传突变的肿瘤内细胞释放而发生,且在临床发展中当前存在众多的内 源蛋白质作为治疗性抗血管生成靶标,例如VEGF和PlGF。此处, 我们已经在体外研究了辅酶Q10(CoQ10),其当前处于癌症进展的人 体研究中。
方法:调节血管生成表型的人脐静脉内皮细胞(HUVEC)命运决定 在100或1500μMCoQ10或赋形剂的存在下检验并与未处理的对照 细胞比较。在内针对细胞凋亡、增殖、迁移和3-D管形 成进行了内皮细胞命运分析。
结果:膜联蛋白V/碘丙锭阳性细胞的形态学和流式细胞分析揭示 了与赋形剂或对照细胞相比1500μM CoQ10存在下HUVEC细胞凋亡 的增加。伴随由于CoQ10导致的细胞死亡增加,HUVEC细胞计数在 1500μM CoQ10存在下显著降低。为评估CoQ10对内皮迁移的潜在效应,HUVEC迁移在内皮划痕分析中细胞清除后5小时检验。CoQ10 和赋形剂在100和1500μM浓度下显著影响HUVEC迁移,表明赋形 剂和CoQ10两者的抗迁移活性。为了确定CoQ10抗肿瘤活性是否是 由于对内皮出芽血管生成的影响,我们在3-D培养物中随时间检验了管形成。赋形剂添加到凝胶和覆盖介质中与对照相比损 害管形成。而且,添加1500μM CoQ10与赋形剂和对照未处理细胞 相比进一步损害HUVEC管形成。这些效应早在接种后24小时和在 培养中最长96小时注意到。总体来看,这些研究证明CoQ10效应很 可能(至少部分地)由于抑制对于新血管形成的局部血液供应的肿瘤 募集。
CoQ10对内皮形态的效应:人脐静脉内皮细胞(HUVEC细胞) 用一定浓度范围的CoQ10处理24小时。药物应用于紧密类似于“正 常”细胞的汇合细胞和同样应用于更密切地代表增殖细胞的血管生成 表型的亚汇合细胞。在汇合的培养物中,添加提高浓度的CoQ10导 致EC的更紧密关联、延长和排列。5000μM导致圆形细胞的轻微增 加(图52A)。亚汇合的内皮细胞对CoQ10的反应与汇合细胞反应 相异(图52B)。内皮在1000μM CoQ10及以上可见为不健康的。增 加的细胞死亡对于提高浓度的CoQ10可见。
CoQ10对于内皮细胞存活具有相异的效应:HUVEC细胞的汇合 和亚汇合培养物用100或1500μM CoQ10处理24小时并对碘丙锭阳 性凋亡细胞进行分析。结果分别显示于图53A和53B中。CoQ10对 于汇合时处理的EC是保护性的,而亚汇合细胞对于CoQ10是敏感的并在1500μM CoQ10下显示提高的细胞凋亡。显示随提高浓度的 CoQ10增加的细胞凋亡水平的亚汇合对照EC(左)、100μM CoQ10 (中)和1500μM(右)的代表性图谱显示于图53C中。
CoQ10降低内皮细胞数和增殖:HUVEC细胞的亚汇合培养物用 100或1500μM CoQ10处理72小时并使用碘丙锭掺入分析(检测 G2/M相DNA)对细胞数(图54A)和增殖(图54B)进行分析。高 浓度的CoQ10导致细胞数的显著降低并对EC增殖具有剂量依赖性的 效应。针对细胞周期的G2/M期的细胞分选的细胞增殖的代表性图谱 显示随提高浓度的CoQ10降低的细胞增殖[图54C,对照EC(左), 100μM CoQ10(中)和1500μM CoQ10(右)]。
CoQ10降低内皮细胞迁移:HUVEC细胞生长到汇合以使用“划 痕”分析测试迁移。100或1500μM CoQ10在刻划时应用并在48小 时内监测清除区域的闭合。100μM CoQ10与对照相比延迟内皮闭合。 0、12、24和36小时时的代表性图像提供于图55中。添加1500μMCoQ10阻止闭合,甚至直到48小时(数据未显示)。
CoQ10影响内皮管形成:在3-D基质胶中生长的内皮细胞随时间 形成管。观察到100μM和1500μM CoQ10对管形成的差异效应。受 损的细胞-细胞关联和早期管结构的破坏在1500μM CoQ10下是显著 的。有趣的是,管形成在1500μM CoQ10存在下不开始,但导致管生长和形成的过程48小时受到影响。显示于图56中的图像在72小 时时获得。
结果和结论:
我们研究了CoQ10的潜在血管生成调节效应。CoQ10是当前在 人实体肿瘤研究中进行研究的调节细胞能量代谢的抗癌剂。
低剂量的CoQ10对于汇合的内皮细胞是保护性的,而添加CoQ10 到亚汇合细胞中导致增加的细胞凋亡、降低的细胞数且是内皮增殖的 强效抑制剂。我们证明了对于汇合和亚汇合细胞的相异效应,其保护 “正常”脉管系统。
对于内皮在2-D划痕分析中迁移的能力的功能性评估揭示了内皮 迁移的强力抑制。延时摄影揭示在2天的培养/处理期间未能闭合清除 区域的动态内皮“前缘”。
3-D基质胶中内皮细胞的悬浮导致随时间的管形成。使用重现在 肿瘤血管生成中发挥作用的许多因素的这一良好描述的分析,我们检 验CoQ10对内皮管形成的效应。添加100μM CoQ10具有适度的管形 成效应,但添加1500μM CoQ10导致内皮管形成的急剧破坏。
总之,这些结果表明CoQ10对内皮出芽、迁移和增殖的影响并选 择性地诱导血管生成内皮细胞中的细胞死亡。
实施例7:辅酶Q10差异地调节汇合和亚汇合HUVEC细胞的功能性 反应
既然已经证明了CoQ10对汇合和亚汇合条件下生长的HUVEC细 胞中细胞增殖和迁移的差异影响,研究CoQ10对HUVEC细胞的生物 化学途径的影响。
评估了CoQ10存在或不存在的情况下HUVEC细胞对常氧和缺氧 的反应。具体地,HUVEC细胞如本文所描述的在常氧或缺氧条件下 在亚汇合和汇合培养物中生长。细胞也暴露于0、100或1500μM CoQ10。一氧化氮(NO)和反应性氧物质(ROS)水平使用本文中提供的方法测定。如图57中所示,HUVEC细胞显示出差异的一氧化氮(NO) 和反应性氧物质(ROS)响应于CoQ10和缺氧的剂量依赖性产生。
HUVEC细胞的生物能量学在各种浓度的CoQ10存在下评估。具 体地,HUVEC细胞在CoQ10不存在或存在(10、100、1500μM)下在 亚汇合和汇合条件中生长。耗氧率(OCR)(总耗氧率和线粒体耗氧率)、 ATP产生和细胞外酸化率(ECAR)使用Seahorse分析评估。在亚汇合培养物中生长的HUVEC细胞与汇合培养物相比限制线粒体氧消耗, 如图58A-D中所示((A)总OCR;(B)线粒体OCR;(C)ATP;(D) ECAR)。CoQ10添加到亚汇合培养物中将线粒体OCR恢复到汇合 水平OCR(图58B)。
实施例8:功能性蛋白质组学和脂质组学应用于阐明CoQ10的抗血 管生成机制
血管生成是提供肿瘤细胞生长所需的氧和营养物的关键的肿瘤 进展赋能特征。我们研究了CoQ10(当前在癌进展的人体研究中进行 研究的抗肿瘤药物)的抗血管生成性能。CoQ10影响“划痕”分析中 的内皮迁移和3-D管形成分析中的管形成。CoQ10的添 加也影响内皮增殖,如通过G2/M期细胞和增殖细胞核抗原(pCNA) 蛋白检测的。CoQ10诱导胱天蛋白酶3的激活并增加血管生成/增殖 内皮细胞的细胞凋亡,而非增殖的汇合内皮细胞培养物的细胞死亡与 对照相比下降。
为了确定血管生成性增殖内皮细胞和非增殖内皮细胞的细胞内 蛋白质组学特征,我们使用了蛋白质组学、脂质组学和功能性蛋白质 组学途径。分别在LTQ-OrbiTrap-Velos和Vantage-QqQ上进行蛋白 质组学和鸟枪脂质组学分析。功能性蛋白质组学途径与对比蛋白质组 学结合采用基于活性的探针。激酶和其它ATP酶特别地用与处于原 始构象的酶的活性位点相互作用的ATP-结合结构域富集探针标记。 富集通过抗生蛋白链菌素树脂的免疫沉淀进行。
使用集成的脂质组学和蛋白质组学平台及生成因果脂质/蛋白质/ 功能蛋白质组学网络的基于AI的贝叶斯信息学平台,鉴别了调节血 管生成的新的蛋白质、脂质和酶。CoQ10处理的细胞及正常和血管生 成细胞的比较用于探测总体激酶活性。对比蛋白质组学和酶活性数据 整合到基于AI的贝叶斯信息学平台中以研究功能性蛋白质-蛋白质相 互作用的因果网络以阐明血管生成的复杂性和动力学。因果相互作用 性网络显示于图59A-C中。具体地,图59A是脂质、蛋白质和激酶 的完全多组学因果相互作用网络。图59B显示蛋白质富集网络的中 枢,和图59C显示激酶、脂质组学和功能性终点网络的中枢。在该网 络中,蛋白质通过圆形表示,激酶通过方块表示,脂质通过菱形表壳, 和功能活性或细胞反应通过八角形表示。提供了一些蛋白质和激酶名 称。平台的输出证实了已知的蛋白质相互作用。
总之,使用平台技术,通过应用整合的功能性蛋白质组学分析以 确定酶活性的总体改变研究了CoQ10的抗血管生成机制和增殖内皮 细胞的独特特征。基于探询式“组学”的平台稳定地推导细胞情报。 用于数据挖掘以推导因果关系的基于AI的网络工程途径产生可发挥 作用的(actionable)生物学情报。此外,发现平台允许更好地理解内皮 细胞响应于环境刺激、代谢状态的改变和适应性分子的产生以缓和生 理扰乱的病理生理学。
实施例9:采用平台技术构建血管生成模型
在本实施例中,上面发明详述部分中详细描述的平台技术用于整 合从专门构建的血管生成模型获得的数据并鉴别驱动血管生成的新 蛋白质/途径。由这种分析获得的关系图谱提供血管生成生物标志物。
血管生成是未完全理解的一系列复杂信号传导途径的结果。血管 生成在多种病理状况中发挥作用,包括,但不限于癌症。本文中提供 了将蛋白质和脂质印记与特别地考察细胞生物能量学和线粒体膜功 能的功能性终点分析结合的系统途径。如以上证明的,亚汇合的 HUVEC细胞可以用于模拟血管生成状态,而汇合的HUVEC细胞可 以用于模拟非血管生成的(即正常的)状态。
在体外模型中,HUVEC细胞在接触抑制(例如,汇合培养物) 的条件下或在缺乏接触抑制(例如,亚汇合培养物,例如,低于约60% 汇合,低于约70%汇合,低于约80%汇合,低于约90%汇合;三维培 养物;或其中通过“刻划”培养物除去细胞斑片的培养物)在环境影 响剂如血管生成抑制剂(例如,CoQ10)存在或不存在下生长以产生 印记和阐明血管生成的潜在机制。蛋白质组和脂质组印记使用本文提 供的平台方法分析。血管生成的生物标志物进一步使用湿式实验室方 法确认。这一途径用作用于理解血管生成的机制的有力工具,从而允 许鉴别新的血管生成生物标志物及开发和测试调节血管生成的药剂。
人脐静脉内皮细胞经历模拟体内疾病相关细胞所经受的血管生 成环境的条件。具体地,细胞在其中生长由于接触抑制而受到抑制 (即,正常细胞)的条件下或在其中在至少一部分培养物中生长未由 于接触抑制而受到抑制(即,血管生成细胞)的条件下生长。为了简 单的原因,在其中在至少一部分培养物中生长未由于接触抑制而受到 抑制的条件下生长的这类细胞称为非汇合培养物。
包含上述细胞的细胞模型另外地通过用调节血管生成的药剂(例 如,抑制血管生成的药剂)处理而将细胞暴露于“环境扰动”进行“探 询”,其中所述细胞在汇合或非汇合培养物中生长。例如,细胞以各 种浓度的辅酶Q10处理,例如,0、50μM、100μM、250μM、500μM、750μM、1000μM、1250μM或1500μM的一种或多种。如本文中提 供的,扰动可以包括细胞的机械破坏,例如通过“刻划”培养物或以 低密度分培养细胞。
来自具有各扰动处理的各种情况的细胞样品在处理后的各时间 收集,例如处理6、12、18、24、36、48、60、72、84、96、108或 120小时后或者其间的一些时间点。对于特定情况,也收集和分析培 养基样品。然后可以分析样品的蛋白质表达或活性水平、基因表达和脂质水平中的一种或多种。
通过定量蛋白质组学对总细胞蛋白质表达改变的iProfiling分析 使用以上发明详述中描述的技术对于在各情况下和各“环境扰动” (即,辅酶Q10处理)收集的细胞和培养基样品进行。转录谱试验例 如使用CFX-384扩增系统进行。在数据收集(Ct)后,相对于 对照的最终倍数变化使用例如制造商的方案中概述的δCt方法确定。 脂质组学试验使用质谱进行。基本上如制造商推荐的采用Seahorse分 析仪测定功能性分析如耗氧率(OCR)。OCR可以在用推靠Seahorse培 养板的盒形成的7μl腔室中的电极记录。
总之,形态学、酶学和流式细胞分析揭示响应于CoQ10处理的细 胞凋亡、迁移、一氧化氮和ROS产生及生物能量容量的显著改变。 脂质组学分析揭示通过改变线粒体功能和细胞密度减轻的脂质途径 的新改变。利用平台方法的蛋白质组学整合揭示细胞内适应和通过线 粒体调节指导的信号传导的未表征相关性。总体来看,这些研究揭示 CoQ10改变内皮迁移、增殖、细胞凋亡、一氧化氮、ROS和蛋白质/ 脂质体系结构。新的机制在本文中提供,其中CoQ10的抗肿瘤活性 是由于血管生成和细胞凋亡因子的代谢交互,其抑制用于新血管形成 的局部血管供应的肿瘤募集。另外,蛋白质组学和脂质组学适应与支 持内皮细胞响应于环境刺激的生理学要求的相互作用网络相关。这些 数据提供对于由于失调的线粒体代谢控制元件导致肿瘤血管生成的 选择性适应的特征性认识。
实施例10:采用平台技术实施用于阐明酶活性的多蛋白质组学模型
一般,以上实施例5中描述的酶学平台技术可以适应于实施用于 鉴别生物系统或疾病过程如血管生成的调节子的进一步方法。该方法 采用血管生成的模型(包含与血管生成相关的细胞)以代表血管生成 的特征性方面。该模型用于获得至少三个水平的数据,即(i)代表与 血管生成相关的细胞中的总体酶活性的第一数据集;(ii)代表与血管 生成相关的细胞中总体酶活性对酶代谢产物或底物的效应的第二数 据集;和(iii)代表与血管生成相关的细胞中总体蛋白质改变的第三数 据集。另外的数据集如脂质组学、转录组学、代谢组学和SNP数据。 该数据用于使用编程的计算装置生成总体酶活性、总体酶活性的效应和总体蛋白质组学改变之中的一致因果关系网络。一致因果关系网络 是仅基于第一、第二和第三数据集(即不基于任何其它已知的生物学 关系)。一致因果关系网络然后用于鉴别血管生成独特的因果关系, 其中与独特的因果关系相关的至少一种基因或蛋白质确认为血管生 成的调节子。
在这一实施例中,平台技术适应于实施用于测量与血管生成相关 的酶活性及该活性对于蛋白质组的直接效应的多蛋白质组学技术,且 因此提供可用于理解在血管生成过程中细胞蛋白质组总体改变的背 景中酶(例如,激酶和/或蛋白酶)与其代谢产物/底物之间的因果关 系的系统。这类技术可以提供有价值的见解,因为酶活性可以与酶表 达正交(例如,活性下调和表达上调)。由这样的分析产生的关系图 谱可以提供通过调节血管生成的疾病治疗靶标以及与血管生成相关 的诊断/预后标志物。这些靶标和标志物可以用于治疗组合物和方法 中。用于建立模型、获得数据集、生成一致因果关系网络和鉴别血管 生成独特的因果关系的技术在发明概述、发明详述和以上实施例中讨 论。用于建立模型及获得代表总体酶活性和总体酶活性对酶代谢产物 或底物的效应的数据集的进一步技术在以下提供。
首先,按照平台技术建立模型,其中例如细胞系经历模拟疾病的 条件并通过暴露于环境扰动(例如,暴露于血管生成的调节子,例如, CoQ10、阿瓦斯汀、VEGF抑制剂、血管形成抑制素、贝伐单抗、HUVEC 细胞汇合的改变)进行探询。第二,酶活性及其下游效应通过分析(i) 总体酶学活性;(ii)酶学活性对蛋白质组(例如,酶学活性的代谢产 物/底物)的特定效应;和(iii)对细胞蛋白质组的总体效应在总体蛋 白质组学改变的背景中追踪。第三,按照平台技术分析数据集以鉴别 目标调节子。例如,血管生成模型可以通过已知的血管生成调节子探 询;对系统的这一扰动对于总体激酶活性的效应与对于磷酸化蛋白质 组和总蛋白质组的最终效应一起进行分析;且数据集可以通过基于 AI的REFSTM系统分析。
例如,在各种不同条件下生长的HUVEC细胞可以用于模拟血管 和正常(例如,非血管生成)状态。因为除了在特定情况下(例如, 妊娠、伤口愈合等)血管生成不会在成人中出现,因此通过这一方法 鉴别的血管生成标志物的存在可用作指示疾病状态(例如,癌症、类风湿性关节炎、年龄相关性黄斑变性或糖尿病性肾病)的标志物。
这一说明性实施例结合了(i)细胞生物学、(ii)集成的蛋白质组学 平台和生成因果蛋白质网络的信息学平台的能力以描绘血管生成中 翻译后修饰(例如,磷酸化)和参与这种机制的酶(例如,激酶)的 作用。特别地,这种途径采用ATP结合结构域富集探针和血管生成 模型中总蛋白质的磷酸化蛋白质组图谱结合基于活性的蛋白质组学。
对比蛋白质组学、磷酸化蛋白质组和酶活性数据整合到基于AI 的REFSTM信息学平台中。然后特别地从功能性观点(即激酶/酶活性 和激酶可以磷酸化的潜在靶标)生成蛋白质相互作用的因果网络。另 外,使用细胞功能读数,确定了调节靶标的磷酸化和机械驱动病理生 理细胞行为的酶/激酶。本文中概述的说明性实施方式有助于细胞反 应、对血管生成机制的认识和用于血管生成临床管控的潜在靶标/生物 标志物的总体表征。
作为说明性实例,代表正常细胞的细胞和血管生成细胞选择用于 比较。如本文中说明的,HUVEC细胞在亚汇合培养物中生长时显示 血管生成特征,而汇合的HUVEC细胞不显示血管生成特征。HUVEC 细胞的亚汇合培养物用CoQ10处理将HUVEC细胞切换至非血管生成状态,如本文中说明的。利用以上提供的蛋白质组学方法,酶学活性 的分析方法可以包括在任何条件下生长的HUVEC细胞的成对分析, 和任选地从与来自第三数据集的结果配对比较的结果的进一步分析。
作为示例性实施方式,在汇合和非汇合培养物中培养的等同数量 的HUVEC细胞被收获且细胞对于目标肽(例如,磷肽)的存在进行 富集。如实施例5中进行比较分析以检测与血管生成相关的酶学活性 的变化。
通过引用引入
可能在本申请全文中引用的所有被引用文献(包括参考文献、专 利、专利申请、在本申请的提交日可得的版本的GenBank号和网站) 的内容以及其中所引用的文献以其整体在此明确通过引用并入本文。 除非另有说明,本发明的实施将采用在本技术领域是众所周知的蛋白 质制剂的常规技术。
等同
本发明可以以其它的具体形式实施而不背离其精神或实质特征。 因此,前述的实施方式在所有方面被视为说明性的而不是限制本文所 描述的发明。因此,本发明的范围是由所附权利要求而不是由前面的 描述决定,因此被包含在本发明的权利要求书的等价物的含义和范围 内的所有变化意图包含在本发明范围之内。
附录A:相关蛋白质的氨基酸和cDNA序列
1.TCOF1:Treacher Collins-Franceschetti综合征1
基因座NM_000356
AA:MAEARKRRELLPLIYHHLLRAGYVRAAREVKEQSGQKCFLAQPV TLLDIYTHWQQTSELGRKRKAEEDAALQAKKTRVSDPISTSESSEEEEEAEAETAKAT PRLASTNSSVLGADLPSSMKEKAKAETEKAGKTGNSMPHPATGKTVANLLSGKSPRKS AEPSANTTLVSETEEEGSVPAFGAAAKPGMVSAGQADSSSEDTSSSSDETDVEVKASE KILQVRAASAPAKGTPGKGATPAPPGKAGAVASQTKAGKPEEDSESSSEESSDSEEET PAAKALLQAKASGKTSQVGAASAPAKESPRKGAAPAPPGKTGPAVAKAQAGKREEDSQ SSSEESDSEEEAPAQAKPSGKAPQVRAASAPAKESPRKGAAPAPPRKTGPAAAQVQVG KQEEDSRSSSEESDSDREALAAMNAAQVKPLGKSPQVKPASTMGMGPLGKGAGPVPPG KVGPATPSAQVGKWEEDSESSSEESSDSSDGEVPTAVAPAQEKSLGNILQAKPTSSPA KGPPQKAGPVAVQVKAEKPMDNSESSEESSDSADSEEAPAAMTAAQAKPALKIPQTKA CPKKTNTTASAKVAPVRVGTQAPRKAGTATSPAGSSPAVAGGTQRPAEDSSSSEESDS EEEKTGLAVTVGQAKSVGKGLQVKAASVPVKGSLGQGTAPVLPGKTGPTVTQVKAEKQ EDSESSEEESDSEEAAASPAQVKTSVKKTQAKANPAAARAPSAKGTISAPGKVVTAAA QAKQRSPSKVKPPVRNPQNSTVLARGPASVPSVGKAVATAAQAQTGPEEDSGSSEEES DSEEEAETLAQVKPSGKTHQIRAALAPAKESPRKGAAPTPPGKTGPSAAQAGKQDDSG SSSEESDSDGEAPAAVTSAQVIKPPLIFVDPNRSPAGPAATPAQAQAASTPRKARASE STARSSSSESEDEDVI PATQCLTPGIRTNVVTMPTAHPRIAPKASMAGASSSKESSRI SDGKKQEGPATQVSKKNPASLPLTQAALKVLAQKASEAQPPVARTQPSSGVDSAVGTL PATSPQSTSVQAKGTNKLRKPKLPEVQQATKAPESSDDSEDSSDSSSGSEEDGEGPQG AKSAHTLGPTPSRTETLVEETAAESSEDDVVAPSQSLLSGYMTPGLTPANSQASKATP KLDSSPSVSSTLAAKDDPDGKQEAKPQQAAGMLSPKTGGKEAASGTTPQKSRKPKKGA GNPQASTLALQSNITQCLLGQPWPLNEAQVQASVVKVLTELLEQERKKVVDTTKESSR KGWESRKRKLSGDQPAARTPRSKKKKKLGAGEGGEASVSPEKTSTTSKGKAKRDKASG DVKEKKGKGSLGSQGAKDEPEEELQKGMGTVEGGDQSNPKSKKEKKKSDKRKKDKEKK EKKKKAKKASTKDSESPSQKKKKKKKKTAEQTV
2.TOP2A:人拓扑异构酶
基因座NM_001067
AA翻译="MEVSPLQPVNENMQVNKIKKNEDAKKRLSVERIYQKKTQLEHIL LRPDTYIGSVELVTQQMWVYDEDVGINYREVTFVPGLYKIFDEILVNAADNKQRDPKM SCIRVTIDPENNLISIWNNGKGIPVVEHKVEKMYVPALIFGQLLTSSNYDDDEKKVTG GRNGYGAKLCNIFSTKFTVETASREYKKMFKQTWMDNMGRAGEMELKPFNGEDYTCIT FQPDLSKFKMQSLDKDIVALMVRRAYDIAGSTKDVKVFLNGNKLPVKGFRSYVDMYLK DKLDETGNSLKVIHEQVNHRWEVCLTMSEKGFQQISFVNSIATSKGGRHVDYVADQIV TKLVDVVKKKNKGGVAVKAHQVKNHMWIFVNALIENPTFDSQTKENMTLQPKSFGSTC QLSEKFIKAAIGCGIVESILNWVKFKAQVQLNKKCSAVKHNRIKGIPKLDDANDAGGR NSTECTLILTEGDSAKTLAVSGLGVVGRDKYGVFPLRGKILNVREASHKQIMENAEINNIIKIVGLQYKKNYEDEDSLKTLRYGKIMIMTDQDQDGSHIKGLLINFIHHNWPSLLR HRFLEEFITPIVKVSKNKQEMAFYSLPEFEEWKSSTPNHKKWKVKYYKGLGTSTSKEA KEYFADMKRHRIQFKYSGPEDDAAISLAFSKKQIDDRKEWLTNFMEDRRQRKLLGLPE DYLYGQTTTYLTYNDFINKELILFSNSDNERSIPSMVDGLKPGQRKVLFTCFKRNDKR EVKVAQLAGSVAEMSSYHHGEMSLMMTIINLAQNFVGSNNLNLLQPIGQFGTRLHGGK DSASPRYIFTMLSSLARLLFPPKDDHTLKFLYDDNQRVEPEWYIPIIPMVLINGAEGI GTGWSCKIPNFDVREIVNNIRRLMDGEEPLPMLPSYKNFKGTIEELAPNQYVISGEVA ILNSTTIEISELPVRTWTQTYKEQVLEPMLNGTEKTPPLITDYREYHTDTTVKFVVKM TEEKLAEAERVGLHKVFKLQTSLTCNSMVLFDHVGCLKKYDTVLDILRDFFELRLKYY GLRKEWLLGMLGAESAKLNNQARFILEKIDGKIIIENKPKKELIKVLIQRGYDSDPVK AWKEAQQKVPDEEENEESDNEKETEKSDSVTDSGPTFNYLLDMPLWYLTKEKKDELCR LRNEKEQELDTLKRKSPSDLWKEDLATFIEELEAVEAKEKQDEQVGLPGKGGKAKGKK TQMAEVLPSPRGQRVIPRITIEMKAEAEKKNKKKIKNENTEGSPQEDGVELEGLKQRL EKKQKREPGTKTKKQTTLAFKPIKKGKKRNPWSDSESDRSSDESNFDVPPRETEPRRA ATKTKFTMDLDSDEDFSDFDEKTDDEDFVPSDASPPKTKTSPKLSNKELKPQKSVVSD LEADDVKGSVPLSSSPPATHFPDETEITNPVPKKNVTVKKTAAKSQSSTSTTGAKKRA APKGTKRDPALNSGVSQKPDPAKTKNRRKRKPSTSDDSDSNFEKIVSKAVTSKKSKGE SDDFHMDFDSAVAPRAKSVRAKKPIKYLEESDEDDLF
3.CAMK2A:CAMK2A钙/钙调蛋白依赖性蛋白质激酶IIα[人]
基因座:NM_015981.3(同工型1)
AA/翻译="MATITCTRFTEEYQLFEELGKGAFSVVRRCVKVLAGQEYAAKII NTKKLSARDHQKLEREARICRLLKHPNIVRLHDSISEEGHHYLIFDLVTGGELFEDIV AREYYSEADASHCIQQILEAVLHCHQMGVVHRDLKPENLLLASKLKGAAVKLADFGLA IEVEGEQQAWFGFAGTPGYLSPEVLRKDPYGKPVDLWACGVILYILLVGYPPFWDEDQ HRLYQQIKAGAYDFPSPEWDTVTPEAKDLINKMLTINPSKRITAAEALKHPWISHRST VASCMHRQETVDCLKKFNARRKLKGAILTTMLATRNFSGGKSGGNKKSDGVKKRKSSS SVQLMESSESTNTTIEDEDTKVRKQEIIKVTEQLIEAISNGDFESYTKMCDPGMTAFE PEALGNLVEGLDFHRFYFENLWSRNSKPVHTTILNPHIHLMGDESACIAYIRITQYLD AGGIPRTAQSEETRVWHRRDGKWQIVHFHRSGAPSVLPH
基因座NM_171825(同工型2)
AA/翻译="MATITCTRFTEEYQLFEELGKGAFSVVRRCVKVLAGQEYAAKII NTKKLSARDHQKLEREARICRLLKHPNIVRLHDSISEEGHHYLIFDLVTGGELFEDIV AREYYSEADASHCIQQILEAVLHCHQMGVVHRDLKPENLLLASKLKGAAVKLADFGLA IEVEGEQQAWFGFAGTPGYLSPEVLRKDPYGKPVDLWACGVILYILLVGYPPFWDEDQ HRLYQQIKAGAYDFPSPEWDTVTPEAKDLINKMLTINPSKRITAAEALKHPWISHRST VASCMHRQETVDCLKKFNARRKLKGAILTTMLATRNFSGGKSGGNKKSDGVKESSEST NTTIEDEDTKVRKQEIIKVTEQLIEAISNGDFESYTKMCDPGMTAFEPEALGNLVEGL DFHRFYFENLWSRNSKPVHTTILNPHIHLMGDESACIAYIRITQYLDAGGIPRTAQSE ETRVWHRRDGKWQIVHFHRSGAPSVLPH
4.CDK1:CDK1细胞周期蛋白依赖性激酶1[人]
基因座NM_001170406(同工型4)
AA/翻译="MEDYTKIEKIGEGTYGVVYKGRHKTTGQVVAMKKIRLESEEEGV PSTAIREISLLKELRHPNIVSLQDVLMQDSRLYLIFEFLSMDLKKYLDSIPPGQYMDS SLVKVKA
基因座NM_001786(同工型1)
AA/翻译="MEDYTKIEKIGEGTYGVVYKGRHKTTGQVVAMKKIRLESEEEGV PSTAIREISLLKELRHPNIVSLQDVLMQDSRLYLIFEFLSMDLKKYLDSIPPGQYMDS SLVKSYLYQILQGIVFCHSRRVLHRDLKPQNLLIDDKGTIKLADFGLARAFGIPIRVY THEVVTLWYRSPEVLLGSARYSTPVDIWSIGTIFAELATKKPLFHGDSEIDQLFRIFR ALGTPNNEVWPEVESLQDYKNTFPKWKPGSLASHVKNLDENGLDLLSKMLIYDPAKRISGKMALNHPYFNDLDNQIKKM
基因座NM_033379(同工型2)
AA/翻译="MEDYTKIEKIGEGTYGVVYKGRHKTTGQVVAMKKIRLESEEEGV PSTAIREISLLKELRHPNIVSLQDVLMQDSRLYLIFEFLSMDLKKYLDSIPPGQYMDS SLVKVVTLWYRSPEVLLGSARYSTPVDIWSIGTIFAELATKKPLFHGDSEIDQLFRIF RALGTPNNEVWPEVESLQDYKNTFPKWKPGSLASHVKNLDENGLDLLSKMLIYDPAKR ISGKMALNHPYFNDLDNQIKKM
5.CLTCL1:CLTCL1网格蛋白,重链样-1[人]
基因座NM_001835(同工型2)
AA/翻译="MAQILPVRFQEHFQLQNLGINPANIGFSTLTMESDKFICIREKV GEQAQVTIIDMSDPMAPIRRPISAESAIMNPASKVIALKAGKTLQIFNIEMKSKMKAH TMAEEVIFWKWVSVNTVALVTETAVYHWSMEGDSQPMKMFDRHTSLVGCQVIHYRTDE YQKWLLLVGISAQQNRVVGAMQLYSVDRKVSQPIEGHAAAFAEFKMEGNAKPATLFCF AVRNPTGGKLHIIEVGQPAAGNQPFVKKAVDVFFPPEAQNDFPVAMQIGAKHGVIYLI TKYGYLHLYDLESGVCICMNRISADTIFVTAPHKPTSGIIGVNKKGQVLSVCVEEDNI VNYATNVLQNPDLGLRLAVRSNLAGAEKLFVRKFNTLFAQGSYAEAAKVAASAPKGIL RTRETVQKFQSIPAQSGQASPLLQYFGILLDQGQLNKLESLELCHLVLQQGRKQLLEK WLKEDKLECSEELGDLVKTTDPMLALSVYLRANVPSKVIQCFAETGQFQKIVLYAKKV GYTPDWIFLLRGVMKISPEQGLQFSRMLVQDEEPLANISQIVDIFMENSLIQQCTSFL LDALKNNRPAEGLLQTWLLEMNLVHAPQVADAILGNKMFTHYDRAHIAQLCEKAGLLQ QALEHYTDLYDIKRAVVHTHLLNPEWLVNFFGSLSVEDSVECLHAMLSANIRQNLQLC VQVASKYHEQLGTQALVELFESFKSYKGLFYFLGSIVNFSQDPDVHLKYIQAACKTGQ IKEVERICRESSCYNPERVKNFLKEAKLTDQLPLIIVCDRFGFVHDLVLYLYRNNLQR YIEIYVQKVNPSRTPAVIGGLLDVDCSEEVIKHLIMAVRGQFSTDELVAEVEKRNRLK LLLPWLESQIQEGCEEPATHNALAKIYIDSNNSPECFLRENAYYDSSVVGRYCEKRDP HLACVAYERGQCDLELIKVCNENSLFKSEARYLVCRKDPELWAHVLEETNPSRRQLID QVVQTALSETRDPEEISVTVKAFMTADLPNELIELLEKIVLDNSVFSEHRNLQNLLILTAIKADRTRVMEYISRLDNYDALDIASIAVSSALYEEAFTVFHKFDMNASAIQVLIEH IGNLDRAYEFAERCNEPAVWSQLAQAQLQKDLVKEAINSYIRGDDPSSYLEVVQSASR SNNWEDLVKFLQMARKKGRESYIETELIFALAKTSRVSELEDFINGPNNAHIQQVGDR CYEEGMYEAAKLLYSNVSNFARLASTLVHLGEYQAAVDNSRKASSTRTWKEVCFACMD GQEFRFAQLCGLHIVIHADELEELMCYYQDRGYFEELILLLEAALGLERAHMGMFTEL AILYSKFKPQKMLEHLELFWSRVNIPKVLRAAEQAHLWAELVFLYDKYEEYDNAVLTM MSHPTEAWKEGQFKDIITKVANVELCYRALQFYLDYKPLLINDLLLVLSPRLDHTWTV SFFSKAGQLPLVKPYLRSVQSHNNKSVNEALNHLLTEEEDYQDAMQHAAESRDAELAQ KLLQWFLEEGKRECFAACLFTCYDLLRPDMVLELAWRHNLVDLAMPYFIQVMREYLSKVDKLDALESLRKQEEHVTEPAPLVFDFDGHE
基因座NM_007098(同工型1)
AA/翻译="MAQILPVRFQEHFQLQNLGINPANIGFSTLTMESDKFICIREKV GEQAQVTIIDMSDPMAPIRRPISAESAIMNPASKVIALKAGKTLQIFNIEMKSKMKAH TMAEEVIFWKWVSVNTVALVTETAVYHWSMEGDSQPMKMFDRHTSLVGCQVIHYRTDE YQKWLLLVGISAQQNRVVGAMQLYSVDRKVSQPIEGHAAAFAEFKMEGNAKPATLFCF AVRNPTGGKLHIIEVGQPAAGNQPFVKKAVDVFFPPEAQNDFPVAMQIGAKHGVIYLI TKYGYLHLYDLESGVCICMNRISADTIFVTAPHKPTSGIIGVNKKGQVLSVCVEEDNI VNYATNVLQNPDLGLRLAVRSNLAGAEKLFVRKFNTLFAQGSYAEAAKVAASAPKGIL RTRETVQKFQSIPAQSGQASPLLQYFGILLDQGQLNKLESLELCHLVLQQGRKQLLEK WLKEDKLECSEELGDLVKTTDPMLALSVYLRANVPSKVIQCFAETGQFQKIVLYAKKV GYTPDWIFLLRGVMKISPEQGLQFSRMLVQDEEPLANISQIVDIFMENSLIQQCTSFL LDALKNNRPAEGLLQTWLLEMNLVHAPQVADAILGNKMFTHYDRAHIAQLCEKAGLLQ QALEHYTDLYDIKRAVVHTHLLNPEWLVNFFGSLSVEDSVECLHAMLSANIRQNLQLC VQVASKYHEQLGTQALVELFESFKSYKGLFYFLGSIVNFSQDPDVHLKYIQAACKTGQ IKEVERICRESSCYNPERVKNFLKEAKLTDQLPLIIVCDRFGFVHDLVLYLYRNNLQR YIEIYVQKVNPSRTPAVIGGLLDVDCSEEVIKHLIMAVRGQFSTDELVAEVEKRNRLK LLLPWLESQIQEGCEEPATHNALAKIYIDSNNSPECFLRENAYYDSSVVGRYCEKRDP HLACVAYERGQCDLELIKVCNENSLFKSEARYLVCRKDPELWAHVLEETNPSRRQLID QVVQTALSETRDPEEISVTVKAFMTADLPNELIELLEKIVLDNSVFSEHRNLQNLLILTAIKADRTRVMEYISRLDNYDALDIASIAVSSALYEEAFTVFHKFDMNASAIQVLIEH IGNLDRAYEFAERCNEPAVWSQLAQAQLQKDLVKEAINSYIRGDDPSSYLEVVQSASR SNNWEDLVKFLQMARKKGRESYIETELIFALAKTSRVSELEDFINGPNNAHIQQVGDR CYEEGMYEAAKLLYSNVSNFARLASTLVHLGEYQAAVDNSRKASSTRTWKEVCFACMD GQEFRFAQLCGLHIVIHADELEELMCYYQDRGYFEELILLLEAALGLERAHMGMFTEL AILYSKFKPQKMLEHLELFWSRVNIPKVLRAAEQAHLWAELVFLYDKYEEYDNAVLTM MSHPTEAWKEGQFKDIITKVANVELCYRALQFYLDYKPLLINDLLLVLSPRLDHTWTV SFFSKAGQLPLVKPYLRSVQSHNNKSVNEALNHLLTEEEDYQGLRASIDAYDNFDNIS LAQQLEKHQLMEFRCIAAYLYKGNNWWAQSVELCKKDHLYKDAMQHAAESRDAELAQK LLQWFLEEGKRECFAACLFTCYDLLRPDMVLELAWRHNLVDLAMPYFIQVMREYLSKVDKLDALESLRKQEEHVTEPAPLVFDFDGHE
6.EIF4G1:EIF4G1真核翻译起始因子4γ,1[人]
基因座NM_001194946(同工型6)
AA/翻译="MNKAPQSTGPPPAPSPGLPQPAFPPGQTAPVVFSTPQATQMNTP SQPRQGGFRSLQHFYPSRAQPPSSAASRVQSAAPARPGPAAHVYPAGSQVMMIPSQIS YPASQGAYYIPGQGRSTYVVPTQQYPVQPGAPGFYPGASPTEFGTYAGAYYPAQGVQQ FPTGVAPAPVLMNQPPQIAPKRERKTIRIRDPNQGGKDITEEIMSGARTASTPTPPQT GGGLEPQANGETPQVAVIVRPDDRSQGAIIADRPGLPGPEHSPSESQPSSPSPTPSPS PVLEPGSEPNLAVLSIPGDTMTTIQMSVEESTPISRETGEPYRLSPEPTPLAEPILEV EVTLSKPVPESEFSSSPLQAPTPLASHTVEIHEPNGMVPSEDLEPEVESSPELAPPPA CPSESPVPIAPTAQPEELLNGAPSPPAVDLSPVSEPEEQAKEVTASMAPPTIPSATPA TAPSATSPAQEEEMEEEEEEEEGEAGEAGEAESEKGGEELLPPESTPIPANLSQNLEA AAATQVAVSVPKRRRKIKELNKKEAVGDLLDAFKEANPAVPEVENQPPAGSNPGPESE GSGVPPRPEEADETWDSKEDKIHNAENIQPGEQKYEYKSDQWKPLNLEEKKRYDREFL LGFQFIFASMQKPEGLPHISDVVLDKANKTPLRPLDPTRLQGINCGPDFTPSFANLGR TTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKA WKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTE ERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQK EFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFK LKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKI IKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSN NQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTDNRR VVQRSSLSRERGEKAGDRGDRLERSERGGDRGDRLDRARTPATKRSFSKEVEERSRER PSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYLH LNDMKEAVQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTA QYYQGLYEILELAEDMEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLGK AASLLLEILGLLCKSMGPKKVGTLWREAGLSWKEFLPEGQDIGAFVAEQKVEYTLGEE SEAPGQRALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQIVSNTLVRALMTAVC YSAIIFETPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLLRMF FDALYDEDVVKEDAFYSWESSKDPAEQQGKGVALKSVTAFFKWLREAEEESDHN
基因座NM_004953(同工型4)
AA/翻译="MSGARTASTPTPPQTGGGLEPQANGETPQVAVIVRPDDRSQGAI IADRPGLPGPEHSPSESQPSSPSPTPSPSPVLEPGSEPNLAVLSIPGDTMTTIQMSVE ESTPISRETGEPYRLSPEPTPLAEPILEVEVTLSKPVPESEFSSSPLQAPTPLASHTV EIHEPNGMVPSEDLEPEVESSPELAPPPACPSESPVPIAPTAQPEELLNGAPSPPAVD LSPVSEPEEQAKEVTASMAPPTIPSATPATAPSATSPAQEEEMEEEEEEEEGEAGEAG EAESEKGGEELLPPESTPIPANLSQNLEAAAATQVAVSVPKRRRKIKELNKKEAVGDL LDAFKEANPAVPEVENQPPAGSNPGPESEGSGVPPRPEEADETWDSKEDKIHNAENIQ PGEQKYEYKSDQWKPLNLEEKKRYDREFLLGFQFIFASMQKPEGLPHISDVVLDKANK TPLRPLDPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPQAGLGPRR SQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLF RRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMC RCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEER GRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECL CRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPR RGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGG WNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAA SEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSSLSRERGEKAGDRGDRLERSERG GDRGDRLDRARTPATKRSFSKEVEERSRERPSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYLHLNDMKEAVQCVQELASPSLLFIFVRHGV ESTLERSAIAREHMGQLLHQLLCAGHLSTAQYYQGLYEILELAEDMEIDIPHVWLYLA ELVTPILQEGGVPMGELFREITKPLRPLGKAASLLLEILGLLCKSMGPKKVGTLWREA GLSWKEFLPEGQDIGAFVAEQKVEYTLGEESEAPGQRALPSEELNRQLEKLLKEGSSN QRVFDWIEANLSEQQIVSNTLVRALMTAVCYSAIIFETPLRVDVAVLKARAKLLQKYL CDEQKELQALYALQALVVTLEQPPNLLRMFFDALYDEDVVKEDAFYSWESSKDPAEQQ GKGVALKSVTAFFKWLREAEEESDHN"
基因座NM_182917(同工型1)
AA/翻译="MNKAPQSTGPPPAPSPGLPQPAFPPGQTAPVVFSTPQATQMNTP SQPRQHFYPSRAQPPSSAASRVQSAAPARPGPAAHVYPAGSQVMMIPSQISYPASQGA YYIPGQGRSTYVVPTQQYPVQPGAPGFYPGASPTEFGTYAGAYYPAQGVQQFPTGVAP APVLMNQPPQIAPKRERKTIRIRDPNQGGKDITEEIMSGARTASTPTPPQTGGGLEPQ ANGETPQVAVIVRPDDRSQGAIIADRPGLPGPEHSPSESQPSSPSPTPSPSPVLEPGS EPNLAVLSIPGDTMTTIQMSVEESTPISRETGEPYRLSPEPTPLAEPILEVEVTLSKP VPESEFSSSPLQAPTPLASHTVEIHEPNGMVPSEDLEPEVESSPELAPPPACPSESPV PIAPTAQPEELLNGAPSPPAVDLSPVSEPEEQAKEVTASMAPPTIPSATPATAPSATS PAQEEEMEEEEEEEEGEAGEAGEAESEKGGEELLPPESTPIPANLSQNLEAAAATQVA VSVPKRRRKIKELNKKEAVGDLLDAFKEANPAVPEVENQPPAGSNPGPESEGSGVPPR PEEADETWDSKEDKIHNAENIQPGEQKYEYKSDQWKPLNLEEKKRYDREFLLGFQFIF ASMQKPEGLPHISDVVLDKANKTPLRPLDPTRLQGINCGPDFTPSFANLGRTTLSTRG PPRGGPGGELPRGPQAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSK RTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGV IDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDK DDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTE AIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKT SSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAP GGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSS LSRERGEKAGDRGDRLERSERGGDRGDRLDRARTPATKRSFSKEVEERSRERPSQPEG LRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYLHLNDMKE AVQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTAQYYQGL YEILELAEDMEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLGKAASLLL EILGLLCKSMGPKKVGTLWREAGLSWKEFLPEGQDIGAFVAEQKVEYTLGEESEAPGQ RALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQIVSNTLVRALMTAVCYSAIIF ETPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLLRMFFDALYD EDVVKEDAFYSWESSKDPAEQQGKGVALKSVTAFFKWLREAEEESDHN
基因座NM_198241(同工型5)
AA/翻译="MNKAPQSTGPPPAPSPGLPQPAFPPGQTAPVVFSTPQATQMNTP SQPRQHFYPSRAQPPSSAASRVQSAAPARPGPAAHVYPAGSQVMMIPSQISYPASQGA YYIPGQGRSTYVVPTQQYPVQPGAPGFYPGASPTEFGTYAGAYYPAQGVQQFPTGVAP APVLMNQPPQIAPKRERKTIRIRDPNQGGKDITEEIMSGARTASTPTPPQTGGGLEPQ ANGETPQVAVIVRPDDRSQGAIIADRPGLPGPEHSPSESQPSSPSPTPSPSPVLEPGS EPNLAVLSIPGDTMTTIQMSVEESTPISRETGEPYRLSPEPTPLAEPILEVEVTLSKP VPESEFSSSPLQAPTPLASHTVEIHEPNGMVPSEDLEPEVESSPELAPPPACPSESPV PIAPTAQPEELLNGAPSPPAVDLSPVSEPEEQAKEVTASMAPPTIPSATPATAPSATS PAQEEEMEEEEEEEEGEAGEAGEAESEKGGEELLPPESTPIPANLSQNLEAAAATQVA VSVPKRRRKIKELNKKEAVGDLLDAFKEANPAVPEVENQPPAGSNPGPESEGSGVPPR PEEADETWDSKEDKIHNAENIQPGEQKYEYKSDQWKPLNLEEKKRYDREFLLGFQFIF ASMQKPEGLPHISDVVLDKANKTPLRPLDPTRLQGINCGPDFTPSFANLGRTTLSTRG PPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKR TAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVI DLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKD DDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEA IMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTS SRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPG GRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSSL SRERGEKAGDRGDRLERSERGGDRGDRLDRARTPATKRSFSKEVEERSRERPSQPEGL RKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYLHLNDMKEA VQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTAQYYQGLY EILELAEDMEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLGKAASLLLE ILGLLCKSMGPKKVGTLWREAGLSWKEFLPEGQDIGAFVAEQKVEYTLGEESEAPGQR ALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQIVSNTLVRALMTAVCYSAIIFE TPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLLRMFFDALYDE DVVKEDAFYSWESSKDPAEQQGKGVALKSVTAFFKWLREAEEESDHN
基因座NM_198242(同工型3)
AA/翻译="MNQPPQIAPKRERKTIRIRDPNQGGKDITEEIMSGARTASTPTP PQTGGGLEPQANGETPQVAVIVRPDDRSQGAIIADRPGLPGPEHSPSESQPSSPSPTP SPSPVLEPGSEPNLAVLSIPGDTMTTIQMSVEESTPISRETGEPYRLSPEPTPLAEPI LEVEVTLSKPVPESEFSSSPLQAPTPLASHTVEIHEPNGMVPSEDLEPEVESSPELAP PPACPSESPVPIAPTAQPEELLNGAPSPPAVDLSPVSEPEEQAKEVTASMAPPTIPSA TPATAPSATSPAQEEEMEEEEEEEEGEAGEAGEAESEKGGEELLPPESTPIPANLSQN LEAAAATQVAVSVPKRRRKIKELNKKEAVGDLLDAFKEANPAVPEVENQPPAGSNPGP ESEGSGVPPRPEEADETWDSKEDKIHNAENIQPGEQKYEYKSDQWKPLNLEEKKRYDR EFLLGFQFIFASMQKPEGLPHISDVVLDKANKTPLRPLDPTRLQGINCGPDFTPSFAN LGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKA EKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAI DTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNR CQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGE LFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQM EKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKV QQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSI DSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTD NRRVVQRSSLSRERGEKAGDRGDRLERSERGGDRGDRLDRARTPATKRSFSKEVEERSRERPSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEE YLHLNDMKEAVQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHL STAQYYQGLYEILELAEDMEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRP LGKAASLLLEILGLLCKSMGPKKVGTLWREAGLSWKEFLPEGQDIGAFVAEQKVEYTL GEESEAPGQRALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQIVSNTLVRALMT AVCYSAIIFETPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLL RMFFDALYDEDVVKEDAFYSWESSKDPAEQQGKGVALKSVTAFFKWLREAEEESDHN
基因座NM_198244(同工型2)
AA/翻译="MMIPSQISYPASQGAYYIPGQGRSTYVVPTQQYPVQPGAPGFYP GASPTEFGTYAGAYYPAQGVQQFPTGVAPAPVLMNQPPQIAPKRERKTIRIRDPNQGG KDITEEIMSGARTASTPTPPQTGGGLEPQANGETPQVAVIVRPDDRSQGAIIADRPGL PGPEHSPSESQPSSPSPTPSPSPVLEPGSEPNLAVLSIPGDTMTTIQMSVEESTPISR ETGEPYRLSPEPTPLAEPILEVEVTLSKPVPESEFSSSPLQAPTPLASHTVEIHEPNG MVPSEDLEPEVESSPELAPPPACPSESPVPIAPTAQPEELLNGAPSPPAVDLSPVSEP EEQAKEVTASMAPPTIPSATPATAPSATSPAQEEEMEEEEEEEEGEAGEAGEAESEKG GEELLPPESTPIPANLSQNLEAAAATQVAVSVPKRRRKIKELNKKEAVGDLLDAFKEA NPAVPEVENQPPAGSNPGPESEGSGVPPRPEEADETWDSKEDKIHNAENIQPGEQKYE YKSDQWKPLNLEEKKRYDREFLLGFQFIFASMQKPEGLPHISDVVLDKANKTPLRPLD PTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKE PRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILN KLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKV PTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELE EARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIG KDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKT IDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISK GSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSSLSRERGEKAGDRGDRLERSERGGDRGDRLD RARTPATKRSFSKEVEERSRERPSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPL KAALSEEELEKKSKAIIEEYLHLNDMKEAVQCVQELASPSLLFIFVRHGVESTLERSA IAREHMGQLLHQLLCAGHLSTAQYYQGLYEILELAEDMEIDIPHVWLYLAELVTPILQ EGGVPMGELFREITKPLRPLGKAASLLLEILGLLCKSMGPKKVGTLWREAGLSWKEFL PEGQDIGAFVAEQKVEYTLGEESEAPGQRALPSEELNRQLEKLLKEGSSNQRVFDWIE ANLSEQQIVSNTLVRALMTAVCYSAIIFETPLRVDVAVLKARAKLLQKYLCDEQKELQ ALYALQALVVTLEQPPNLLRMFFDALYDEDVVKEDAFYSWESSKDPAEQQGKGVALKS VTAFFKWLREAEEESDHN
7.ENO1:ENO1烯醇化酶1,(α)[人]
基因座NM_001428
AA/翻译="MSILKIHAREIFDSRGNPTVEVDLFTSKGLFRAAVPSGASTGIY EALELRDNDKTRYMGKGVSKAVEHINKTIAPALVSKKLNVTEQEKIDKLMIEMDGTEN KSKFGANAILGVSLAVCKAGAVEKGVPLYRHIADLAGNSEVILPVPAFNVINGGSHAG NKLAMQEFMILPVGAANFREAMRIGAEVYHNLKNVIKEKYGKDATNVGDEGGFAPNIL ENKEGLELLKTAIGKAGYTDKVVIGMDVAASEFFRSGKYDLDFKSPDDPSRYISPDQL ADLYKSFIKDYPVVSIEDPFDQDDWGAWQKFTASAGIQVVGDDLTVTNPKRIAKAVNE KSCNCLLLKVNQIGSVTESLQACKLAQANGWGVMVSHRSGETEDTFIADLVVGLCTGQ IKTGAPCRSERLAKYNQLLRIEEELGSKAKFAGRNFRNPLAK
8.FBL:FBL纤维蛋白[人]
基因座NM_001436
AA/翻译="MKPGFSPRGGGFGGRGGFGDRGGRGGRGGFGGGRGRGGGFRGRG RGGGGGGGGGGGGGRGGGGFHSGGNRGRGRGGKRGNQSGKNVMVEPHRHEGVFICRGK EDALVTKNLVPGESVYGEKRVSISEGDDKIEYRAWNPFRSKLAAAILGGVDQIHIKPG AKVLYLGAASGTTVSHVSDIVGPDGLVYAVEFSHRSGRDLINLAKKRTNIIPVIEDAR HPHKYRMLIAMVDVIFADVAQPDQTRIVALNAHTFLRNGGHFVISIKANCIDSTASAE AVFASEVKKMQQENMKPQEQLTLEPYERDHAVVVGVYRPPPKVKN
9.GSK3B:GSK3B糖原合酶激酶3β[人]
基因座NM_001146156(同工型2)
AA/翻译="MSGRPRTTSFAESCKPVQQPSAFGSMKVSRDKDGSKVTTVVATP GQGPDRPQEVSYTDTKVIGNGSFGVVYQAKLCDSGELVAIKKVLQDKRFKNRELQIMR KLDHCNIVRLRYFFYSSGEKKDEVYLNLVLDYVPETVYRVARHYSRAKQTLPVIYVKL YMYQLFRSLAYIHSFGICHRDIKPQNLLLDPDTAVLKLCDFGSAKQLVRGEPNVSYIC SRYYRAPELIFGATDYTSSIDVWSAGCVLAELLLGQPIFPGDSGVDQLVEIIKVLGTP TREQIREMNPNYTEFKFPQIKAHPWTKVFRPRTPPEAIALCSRLLEYTPTARLTPLEA CAHSFFDELRDPNVKLPNGRDTPALFNFTTQELSSNPPLATILIPPHARIQAAASTPT NATAASDANTGDRGQTNNAASASASNST
基因座NM_002093(同工型1)
AA/翻译="MSGRPRTTSFAESCKPVQQPSAFGSMKVSRDKDGSKVTTVVATP GQGPDRPQEVSYTDTKVIGNGSFGVVYQAKLCDSGELVAIKKVLQDKRFKNRELQIMR KLDHCNIVRLRYFFYSSGEKKDEVYLNLVLDYVPETVYRVARHYSRAKQTLPVIYVKL YMYQLFRSLAYIHSFGICHRDIKPQNLLLDPDTAVLKLCDFGSAKQLVRGEPNVSYIC SRYYRAPELIFGATDYTSSIDVWSAGCVLAELLLGQPIFPGDSGVDQLVEIIKVLGTP TREQIREMNPNYTEFKFPQIKAHPWTKDSSGTGHFTSGVRVFRPRTPPEAIALCSRLL EYTPTARLTPLEACAHSFFDELRDPNVKLPNGRDTPALFNFTTQELSSNPPLATILIP PHARIQAAASTPTNATAASDANTGDRGQTNNAASASASNST
10.HDLBP:HDLBP高密度脂蛋白结合蛋白[人]
基因座NM_001243900(同工型b)
AA/翻译="MHLAERDRWLFVATVMMHFVSIKSGFPGLCVGVRSTMSSVAVLT QESFAEHRSGLVPQQIKVATLNSEEESDPPTYKDAFPPLPEKAACLESAQEPAGAWGN KIRPIKASVITQVFHVPLEERKYKDMNQFGEGEQAKICLEIMQRTGAHLELSLAKDQG LSIMVSGKLDAVMKARKDIVARLQTQASATVAIPKEHHRFVIGKNGEKLQDLELKTAT KIQIPRPDDPSNQIKITGTKEGIEKARHEVLLISAEQDKRAVERLEVEKAFHPFIAGP YNRLVGEIMQETGTRINIPPPSVNRTEIVFTGEKEQLAQAVARIKKIYEEKANSFTVS SVAAPSWLHRFIIGKKGQNLAKITQQMPKVHIEFTEGEDKITLEGPTEDVNVAQEQIE GMVKDLINRMDYVEINIDHKFHRHLIGKSGANINRIKDQYKVSVRIPPDSEKSNLIRI EGDPQGVQQAKRELLELASRMENERTKDLIIEQRFHRTIIGQKGERIREIRDKFPEVI INFPDPAQKSDIVQLRGPKNEVEKCTKYMQKMVADLVENSYSISVPIFKQFHKNIIGK GGANIKKIREESNTKIDLPAENSNSETIIITGKRANCEAARSRILSIQKDLANIAEVE VSIPAKLHNSLIGTKGRLIRSIMEECGGVHIHFPVEGSGSDTVVIRGPSSDVEKAKKQ LLHLAEEKQTKSFTVDIRAKPEYHKFLIGKGGGKIRKVRDSTGARVIFPAAEDKDQDL ITIIGKEDAVREAQKELEALIQNLDNVVEDSMLVDPKHHRHFVIRRGQVLREIAEEYG GVMVSFPRSGTQSDKVTLKGAKDCVEAAKKRIQEIIEDLEAQVTLECAIPQKFHRSVM GPKGSRIQQITRDFSVQIKFPDREENAVHSTEPVVQENGDEAGEGREAKDCDPGSPRR CDIIIISGRKEKCEAAKEALEALVPVTIEVEVPFDLHRYVIGQKGSGIRKMMDEFEVN IHVPAPELQSDIIAITGLAANLDRAKAGLLERVKELQAEQEDRALRSFKLSVTVDPKYHPKIIGRKGAVITQIRLEHDVNIQFPDKDDGNQPQDQITITGYEKNTEAARDAILRIV GELEQMVSEDVPLDHRVHARIIGARGKAIRKIMDEFKVDIRFPQSGAPDPNCVTVTGL PENVEEAIDHILNLEEEYLADVVDSEALQVYMKPPAHEEAKAPSRGFVVRDAPWTASS SEKAPDMSSSEEFPSFGAQVAPKTLPWGPKR
基因座NM_005336(同工型a)
AA/翻译="MSSVAVLTQESFAEHRSGLVPQQIKVATLNSEEESDPPTYKDAF PPLPEKAACLESAQEPAGAWGNKIRPIKASVITQVFHVPLEERKYKDMNQFGEGEQAK ICLEIMQRTGAHLELSLAKDQGLSIMVSGKLDAVMKARKDIVARLQTQASATVAIPKE HHRFVIGKNGEKLQDLELKTATKIQIPRPDDPSNQIKITGTKEGIEKARHEVLLISAE QDKRAVERLEVEKAFHPFIAGPYNRLVGEIMQETGTRINIPPPSVNRTEIVFTGEKEQ LAQAVARIKKIYEEKKKKTTTIAVEVKKSQHKYVIGPKGNSLQEILERTGVSVEIPPS DSISETVILRGEPEKLGQALTEVYAKANSFTVSSVAAPSWLHRFIIGKKGQNLAKITQ QMPKVHIEFTEGEDKITLEGPTEDVNVAQEQIEGMVKDLINRMDYVEINIDHKFHRHL IGKSGANINRIKDQYKVSVRIPPDSEKSNLIRIEGDPQGVQQAKRELLELASRMENER TKDLIIEQRFHRTIIGQKGERIREIRDKFPEVIINFPDPAQKSDIVQLRGPKNEVEKC TKYMQKMVADLVENSYSISVPIFKQFHKNIIGKGGANIKKIREESNTKIDLPAENSNS ETIIITGKRANCEAARSRILSIQKDLANIAEVEVSIPAKLHNSLIGTKGRLIRSIMEE CGGVHIHFPVEGSGSDTVVIRGPSSDVEKAKKQLLHLAEEKQTKSFTVDIRAKPEYHK FLIGKGGGKIRKVRDSTGARVIFPAAEDKDQDLITIIGKEDAVREAQKELEALIQNLD NVVEDSMLVDPKHHRHFVIRRGQVLREIAEEYGGVMVSFPRSGTQSDKVTLKGAKDCV EAAKKRIQEIIEDLEAQVTLECAIPQKFHRSVMGPKGSRIQQITRDFSVQIKFPDREE NAVHSTEPVVQENGDEAGEGREAKDCDPGSPRRCDIIIISGRKEKCEAAKEALEALVP VTIEVEVPFDLHRYVIGQKGSGIRKMMDEFEVNIHVPAPELQSDIIAITGLAANLDRAKAGLLERVKELQAEQEDRALRSFKLSVTVDPKYHPKIIGRKGAVITQIRLEHDVNIQF PDKDDGNQPQDQITITGYEKNTEAARDAILRIVGELEQMVSEDVPLDHRVHARIIGAR GKAIRKIMDEFKVDIRFPQSGAPDPNCVTVTGLPENVEEAIDHILNLEEEYLADVVDS EALQVYMKPPAHEEAKAPSRGFVVRDAPWTASSSEKAPDMSSSEEFPSFGAQVAPKTL PWGPKR
基因座NM_203346(同工型a,转录物变体2)
AA/翻译="MSSVAVLTQESFAEHRSGLVPQQIKVATLNSEEESDPPTYKDAF PPLPEKAACLESAQEPAGAWGNKIRPIKASVITQVFHVPLEERKYKDMNQFGEGEQAK ICLEIMQRTGAHLELSLAKDQGLSIMVSGKLDAVMKARKDIVARLQTQASATVAIPKE HHRFVIGKNGEKLQDLELKTATKIQIPRPDDPSNQIKITGTKEGIEKARHEVLLISAE QDKRAVERLEVEKAFHPFIAGPYNRLVGEIMQETGTRINIPPPSVNRTEIVFTGEKEQ LAQAVARIKKIYEEKKKKTTTIAVEVKKSQHKYVIGPKGNSLQEILERTGVSVEIPPS DSISETVILRGEPEKLGQALTEVYAKANSFTVSSVAAPSWLHRFIIGKKGQNLAKITQ QMPKVHIEFTEGEDKITLEGPTEDVNVAQEQIEGMVKDLINRMDYVEINIDHKFHRHL IGKSGANINRIKDQYKVSVRIPPDSEKSNLIRIEGDPQGVQQAKRELLELASRMENER TKDLIIEQRFHRTIIGQKGERIREIRDKFPEVIINFPDPAQKSDIVQLRGPKNEVEKC TKYMQKMVADLVENSYSISVPIFKQFHKNIIGKGGANIKKIREESNTKIDLPAENSNS ETIIITGKRANCEAARSRILSIQKDLANIAEVEVSIPAKLHNSLIGTKGRLIRSIMEE CGGVHIHFPVEGSGSDTVVIRGPSSDVEKAKKQLLHLAEEKQTKSFTVDIRAKPEYHK FLIGKGGGKIRKVRDSTGARVIFPAAEDKDQDLITIIGKEDAVREAQKELEALIQNLD NVVEDSMLVDPKHHRHFVIRRGQVLREIAEEYGGVMVSFPRSGTQSDKVTLKGAKDCV EAAKKRIQEIIEDLEAQVTLECAIPQKFHRSVMGPKGSRIQQITRDFSVQIKFPDREE NAVHSTEPVVQENGDEAGEGREAKDCDPGSPRRCDIIIISGRKEKCEAAKEALEALVP VTIEVEVPFDLHRYVIGQKGSGIRKMMDEFEVNIHVPAPELQSDIIAITGLAANLDRAKAGLLERVKELQAEQEDRALRSFKLSVTVDPKYHPKIIGRKGAVITQIRLEHDVNIQF PDKDDGNQPQDQITITGYEKNTEAARDAILRIVGELEQMVSEDVPLDHRVHARIIGAR GKAIRKIMDEFKVDIRFPQSGAPDPNCVTVTGLPENVEEAIDHILNLEEEYLADVVDS EALQVYMKPPAHEEAKAPSRGFVVRDAPWTASSSEKAPDMSSSEEFPSFGAQVAPKTL PWGPKR
11.HIST1H2BA:HIST1H2BA组蛋白簇1,H2ba[人]
基因座NM_170610
AA/翻译="MPEVSSKGATISKKGFKKAVVKTQKKEGKKRKRTRKESYSIYIY KVLKQVHPDTGISSKAMSIMNSFVTDIFERIASEASRLAHYSKRSTISSREIQTAVRL LLPGELAKHAVSEGTKAVTKYTSSK
12.HMGB2:HMGB2高迁移率组盒2[人]
基因座NM_001130688(同工型2)
AA/翻译="MGKGDPNKPRGKMSSYAFFVQTCREEHKKKHPDSSVNFAEFSKK CSERWKTMSAKEKSKFEDMAKSDKARYDREMKNYVPPKGDKKGKKKDPNAPKRPPSAF FLFCSEHRPKIKSEHPGLSIGDTAKKLGEMWSEQSAKDKQPYEQKAAKLKEKYEKDIA AYRAKGKSEAGKKGPGRPTGSKKKNEPEDEEEEEEEEDEDEEEEDEDEE
基因座NM_001130689(同工型3)
AA/翻译="MGKGDPNKPRGKMSSYAFFVQTCREEHKKKHPDSSVNFAEFSKK CSERWKTMSAKEKSKFEDMAKSDKARYDREMKNYVPPKGDKKGKKKDPNAPKRPPSAF FLFCSEHRPKIKSEHPGLSIGDTAKKLGEMWSEQSAKDKQPYEQKAAKLKEKYEKDIA AYRAKGKSEAGKKGPGRPTGSKKKNEPEDEEEEEEEEDEDEEEEDEDEE
基因座NM_002129(同工型1)
AA/翻译="MGKGDPNKPRGKMSSYAFFVQTCREEHKKKHPDSSVNFAEFSKK CSERWKTMSAKEKSKFEDMAKSDKARYDREMKNYVPPKGDKKGKKKDPNAPKRPPSAF FLFCSEHRPKIKSEHPGLSIGDTAKKLGEMWSEQSAKDKQPYEQKAAKLKEKYEKDIA AYRAKGKSEAGKKGPGRPTGSKKKNEPEDEEEEEEEEDEDEEEEDEDEE
13.HNRNPK:HNRNPK异质核核糖核蛋白K[人]
基因座NM_002140(同工型a变体1)
AA/翻译="METEQPEETFPNTETNGEFGKRPAEDMEEEQAFKRSRNTDEMVE LRILLQSKNAGAVIGKGGKNIKALRTDYNASVSVPDSSGPERILSISADIETIGEILK KIIPTLEEGLQLPSPTATSQLPLESDAVECLNYQHYKGSDFDCELRLLIHQSLAGGII GVKGAKIKELRENTQTTIKLFQECCPHSTDRVVLIGGKPDRVVECIKIILDLISESPI KGRAQPYDPNFYDETYDYGGFTMMFDDRRGRPVGFPMRGRGGFDRMPPGRGGRPMPPS RRDYDDMSPRRGPPPPPPGRGGRGGSRARNLPLPPPPPPRGGDLMAYDRRGRPGDRYD GMVGFSADETWDSAIDTWSPSEWQMAYEPQGGSGYDYSYAGGRGSYGDLGGPIITTQV TIPKDLAGSIIGKGGQRIKQIRHESGASIKIDEPLEGSEDRIITITGTQDQIQNAQYL LQNSVKQYADVEGF
基因座NM_031262(同工型3变体3)
AA/翻译="METEQPEETFPNTETNGEFGKRPAEDMEEEQAFKRSRNTDEMVE LRILLQSKNAGAVIGKGGKNIKALRTDYNASVSVPDSSGPERILSISADIETIGEILK KIIPTLEEGLQLPSPTATSQLPLESDAVECLNYQHYKGSDFDCELRLLIHQSLAGGII GVKGAKIKELRENTQTTIKLFQECCPHSTDRVVLIGGKPDRVVECIKIILDLISESPI KGRAQPYDPNFYDETYDYGGFTMMFDDRRGRPVGFPMRGRGGFDRMPPGRGGRPMPPS RRDYDDMSPRRGPPPPPPGRGGRGGSRARNLPLPPPPPPRGGDLMAYDRRGRPGDRYD GMVGFSADETWDSAIDTWSPSEWQMAYEPQGGSGYDYSYAGGRGSYGDLGGPIITTQV TIPKDLAGSIIGKGGQRIKQIRHESGASIKIDEPLEGSEDRIITITGTQDQIQNAQYL LQNSVKQYSGKFF
基因座NM_031263(同工型a变体2)
AA/翻译="METEQPEETFPNTETNGEFGKRPAEDMEEEQAFKRSRNTDEMVE LRILLQSKNAGAVIGKGGKNIKALRTDYNASVSVPDSSGPERILSISADIETIGEILK KIIPTLEEGLQLPSPTATSQLPLESDAVECLNYQHYKGSDFDCELRLLIHQSLAGGII GVKGAKIKELRENTQTTIKLFQECCPHSTDRVVLIGGKPDRVVECIKIILDLISESPI KGRAQPYDPNFYDETYDYGGFTMMFDDRRGRPVGFPMRGRGGFDRMPPGRGGRPMPPS RRDYDDMSPRRGPPPPPPGRGGRGGSRARNLPLPPPPPPRGGDLMAYDRRGRPGDRYD GMVGFSADETWDSAIDTWSPSEWQMAYEPQGGSGYDYSYAGGRGSYGDLGGPIITTQV TIPKDLAGSIIGKGGQRIKQIRHESGASIKIDEPLEGSEDRIITITGTQDQIQNAQYL LQNSVKQYADVEGF
14.HNRPDL:HNRPDL异质核核糖核蛋白D-样[人]
基因座NM_001207000(同工型B)
AA/翻译="MEVPPRLSHVPPPLFPSAPATLASRSLSHWRPRPPRQLAPLLPS LAPSSARQGARRAQRHVTAQQPSRLAGGAAIKGGRRRRPDLFRRHFKSSSIQRSAAAA AATRTARQHPPADSSVTMEDMNEYSNIEEFAEGSKINASKNQQDDGKMFIGGLSWDTS KKDLTEYLSRFGEVVDCTIKTDPVTGRSRGFGFVLFKDAASVDKVLELKEHKLDGKLI DPKRAKALKGKEPPKKVFVGGLSPDTSEEQIKEYFGAFGEIENIELPMDTKTNERRGF CFITYTDEEPVKKLLESRYHQIGSGKCEIKVAQPKEVYRQQQQQQKGGRGAAAGGRGGTRGRGRGQQSTYGKASRGGGNHQNNYQPY
基因座NM_031372(同工型a)
AA/翻译="MEVPPRLSHVPPPLFPSAPATLASRSLSHWRPRPPRQLAPLLPS LAPSSARQGARRAQRHVTAQQPSRLAGGAAIKGGRRRRPDLFRRHFKSSSIQRSAAAA AATRTARQHPPADSSVTMEDMNEYSNIEEFAEGSKINASKNQQDDGKMFIGGLSWDTS KKDLTEYLSRFGEVVDCTIKTDPVTGRSRGFGFVLFKDAASVDKVLELKEHKLDGKLI DPKRAKALKGKEPPKKVFVGGLSPDTSEEQIKEYFGAFGEIENIELPMDTKTNERRGF CFITYTDEEPVKKLLESRYHQIGSGKCEIKVAQPKEVYRQQQQQQKGGRGAAAGGRGG TRGRGRGQGQNWNQGFNNYYDQGYGNYNSAYGGDQNYSGYGGYDYTGYNYGNYGYGQG YADYSGQQSTYGKASRGGGNHQNNYQPY
15.HSPA9:HSPA9热休克70kDa蛋白9(mortalin)[人]
基因座NM_004134
AA/翻译="MISASRAAAARLVGAAASRGPTAARHQDSWNGLSHEAFRLVSRR DYASEAIKGAVVGIDLGTTNSCVAVMEGKQAKVLENAEGARTTPSVVAFTADGERLVG MPAKRQAVTNPNNTFYATKRLIGRRYDDPEVQKDIKNVPFKIVRASNGDAWVEAHGKL YSPSQIGAFVLMKMKETAENYLGHTAKNAVITVPAYFNDSQRQATKDAGQISGLNVLR VINEPTAAALAYGLDKSEDKVIAVYDLGGGTFDISILEIQKGVFEVKSTNGDTFLGGE DFDQALLRHIVKEFKRETGVDLTKDNMALQRVREAAEKAKCELSSSVQTDINLPYLTM DSSGPKHLNMKLTRAQFEGIVTDLIRRTIAPCQKAMQDAEVSKSDIGEVILVGGMTRM PKVQQTVQDLFGRAPSKAVNPDEAVAIGAAIQGGVLAGDVTDVLLLDVTPLSLGIETL GGVFTKLINRNTTIPTKKSQVFSTAADGQTQVEIKVCQGEREMAGDNKLLGQFTLIGI PPAPRGVPQIEVTFDIDANGIVHVSAKDKGTGREQQIVIQSSGGLSKDDIENMVKNAE KYAEEDRRKKERVEAVNMAEGIIHDTETKMEEFKDQLPADECNKLKEEISKMRELLAR KDSETGENIRQAASSLQQASLKLFEMAYKKMASEREGSGSSGTGEQKEDQKEEKQ
16.MAP2K2:MAP2K2有丝分裂原激活蛋白激酶激酶2[人]
基因座NM_030662
AA/翻译="MLARRKPVLPALTINPTIAEGPSPTSEGASEANLVDLQKKLEEL
ELDEQQKKRLEAFLTQKAKVGELKDDDFERISELGAGNGGVVTKVQHRPSGLIMARKL IHLEIKPAIRNQIIRELQVLHECNSPYIVGFYGAFYSDGEISICMEHMDGGSLDQVLK EAKRIPEEILGKVSIAVLRGLAYLREKHQIMHRDVKPSNILVNSRGEIKLCDFGVSGQ LIDSMANSFVGTRSYMAPERLQGTHYSVQSDIWSMGLSLVELAVGRYPIPPPDAKELE AIFGRPVVDGEEGEPHSISPRPRPPGRPVSGHGMDSRPAMAIFELLDYIVNEPPPKLP NGVFTPDFQEFVNKCLIKNPAERADLKMLTNHTFIKRSEVEEVDFAGWLCKTLRLNQP GTPTRTAV
17.LDHA:LDHA乳酸脱氢酶A[人]
基因座NM_001135239(同工型2)
AA/翻译="MATLKDQLIYNLLKEEQTPQNKITVVGVGAVGMACAISILMKDL ADELALVDVIEDKLKGEMMDLQHGSLFLRTPKIVSGKVDILTYVAWKISGFPKNRVIG SGCNLDSARFRYLMGERLGVHPLSCHGWVLGEHGDSSVPVWSGMNVAGVSLKTLHPDL GTDKDKEQWKEVHKQVVESAYEVIKLKGYTSWAIGLSVADLAESIMKNLRRVHPVSTM IKGLYGIKDDVFLSVPCILGQNGISDLVKVTLTSEEEARLKKSADTLWGIQKELQF
基因座NM_001165414(同工型3)
AA/翻译="MGEPSGGYTYTQTSIFLFHAKIPFGSKSNMATLKDQLIYNLLKE EQTPQNKITVVGVGAVGMACAISILMKDLADELALVDVIEDKLKGEMMDLQHGSLFLR TPKIVSGKDYNVTANSKLVIITAGARQQEGESRLNLVQRNVNIFKFIIPNVVKYSPNC KLLIVSNPVDILTYVAWKISGFPKNRVIGSGCNLDSARFRYLMGERLGVHPLSCHGWV LGEHGDSSVPVWSGMNVAGVSLKTLHPDLGTDKDKEQWKEVHKQVVESAYEVIKLKGY TSWAIGLSVADLAESIMKNLRRVHPVSTMIKGLYGIKDDVFLSVPCILGQNGISDLVKVTLTSEEEARLKKSADTLWGIQKELQF
基因座NM_001165415(同工型4)
AA/翻译="MATLKDQLIYNLLKEEQTPQNKITVVGVGAVGMACAISILMKDL ADELALVDVIEDKLKGEMMDLQHGSLFLRTPKIVSGKDYNVTANSKLVIITAGARQQE GESRLNLVQRNVNIFKFIIPNVVKYSPNCKLLIVSNPVDILTYVAWKISGFPKNRVIG SGCNLDSARFRYLMGERLGVHPLSCHGWVLGEHGDSSVPVWSGMNVAGVSLKTLHPDL GTDKDKEQWKECRYTLGDPKGAAILKSSDVISFHCLGYNRILGGGCACCPFYLICD
基因座NM_001165416(同工型5)
AA/翻译="MATLKDQLIYNLLKEEQTPQNKITVVGVGAVGMACAISILMKDL ADELALVDVIEDKLKGEMMDLQHGSLFLRTPKIVSGKDYNVTANSKLVIITAGARQQE GESRLNLVQRNVNIFKFIIPNVVKYSPNCKLLIVSNPVDILTYVAWKISGFPKNRVIG SGCNLDSARFRYLMGERLGVHPLSCHGWVLGEHGDSSVPVWSGMNVAGVSLKTLHPDL GTDKDKEQWKEVHKQVVERVFTE
基因座NM_005566(同工型1)
AA/翻译="MATLKDQLIYNLLKEEQTPQNKITVVGVGAVGMACAISILMKDL ADELALVDVIEDKLKGEMMDLQHGSLFLRTPKIVSGKDYNVTANSKLVIITAGARQQE GESRLNLVQRNVNIFKFIIPNVVKYSPNCKLLIVSNPVDILTYVAWKISGFPKNRVIG SGCNLDSARFRYLMGERLGVHPLSCHGWVLGEHGDSSVPVWSGMNVAGVSLKTLHPDL GTDKDKEQWKEVHKQVVESAYEVIKLKGYTSWAIGLSVADLAESIMKNLRRVHPVSTM IKGLYGIKDDVFLSVPCILGQNGISDLVKVTLTSEEEARLKKSADTLWGIQKELQF
18.MAP4:MAP4微管相关蛋白4[人]
基因座NM_001134364(同工型4)
AA/翻译="MADLSLADALTEPSPDIEGEIKRDFIATLEAEAFDDVVGETVGK TDYIPLLDVDEKTGNSESKKKPCSETSQIEDTPSSKPTLLANGGHGVEGSDTTGSPTE FLEEKMAYQEYPNSQNWPEDTNFCFQPEQVVDPIQTDPFKMYHDDDLADLVFPSSATA DTSIFAGQNDPLKDSYGMSPCNTAVVPQGWSVEALNSPHSESFVSPEAVAEPPQPTAV PLELAKEIEMASEERPPAQALEIMMGLKTTDMAPSKETEMALAKDMALATKTEVALAK DMESPTKLDVTLAKDMQPSMESDMALVKDMELPTEKEVALVKDVRWPTETDVSSAKNV VLPTETEVAPAKDVTLLKETERASPIKMDLAPSKDMGPPKENKKETERASPIKMDLAP SKDMGPPKENKIVPAKDLVLLSEIEVAQANDIISSTEISSAEKVALSSETEVALARDM TLPPETNVILTKDKALPLEAEVAPVKDMAQLPETEIAPAKDVAPSTVKEVGLLKDMSP LSETEMALGKDVTPPPETEVVLIKNVCLPPEMEVALTEDQVPALKTEAPLAKDGVLTL ANNVTPAKDVPPLSETEATPVPIKDMEIAQTQKGISEDSHLESLQDVGQSAAPTFMIS PETVTGTGKKCSLPAEEDSVLEKLGERKPCNSQPSELSSETSGIARPEEGRPVVSGTG NDITTPPNKELPPSPEKKTKPLATTQPAKTSTSKAKTQPTSLPKQPAPTTIGGLNKKP MSLASGLVPAAPPKRPAVASARPSILPSKDVKPKPIADAKAPEKRASPSKPASAPASR SGSKSTQTVAKTTTAAAVASTGPSSRSPSTLLPKKPTAIKTEGKPAEVKKMTAKSVPA DLSRPKSTSTSSMKKTTTLSGTAPAAGVVPSRVKATPMPSRPSTTPFIDKKPTSAKPS STTPRLSRLATNTSAPDLKNVRSKVGSTENIKHQPGGGRAKVEKKTEAAATTRKPESN AVTKTAGPIASAQKQPAGKVQIVSKKVSYSHIQSKCGSKDNIKHVPGGGNVQIQNKKVDISKVSSKCGSKANIKHKPGGGDVKIESQKLNFKEKAQAKVGSLDNVGHLPAGGAVKI ETYRLTFRANARARTDHGADIVSRPPHFPGGPNSGSRVLGPLSRAVH
基因座NM_002375(同工型1)
AA/翻译="MADLSLADALTEPSPDIEGEIKRDFIATLEAEAFDDVVGETVGK TDYIPLLDVDEKTGNSESKKKPCSETSQIEDTPSSKPTLLANGGHGVEGSDTTGSPTE FLEEKMAYQEYPNSQNWPEDTNFCFQPEQVVDPIQTDPFKMYHDDDLADLVFPSSATA DTSIFAGQNDPLKDSYGMSPCNTAVVPQGWSVEALNSPHSESFVSPEAVAEPPQPTAV PLELAKEIEMASEERPPAQALEIMMGLKTTDMAPSKETEMALAKDMALATKTEVALAK DMESPTKLDVTLAKDMQPSMESDMALVKDMELPTEKEVALVKDVRWPTETDVSSAKNV VLPTETEVAPAKDVTLLKETERASPIKMDLAPSKDMGPPKENKKETERASPIKMDLAP SKDMGPPKENKIVPAKDLVLLSEIEVAQANDIISSTEISSAEKVALSSETEVALARDM TLPPETNVILTKDKALPLEAEVAPVKDMAQLPETEIAPAKDVAPSTVKEVGLLKDMSP LSETEMALGKDVTPPPETEVVLIKNVCLPPEMEVALTEDQVPALKTEAPLAKDGVLTL ANNVTPAKDVPPLSETEATPVPIKDMEIAQTQKGISEDSHLESLQDVGQSAAPTFMIS PETVTGTGKKCSLPAEEDSVLEKLGERKPCNSQPSELSSETSGIARPEEGRPVVSGTG NDITTPPNKELPPSPEKKTKPLATTQPAKTSTSKAKTQPTSLPKQPAPTTIGGLNKKP MSLASGLVPAAPPKRPAVASARPSILPSKDVKPKPIADAKAPEKRASPSKPASAPASR SGSKSTQTVAKTTTAAAVASTGPSSRSPSTLLPKKPTAIKTEGKPAEVKKMTAKSVPA DLSRPKSTSTSSMKKTTTLSGTAPAAGVVPSRVKATPMPSRPSTTPFIDKKPTSAKPS STTPRLSRLATNTSAPDLKNVRSKVGSTENIKHQPGGGRAKVEKKTEAAATTRKPESN AVTKTAGPIASAQKQPAGKVQIVSKKVSYSHIQSKCGSKDNIKHVPGGGNVQIQNKKVDISKVSSKCGSKANIKHKPGGGDVKIESQKLNFKEKAQAKVGSLDNVGHLPAGGAVKT EGGGSEAPLCPGPPAGEEPAISEAAPEAGAPTSASGLNGHPTLSGGGDQREAQTLDSQ IQETSI
基因座NM_030885(同工型3)
AA/翻译="MADLSLADALTEPSPDIEGEIKRDFIATLEAEAFDDVVGETVGK TDYIPLLDVDEKTGNSESKKKPCSETSQIEDTPSSKPTLLANGGHGVEGSDTTEA
19.MAPK1:MAPK1有丝分裂原激活蛋白激酶1[人]
基因座NM_002745(同工型1)
AA/翻译="MAAAAAAGAGPEMVRGQVFDVGPRYTNLSYIGEGAYGMVCSAYD NVNKVRVAIKKISPFEHQTYCQRTLREIKILLRFRHENIIGINDIIRAPTIEQMKDVY IVQDLMETDLYKLLKTQHLSNDHICYFLYQILRGLKYIHSANVLHRDLKPSNLLLNTT CDLKICDFGLARVADPDHDHTGFLTEYVATRWYRAPEIMLNSKGYTKSIDIWSVGCIL AEMLSNRPIFPGKHYLDQLNHILGILGSPSQEDLNCIINLKARNYLLSLPHKNKVPWN RLFPNADSKALDLLDKMLTFNPHKRIEVEQALAHPYLEQYYDPSDEPIAEAPFKFDMELDDLPKEKLKELIFEETARFQPGYRS
基因座NM_138957(同工型2)
AA/翻译="MAAAAAAGAGPEMVRGQVFDVGPRYTNLSYIGEGAYGMVCSAYD NVNKVRVAIKKISPFEHQTYCQRTLREIKILLRFRHENIIGINDIIRAPTIEQMKDVY IVQDLMETDLYKLLKTQHLSNDHICYFLYQILRGLKYIHSANVLHRDLKPSNLLLNTT CDLKICDFGLARVADPDHDHTGFLTEYVATRWYRAPEIMLNSKGYTKSIDIWSVGCIL AEMLSNRPIFPGKHYLDQLNHILGILGSPSQEDLNCIINLKARNYLLSLPHKNKVPWN RLFPNADSKALDLLDKMLTFNPHKRIEVEQALAHPYLEQYYDPSDEPIAEAPFKFDMELDDLPKEKLKELIFEETARFQPGYRS
20.MARCKS:MARCKS豆蔻酰化富丙氨酸蛋白激酶C底物[人]
基因座NM_002356
AA/翻译="MGAQFSKTAAKGEAAAERPGEAAVASSPSKANGQENGHVKVNGD ASPAAAESGAKEELQANGSAPAADKEEPAAAGSGAASPSAAEKGEPAAAAAPEAGASP VEKEAPAEGEAAEPGSPTAAEGEAASAASSTSSPKAEDGATPSPSNETPKKKKKRFSF KKSFKLSGFSFKKNKKEAGEGGEAEAPAAEGGKDEAAGGAAAAAAEAGAASGEQAAAP GEEAAAGEEGAAGGDPQEAKPQEAAVAPEKPPASDETKAAEEPSKVEEKKAEEAGASA AACEAPSAAGPGAPPEQEAAPAEEPAAAAASSACAAPSQEAQPECSPEAPPAEAAE
21.NME1:NME1 NME/NM23核苷二磷酸激酶1[人]
基因座NM_000269(同工型b)
AA/翻译="MANCERTFIAIKPDGVQRGLVGEIIKRFEQKGFRLVGLKFMQAS EDLLKEHYVDLKDRPFFAGLVKYMHSGPVVAMVWEGLNVVKTGRVMLGETNPADSKPG TIRGDFCIQVGRNIIHGSDSVESAEKEIGLWFHPEELVDYTSCAQNWIYE
基因座NM_198175(同工型1)
AA/翻译="MVLLSTLGIVFQGEGPPISSCDTGTMANCERTFIAIKPDGVQRG LVGEIIKRFEQKGFRLVGLKFMQASEDLLKEHYVDLKDRPFFAGLVKYMHSGPVVAMV WEGLNVVKTGRVMLGETNPADSKPGTIRGDFCIQVGRNIIHGSDSVESAEKEIGLWFH PEELVDYTSCAQNWIYE
22.NME2:NME2 NME/NM23核苷二磷酸激酶2[人]
基因座NM_001018137(同工型a变体2)
AA/翻译="MANLERTFIAIKPDGVQRGLVGEIIKRFEQKGFRLVAMKFLRAS EEHLKQHYIDLKDRPFFPGLVKYMNSGPVVAMVWEGLNVVKTGRVMLGETNPADSKPG TIRGDFCIQVGRNIIHGSDSVKSAEKEISLWFKPEELVDYKSCAHDWVYE
基因座NM_001018138(同工型a变体3)
AA/翻译="MANLERTFIAIKPDGVQRGLVGEIIKRFEQKGFRLVAMKFLRAS EEHLKQHYIDLKDRPFFPGLVKYMNSGPVVAMVWEGLNVVKTGRVMLGETNPADSKPG TIRGDFCIQVGRNIIHGSDSVKSAEKEISLWFKPEELVDYKSCAHDWVYE
基因座NM_001018139(同工型a变体4)
AA/翻译="MANLERTFIAIKPDGVQRGLVGEIIKRFEQKGFRLVAMKFLRAS EEHLKQHYIDLKDRPFFPGLVKYMNSGPVVAMVWEGLNVVKTGRVMLGETNPADSKPG TIRGDFCIQVGRNIIHGSDSVKSAEKEISLWFKPEELVDYKSCAHDWVYE
基因座NM_001198682(同工型b变体5)
AA/翻译="MANLERTFIAIKPDGVQRGLVGEIIKRFEQKGFRLVAMKFLRAS EEHLKQHYIDLKDRPFFPGLVKYMNSGPVVAMEHHSWQ
基因座NM_002512(同工型a变体1)
AA/翻译="MANLERTFIAIKPDGVQRGLVGEIIKRFEQKGFRLVAMKFLRAS EEHLKQHYIDLKDRPFFPGLVKYMNSGPVVAMVWEGLNVVKTGRVMLGETNPADSKPG TIRGDFCIQVGRNIIHGSDSVKSAEKEISLWFKPEELVDYKSCAHDWVYE
23.PGK1:PGK1磷酸甘油酸激酶1[人]
基因座NM_000291
AA/翻译="MSLSNKLTLDKLDVKGKRVVMRVDFNVPMKNNQITNNQRIKAAV PSIKFCLDNGAKSVVLMSHLGRPDGVPMPDKYSLEPVAVELKSLLGKDVLFLKDCVGP EVEKACANPAAGSVILLENLRFHVEEEGKGKDASGNKVKAEPAKIEAFRASLSKLGDV YVNDAFGTAHRAHSSMVGVNLPQKAGGFLMKKELNYFAKALESPERPFLAILGGAKVA DKIQLINNMLDKVNEMIIGGGMAFTFLKVLNNMEIGTSLFDEEGAKIVKDLMSKAEKN GVKITLPVDFVTADKFDENAKTGQATVASGIPAGWMGLDCGPESSKKYAEAVTRAKQI VWNGPVGVFEWEAFARGTKALMDEVVKATSRGCITIIGGGDTATCCAKWNTEDKVSHV STGGGASLELLEGKVLPGVDALSNI
24.PGK2:PGK2磷酸甘油酸激酶2[人]
基因座NM_138733
AA/翻译="MSLSKKLTLDKLDVRGKRVIMRVDFNVPMKKNQITNNQRIKASI PSIKYCLDNGAKAVVLMSHLGRPDGVPMPDKYSLAPVAVELKSLLGKDVLFLKDCVGA EVEKACANPAPGSVILLENLRFHVEEEGKGQDPSGKKIKAEPDKIEAFRASLSKLGDV YVNDAFGTAHRAHSSMVGVNLPHKASGFLMKKELDYFAKALENPVRPFLAILGGAKVA DKIQLIKNMLDKVNEMIIGGGMAYTFLKVLNNMEIGASLFDEEGAKIVKDIMAKAQKN GVRITFPVDFVTGDKFDENAQVGKATVASGISPGWMGLDCGPESNKNHAQVVAQARLI VWNGPLGVFEWDAFAKGTKALMDEIVKATSKGCITVIGGGDTATCCAKWNTEDKVSHV STGGGASLELLEGKILPGVEALSNM
25.RAB7A:RAB7A RAB7A,成员RAS致癌基因家族[人]
基因座NM_004637
AA/翻译="MTSRKKVLLKVIILGDSGVGKTSLMNQYVNKKFSNQYKATIGAD FLTKEVMVDDRLVTMQIWDTAGQERFQSLGVAFYRGADCCVLVFDVTAPNTFKTLDSW RDEFLIQASPRDPENFPFVVLGNKIDLENRQVATKRAQAWCYSKNNIPYFETSAKEAI NVEQAFQTIARNALKQETEVELYNEFPEPIKLDKNDRAKASAESCSC
26.RPL17:RPL17核糖体蛋白L17[人]
基因座NM_000985(同工型A变体1)
AA/翻译="MVRYSLDPENPTKSCKSRGSNLRVHFKNTRETAQAIKGMHIRKA TKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGRWPKKSAEFLLHMLKNAESNA ELKGLDVDSLVIEHIQVNKAPKMRRRTYRAHGRINPYMSSPCHIEMILTEKEQIVPKP EEEVAQKKKISQKKLKKQKLMARE
基因座NM_001035006(同工型a变体2)
AA/翻译="MVRYSLDPENPTKSCKSRGSNLRVHFKNTRETAQAIKGMHIRKA TKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGRWPKKSAEFLLHMLKNAESNA ELKGLDVDSLVIEHIQVNKAPKMRRRTYRAHGRINPYMSSPCHIEMILTEKEQIVPKP EEEVAQKKKISQKKLKKQKLMARE
基因座NM_001199340(同工型a变体3)
AA/翻译="MVRYSLDPENPTKSCKSRGSNLRVHFKNTRETAQAIKGMHIRKA TKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGRWPKKSAEFLLHMLKNAESNA ELKGLDVDSLVIEHIQVNKAPKMRRRTYRAHGRINPYMSSPCHIEMILTEKEQIVPKP EEEVAQKKKISQKKLKKQKLMARE
基因座NM_001199341(同工型a变体4)
AA/翻译="MVRYSLDPENPTKSCKSRGSNLRVHFKNTRETAQAIKGMHIRKA TKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGRWPKKSAEFLLHMLKNAESNA ELKGLDVDSLVIEHIQVNKAPKMRRRTYRAHGRINPYMSSPCHIEMILTEKEQIVPKP EEEVAQKKKISQKKLKKQKLMARE
基因座NM_001199342(同工型A变体5)
AA/翻译="MVRYSLDPENPTKSCKSRGSNLRVHFKNTRETAQAIKGMHIRKA TKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGRWPKKSAEFLLHMLKNAESNA ELKGLDVDSLVIEHIQVNKAPKMRRRTYRAHGRINPYMSSPCHIEMILTEKEQIVPKP EEEVAQKKKISQKKLKKQKLMARE
基因座NM_001199343(同工型a变体6)
AA/翻译="MVRYSLDPENPTKSCKSRGSNLRVHFKNTRETAQAIKGMHIRKA TKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGRWPKKSAEFLLHMLKNAESNA ELKGLDVDSLVIEHIQVNKAPKMRRRTYRAHGRINPYMSSPCHIEMILTEKEQIVPKP EEEVAQKKKISQKKLKKQKLMARE
基因座NM_001199344(同工型a变体7)
AA/翻译="MVRYSLDPENPTKSCKSRGSNLRVHFKNTRETAQAIKGMHIRKA TKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGRWPKKSAEFLLHMLKNAESNA ELKGLDVDSLVIEHIQVNKAPKMRRRTYRAHGRINPYMSSPCHIEMILTEKEQIVPKP EEEVAQKKKISQKKLKKQKLMARE
基因座NM_001199345(同工型b变体8)
AA/翻译="MHIRKATKYLKDVTLQKQCVPFRRYNGGVGRCAQAKQWGWTQGR WPKKSAEFLLHMLKNAESNAELKGLDVDSLVIEHIQVNKAPKMRRRTYRAHGRINPYM SSPCHIEMILTEKEQIVPKPEEEVAQKKKISQKKLKKQKLMARE
27.RPL28:RPL28核糖体蛋白L28[人]
基因座NM_000991(同工型2)
AA/翻译="MSAHLQWMVVRNCSSFLIKRNKQTYSTEPNNLKARNSFRYNGLI HRKTVGVEPAADGKGVVVVIKRRSGQRKPATSYVRTTINKNARATLSSIRHMIRKNKY RPDLRMAAIRRASAILRSQKPVMVKRKRTRPTKSS
基因座NM_001136134(同工型1)
AA/翻译="MSAHLQWMVVRNCSSFLIKRNKQTYSTEPNNLKARNSFRYNGLI HRKTVGVEPAADGKGVVVVIKRRSGQRKPATSYVRTTINKNARATLSSIRHMIRKNKY RPDLRMVSWGLGIRLGETGQCCGEGPPTTGCNMGWRGMDSCFQPTPHTQHWPRGRLVE CMG
基因座NM_001136135(同工型3)
AA/翻译="MSAHLQWMVVRNCSSFLIKRNKQTYSTEPNNLKARNSFRYNGLI HRKTVGVEPAADGKGVVVVIKRRSGQRKPATSYVRTTINKNARATLSSIRHMIRKNKY RPDLRMDMLASTGSGLCCSVAVQPWASSSTSLCLRTLICNMRVDRPYYSGLMRRLNVQ NLLDCAHKS
基因座NM_001136136(同工型4)
AA/翻译="MSAHLQWMVVRNCSSFLIKRNKQTYSTEPNNLKARNSFRYNGLI HRKTVGVEPAADGKGVVVVIKRRSGEFCLVWARERPLSRVWEL
基因座NM_001136137(同工型5)
AA/翻译="MSAHLQWMVVRNCSSFLIKRNKQTYSTEPNNLKARNSFRYNGLIHRKTVGVEPAADGKGVVVVIKRRSE
28.RPS5:RPS5核糖体蛋白S5[人]
基因座NM_001009
AA/翻译="MTEWETAAPAVAETPDIKLFGKWSTDDVQINDISLQDYIAVKEK YAKYLPHSAGRYAAKRFRKAQCPIVERLTNSMMMHGRNNGKKLMTVRIVKHAFEIIHL LTGENPLQVLVNAIINSGPREDSTRIGRAGTVRRQAVDVSPLRRVNQAIWLLCTGARE AAFRNIKTIAECLADELINAAKGSSNSYAIKKKDELERVAKSNR
29.RPS6:RPS6核糖体蛋白S6[人]
基因座NM_001010
AA/翻译="MKLNISFPATGCQKLIEVDDERKLRTFYEKRMATEVAADALGEE WKGYVVRISGGNDKQGFPMKQGVLTHGRVRLLLSKGHSCYRPRRTGERKRKSVRGCIV DANLSVLNLVIVKKGEKDIPGLTDTTVPRRLGPKRASRIRKLFNLSKEDDVRQYVVRK PLNKEGKKPRTKAPKIQRLVTPRVLQHKRRRIALKKQRTKKNKEEAAEYAKLLAKRMK EAKEKRQEQIAKRRRLSSLRASTSKSESSQK
30.SLTM:SLTM SAFB-样,转录调节子[人]
基因座NM_001013843(同工型b)
AA/翻译="MAAATGAVAASAASGQAEGKKITDLRVIDLKSELKRRNLDITGV KTVLISRLKQAIEEEGGDPDNIELTVSTDTPNKKPTKGKGKKHEADELSGDASVEDDA FIKDCELENQEAHEQDGNDELKDSEEFGENEEENVHSKELLSAEENKRAHELIEAEGI EDIEKEDIESQEIEAQEGEDDTFLTAQDGEEEENEKEGSLAEADHTAHEEMEAHTTVK EAEDDNISVTIQAEDAITLDFDGDDLLETGKNVKITDSEASKPKDGQDAIAQSPEKES KDYEMNANHKDGKKEDCVKGDPVEKEARESSKKAESGDKEKDTLKKGPSSTGASGQAK SSSKESKDSKTSSKDDKGSTSSTSGSSGSSTKNIWVSGLSSNTKAADLKNLFGKYGKV LSAKVVTNARSPGAKCYGIVTMSSSTEVSRCIAHLHRTELHGQLISVEKVKGDPSKKE MKKENDEKSSSRSSGDKKNTSDRSSKTQASVKKEEKRSSEKSEKKESKDTKKIEGKDE KNDNGASGQTSESIKKSEEKKRISSKSPGHMVILDQTKGDHCRPSRRGRYEKIHGRSK EKERASLDKKRDKDYRRKEILPFEKMKEQRLREHLVRFERLRRAMELRRRREIAERER RERERIRIIREREERERLQRERERLEIERQKLERERMERERLERERIRIEQERRKEAE RIAREREELRRQQQQLRYEQEKRNSLKRPRDVDHRRDDPYWSENKKLSLDTDARFGHG SDYSRQQNRFNDFDHRERGRFPESSAVQSSSFERRDRFVGQSEGKKARPTARREDPSF ERYPKNFSDSRRNEPPPPRNELRESDRREVRGERDERRTVIIHDRPDITHPRHPREAG PNPSRPTSWKSEGSMSTDKRETRVERPERSGREVSGHSVRGAPPGNRSSASGYGSREG DRGVITDRGGGSQHYPEERHVVERHGRDTSGPRKEWHGPPSQGPSYHDTRRMGDGRAG AGMITQHSSNASPINRIVQISGNSMPRGSGSGFKPFKGGPPRRF
基因座NM_024755(同工型a)
AA/翻译="MAAATGAVAASAASGQAEGKKITDLRVIDLKSELKRRNLDITGV KTVLISRLKQAIEEEGGDPDNIELTVSTDTPNKKPTKGKGKKHEADELSGDASVEDDA FIKDCELENQEAHEQDGNDELKDSEEFGENEEENVHSKELLSAEENKRAHELIEAEGI EDIEKEDIESQEIEAQEGEDDTFLTAQDGEEEENEKDIAGSGDGTQEVSKPLPSEGSL AEADHTAHEEMEAHTTVKEAEDDNISVTIQAEDAITLDFDGDDLLETGKNVKITDSEA SKPKDGQDAIAQSPEKESKDYEMNANHKDGKKEDCVKGDPVEKEARESSKKAESGDKE KDTLKKGPSSTGASGQAKSSSKESKDSKTSSKDDKGSTSSTSGSSGSSTKNIWVSGLS SNTKAADLKNLFGKYGKVLSAKVVTNARSPGAKCYGIVTMSSSTEVSRCIAHLHRTEL HGQLISVEKVKGDPSKKEMKKENDEKSSSRSSGDKKNTSDRSSKTQASVKKEEKRSSE KSEKKESKDTKKIEGKDEKNDNGASGQTSESIKKSEEKKRISSKSPGHMVILDQTKGD HCRPSRRGRYEKIHGRSKEKERASLDKKRDKDYRRKEILPFEKMKEQRLREHLVRFER LRRAMELRRRREIAERERRERERIRIIREREERERLQRERERLEIERQKLERERMERE RLERERIRIEQERRKEAERIAREREELRRQQQQLRYEQEKRNSLKRPRDVDHRRDDPY WSENKKLSLDTDARFGHGSDYSRQQNRFNDFDHRERGRFPESSAVQSSSFERRDRFVG QSEGKKARPTARREDPSFERYPKNFSDSRRNEPPPPRNELRESDRREVRGERDERRTV IIHDRPDITHPRHPREAGPNPSRPTSWKSEGSMSTDKRETRVERPERSGREVSGHSVR GAPPGNRSSASGYGSREGDRGVITDRGGGSQHYPEERHVVERHGRDTSGPRKEWHGPP SQGPSYHDTRRMGDGRAGAGMITQHSSNASPINRIVQISGNSMPRGSGSGFKPFKGGPPRRF
31.TMED4:TMED4跨膜emp24蛋白含转运结构域4[人]
基因座NM_182547
AA/翻译="MAGVGAGPLRAMGRQALLLLALCATGAQGLYFHIGETEKRCFIE EIPDETMVIGNYRTQMWDKQKEVFLPSTPGLGMHVEVKDPDGKVVLSRQYGSEGRFTF TSHTPGDHQICLHSNSTRMALFAGGKLRVHLDIQVGEHANNYPEIAAKDKLTELQLRA RQLLDQVEQIQKEQDYQRYREERFRLTSESTNQRVLWWSIAQTVILILTGIWQMRHLK SFFEAKKLV
32.TNRCBA:ADRBK1肾上腺素能,β,受体激酶1[人]
基因座NM_001619
AA/翻译="MADLEAVLADVSYLMAMEKSKATPAARASKKILLPEPSIRSVMQ KYLEDRGEVTFEKIFSQKLGYLLFRDFCLNHLEEARPLVEFYEEIKKYEKLETEEERV ARSREIFDSYIMKELLACSHPFSKSATEHVQGHLGKKQVPPDLFQPYIEEICQNLRGD VFQKFIESDKFTRFCQWKNVELNIHLTMNDFSVHRIIGRGGFGEVYGCRKADTGKMYA MKCLDKKRIKMKQGETLALNERIMLSLVSTGDCPFIVCMSYAFHTPDKLSFILDLMNG GDLHYHLSQHGVFSEADMRFYAAEIILGLEHMHNRFVVYRDLKPANILLDEHGHVRIS DLGLACDFSKKKPHASVGTHGYMAPEVLQKGVAYDSSADWFSLGCMLFKLLRGHSPFR QHKTKDKHEIDRMTLTMAVELPDSFSPELRSLLEGLLQRDVNRRLGCLGRGAQEVKES PFFRSLDWQMVFLQKYPPPLIPPRGEVNAADAFDIGSFDEEDTKGIKLLDSDQELYRN FPLTISERWQQEVAETVFDTINAETDRLEARKKAKNKQLGHEEDYALGKDCIMHGYMS KMGNPFLTQWQRRYFYLFPNRLEWRGEGEAPQSLLTMEEIQSVEETQIKERKCLLLKI RGGKQFILQCDSDPELVQWKKELRDAYREAQQLVQRVPKMKNKPRSPVVELSKVPLVQ RGSANGL
33.TUBB:TUBB微管蛋白,βI类[人]
基因座NM_178014
AA/翻译="MREIVHIQAGQCGNQIGAKFWEVISDEHGIDPTGTYHGDSDLQL DRISVYYNEATGGKYVPRAILVDLEPGTMDSVRSGPFGQIFRPDNFVFGQSGAGNNWA KGHYTEGAELVDSVLDVVRKEAESCDCLQGFQLTHSLGGGTGSGMGTLLISKIREEYP DRIMNTFSVVPSPKVSDTVVEPYNATLSVHQLVENTDETYCIDNEALYDICFRTLKLT TPTYGDLNHLVSATMSGVTTCLRFPGQLNADLRKLAVNMVPFPRLHFFMPGFAPLTSR GSQQYRALTVPELTQQVFDAKNMMAACDPRHGRYLTVAAVFRGRMSMKEVDEQMLNVQ NKNSSYFVEWIPNNVKTAVCDIPPRGLKMAVTFIGNSTAIQELFKRISEQFTAMFRRK AFLHWYTGEGMDEMEFTEAESNMNDLVSEYQQYQDATAEEEEDFGEEAEEEA
34.UBE21:UBE2I遍在蛋白偶联酶E2I[人]
基因座NM_003345(变体1)
AA/翻译="MSGIALSRLAQERKAWRKDHPFGFVAVPTKNPDGTMNLMNWECA IPGKKGTPWEGGLFKLRMLFKDDYPSSPPKCKFEPPLFHPNVYPSGTVCLSILEEDKD WRPAITIKQILLGIQELLNEPNIQDPAQAEAYTIYCQNRVEYEKRVRAQAKKFAPS
基因座NM_194259(变体2)
AA/翻译="MSGIALSRLAQERKAWRKDHPFGFVAVPTKNPDGTMNLMNWECA IPGKKGTPWEGGLFKLRMLFKDDYPSSPPKCKFEPPLFHPNVYPSGTVCLSILEEDKD WRPAITIKQILLGIQELLNEPNIQDPAQAEAYTIYCQNRVEYEKRVRAQAKKFAPS
基因座NM_194260(变体3)
AA/翻译="MSGIALSRLAQERKAWRKDHPFGFVAVPTKNPDGTMNLMNWECA IPGKKGTPWEGGLFKLRMLFKDDYPSSPPKCKFEPPLFHPNVYPSGTVCLSILEEDKD WRPAITIKQILLGIQELLNEPNIQDPAQAEAYTIYCQNRVEYEKRVRAQAKKFAPS
基因座NM_194261(变体4)
AA/翻译="MSGIALSRLAQERKAWRKDHPFGFVAVPTKNPDGTMNLMNWECA IPGKKGTPWEGGLFKLRMLFKDDYPSSPPKCKFEPPLFHPNVYPSGTVCLSILEEDKD WRPAITIKQILLGIQELLNEPNIQDPAQAEAYTIYCQNRVEYEKRVRAQAKKFAPS
Claims (45)
1.一种用于鉴别生物系统的调节子的方法,所述方法包括:
(1)使用与该生物系统相关的细胞建立该生物系统的模型来代表该生物系统的特征性方面;
(2)从所述模型获得第一数据集,其中所述第一数据集代表与该生物系统相关的细胞中的总体蛋白质组学改变;
(3)从所述模型获得第二数据集,其中所述第二数据集代表与该生物系统相关的细胞的一种或多种功能活性或细胞反应,其中所述细胞的一种或多种功能活性或细胞反应包括与该生物系统相关的细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应;
(4)用编程的计算设备,仅仅基于所述第一数据集和第二数据集,生成与所述总体蛋白质组学改变和所述一种或多种功能活性或细胞反应相关的第一因果关系网络,其中所述第一因果关系网络是包括关于所述总体蛋白质组学改变和所述一种或多种功能活性或细胞反应之中的关系的定量概率定向信息的因果关系贝叶斯网络,且其中所述第一因果关系网络的生成不基于所述第一数据集和第二数据集以外的任何已知的生物学关系;
(5)从所述第一因果关系网络和基于对照细胞数据的第二因果关系网络生成差异因果关系网络;和
(6)从所述生成的差异因果关系网络鉴别在该生物系统中独特的因果关系,其中与该独特的因果关系相关的至少一种酶被确定为该生物系统的调节子。
2.如权利要求1的方法,其中所述第一数据集还代表表征与所述生物系统相关的细胞的脂质组学数据。
3.如权利要求2的方法,其中所述第一因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据和所述细胞的一种或多种功能活性或细胞反应之中生成,其中所述细胞的一种或多种功能活性或细胞反应包括总体酶学活性和/或总体酶学活性对至少一种酶代谢产物或底物的效应。
4.如权利要求1的方法,其中所述第一数据集还代表表征所述与生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种。
5.如权利要求1的方法,其中所述第一数据集还代表表征所述与生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的两种或更多种。
6.如权利要求4或5的方法,其中所述第一因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种与所述细胞的一种或多种功能活性或细胞反应之中生成,其中所述细胞的一种或多种功能活性或细胞反应包括总体酶学活性和/或总体酶学活性对至少一种酶代谢产物或底物的效应。
7.如权利要求1-6中任一项的方法,其中所述总体酶学活性包括总体激酶活性。
8.如权利要求1-7中任一项的方法,其中所述总体酶学活性对酶代谢产物或底物的效应包括所述细胞的磷酸化蛋白质组。
9.如权利要求1-8中任一项的方法,其中所述代表细胞的一种或多种功能活性或细胞反应的第二数据集还包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。
10.如权利要求1-8中任一项的方法,其中所述第一因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种与所述细胞的一种或多种功能活性或细胞反应之中生成,其中所述细胞的一种或多种功能活性或细胞反应包括总体酶学活性和/或总体酶学活性对至少一种酶代谢产物或底物的效应且还包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。
11.如权利要求1-10中任一项的方法,其中所述对照细胞数据包括代表对照细胞中的总体蛋白质组学改变的第一对照数据集和代表对照细胞的一种或多种功能活性或细胞反应的第二对照数据集,其中所述对照细胞的一种或多种功能活性或细胞反应包括对照细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应;和
其中该方法进一步包括,在步骤(5)之前,用编程的计算设备,仅仅基于所述第一对照数据集和第二对照数据集,生成与所述总体蛋白质组学改变和所述一种或多种功能活性或细胞反应相关的第二因果关系网络,其中所述第二因果关系网络的生成不基于所述第一对照数据集和第二对照数据集以外的任何已知的生物学关系。
12.如权利要求11的方法,其中所述与生物系统相关的细胞经受环境扰动,且所述对照细胞是没有经受环境扰动的与生物系统相关的相同细胞。
13.如权利要求12的方法,其中所述环境扰动包括与生物活性剂的接触、培养条件的变化、遗传修饰/突变的引入和引起遗传修饰/突变的媒介的引入中的一种或多种。
14.如权利要求13的方法,其中所述环境扰动包括使所述细胞与酶活性抑制剂接触。
15.如权利要求14的方法,其中所述酶活性抑制剂是激酶抑制剂。
16.如权利要求13的方法,其中所述环境扰动包括使所述细胞与CoQ10接触。
17.如权利要求14的方法,其中所述环境扰动还包括使所述细胞与CoQ10接触。
18.如权利要求1的方法,其中所述生成步骤通过基于人工智能(AI)的信息学平台完成。
19.如权利要求18的方法,其中所述基于AI的信息学平台接受来自所述第一数据集和第二数据集的所有数据输入而不应用统计截止点。
20.如权利要求1的方法,其中所生成的第一因果关系网络是第一模拟因果关系网络,且其中步骤(4)进一步包括:
(i)仅基于所述第一数据集和第二数据集生成第一一致因果关系网络;和
(ii)通过基于输入数据的计算机模拟优化所述第一一致因果关系网络到第一模拟因果关系网络,以对于所述第一因果关系网络内的一个或多个因果关系提供预测的置信水平。
21.如权利要求1-20中任一项的方法,其中所述确定的独特因果关系是选自下组的至少一对之间的关系:基因的表达和脂质的水平;基因的表达和转录物的水平;基因的表达和代谢产物的水平;第一基因的表达和第二基因的表达;基因的表达和SNP的存在;基因的表达和功能活性;脂质的水平和转录物的水平;脂质的水平和代谢产物的水平;第一脂质的水平和第二脂质的水平;脂质的水平和SNP的存在;脂质的水平和功能活性;第一转录物的水平和第二转录物的水平;转录物的水平和代谢产物的水平;转录物的水平和SNP的存在;第一转录物的水平和功能活性的水平;第一代谢产物的水平和第二代谢产物的水平;代谢产物的水平和SNP的存在;代谢产物的水平和功能活性;第一SNP的存在和第二SNP的存在;及SNP的存在和功能活性。
22.如权利要求1-21中任一项的方法,其中所述确定的独特因果关系是至少脂质的水平、基因的表达和一种或多种功能活性之间的关系,其中所述功能活性是总体激酶活性。
23.如权利要求1的方法,其中所述生物系统是疾病过程;
其中使用疾病相关细胞建立该疾病过程的模型以代表该疾病过程的特征性方面;
其中所述第一数据集代表疾病相关细胞中的总体蛋白质组学改变;
其中所述第二数据集代表所述疾病相关细胞的一种或多种功能活性或细胞反应,其中所述细胞的一种或多种功能活性或细胞反应包括疾病相关细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应;和
其中从所述生成的差异因果关系网络鉴别在所述生物系统中独特的因果关系包括鉴别在所述疾病过程中独特的因果关系,其中与该独特的因果关系相关的至少一种酶被确定为所述疾病过程的调节子。
24.如权利要求23的方法,其中所述第一数据集还代表表征所述疾病相关细胞的脂质组学数据。
25.如权利要求24的方法,其中所述第一因果关系网络在所述总体蛋白质组学改变、脂质组学数据和所述细胞的一种或多种功能活性或细胞反应之中生成,其中所述细胞的一种或多种功能活性或细胞反应包括疾病相关细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应。
26.如权利要求23的方法,其中所述第一数据集还代表表征所述疾病相关细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种。
27.如权利要求26的方法,其中所述第一数据集还代表表征所述疾病相关细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的两种或更多种。
28.如权利要求26或27的方法,其中所述因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种与所述细胞的一种或多种功能活性或细胞反应之中生成,其中所述细胞的一种或多种功能活性或细胞反应包括疾病相关细胞中的总体酶学活性和/或总体酶学活性对至少一种酶代谢产物或底物的效应。
29.如权利要求23-28中任一项的方法,其中所述总体酶学活性包括总体激酶活性,且其中所述总体酶学活性对酶代谢产物或底物的效应包括所述细胞的磷酸化蛋白质组。
30.如权利要求23-29中任一项的方法,其中所述代表细胞的一种或多种功能活性或细胞反应的第二数据集还包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。
31.如权利要求30的方法,其中所述第一因果关系网络在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种与所述细胞的一种或多种功能活性或细胞反应之中生成,其中所述细胞的一种或多种功能活性或细胞反应包括生物能量学、细胞增殖、细胞凋亡、细胞器功能、细胞迁移、管形成、趋化性、细胞外基质降解、出芽和通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现的基因型-表型相关性中的一种或多种。
32.如权利要求23-31中任一项的方法,其中所述疾病过程是癌症、糖尿病、肥胖症、心血管疾病、年龄相关性黄斑变性、糖尿病性视网膜病或炎性疾病。
33.如权利要求23-31中任一项的方法,其中所述疾病过程包括血管生成。
34.如权利要求23-31中任一项的方法,其中所述疾病过程包括肝细胞癌、肺癌、乳腺癌、前列腺癌、黑色素瘤、癌瘤、肉瘤、淋巴瘤、白血病、鳞状细胞癌、结肠直肠癌、胰腺癌、甲状腺癌、子宫内膜癌、膀胱癌、肾癌、实体瘤、白血病、非霍奇金淋巴瘤或耐药性癌症。
35.如权利要求23-31任一项的方法,其中所述对照细胞数据包括代表对照细胞中的总体蛋白质组学改变的第一对照数据集和代表对照细胞的一种或多种功能活性或细胞反应的第二对照数据集,其中所述对照细胞的一种或多种功能活性或细胞反应包括对照细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应;和
其中该方法在步骤(5)之前进一步包括用编程的计算设备,仅仅基于所述第一对照数据集和第二对照数据集,生成与所述总体蛋白质组学改变和所述一种或多种功能活性或细胞反应相关的第二因果关系网络,其中所述第二因果关系网络的生成不基于所述第一对照数据集和第二对照数据集以外的任何已知的生物学关系。
36.如权利要求35的方法,其中所述疾病相关细胞经受环境扰动,且所述对照细胞是没有经受环境扰动的相同疾病相关细胞。
37.如权利要求36的方法,其中所述环境扰动包括与生物活性剂的接触、培养条件的变化、遗传修饰/突变的引入和引起遗传修饰/突变的媒介的引入中的一种或多种。
38.如权利要求37的方法,其中所述环境扰动包括使所述细胞与酶活性抑制剂接触。
39.如权利要求38的方法,其中所述酶活性抑制剂是激酶抑制剂。
40.如权利要求37的方法,其中所述环境扰动包括使所述细胞与CoQ10接触。
41.如权利要求23的方法,其中所述疾病过程的特征性方面包括缺氧状态、高血糖状态、富乳酸培养条件或它们的组合。
42.如权利要求23的方法,其中所述生成步骤通过基于人工智能(AI)的信息学平台完成。
43.如权利要求23的方法,其中所述基于AI的信息学平台接受来自所述第一数据集和第二数据集的所有数据输入而不应用统计截止点。
44.如权利要求23的方法,其中所述生成的第一因果关系网络是第一模拟因果关系网络,且其中步骤(4)包括:
(i)仅基于所述第一数据集和第二数据集生成第一一致因果关系网络;和
(ii)通过基于输入数据的计算机模拟优化所述第一一致因果关系网络到第一模拟因果关系网络,以对于所述第一因果关系网络内的一个或多个因果关系提供预测的置信水平。
45.如权利要求1的方法,其中所述第一数据集还代表表征与该生物系统相关的细胞的脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种;
其中所述与该生物系统相关的细胞中的总体酶学活性和/或总体酶学活性对酶代谢产物或底物的效应是与该生物系统相关的细胞中的总体激酶活性和/或总体激酶活性对激酶代谢产物或底物的效应;
其中所述因果关系网络使用编程的计算设备,仅仅基于所述第一数据集和第二数据集在所述总体蛋白质组学改变、所述脂质组学数据、代谢组学数据、转录组学数据、基因组学数据和SNP数据中的一种或多种与所述一种或多种功能活性或细胞反应之中生成;
其中与该独特的因果关系相关的至少一种激酶被确定为该生物系统的调节子。
Applications Claiming Priority (13)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201261619326P | 2012-04-02 | 2012-04-02 | |
| US61/619,326 | 2012-04-02 | ||
| US201261620305P | 2012-04-04 | 2012-04-04 | |
| US61/620,305 | 2012-04-04 | ||
| US201261665631P | 2012-06-28 | 2012-06-28 | |
| US61/665,631 | 2012-06-28 | ||
| US201261668617P | 2012-07-06 | 2012-07-06 | |
| US61/668,617 | 2012-07-06 | ||
| US201261678596P | 2012-08-01 | 2012-08-01 | |
| US201261678590P | 2012-08-01 | 2012-08-01 | |
| US61/678,596 | 2012-08-01 | ||
| US61/678,590 | 2012-08-01 | ||
| CN201280073683.2A CN104520435A (zh) | 2012-04-02 | 2012-09-07 | 基于细胞的探询式分析及其应用 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201280073683.2A Division CN104520435A (zh) | 2012-04-02 | 2012-09-07 | 基于细胞的探询式分析及其应用 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN110456035A true CN110456035A (zh) | 2019-11-15 |
Family
ID=49235335
Family Applications (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201711192165.3A Active CN108048521B (zh) | 2012-04-02 | 2012-09-07 | 基于细胞的探询式分析及其应用 |
| CN201280073683.2A Pending CN104520435A (zh) | 2012-04-02 | 2012-09-07 | 基于细胞的探询式分析及其应用 |
| CN201910734226.7A Pending CN110456035A (zh) | 2012-04-02 | 2012-09-07 | 基于细胞的探询式分析及其应用 |
Family Applications Before (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201711192165.3A Active CN108048521B (zh) | 2012-04-02 | 2012-09-07 | 基于细胞的探询式分析及其应用 |
| CN201280073683.2A Pending CN104520435A (zh) | 2012-04-02 | 2012-09-07 | 基于细胞的探询式分析及其应用 |
Country Status (14)
| Country | Link |
|---|---|
| US (2) | US10061887B2 (zh) |
| EP (1) | EP2834366B1 (zh) |
| JP (3) | JP6189926B2 (zh) |
| KR (2) | KR102149070B1 (zh) |
| CN (3) | CN108048521B (zh) |
| AU (2) | AU2012376214B2 (zh) |
| BR (1) | BR112014024537A2 (zh) |
| CA (1) | CA2869296A1 (zh) |
| EA (1) | EA038600B1 (zh) |
| HK (1) | HK1209161A1 (zh) |
| IL (1) | IL234920B (zh) |
| MX (2) | MX375673B (zh) |
| SG (2) | SG11201406201YA (zh) |
| WO (1) | WO2013151577A1 (zh) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN113035298A (zh) * | 2021-04-02 | 2021-06-25 | 南京信息工程大学 | 递归生成大阶数行限制覆盖阵列的药物临床试验设计方法 |
| CN113943720A (zh) * | 2021-11-03 | 2022-01-18 | 江苏省农业科学院 | 一种绿盲蝽GRK基因、其dsRNA及其合成方法和应用 |
| WO2024016944A1 (zh) * | 2022-07-18 | 2024-01-25 | 华东师范大学 | 预防和保护脑缺血疾病的标志物及阿司匹林衍生物在预防和保护脑缺血疾病中的应用 |
| WO2025162029A1 (zh) * | 2024-01-30 | 2025-08-07 | 抟相医药(杭州)有限公司 | 基于凝聚体荧光漂白恢复技术(Drop-FRAP)的生物大分子相互作用调节剂筛选平台 |
Families Citing this family (43)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103501859B (zh) | 2011-03-02 | 2017-08-25 | 博格有限责任公司 | 基于细胞的探询式分析及其应用 |
| JP6189926B2 (ja) | 2012-04-02 | 2017-08-30 | バーグ エルエルシー | 照合による細胞に基づくアッセイ及びその使用 |
| EP2668945A1 (de) | 2012-06-01 | 2013-12-04 | Bayer Technology Services GmbH | Genotyp- bzw. Phänotyp-basierte Arzeimittelformulierungen |
| US9449284B2 (en) * | 2012-10-04 | 2016-09-20 | Nec Corporation | Methods and systems for dependency network analysis using a multitask learning graphical lasso objective function |
| CN103558354B (zh) | 2013-11-15 | 2015-07-15 | 南京大学 | 一种基于生物组学整合技术的水体毒性分析方法 |
| CN106471508A (zh) * | 2014-06-20 | 2017-03-01 | 康涅狄格儿童医疗中心 | 自动化细胞培养系统及对应的方法 |
| AU2015314956A1 (en) * | 2014-09-11 | 2017-04-06 | Berg Llc | Bayesian causal relationship network models for healthcare diagnosis and treatment based on patient data |
| CN105624275B (zh) * | 2014-11-06 | 2020-03-27 | 上海市东方医院 | Eif4g1在鳞癌诊断和治疗中的应用 |
| JP6270221B2 (ja) * | 2015-02-13 | 2018-01-31 | 国立研究開発法人産業技術総合研究所 | バイオマーカー探索方法、バイオマーカー探索装置、及びプログラム |
| KR101786859B1 (ko) * | 2015-04-30 | 2017-10-17 | 서울대학교산학협력단 | 혈장 내 아밀로이드베타의 농도를 통해 알츠하이머병을 임상학적 및 병리학적으로 모니터링하는 방법 |
| US10395759B2 (en) | 2015-05-18 | 2019-08-27 | Regeneron Pharmaceuticals, Inc. | Methods and systems for copy number variant detection |
| DK3303579T3 (da) * | 2015-05-28 | 2021-05-31 | Stichting Het Nederlands Kanker Inst Antoni Van Leeuwenhoek Ziekenhuis | Assays til at identificere genetiske elementer, der påvirker fænotype |
| CN106250717B (zh) * | 2015-06-04 | 2019-03-12 | 徐勇 | 急性髓性白血病的miRNA与转录因子的系统及其构建方法和应用 |
| US20160363567A1 (en) * | 2015-06-15 | 2016-12-15 | Lunatech, Llc | Vapor Device For Stressing And Analyzing Compounds |
| WO2017065127A1 (ja) * | 2015-10-14 | 2017-04-20 | 公立大学法人横浜市立大学 | 腎癌薬物療法の効果判定のための血中バイオマーカー |
| AU2017218149B2 (en) | 2016-02-12 | 2020-09-03 | Regeneron Pharmaceuticals, Inc. | Methods and systems for detection of abnormal karyotypes |
| CN115639134A (zh) | 2016-06-10 | 2023-01-24 | 加利福尼亚大学董事会 | 基于图像的细胞分选系统和方法 |
| WO2018090054A1 (en) | 2016-11-14 | 2018-05-17 | Berg Llc | Methods for treating parkinson's disease |
| CN106834105A (zh) * | 2017-02-21 | 2017-06-13 | 齐齐哈尔医学院 | 一种用于表观遗传分析的设备和方法 |
| US11636917B2 (en) * | 2017-06-28 | 2023-04-25 | The Regents Of The University Of California | Simulating the metabolic pathway dynamics of an organism |
| CN107475346B (zh) * | 2017-08-11 | 2021-08-06 | 北京汉典制药有限公司 | 一种体外筛选糖尿病肾病药物的方法 |
| JP6902977B2 (ja) * | 2017-09-22 | 2021-07-14 | 新日本無線株式会社 | 起動回路の故障検出方法 |
| EP3697925A4 (en) * | 2017-10-18 | 2021-06-23 | Venn Biosciences Corporation | IDENTIFICATION AND USE OF BIOLOGICAL PARAMETERS FOR THE DIAGNOSIS AND MONITORING OF A TREATMENT |
| JP2021073432A (ja) * | 2018-03-02 | 2021-05-13 | 国立研究開発法人医薬基盤・健康・栄養研究所 | 治療標的である活性化キナーゼのスクリーニング方法 |
| JP7176381B2 (ja) * | 2018-12-03 | 2022-11-22 | 富士通株式会社 | 環状分子の構造探索方法、及び構造探索装置、並びにプログラム |
| CN109536473A (zh) * | 2018-12-19 | 2019-03-29 | 华中科技大学鄂州工业技术研究院 | 整合多组学数据推测细胞转分化中关键蛋白质激酶的方法 |
| EP3935581A4 (en) | 2019-03-04 | 2022-11-30 | Iocurrents, Inc. | DATA COMPRESSION AND COMMUNICATION USING MACHINE LEARNING |
| WO2020264379A1 (en) * | 2019-06-26 | 2020-12-30 | Berg Llc | Markers for the diagnosis of prostate cancer |
| EP4100876A4 (en) * | 2020-03-10 | 2024-02-28 | AI:ON Innovations, Inc. | SYSTEM AND METHOD FOR LEARNING TRANSMISSION PROCESSES IN MAMMALS |
| CN115698314A (zh) * | 2020-06-08 | 2023-02-03 | 国立大学法人东京医科齿科大学 | 靶分子预测方法 |
| WO2022045334A1 (ja) * | 2020-08-31 | 2022-03-03 | 武田薬品工業株式会社 | 推論装置、推論方法、推論プログラム、モデル生成方法、推論サービス提供システム、推論サービス提供方法及び推論サービス提供プログラム |
| US11227690B1 (en) * | 2020-09-14 | 2022-01-18 | Opendna Ltd. | Machine learning prediction of therapy response |
| CN113138249B (zh) * | 2021-04-12 | 2021-11-23 | 北京蛋白质组研究中心 | 基于微孔阵列芯片的微量样本代谢组、蛋白质组和磷酸化蛋白质组多组学分析方法 |
| EP4338163A4 (en) * | 2021-05-13 | 2024-11-06 | Scipher Medicine Corporation | ASSESSMENT OF RESPONSE TO THERAPY |
| US20250322901A1 (en) * | 2022-05-27 | 2025-10-16 | Memorial Sloan-Kettering Cancer Center | Systems and methods for metabolite imputation |
| WO2024081570A1 (en) * | 2022-10-10 | 2024-04-18 | Eli Lilly And Company | Methods and systems for using causal networks to develop models for evaluating biological processes |
| EP4602611A1 (en) * | 2022-10-13 | 2025-08-20 | SomaLogic Operating Co., Inc. | Systems and methods for validation of proteomic models |
| WO2024211805A1 (en) * | 2023-04-07 | 2024-10-10 | The Medical College Of Wisconsin, Inc. | Compositions and methods for treatment or preventative treatment of cancer including triple negative breast cancer and/or lung cancer |
| CN117133375B (zh) * | 2023-07-24 | 2025-05-30 | 浙江大学 | 一种基于机器学习的致肥胖化学品预测方法及装置 |
| KR102763225B1 (ko) * | 2023-09-26 | 2025-02-07 | 주식회사 그래디언트바이오컨버전스 | 최적의 오가노이드 배양배지 조합 결정 장치, 배양배지 조합들에 대한 생존율을 산출하여 최적의 조합을 결정하는 방법, 및 컴퓨터 프로그램 |
| KR102763227B1 (ko) * | 2023-09-26 | 2025-02-07 | 주식회사 그래디언트바이오컨버전스 | 최적의 줄기 세포 배양배지 조합 결정 장치, 배양배지 조합들에 대한 분화 성공률을 산출하여 최적의 조합을 결정하는 방법, 및 컴퓨터 프로그램 |
| CN118607082A (zh) * | 2024-08-09 | 2024-09-06 | 成都理工大学 | 一种基于深度学习的压裂过程中套管变形的预测方法 |
| CN119120480B (zh) * | 2024-10-17 | 2025-04-29 | 山东省农业科学院畜牧兽医研究所 | 一种用于华西牛育种调节的环状rna及其应用 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20030017445A1 (en) * | 2000-03-06 | 2003-01-23 | Berg Ellen L. | Patient classification |
| WO2006054991A1 (en) * | 2004-11-17 | 2006-05-26 | Immunivest Corporation | Magnetic enrichment of circulating cells, fragments and debris for enabling hts proteomics and genomics in disease detection |
| US20070038385A1 (en) * | 2001-06-18 | 2007-02-15 | Tatiana Nikolskaya | Methods for identification of novel protein drug targets and biomarkers utilizing functional networks |
Family Cites Families (105)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB8308235D0 (en) | 1983-03-25 | 1983-05-05 | Celltech Ltd | Polypeptides |
| US4816567A (en) | 1983-04-08 | 1989-03-28 | Genentech, Inc. | Recombinant immunoglobin preparations |
| JPS6147500A (ja) | 1984-08-15 | 1986-03-07 | Res Dev Corp Of Japan | キメラモノクロ−ナル抗体及びその製造法 |
| EP0173494A3 (en) | 1984-08-27 | 1987-11-25 | The Board Of Trustees Of The Leland Stanford Junior University | Chimeric receptors by dna splicing and expression |
| GB8422238D0 (en) | 1984-09-03 | 1984-10-10 | Neuberger M S | Chimeric proteins |
| JPS61134325A (ja) | 1984-12-04 | 1986-06-21 | Teijin Ltd | ハイブリツド抗体遺伝子の発現方法 |
| US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
| US4676980A (en) | 1985-09-23 | 1987-06-30 | The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services | Target specific cross-linked heteroantibodies |
| JPS63501765A (ja) | 1985-11-01 | 1988-07-21 | インタ−ナショナル、ジェネティック、エンジニアリング インコ−ポレ−テッド | 抗体遺伝子のモジュ−ル組立体、それにより産生された抗体及び用途 |
| US4868103A (en) | 1986-02-19 | 1989-09-19 | Enzo Biochem, Inc. | Analyte detection by means of energy transfer |
| US5225539A (en) | 1986-03-27 | 1993-07-06 | Medical Research Council | Recombinant altered antibodies and methods of making altered antibodies |
| US4902505A (en) | 1986-07-30 | 1990-02-20 | Alkermes | Chimeric peptides for neuropeptide delivery through the blood-brain barrier |
| US4946778A (en) | 1987-09-21 | 1990-08-07 | Genex Corporation | Single polypeptide chain binding molecules |
| US4904582A (en) | 1987-06-11 | 1990-02-27 | Synthetic Genetics | Novel amphiphilic nucleic acid conjugates |
| US4843155A (en) | 1987-11-19 | 1989-06-27 | Piotr Chomczynski | Product and process for isolating RNA |
| DE768377T1 (de) | 1988-09-02 | 1998-01-02 | Dyax Corp | Herstellung und Auswahl von Rekombinantproteinen mit verschiedenen Bindestellen |
| US5223409A (en) | 1988-09-02 | 1993-06-29 | Protein Engineering Corp. | Directed evolution of novel binding proteins |
| US5530101A (en) | 1988-12-28 | 1996-06-25 | Protein Design Labs, Inc. | Humanized immunoglobulins |
| US5800992A (en) | 1989-06-07 | 1998-09-01 | Fodor; Stephen P.A. | Method of detecting nucleic acids |
| US5143854A (en) | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
| US6040138A (en) | 1995-09-15 | 2000-03-21 | Affymetrix, Inc. | Expression monitoring by hybridization to high density oligonucleotide arrays |
| US5744101A (en) | 1989-06-07 | 1998-04-28 | Affymax Technologies N.V. | Photolabile nucleoside protecting groups |
| US5427908A (en) | 1990-05-01 | 1995-06-27 | Affymax Technologies N.V. | Recombinant library screening methods |
| DK0585287T3 (da) | 1990-07-10 | 2000-04-17 | Cambridge Antibody Tech | Fremgangsmåde til fremstilling af specifikke bindingsparelementer |
| GB9015198D0 (en) | 1990-07-10 | 1990-08-29 | Brien Caroline J O | Binding substance |
| US5545806A (en) | 1990-08-29 | 1996-08-13 | Genpharm International, Inc. | Ransgenic non-human animals for producing heterologous antibodies |
| US5661016A (en) | 1990-08-29 | 1997-08-26 | Genpharm International Inc. | Transgenic non-human animals capable of producing heterologous antibodies of various isotypes |
| US5633425A (en) | 1990-08-29 | 1997-05-27 | Genpharm International, Inc. | Transgenic non-human animals capable of producing heterologous antibodies |
| US5625126A (en) | 1990-08-29 | 1997-04-29 | Genpharm International, Inc. | Transgenic non-human animals for producing heterologous antibodies |
| AU8507191A (en) | 1990-08-29 | 1992-03-30 | Genpharm International, Inc. | Transgenic non-human animals capable of producing heterologous antibodies |
| CA2095633C (en) | 1990-12-03 | 2003-02-04 | Lisa J. Garrard | Enrichment method for variant proteins with altered binding properties |
| ES2287206T3 (es) | 1991-03-01 | 2007-12-16 | Dyax Corporation | Proceso para el desarrollo de mini-proteinas de union. |
| WO1992018619A1 (en) | 1991-04-10 | 1992-10-29 | The Scripps Research Institute | Heterodimeric receptor libraries using phagemids |
| DE4122599C2 (de) | 1991-07-08 | 1993-11-11 | Deutsches Krebsforsch | Phagemid zum Screenen von Antikörpern |
| US5621083A (en) | 1991-11-04 | 1997-04-15 | Xoma Corporation | Immunotoxins comprising ribosome-inactivating proteins |
| WO1993009668A1 (en) | 1991-11-22 | 1993-05-27 | Affymax Technology N.V. | Combinatorial strategies for polymer synthesis |
| US6027725A (en) | 1991-11-25 | 2000-02-22 | Enzon, Inc. | Multivalent antigen-binding proteins |
| DE69326967T2 (de) | 1992-01-17 | 2000-06-15 | Lakowicz, Joseph R. | Phasenmodulationsenergieübertragungsfluoroimmunassay |
| US5918200A (en) | 1992-08-31 | 1999-06-29 | Yamatake-Honeywell Co., Ltd. | State estimating apparatus |
| US5605798A (en) | 1993-01-07 | 1997-02-25 | Sequenom, Inc. | DNA diagnostic based on mass spectrometry |
| EP0679196B1 (en) | 1993-01-07 | 2004-05-26 | Sequenom, Inc. | Dna sequencing by mass spectrometry |
| EP0689610B1 (en) | 1993-03-19 | 2002-07-03 | Sequenom, Inc. | Dna sequencing by mass spectrometry via exonuclease degradation |
| US5538848A (en) | 1994-11-16 | 1996-07-23 | Applied Biosystems Division, Perkin-Elmer Corp. | Method for detecting nucleic acid amplification using self-quenching fluorescence probe |
| US5556752A (en) | 1994-10-24 | 1996-09-17 | Affymetrix, Inc. | Surface-bound, unimolecular, double-stranded DNA |
| US5545531A (en) | 1995-06-07 | 1996-08-13 | Affymax Technologies N.V. | Methods for making a device for concurrently processing multiple biological chip assays |
| US5854033A (en) | 1995-11-21 | 1998-12-29 | Yale University | Rolling circle replication reporter systems |
| EP0880598A4 (en) | 1996-01-23 | 2005-02-23 | Affymetrix Inc | RAPID EVALUATION OF NUCLEIC ACID ABUNDANCE DIFFERENCE, WITH A HIGH-DENSITY OLIGONUCLEOTIDE SYSTEM |
| EP0879449A2 (en) | 1996-02-09 | 1998-11-25 | Adeza Biomedical Corporation | Method for selecting medical and biochemical diagnostic tests using neural network-related applications |
| US5898031A (en) | 1996-06-06 | 1999-04-27 | Isis Pharmaceuticals, Inc. | Oligoribonucleotides for cleaving RNA |
| WO1999023254A1 (en) | 1997-10-31 | 1999-05-14 | Affymetrix, Inc. | Expression profiles in adult and fetal organs |
| US6020135A (en) | 1998-03-27 | 2000-02-01 | Affymetrix, Inc. | P53-regulated genes |
| CA2441060A1 (en) | 2001-03-13 | 2002-09-19 | Ashni Naturaceuticals, Inc. | Method for association of genomic and proteomic pathways associated with physiological or pathophysiological processes |
| US7393656B2 (en) * | 2001-07-10 | 2008-07-01 | The Board Of Trustees Of The Leland Stanford Junior University | Methods and compositions for risk stratification |
| US7415359B2 (en) | 2001-11-02 | 2008-08-19 | Gene Network Sciences, Inc. | Methods and systems for the identification of components of mammalian biochemical networks as targets for therapeutic agents |
| WO2003099320A1 (en) | 2002-05-24 | 2003-12-04 | Zensun (Shanghai) Sci-Tech.Ltd | Neuregulin based methods and compositions for treating viral myocarditis and dilated cardiomyopathy |
| ATE398808T1 (de) | 2002-08-29 | 2008-07-15 | Gene Network Sciences Inc | Systeme und verfahren zum schliessen auf biologische netzwerke |
| CN1714371A (zh) | 2002-11-19 | 2005-12-28 | Gni美国公司 | 根据时间序列基因表达数据的基因网络的非线性模拟 |
| US20070104688A1 (en) | 2003-02-13 | 2007-05-10 | City Of Hope | Small interfering RNA mediated transcriptional gene silencing in mammalian cells |
| JP4288345B2 (ja) * | 2003-06-19 | 2009-07-01 | 独立行政法人産業技術総合研究所 | 新規てんかんモデル動物 |
| EP1512970A1 (en) * | 2003-09-05 | 2005-03-09 | Nederlandse Organisatie voor toegepast-natuurwetenschappelijk Onderzoek TNO | Method for determining the impact of a multicomponent mixture on the biological profile of a disease |
| US20070134734A1 (en) | 2003-10-14 | 2007-06-14 | Cellfree Sciences Co., Ltd. | Novel screening method of indicator substance |
| AU2005238446B2 (en) | 2004-04-15 | 2009-07-30 | Banyan Biomarkers Inc. | Neural proteins as biomarkers for nervous system injury and other neural disorders |
| US8185367B2 (en) | 2004-04-30 | 2012-05-22 | Merck Sharp & Dohme Corp. | Systems and methods for reconstructing gene networks in segregating populations |
| EP1607898A3 (en) | 2004-05-18 | 2006-03-29 | Neal E. Solomon | A bioinformatics system for functional proteomics modelling |
| GB0419124D0 (en) | 2004-08-27 | 2004-09-29 | Proteome Sciences Plc | Methods and compositions relating to Alzheimer's disease |
| US20100316629A1 (en) | 2004-09-01 | 2010-12-16 | Shaughnessy Jr John D | Use of gene expression profiling to predict survival in cancer patient |
| CN101194260A (zh) * | 2005-01-24 | 2008-06-04 | 利兰·斯坦福青年大学托管委员会 | 使用贝叶斯网络建立细胞信号传导系统模型的方法 |
| US20080195570A1 (en) | 2005-03-31 | 2008-08-14 | Koninklijke Philips Electronics, N.V. | System and Method for Collecting Evidence Pertaining to Relationships Between Biomolecules and Diseases |
| WO2006129401A1 (ja) * | 2005-05-31 | 2006-12-07 | Jcl Bioassay Corporation | プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法 |
| US7906116B2 (en) | 2005-09-01 | 2011-03-15 | Parkash Gill | Methods for using and identifying modulators of Delta-like 4 |
| WO2007039255A1 (en) | 2005-09-30 | 2007-04-12 | Universiteit Maastricht | Tumor angiogenesis associated genes and a method for their identification |
| EP1840574A1 (en) | 2006-03-30 | 2007-10-03 | Institut Pasteur | Use of the alpha chain of brain spectrin and fragments thereof, for diagnosing cerebral diseases |
| US20080046290A1 (en) | 2006-08-21 | 2008-02-21 | Cerner Innovation, Inc. | System and method for compiling and displaying discharge instructions for a patient |
| US8571803B2 (en) | 2006-11-15 | 2013-10-29 | Gene Network Sciences, Inc. | Systems and methods for modeling and analyzing networks |
| JP5646174B2 (ja) | 2006-12-05 | 2014-12-24 | デコード・ジェネティクス・イーエイチエフ | 心臓不整脈のリスクマネージメント用の遺伝マーカー |
| CN101105841B (zh) | 2007-02-12 | 2011-06-15 | 浙江大学 | 由大规模基因芯片表达谱数据构建基因调控亚网络的方法 |
| US8140270B2 (en) | 2007-03-22 | 2012-03-20 | National Center For Genome Resources | Methods and systems for medical sequencing analysis |
| US20090117562A1 (en) | 2007-04-09 | 2009-05-07 | Valerie Wailin Hu | Method and kit for diagnosing Autism using gene expression profiling |
| EP2147387A4 (en) | 2007-05-16 | 2012-05-02 | Edsa Micro Corp | REAL-TIME FORECASTING SYSTEMS FOR INTELLIGENT ENERGY MONITORING AND MANAGEMENT OF ELECTRICITY NETWORKS |
| JP2009050171A (ja) * | 2007-08-23 | 2009-03-12 | Toyobo Co Ltd | 表面プラズモン共鳴による基板上におけるリン酸化の検出方法 |
| DE102007044380A1 (de) | 2007-09-17 | 2009-03-19 | Siemens Ag | Verfahren zum rechnergestützten Lernen eines probabilistischen Netzes |
| US7895146B2 (en) | 2007-12-03 | 2011-02-22 | Microsoft Corporation | Time modulated generative probabilistic models for automated causal discovery that monitors times of packets |
| WO2009082607A2 (en) | 2007-12-04 | 2009-07-02 | Alnylam Pharmaceuticals, Inc. | Targeting lipids |
| CA2716375C (en) | 2008-02-20 | 2018-05-29 | The Children's Hospital Of Philadelphia | Genetic alterations associated with autism and the autistic phenotype and methods of use thereof for the diagnosis and treatmemt of autism |
| US8173369B2 (en) | 2008-05-15 | 2012-05-08 | The Regents Of The University Of California | Peripheral gene expression biomarkers for autism |
| US8005770B2 (en) | 2008-06-09 | 2011-08-23 | Microsoft Corporation | Parallel generation of a bayesian network |
| CN102224255A (zh) * | 2008-08-15 | 2011-10-19 | 梅里麦克制药股份有限公司 | 用于预测细胞对治疗剂的应答的方法和系统 |
| EP2318970A2 (en) | 2008-08-15 | 2011-05-11 | Koninklijke Philips Electronics N.V. | Model enhanced imaging |
| WO2010045463A2 (en) | 2008-10-15 | 2010-04-22 | Government Of The United States As Represented By The Secretary Of The Army | Clinical decision model |
| CA2743473C (en) * | 2008-11-17 | 2022-06-14 | Veracyte, Inc. | Methods and compositions of molecular profiling for disease diagnostics |
| US20110294693A1 (en) | 2008-11-17 | 2011-12-01 | The George Washington University | Compositions and Methods for Identifying Autism Spectrum Disorders |
| US20110020312A1 (en) | 2009-05-11 | 2011-01-27 | Niven Rajin Narain | Methods for treatment of metabolic disorders using epimetabolic shifters, multidimensional intracellular molecules, or environmental influencers |
| US20110202486A1 (en) | 2009-07-21 | 2011-08-18 | Glenn Fung | Healthcare Information Technology System for Predicting Development of Cardiovascular Conditions |
| WO2011031803A1 (en) | 2009-09-08 | 2011-03-17 | Nodality, Inc. | Analysis of cell networks |
| US20110112380A1 (en) | 2009-11-12 | 2011-05-12 | eTenum, LLC | Method and System for Optimal Estimation in Medical Diagnosis |
| US20130123124A1 (en) | 2010-03-12 | 2013-05-16 | Children's Medical Center Corporation | Methods and compositions for characterizing autism spectrum disorder based on gene expression patterns |
| EP2600154A4 (en) | 2010-03-31 | 2014-06-11 | Univ Kumamoto Nat Univ Corp | METHOD FOR GENERATING A DATA SET FOR INTEGRATED PROTEOMICS, METHOD FOR INTEGRATED PROTEOMICS WITH THE DATA PROTEOM FOR INTEGRATED PROTEOMICS PRODUCED IN THIS PRODUCTION PROCESS, AND METHOD FOR IDENTIFYING A DISEASE SUBSTANCE THEREWITH |
| US11195213B2 (en) | 2010-09-01 | 2021-12-07 | Apixio, Inc. | Method of optimizing patient-related outcomes |
| CN103501859B (zh) | 2011-03-02 | 2017-08-25 | 博格有限责任公司 | 基于细胞的探询式分析及其应用 |
| SG188320A1 (en) | 2011-08-31 | 2013-04-30 | Apixio Inc | Medical information navigation engine (mine) system |
| CN103107315B (zh) | 2011-11-10 | 2016-03-30 | 北京有色金属研究总院 | 一种纳米硅碳复合材料及其制备方法 |
| KR20140140069A (ko) | 2012-03-05 | 2014-12-08 | 버그 엘엘씨 | 전반적 발달장애의 진단 및 치료용 조성물 및 그 진단 및 치료 방법 |
| JP6189926B2 (ja) | 2012-04-02 | 2017-08-30 | バーグ エルエルシー | 照合による細胞に基づくアッセイ及びその使用 |
| CN107449921A (zh) | 2012-05-22 | 2017-12-08 | 博格有限责任公司 | 用于鉴别药物诱导毒性标志物的基于细胞的探询式分析 |
| AU2015314956A1 (en) | 2014-09-11 | 2017-04-06 | Berg Llc | Bayesian causal relationship network models for healthcare diagnosis and treatment based on patient data |
-
2012
- 2012-09-07 JP JP2015503185A patent/JP6189926B2/ja active Active
- 2012-09-07 KR KR1020147030700A patent/KR102149070B1/ko active Active
- 2012-09-07 HK HK15109778.2A patent/HK1209161A1/zh unknown
- 2012-09-07 CN CN201711192165.3A patent/CN108048521B/zh active Active
- 2012-09-07 KR KR1020207023974A patent/KR20200105524A/ko not_active Abandoned
- 2012-09-07 WO PCT/US2012/054321 patent/WO2013151577A1/en not_active Ceased
- 2012-09-07 SG SG11201406201YA patent/SG11201406201YA/en unknown
- 2012-09-07 SG SG10201608234UA patent/SG10201608234UA/en unknown
- 2012-09-07 AU AU2012376214A patent/AU2012376214B2/en active Active
- 2012-09-07 BR BR112014024537A patent/BR112014024537A2/pt not_active IP Right Cessation
- 2012-09-07 CN CN201280073683.2A patent/CN104520435A/zh active Pending
- 2012-09-07 EP EP12873625.3A patent/EP2834366B1/en active Active
- 2012-09-07 MX MX2018002069A patent/MX375673B/es unknown
- 2012-09-07 US US13/607,587 patent/US10061887B2/en active Active
- 2012-09-07 CA CA2869296A patent/CA2869296A1/en active Pending
- 2012-09-07 EA EA201491833A patent/EA038600B1/ru unknown
- 2012-09-07 CN CN201910734226.7A patent/CN110456035A/zh active Pending
- 2012-09-07 MX MX2014011797A patent/MX357392B/es active IP Right Grant
-
2014
- 2014-10-01 IL IL234920A patent/IL234920B/en active IP Right Grant
-
2017
- 2017-08-03 JP JP2017150309A patent/JP6767320B2/ja active Active
-
2018
- 2018-08-07 US US16/056,830 patent/US12437835B2/en active Active
-
2019
- 2019-01-31 AU AU2019200670A patent/AU2019200670B2/en active Active
-
2020
- 2020-09-17 JP JP2020156318A patent/JP2021003121A/ja active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20030017445A1 (en) * | 2000-03-06 | 2003-01-23 | Berg Ellen L. | Patient classification |
| US20070038385A1 (en) * | 2001-06-18 | 2007-02-15 | Tatiana Nikolskaya | Methods for identification of novel protein drug targets and biomarkers utilizing functional networks |
| WO2006054991A1 (en) * | 2004-11-17 | 2006-05-26 | Immunivest Corporation | Magnetic enrichment of circulating cells, fragments and debris for enabling hts proteomics and genomics in disease detection |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN113035298A (zh) * | 2021-04-02 | 2021-06-25 | 南京信息工程大学 | 递归生成大阶数行限制覆盖阵列的药物临床试验设计方法 |
| CN113035298B (zh) * | 2021-04-02 | 2023-06-20 | 南京信息工程大学 | 递归生成大阶数行限制覆盖阵列的药物临床试验设计方法 |
| CN113943720A (zh) * | 2021-11-03 | 2022-01-18 | 江苏省农业科学院 | 一种绿盲蝽GRK基因、其dsRNA及其合成方法和应用 |
| WO2024016944A1 (zh) * | 2022-07-18 | 2024-01-25 | 华东师范大学 | 预防和保护脑缺血疾病的标志物及阿司匹林衍生物在预防和保护脑缺血疾病中的应用 |
| WO2025162029A1 (zh) * | 2024-01-30 | 2025-08-07 | 抟相医药(杭州)有限公司 | 基于凝聚体荧光漂白恢复技术(Drop-FRAP)的生物大分子相互作用调节剂筛选平台 |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN108048521B (zh) | 基于细胞的探询式分析及其应用 | |
| US20240062844A1 (en) | Interrogatory cell-based assays and uses thereof | |
| US20240161863A1 (en) | Interrogatory cell-based assays for identifying drug-induced toxicity markers | |
| HK1245917A1 (zh) | 基於细胞的探询式分析及其应用 | |
| HK1192507B (zh) | 基於细胞的探询式分析及其应用 | |
| HK1192507A (zh) | 基於细胞的探询式分析及其应用 | |
| NZ614891B2 (en) | Interrogatory cell-based assays and uses thereof |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| WD01 | Invention patent application deemed withdrawn after publication | ||
| WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191115 |