CN112466403A - 一种细胞通讯分析方法及系统 - Google Patents
一种细胞通讯分析方法及系统 Download PDFInfo
- Publication number
- CN112466403A CN112466403A CN202011620086.XA CN202011620086A CN112466403A CN 112466403 A CN112466403 A CN 112466403A CN 202011620086 A CN202011620086 A CN 202011620086A CN 112466403 A CN112466403 A CN 112466403A
- Authority
- CN
- China
- Prior art keywords
- ligand
- cell
- receptor
- cells
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 76
- 230000023402 cell communication Effects 0.000 title claims abstract description 31
- 239000003446 ligand Substances 0.000 claims abstract description 124
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 73
- 230000014509 gene expression Effects 0.000 claims abstract description 62
- 230000033228 biological regulation Effects 0.000 claims abstract description 36
- 230000000694 effects Effects 0.000 claims abstract description 28
- 230000008614 cellular interaction Effects 0.000 claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 12
- 238000010586 diagram Methods 0.000 claims abstract description 9
- 239000011159 matrix material Substances 0.000 claims abstract description 8
- 238000010276 construction Methods 0.000 claims abstract description 3
- 108020003175 receptors Proteins 0.000 claims description 74
- 102000005962 receptors Human genes 0.000 claims description 74
- 230000010267 cellular communication Effects 0.000 claims description 27
- 230000011664 signaling Effects 0.000 claims description 26
- 238000004891 communication Methods 0.000 claims description 15
- 230000001105 regulatory effect Effects 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 11
- 230000003993 interaction Effects 0.000 claims description 11
- 238000003556 assay Methods 0.000 claims description 9
- 230000001413 cellular effect Effects 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 claims 2
- 238000011160 research Methods 0.000 abstract description 10
- 210000004027 cell Anatomy 0.000 description 156
- 241000894007 species Species 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 230000008568 cell cell communication Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 210000003370 receptor cell Anatomy 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000019491 signal transduction Effects 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 230000035992 intercellular communication Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000009456 molecular mechanism Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000008844 regulatory mechanism Effects 0.000 description 2
- 108091008023 transcriptional regulators Proteins 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000007730 Akt signaling Effects 0.000 description 1
- 108091006146 Channels Proteins 0.000 description 1
- 208000003251 Pruritus Diseases 0.000 description 1
- 102000013530 TOR Serine-Threonine Kinases Human genes 0.000 description 1
- 108010065917 TOR Serine-Threonine Kinases Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种细胞通讯分析方法及系统,该方法包括细胞通讯预测和配体‑靶基因调控预测;细胞通讯预测包括配受体对表达丰度分析、配受体对数目分析、显著富集配受体对数目分析和细胞交互网络图构建;配体‑靶基因调控预测包括配体活性分析和配体‑靶基因调控潜力分析;本发明细胞通讯分析方法主要是描述细胞间的关联关系,利用CellphoneDB软件基于单细胞基因表达量矩阵进行细胞通讯网络构建,利用NicheNet软件基于配体‑靶基因表达关系,分析配体活力以及配体对靶基因的调控潜力。本发明多种图示化结果展示,便于研究细胞间的关联关系;可以为揭示某个细胞行为,深入解析细胞通讯结果,提供一个新的基础科研研究思路。
Description
技术领域
本发明涉及生物信息分析领域,具体涉及一种细胞通讯分析方法及系统。
背景技术
复杂的细胞外反应始于配体与其受体的结合和特定细胞信号通路的激活,因此,了解和绘制这些配体和受体的相互作用是理解细胞行为和对邻近细胞反应的基础,也是进行很多科研机制问题研究的基础。但组织细胞内的互作机制非常复杂,涉及多种细胞,以及潜在上千种配体-受体关系,以传统的分子生物学方法来筛选,依靠科研人员的经验判断为主,很难直接锁定关键的细胞互作关系。若人为经验判断不准确,功能验证有假阳性情况存在,又需重新筛选和验证,过程费时费力,且极有可能筛选不到关键互作的细胞配受体,对研究生物学问题造成了极大的障碍。
单细胞测序技术更好的解决了传统技术中细胞异质性的分析,在肿瘤、微生物学,神经科学等众多研究领域有着广阔的应用。随着单细胞测序技术越来越普及,单细胞转录组测序数据量逐渐增加,使得研究和解析细胞通信网络成为了可能。通过细胞通讯分析可以系统性解码细胞间通信网络,有助于揭示通讯细胞间的调控机制,并最终解释组织在稳态中的功能及其在疾病中的变化。虽然,单细胞测序提供的基因测序大数据为筛选关键细胞互作关系提供了可能,可利用精准的组学技术来筛选,克服传统生物学筛选中对科研人员经验的依赖性强的问题,但如何利用单细胞测序数据来合理、准确且高效的筛选和研究细胞配受体之间的互作关系仍是重点和难点。综上所述,细胞通讯分析技术重要性强,且应用广阔,但目前尚未有此类技术方法全面的,深入的研究细胞间交流的分子机制,并对数据结果多种图示化形式展示,因此本发明提供一种细胞通讯分析方法,可应用于对单细胞转录组测序数据进一步展开细胞通讯分析,其分析过程高效、分析内容全面、分析结果可视化。
发明内容
有鉴于此,为了解决现有技术中的上述问题,本发明提出一种细胞通讯分析方法及系统,主要是描述细胞间的关联关系,利用CellphoneDB软件基于单细胞基因表达量矩阵进行细胞通讯网络构建,利用NicheNet软件基于配体-靶基因表达关系,分析配体活力以及配体对靶基因的调控潜力。
本发明通过以下技术手段解决上述问题:
一方面,本发明提供一种细胞通讯分析方法,包括细胞通讯预测和配体-靶基因调控预测两大内容,具体方法如下:
细胞通讯预测包括:
配受体对表达丰度分析:输入单细胞基因表达量矩阵,利用 CellphoneDB软件中包含的配体-受体信息,基于一个细胞表达受体而另一个细胞表达配体的方式来分析每一对细胞中配体-受体对的表达丰度。其中,本发明只对在特定簇中大于用户指定阈值百分比的细胞表达的受体和配体进行分析(默认值为 10%)。
配受体对数目分析: 基于对每一对细胞中配体-受体对表达丰度的分析,可以获得每一对细胞中表达的配受体对数目,由此可以对细胞间的通讯关系进行初步评估。
显著富集配受体对数目分析:利用 CellphoneDB 软件对数据集中的所有细胞类型之间进行成对比较,分析每一对细胞中显著富集的配受体对数目。首先,随机排列所有细胞簇标记(默认为 1,000 次),并确定细胞簇中配体表达水平的平均值和相互作用细胞簇中受体平均表达水平。通过这种方式,在两种细胞类型之间的配对比较中为每个配体-受体对生成了零分布。通过计算与实际均值一样高或高于实际均值的配受体表达量均值的比例,本发明获得每种配体受体复合物在特定细胞类型中富集可能性的 P 值,本发明定义 P值小于 0.05 为显著富集。
细胞交互网络图构建:基于CellphoneDB软件分析得到的每一对细胞对之间显著富集的配体-受体对数目,构建了细胞相互作用网络图,以细胞对之间富集的配受体对数目为线的数据来源,以细胞中含有的配受体对总数目为节点的数据来源绘图,更加直观的展示了细胞之间的潜在调控关系。
配体-靶基因调控预测包括:
配体活性分析:利用 NicheNet软件来分析配体信号细胞中最有可能影响相互作用的受体信号细胞中的特定基因集表达的配体,软件基于先前的配体-靶基因预测与配受体信号细胞交流后实际观察到的受体信号细胞中相应靶基因集表达变化程度的相关性对配体活性进行排序。
配体-靶基因调控潜力分析: 利用加权网络对配体信号细胞中的配体与受体信号细胞中特定基因集中的基因之间的调控潜力进行打分,分值越大则调控潜力越大。
另一方面,本发明提供一种细胞通讯分析系统,包括细胞通讯预测模块和配体-靶基因调控预测模块;
所述细胞通讯预测模块包括:
配受体对表达丰度分析单元,用于输入单细胞基因表达量矩阵,利用CellphoneDB软件中包含的配体-受体信息,基于一个细胞表达受体而另一个细胞表达配体的方式来分析每一对细胞中配体-受体对的表达丰度。其中,本发明只对在特定簇中大于用户指定阈值百分比的细胞表达的受体和配体进行分析(默认值为 10%)。
配受体对数目分析单元,用于基于对每一对细胞中配体-受体对表达丰度的分析,可以获得每一对细胞中表达的配受体对数目,由此可以对细胞间的通讯关系进行初步评估。
显著富集配受体对数目分析单元,用于利用 CellphoneDB 软件对数据集中的所有细胞类型之间进行成对比较,分析每一对细胞中显著富集的配受体对数目。首先,随机排列所有细胞簇标记(默认为 1,000 次),并确定细胞簇中配体表达水平的平均值和相互作用细胞簇中受体平均表达水平。通过这种方式,在两种细胞类型之间的配对比较中为每个配体-受体对生成了零分布。通过计算与实际均值一样高或高于实际均值的配受体表达量均值的比例,本发明获得每种配体受体复合物在特定细胞类型中富集可能性的 P 值,本发明定义 P 值小于 0.05 为显著富集。
细胞交互网络图构建单元,用于基于每一对细胞对之间显著富集的配体-受体对数目,构建细胞相互作用网络图,以细胞对之间富集的配受体对数目为线的数据来源,以细胞中含有的配受体对总数目为节点的数据来源绘图,更加直观的展示了细胞之间的潜在调控关系。
所述配体-靶基因调控预测模块包括:
配体活性分析单元,用于利用 NicheNet软件来分析配体信号细胞中最有可能影响相互作用的受体信号细胞中的特定基因集表达的配体,软件基于先前的配体-靶基因预测与配受体信号细胞交流后实际观察到的受体信号细胞中相应靶基因集表达变化程度的相关性对配体活性进行排序。
配体-靶基因调控潜力分析单元,用于利用加权网络对配体信号细胞中的配体与受体信号细胞中特定基因集中的基因之间的调控潜力进行打分,分值越大则调控潜力越大。
与现有技术相比,本发明的有益效果至少包括:
(1)本发明的细胞通讯分析方法两个软件联合分析,利用CellphoneDB软件预测细胞间潜在的通讯关系,紧接着从互作网络中选取通讯关系最强的五对细胞,利用NicheNet软件进一步分析细胞对中显著富集配受体对中的配体活性,并最终揭示配体主要调控的靶基因。即先对细胞间关系进行分析,在对细胞内调控网络分析,从细胞间通讯预测到定位至某个基因的表达变化,由此给出的是一个完整的从细胞通讯角度出发揭示表型变化机制的研究思路。
(2)目前分析方法主要受物种限制,本发明细胞通讯方法以人的细胞通讯为研究模型,可以推广至其他模式物种,针对非模式物种也可以通过同源比对之后进行分析,可应用范围广泛。为非模式物种提供了一个细胞通讯分析系统。也可以为揭示某个细胞行为,深入解析细胞通讯结果,提供一个新的基础科研研究思路。
(3)多种图示化结果展示,便于研究细胞间的关联关系。且独创性的构建了细胞相互作用网络图,图形可视化,极为直观展示,便于分析结果深入解读。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明细胞通讯分析方法的流程图;
图2是本发明P值最显著的前25对配受体对表达丰度气泡图;
图3 是本发明每一对细胞具有的配体-受体配对数热图;
图4 是本发明每一对细胞具有的显著富集的配体-受体配对数热图;
图5是本发明细胞交互网络图;
图6是本发明配体活力热图;
图7是本发明细胞通讯分析系统的结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合附图和具体的实施例对本发明的技术方案进行详细说明。需要指出的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1所示,本发明公开了一种细胞通讯分析方法,包括细胞通讯预测和配体-靶基因调控预测两大内容,具体方法如下:
1. 细胞通讯预测
1.1 配受体对表达丰度分析
输入单细胞基因表达量矩阵,利用 CellphoneDB软件中包含的配体-受体信息,基于一个细胞表达受体而另一个细胞表达配体的方式来分析每一对细胞中配体-受体对的表达丰度。
本实施例只对在特定簇中大于用户指定阈值百分比的细胞表达的受体和配体进行分析(默认值为 10%)。只展示了P值最显著的前25对配受体在前10对细胞对中的表达丰度信息(图2)。优选的,图形具体展示的信息是可以根据研究人员的实验背景所需的输出要求进行调整的。横坐标为细胞对,纵坐标为配受体对,每一个气泡代表一个配受体对,气泡颜色反映该配受体对在这一对细胞中的平均表达量,气泡颜色越红代表平均表达量越高,颜色越蓝代表平均表达量越低,气泡的大小代表该配受体在这一对细胞中的富集显著性,气泡越大越显著。
1.2 配受体对数目分析
基于上述对每一对细胞中配体-受体对表达丰度的分析,本实施例可以获得每一对细胞中表达的配受体对数目,由此可以对细胞间的通讯关系进行初步评估(图3)。图中每一行/列代表一个细胞,每一对细胞具有的配受体配对数用不同颜色表示,颜色越蓝表示这对细胞具有的配受体配对数越少,颜色越红表示这对细胞具有的配受体配对数越多。
1.3 显著富集配受体对数目分析
为了鉴定生物学相关性,本实施例利用 CellphoneDB 软件对数据集中的所有细胞类型之间进行成对比较,分析每一对细胞中显著富集的配受体对数目。首先,随机排列所有细胞簇标记(默认为 1,000 次),并确定细胞簇中配体表达水平的平均值和相互作用细胞簇中受体平均表达水平。通过这种方式,在两种细胞类型之间的配对比较中为每个配体-受体对生成了零分布。通过计算与实际均值一样高或高于实际均值的配受体表达量均值的比例,本实施例获得每种配体受体复合物在特定细胞类型中富集可能性的 P 值,本实施例定义 P 值小于 0.05 为显著富集(图4)。配受体在这一对细胞中的富集显著性P 值小于0.05则定义该配受体对为显著富集配受体对,基于显著富集配受体对数目绘图。图中每一行/列代表一个细胞,每一对细胞具有的显著富集配受体配对数用不同颜色表示,颜色越蓝表示这对细胞具有的显著富集配受体配对数越少,颜色越红表示这对细胞具有的显著富集配受体配对数越多。
1.4 细胞交互网络图构建
基于每一对细胞对之间显著富集的配体-受体对数目,本实施例以细胞对之间富集的配受体对数目为线的数据来源,以细胞中含有的配受体对总数目为节点的数据来源绘图,构建了细胞相互作用网络图,可以更加直观的展示细胞之间的调控关系(图5)。气泡代表一个细胞亚群,气泡大小由互作的细胞亚群数量决定,代表细胞在群体之间的关联作用,气泡越大说明细胞在群体中关联作用越强。线代表配体-受体对,线的粗细由每一对细胞之间配受体配对数目决定,代表细胞对之间通讯强弱,线越粗说明细胞对之间通讯越强。
CellphoneDB构建了细胞之间的通讯状态,阐明细胞可以通过哪些细胞外信号进行沟通,但配体细胞产生的配体如何影响受体细胞,即配体作用后,受体细胞产生了哪些信号响应需要进一步探索。因此,在细胞通讯预测的基础上,本实施例利用NicheNet软件中配体-靶基因预测信息,基于受体信号细胞中特定基因集的表达量变化,可以进一步分析配体信号细胞中的配体活性以及配体对特定基因集中的基因的调控潜力。配体-受体-靶基因分析能够更好的分析配体细胞内或细胞间配体活性的差异性,有助于揭示通讯细胞间的调控机制。
2.配体-靶基因调控预测
2.1 配体活性分析
利用 NicheNet软件来分析配体信号细胞中的哪些配体最有可能影响相互作用的受体信号细胞中的特定基因集表达,软件基于先前的配体-靶基因预测与配受体信号细胞交流后实际观察到的受体信号细胞中相应靶基因集表达变化程度的相关性对配体活性进行排序。
本实施例,从细胞交互网络图中选取了在所有细胞群中关联关系最强的一个细胞作为配体细胞,同时选取了与它通讯关系最强的五个细胞作为受体细胞。然后,从KEGGpathway数据库中选取了与基础调控相关信号通路map04151-PI3K-Akt signalingpathway、与肿瘤相关信号通路map04668-TNF signaling pathway、与生长代谢相关信号通路map04150-mTOR signaling pathway作为受体信号细胞中特定基因集分别对配体信号细胞进行了配体活性分析。
值得说明的是,用于配体活性分析的细胞对和基因集可根据实验样本具体的研究目的确定。
2.2 配体-靶基因调控潜力分析
NicheNet 软件整合了包含蛋白质-蛋白质相互作用,配体到下游转录调节因子的信号传导途径,以及转录调节因子和靶基因之间的基因调节相互作用的生物学信息,构建了配体-靶基因调控加权网络。
本实施例利用NicheNet针对上述三个信号通路基因集分别筛选了每一对细胞中的配体-靶基因对,并对配体信号细胞中的配体与受体信号细胞中特定基因集中的基因之间的调控潜力进行打分,分值越大则调控潜力越大。
表1 配体-靶基因调控潜力表(本实施例仅展示前10行)
| 配体信号细胞表达的调控受体信号细胞的所有配体 | PI3K-Akt signalingpathway | TNF signalingpathway | mTOR signalingpathway |
| GSTP1-SLC7A5 | 0 | 0 | 0.00102111808969808 |
| CALM1-TNFRSF1A | 0 | 0 | 0.000976306071064089 |
| RPS19-FASLG | 0 | 0 | 0 |
| HLA-DRA-ITCH | 0 | 0 | 0 |
| CALM1-MAGI1 | 0.000991246964520441 | 0 | 0 |
| GSTP1-DVL2 | 0 | 0 | 0.000968193464447792 |
| RPS19-MAGI1 | 0 | 0 | 0 |
| RPS19-DVL2 | 0 | 0 | 0 |
| CALM1-BCL2 | 0.00116751811142316 | 0 | 0 |
| HLA-DRA-FOXO3 | 0.000995927826908199 | 0 | 0 |
本实施例,进一步根据分值绘制配体-靶基因调控潜力热图(图6),从热图中可以得到配体主要调控的靶基因,有助于揭示细胞通讯的分子机制。图中纵坐标为配体信号细胞中调控受体信号细胞中特定基因集的所有配体,横坐标为受体信号细胞中不同的基因集,配体的活力用不同颜色表示,颜色越深表示配体在这对细胞中活力越强,颜色越浅则活力越弱。
实施例2
如图7所示,本发明还提供一种细胞通讯分析系统,包括细胞通讯预测模块和配体-靶基因调控预测模块;
所述细胞通讯预测模块包括:
配受体对表达丰度分析单元,用于输入单细胞基因表达量矩阵,利用CellphoneDB软件中包含的配体-受体信息,基于一个细胞表达受体而另一个细胞表达配体的方式来分析每一对细胞中配体-受体对的表达丰度。
配受体对数目分析单元,用于基于对每一对细胞中配体-受体对表达丰度的分析,可以获得每一对细胞中表达的配受体对数目,由此可以对细胞间的通讯关系进行初步评估。
显著富集配受体对数目分析单元,用于利用 CellphoneDB 软件对数据集中的所有细胞类型之间进行成对比较,分析每一对细胞中显著富集的配受体对数目。
细胞交互网络图构建单元,用于基于每一对细胞对之间显著富集的配体-受体对数目,构建细胞相互作用网络图,以细胞对之间富集的配受体对数目为线的数据来源,以细胞中含有的配受体对总数目为节点的数据来源绘图,更加直观的展示了细胞之间的潜在调控关系。
所述配体-靶基因调控预测模块包括:
配体活性分析单元,用于利用 NicheNet软件来分析配体信号细胞中最有可能影响相互作用的受体信号细胞中的特定基因集表达的配体,软件基于先前的配体-靶基因预测与配受体信号细胞交流后实际观察到的受体信号细胞中相应靶基因集表达变化程度的相关性对配体活性进行排序。
配体-靶基因调控潜力分析单元,用于利用加权网络对配体信号细胞中的配体与受体信号细胞中特定基因集中的基因之间的调控潜力进行打分,分值越大则调控潜力越大。
与现有技术相比,本发明的有益效果至少包括:
(1)本发明的细胞通讯分析方法两个软件联合分析,利用CellphoneDB软件预测细胞间潜在的通讯关系,紧接着从互作网络中选取通讯关系最强的五对细胞,利用NicheNet软件进一步分析细胞对中显著富集配受体对中的配体活性,并最终揭示配体主要调控的靶基因。即先对细胞间关系进行分析,在对细胞内调控网络分析,从细胞间通讯预测到定位至某个基因的表达变化,由此给出的是一个完整的从细胞通讯角度出发揭示表型变化机制的研究思路。
(2)目前分析方法主要受物种限制,本发明细胞通讯方法以人的细胞通讯为研究模型,可以推广至其他模式物种,针对非模式物种也可以通过同源比对之后进行分析,可应用范围广泛。为非模式物种提供了一个细胞通讯分析系统。也可以为揭示某个细胞行为,深入解析细胞通讯结果,提供一个新的基础科研研究思路。
(3)多种图示化结果展示,便于研究细胞间的关联关系。且独创性的构建了细胞相互作用网络图,图形可视化,极为直观展示,便于分析结果深入解读。以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种细胞通讯分析方法,其特征在于,包括细胞通讯预测和配体-靶基因调控预测;
细胞通讯预测包括:
配受体对表达丰度分析:输入单细胞基因表达量矩阵,利用细胞配受体分析软件中包含的配体-受体信息,基于一个细胞表达受体而另一个细胞表达配体的方式来分析每一对细胞中配体-受体对的表达丰度;
配受体对数目分析:基于对每一对细胞中配体-受体对表达丰度的分析,获得每一对细胞中表达的配受体对数目,对细胞间的通讯关系进行初步评估;
显著富集配受体对数目分析:利用细胞配受体分析软件对数据集中的所有细胞类型之间进行成对比较,分析每一对细胞中显著富集的配受体对数目;
细胞交互网络图构建:基于每一对细胞对之间显著富集的配体-受体对数目,构建细胞相互作用网络图,具体为:以细胞对之间富集的配受体对数目为线的数据来源,以细胞中含有的配受体对总数目为节点的数据来源绘图;
配体-靶基因调控预测包括:
配体活性分析:利用细胞配体活性分析软件来分析配体信号细胞中最有可能影响相互作用的受体信号细胞中的特定基因集表达的配体,软件基于先前的配体-靶基因预测与配受体信号细胞交流后实际观察到的受体信号细胞中相应靶基因集表达变化程度的相关性对配体活性进行排序;
配体-靶基因调控潜力分析:利用加权网络对配体信号细胞中的配体与受体信号细胞中特定基因集中的基因之间的调控潜力进行打分,分值越大则调控潜力越大。
2.根据权利要求1所述的细胞通讯分析方法,其特征在于,配受体对表达丰度分析中,只对在特定簇中大于用户指定阈值百分比的细胞表达的受体和配体进行分析。
3.根据权利要求2所述的细胞通讯分析方法,其特征在于,用户指定阈值百分比默认值为 10%。
4.根据权利要求1所述的细胞通讯分析方法,其特征在于,显著富集配受体对数目分析具体步骤如下:
随机排列所有细胞簇标记,并确定细胞簇中配体表达水平的平均值和相互作用细胞簇中受体平均表达水平;通过这种方式,在两种细胞类型之间的配对比较中为每个配体-受体对生成了零分布;通过计算高于或等于实际均值的配受体表达量均值的比例,获得每种配体受体复合物在特定细胞类型中富集可能性的 P 值,定义 P 值小于 0.05 为显著富集。
5.根据权利要求4所述的细胞通讯分析方法,其特征在于,随机排列所有细胞簇标记默认为 1,000 次。
6.根据权利要求1所述的细胞通讯分析方法,其特征在于,所述细胞配受体分析软件为CellphoneDB软件;所述细胞配体活性分析软件为NicheNet软件。
7.一种细胞通讯分析系统,其特征在于,包括细胞通讯预测模块和配体-靶基因调控预测模块;
所述细胞通讯预测模块包括:
配受体对表达丰度分析单元,用于输入单细胞基因表达量矩阵,利用细胞配受体分析软件中包含的配体-受体信息,基于一个细胞表达受体而另一个细胞表达配体的方式来分析每一对细胞中配体-受体对的表达丰度;
配受体对数目分析单元,用于基于对每一对细胞中配体-受体对表达丰度的分析,获得每一对细胞中表达的配受体对数目,对细胞间的通讯关系进行初步评估;
显著富集配受体对数目分析单元,用于利用细胞配受体分析软件对数据集中的所有细胞类型之间进行成对比较,分析每一对细胞中显著富集的配受体对数目;
细胞交互网络图构建单元,用于基于每一对细胞对之间显著富集的配体-受体对数目,构建细胞相互作用网络图,具体为:以细胞对之间富集的配受体对数目为线的数据来源,以细胞中含有的配受体对总数目为节点的数据来源绘图;
所述配体-靶基因调控预测模块包括:
配体活性分析单元,用于利用细胞配体活性分析软件来分析配体信号细胞中最有可能影响相互作用的受体信号细胞中的特定基因集表达的配体,软件基于先前的配体-靶基因预测与配受体信号细胞交流后实际观察到的受体信号细胞中相应靶基因集表达变化程度的相关性对配体活性进行排序;
配体-靶基因调控潜力分析单元,用于利用加权网络对配体信号细胞中的配体与受体信号细胞中特定基因集中的基因之间的调控潜力进行打分,分值越大则调控潜力越大。
8.根据权利要求7所述的细胞通讯分析系统,其特征在于,所述配受体对表达丰度分析单元只对在特定簇中大于用户指定阈值百分比的细胞表达的受体和配体进行分析。
9.根据权利要求8所述的细胞通讯分析系统,其特征在于,用户指定阈值百分比默认值为 10%。
10.根据权利要求7所述的细胞通讯分析系统,其特征在于,所述显著富集配受体对数目分析单元具体分析步骤如下:
随机排列所有细胞簇标记,并确定细胞簇中配体表达水平的平均值和相互作用细胞簇中受体平均表达水平;通过这种方式,在两种细胞类型之间的配对比较中为每个配体-受体对生成了零分布;通过计算高于或等于实际均值的配受体表达量均值的比例,获得每种配体受体复合物在特定细胞类型中富集可能性的 P 值,定义 P 值小于 0.05 为显著富集。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202011620086.XA CN112466403B (zh) | 2020-12-31 | 2020-12-31 | 一种细胞通讯分析方法及系统 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202011620086.XA CN112466403B (zh) | 2020-12-31 | 2020-12-31 | 一种细胞通讯分析方法及系统 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN112466403A true CN112466403A (zh) | 2021-03-09 |
| CN112466403B CN112466403B (zh) | 2022-06-14 |
Family
ID=74802247
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202011620086.XA Active CN112466403B (zh) | 2020-12-31 | 2020-12-31 | 一种细胞通讯分析方法及系统 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN112466403B (zh) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114480600A (zh) * | 2022-01-28 | 2022-05-13 | 深圳市人民医院 | 一种基于原发性干燥综合征患者免疫细胞的细胞通讯分析方法 |
| CN115083523A (zh) * | 2022-06-22 | 2022-09-20 | 广州基迪奥生物科技有限公司 | 一种双向同源比对的非模式物种细胞注释方法 |
| CN116013405A (zh) * | 2023-01-04 | 2023-04-25 | 华南农业大学 | 一种基于ExtraCellTalk的细胞通讯网络分析方法 |
| CN116403640A (zh) * | 2023-03-27 | 2023-07-07 | 上海欧易生物医学科技有限公司 | 一种基于外泌体miRNA和单细胞核转录组联合的细胞-miRNA-细胞网络构建方法及系统 |
| CN116913388A (zh) * | 2023-06-07 | 2023-10-20 | 金凤实验室 | 单细胞转录组数据分析处理方法及电子设备 |
| CN116959583A (zh) * | 2023-06-07 | 2023-10-27 | 金凤实验室 | 细胞数据综合分析系统 |
| CN120808884A (zh) * | 2025-09-04 | 2025-10-17 | 国科大杭州高等研究院 | 细胞间通信关系的识别方法、装置、设备及存储介质 |
Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20070072246A1 (en) * | 2003-09-03 | 2007-03-29 | Berg Ellen L | Cell-based assays for determining drug action |
| CN103501859A (zh) * | 2011-03-02 | 2014-01-08 | 博格有限责任公司 | 基于细胞的探询式分析及其应用 |
| WO2018152240A1 (en) * | 2017-02-14 | 2018-08-23 | The Regents Of The University Of Colorado, A Body Corporate | Methods for predicting transcription factor activity |
| US20190071718A1 (en) * | 2016-04-15 | 2019-03-07 | Koninklijke Philips N.V. | Sub-population detection and quantization of receptor-ligand states for characterizing inter-cellular communication and intratumoral heterogeneity |
| CN110957007A (zh) * | 2019-11-26 | 2020-04-03 | 上海交通大学 | 一种基于组织外泌体磷酸化蛋白组的多组学分析方法 |
| CN111312334A (zh) * | 2020-03-09 | 2020-06-19 | 上海源兹生物科技有限公司 | 一种影响细胞间通讯的受体-配体系统分析方法 |
| CN111524554A (zh) * | 2020-04-24 | 2020-08-11 | 上海海洋大学 | 基于lincs-l1000扰动信号的细胞活性预测方法 |
| CN111613268A (zh) * | 2020-05-27 | 2020-09-01 | 中山大学 | 基于单细胞转录组数据的基因表达调控机制的确定方法 |
| CN111961726A (zh) * | 2012-12-26 | 2020-11-20 | 皇家飞利浦有限公司 | 使用靶基因表达的线性组合评价细胞信号传导途径活性 |
-
2020
- 2020-12-31 CN CN202011620086.XA patent/CN112466403B/zh active Active
Patent Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20070072246A1 (en) * | 2003-09-03 | 2007-03-29 | Berg Ellen L | Cell-based assays for determining drug action |
| CN103501859A (zh) * | 2011-03-02 | 2014-01-08 | 博格有限责任公司 | 基于细胞的探询式分析及其应用 |
| CN111961726A (zh) * | 2012-12-26 | 2020-11-20 | 皇家飞利浦有限公司 | 使用靶基因表达的线性组合评价细胞信号传导途径活性 |
| US20190071718A1 (en) * | 2016-04-15 | 2019-03-07 | Koninklijke Philips N.V. | Sub-population detection and quantization of receptor-ligand states for characterizing inter-cellular communication and intratumoral heterogeneity |
| WO2018152240A1 (en) * | 2017-02-14 | 2018-08-23 | The Regents Of The University Of Colorado, A Body Corporate | Methods for predicting transcription factor activity |
| CN110957007A (zh) * | 2019-11-26 | 2020-04-03 | 上海交通大学 | 一种基于组织外泌体磷酸化蛋白组的多组学分析方法 |
| CN111312334A (zh) * | 2020-03-09 | 2020-06-19 | 上海源兹生物科技有限公司 | 一种影响细胞间通讯的受体-配体系统分析方法 |
| CN111524554A (zh) * | 2020-04-24 | 2020-08-11 | 上海海洋大学 | 基于lincs-l1000扰动信号的细胞活性预测方法 |
| CN111613268A (zh) * | 2020-05-27 | 2020-09-01 | 中山大学 | 基于单细胞转录组数据的基因表达调控机制的确定方法 |
Non-Patent Citations (4)
| Title |
|---|
| 何思羽等: "基于生物信息分析学方法筛选多发性骨髓瘤差异表达基因", 《山东医药》 * |
| 何思羽等: "基于生物信息分析学方法筛选多发性骨髓瘤差异表达基因", 《山东医药》, no. 15, 25 May 2019 (2019-05-25), pages 28 - 32 * |
| 朱锦芳,郑仲承,刘新垣: "细胞因子受体及其介导的信号转导", 《生命的化学》 * |
| 朱锦芳,郑仲承,刘新垣: "细胞因子受体及其介导的信号转导", 《生命的化学》, no. 03, 15 June 1996 (1996-06-15), pages 14 - 18 * |
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114480600A (zh) * | 2022-01-28 | 2022-05-13 | 深圳市人民医院 | 一种基于原发性干燥综合征患者免疫细胞的细胞通讯分析方法 |
| CN115083523A (zh) * | 2022-06-22 | 2022-09-20 | 广州基迪奥生物科技有限公司 | 一种双向同源比对的非模式物种细胞注释方法 |
| CN115083523B (zh) * | 2022-06-22 | 2025-02-07 | 广州基迪奥生物科技有限公司 | 一种双向同源比对的非模式物种细胞注释方法 |
| CN116013405A (zh) * | 2023-01-04 | 2023-04-25 | 华南农业大学 | 一种基于ExtraCellTalk的细胞通讯网络分析方法 |
| CN116403640A (zh) * | 2023-03-27 | 2023-07-07 | 上海欧易生物医学科技有限公司 | 一种基于外泌体miRNA和单细胞核转录组联合的细胞-miRNA-细胞网络构建方法及系统 |
| CN116403640B (zh) * | 2023-03-27 | 2025-11-18 | 上海欧易生物医学科技有限公司 | 一种上游细胞-miRNA-下游细胞网络构建方法及系统 |
| CN116913388A (zh) * | 2023-06-07 | 2023-10-20 | 金凤实验室 | 单细胞转录组数据分析处理方法及电子设备 |
| CN116959583A (zh) * | 2023-06-07 | 2023-10-27 | 金凤实验室 | 细胞数据综合分析系统 |
| CN120808884A (zh) * | 2025-09-04 | 2025-10-17 | 国科大杭州高等研究院 | 细胞间通信关系的识别方法、装置、设备及存储介质 |
| CN120808884B (zh) * | 2025-09-04 | 2025-12-16 | 国科大杭州高等研究院 | 细胞间通信关系的识别方法、装置、设备及存储介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN112466403B (zh) | 2022-06-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN112466403B (zh) | 一种细胞通讯分析方法及系统 | |
| Aguilée et al. | Clade diversification dynamics and the biotic and abiotic controls of speciation and extinction rates | |
| Brazma et al. | Gene expression data analysis | |
| Bendall et al. | Single-cell trajectory detection uncovers progression and regulatory coordination in human B cell development | |
| Shen et al. | Meta-analysis for pathway enrichment analysis when combining multiple genomic studies | |
| Brazma et al. | Gene expression data analysis | |
| CN107391963A (zh) | 基于计算云平台的真核无参转录组交互分析系统及其方法 | |
| Qu et al. | Gene trajectory inference for single-cell data by optimal transport metrics | |
| Zhang et al. | T cell-related prognostic risk model and tumor immune environment modulation in lung adenocarcinoma based on single-cell and bulk RNA sequencing | |
| Pehkonen et al. | Theme discovery from gene lists for identification and viewing of multiple functional groups | |
| US20160019335A1 (en) | Method, apparatus and computer program product for metabolomics analysis | |
| US20090299646A1 (en) | System and method for biological pathway perturbation analysis | |
| Wiltgen et al. | DNA microarray analysis: principles and clinical impact | |
| Sekula et al. | Detection of differentially expressed genes in discrete single-cell RNA sequencing data using a hurdle model with correlated random effects | |
| Li et al. | SEPA: signaling entropy-based algorithm to evaluate personalized pathway activation for survival analysis on pan-cancer data | |
| Harbig et al. | OmicsTIDE: interactive exploration of trends in multi-omics data | |
| Bartlett et al. | An eQTL biological data visualization challenge and approaches from the visualization community | |
| KR101003175B1 (ko) | 상호 연관 지도 작성법을 이용한 다목적 활용 가능 유전자 판별법 | |
| Tzaferis et al. | SCALA: A complete solution for multimodal analysis of single-cell Next Generation Sequencing data | |
| LU103183B1 (en) | Method for building prognosis model of lung adenocarcinoma based on cuproptosis-related genes | |
| Ancheta et al. | Challenges and Progress in RNA Velocity: Comparative Analysis Across Multiple Biological Contexts | |
| Fan et al. | scHi-CSim: a flexible simulator that generates high-fidelity single-cell Hi-C data for benchmarking | |
| Wang et al. | KanCell: dissecting cellular heterogeneity in biological tissues through integrated single-cell and spatial transcriptomics | |
| Li et al. | Assumption weighting for incorporating heterogeneity into meta-analysis of genomic data | |
| McArdle et al. | PRESTO, a new tool for integrating large-scale-omics data and discovering disease-specific signatures |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |