[go: up one dir, main page]

CN107368700A - 基于计算云平台的微生物多样性交互分析系统及其方法 - Google Patents

基于计算云平台的微生物多样性交互分析系统及其方法 Download PDF

Info

Publication number
CN107368700A
CN107368700A CN201710598335.1A CN201710598335A CN107368700A CN 107368700 A CN107368700 A CN 107368700A CN 201710598335 A CN201710598335 A CN 201710598335A CN 107368700 A CN107368700 A CN 107368700A
Authority
CN
China
Prior art keywords
analysis
module
project
result
cloud platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710598335.1A
Other languages
English (en)
Inventor
余果
任一
郭权
王兆月
董亚晨
刘林梦
赵建华
杨慧
宣红东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Sangge Information Technology Co Ltd
Original Assignee
Shanghai Sangge Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Sangge Information Technology Co Ltd filed Critical Shanghai Sangge Information Technology Co Ltd
Priority to CN201710598335.1A priority Critical patent/CN107368700A/zh
Publication of CN107368700A publication Critical patent/CN107368700A/zh
Priority to CN201810797363.0A priority patent/CN109192242A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于计算云平台的微生物多样性交互分析系统及其方法,该系统包括项目管理模块、基础分析任务提交模块和交互式结果分析模块;首先,向本地集群服务器上传测序数据,在项目管理模块中建立项目,同时在本地集群服务器上传客户的数据库或者选择使用线上的数据库,并且在该项目管理模块中可以进行项目锁定或者共享给他人操作;然后,在基础分析任务提交模块中,用户可以通过可视化界面对测序数据进行参数分析,分析之后产生项目文件;分析之前,先进行判定数据质控是否合格,若合格则进行参数分析;若不合格则直接返回报错;产生的项目文件传送至交互式结果分析模块中进行交互式分析,得到直观呈现的报告。

Description

基于计算云平台的微生物多样性交互分析系统及其方法
技术领域
本发明涉及生物信息分析技术领域,尤其涉及一种基于计算云平台的微生物多样性交互分析系统及其方法。
背景技术
微生物作为生物类群的重要组成部分,具有巨大的种群数量,广泛的分布范围,极强的适应与繁殖能力。一些非培养的研究微生物多样性的方法,如DNA指纹图谱技术、微阵列基因芯片等,克服了传统培养技术的一些缺点,获得了一部分不能分离培养的土壤微生物信息。高通量测序方法实现了大规模微生物基因直接测序,极大的提高了测序通量,在微生物物种和结构多样性研究中可获得更多的信息。
生物信息学数据分析是高通量测序应用于微生物多样性研究的最关键步骤。Illumina HiSeq运行一次产生的数据量高达1000G,个人计算机和工作站显然无法完成这些数据的处理工作。
高通量数据处理时要对数据进行调整、筛选、比对,需要生物信息学工作者掌握脚本程序编写能力。现有微生物多样性生物信息分析主要由三部分组成。标准生物信息学分析是整个多样性分析的基础,其结果呈现包括有效测序序列结果统计、优质序列统计、各样本序列数目统计、OTU(操作分类单元)生成、稀释曲线分析、多样性指数分析、样品OTU分布及分类学信息。高级生物信息学分析呈现方式包括:聚类分析、多样品群落结构分析以及组间显著性差异分析等。个性化生物信息学分析包括:PCA分析、RDA/CCA分析等。
现有技术的业务流程采用手动的方式,工作效率较低,因此无法满足市场的需求。
发明内容
针对上述技术中存在的不足之处,本发明提供一种基于计算云平台的微生物多样性交互分析系统及其方法,以解决个人计算机和工作站无法完成数据处理和现有手动业务流程效率低的问题。
为实现上述目的,本发明提供一种基于计算云平台的微生物多样性交互分析系统,包括
项目管理模块,用于对项目信息进行查看和管理,通过项目、任务、应用和文件对所有状态的分析项目进行综合管理;
基础分析任务提交模块,用于设置基础参数运行任务,并将结果以及原始数据按照预设格式整合封装成相应的项目文件;
交互式结果分析模块,用于根据用户请求生成分析结果,并将结果可视化展示;
所述项目管理模块通过基础分析任务提交模块与交互式结果分析模块相连接;
首先,向本地集群服务器上传测序数据,在项目管理模块中建立项目,同时在本地集群服务器上传客户的数据库或者选择使用线上的数据库,并且在该项目管理模块中可以进行项目锁定或者共享给他人操作;
然后,在基础分析任务提交模块中,用户可以通过可视化界面对测序数据进行参数分析,分析之后产生项目文件;分析之前,先进行判定数据质控是否合格,若合格则进行参数分析;若不合格则直接返回报错;
最后,产生的项目文件传送至交互式结果分析模块中进行交互式分析,根据用户需求对项目文件进行二次分析和统计,得到直观呈现的报告。
为实现上述目的,本发明还提供一种基于计算云平台的微生物多样性交互分析方法,包括以下步骤:
步骤0,创建项目;
步骤1,向本地集群服务器上传测序数据,在项目管理模块中建立项目,同时在本地集群服务器上传客户的数据库或者选择使用线上的数据库,并且在该项目管理模块中可以进行项目锁定或者共享给他人操作;
步骤2,建立任务;
步骤3,在基础分析任务提交模块中,用户可以通过可视化界面对测序数据进行参数分析,分析之后产生项目文件;分析之前,先进行判定数据质控是否合格,若合格则进行参数分析;若不合格则直接返回报错;
步骤4,产生的项目文件传送至交互式结果分析模块中进行交互式分析,根据用户需求对项目文件进行二次分析和统计,得到直观呈现的报告。
其中,所述步骤3中在进行测序数据参数分析时,用户可以自行选择分组方案,并且配置环境因子,选择需要的数据库,选择完成之后再进行分析。
其中,所述项目管理模块,还可用于查看和管理上传的相关文件或由分析产生的相关文件,可对相关文件进行上传、查找、复制、移动、删除和下载操作;项目管理模块还用于标记项目状态进度,项目状态进度可为未开始、进行中、已完成、已终止和问题;项目管理模块还用于查看任务运行的状态与日志信息;且项目管理模块,还用于共享项目,并管理成员权限。
其中,物种分类数据库存储在本地集群服务器内,使用线上的数据库包括16s、18s、its和fungi,也可上传自定义数据库。
其中,所述基础分析任务提交模块可用于数据质控统计、OTU聚类、物种分类、Alpha多样性和Beta多样性研究。
其中,所述交互式结果分析模块还用于高级生物信息学分析和个性化生物信息学分析,包括群落组成分析、组间显著性差异分析、样本分组分析、LEfSe多级物种差异判别分析和进化分析;交互式结果分析模块还用于更改分组方案和挑选分析样品。
其中,所述交互式结果分析模块包括图表工具,可实现更改颜色方案、形状方案、柱形方向;可显示图例、点名称、合并或排序功能;交互式结果分析模块分析结果可存入报告,在报告中展示;交互式结果分析模块分析结果图可以PNG、JPEG、PDF、SVG格式下载;交互式结果分析模块的报告格式可为html和pdf。
其中,所述项目管理模块、基础分析任务提交模块和交互式结果分析模块的操作均基于html+Css+jquery的前端页面和PHP+Alpha服务器后台,交互分析模块接收到任务执行命令后调动Perl、C、python、R计算机语言的服务器端脚本对测序数据进行基本分析。
其中,所述基础分析任务提交模块在对所述测序数据进行分析的不同阶段,从其存储的分析软件中选取相应的分析软件对所述测序数据进行分析。
本发明的有益效果是:与现有技术相比,本发明提供的基于计算云平台的微生物多样性交互分析系统及其方法,该发明主要包括项目管理模块、基础分析任务提交模块和交互式结果分析模块三大模块,该系统及方法借助云计算技术,通过网络方便的获取大量测序数据分析所需要的基础计算资源,满足了大数据背景下研究人员对于基础计算资源的巨大需求。同时,基于计算云平台的微生物多样性交互分析方法提供了高集成化的数据分析平台,无需用户自己整合各类分析软件,搭建分析流程,真正意义上实现了一键化生物信息分析。此外,基于计算云平台的微生物多样性分析可灵活设置分组,支持多种算法,呈现可视化的结果和交互式的报告。最后,基于计算云平台的微生物多样性分析内容全面,不仅涵盖微生物多样性分析的基础分析和高级分析,还包括部分个性化分析,更好满足用户需求。
附图说明
图1为本发明的基于计算云平台的微生物多样性交互分析系统方框图;
图2为本发明的基于计算云平台的微生物多样性交互分析方法流程图;
图3为本发明中基础分析任务提交模块的微生物多样性分析的示意图;
图4为本发明中微生物多样性分析新建项目示意图;
图5为本发明中微生物多样性基础任务参数提交示意图。
图6为本发明中微生物多样性交互分析示意图;
图7为本发明中微生物多样性PCA图表工具示意图;
图8为本发明中微生物多样性分析报告示意图。
主要元件符号说明如下:
10、项目管理模块 11、基础分析任务提交模块
12、交互式结果分析模块。
具体实施方式
为了更清楚地表述本发明,下面结合附图对本发明作进一步地描述。
请参阅图1,本发明的基于计算云平台的微生物多样性交互分析系统,包括
项目管理模块10,用于对项目信息进行查看和管理,通过项目、任务、应用和文件对所有状态的分析项目进行综合管理;
基础分析任务提交模块11,用于设置基础参数运行任务,并将结果以及原始数据按照预设格式整合封装成相应的项目文件;
交互式结果分析模块12,用于根据用户请求生成分析结果,并将结果可视化展示;
项目管理模块通过基础分析任务提交模块与交互式结果分析模块相连接;
首先,向本地集群服务器上传测序数据,在项目管理模块中建立项目,同时在本地集群服务器上传客户的数据库或者选择使用线上的数据库,并且在该项目管理模块中可以进行项目锁定或者共享给他人操作;测序数据可以是fastq格式的数据;
然后,在基础分析任务提交模块中,用户可以通过可视化界面对测序数据进行参数分析,分析之后产生项目文件;分析之前,先进行判定数据质控是否合格,若合格则进行参数分析;若不合格则直接返回报错;
最后,产生的项目文件传送至交互式结果分析模块中进行交互式分析,根据用户需求对项目文件进行二次分析和统计,得到直观呈现的报告。
请进一步参阅图2,本发明还提供一种基于计算云平台的微生物多样性交互分析方法,包括以下步骤:
步骤S0,创建项目;
步骤S1,向本地集群服务器上传测序数据,在项目管理模块中建立项目,同时在本地集群服务器上传客户的数据库或者选择使用线上的数据库,并且在该项目管理模块中可以进行项目锁定或者共享给他人操作;
步骤S2,建立任务;
步骤S3,在基础分析任务提交模块中,用户可以通过可视化界面对测序数据进行参数分析,分析之后产生项目文件;分析之前,先进行判定数据质控是否合格,若合格则进行参数分析;若不合格则直接返回报错;
步骤S4,产生的项目文件传送至交互式结果分析模块中进行交互式分析,根据用户需求对项目文件进行二次分析和统计,得到直观呈现的报告。
相较于现有技术的情况,本发明提供的基于计算云平台的微生物多样性交互分析系统及其方法,该发明主要包括项目管理模块10、基础分析任务提交模块11和交互式结果分析模块12三大模块,该系统及方法借助云计算技术,通过网络方便的获取大量测序数据分析所需要的基础计算资源,满足了大数据背景下研究人员对于基础计算资源的巨大需求。同时,基于计算云平台的微生物多样性交互分析方法提供了高集成化的数据分析平台,无需用户自己整合各类分析软件,搭建分析流程,真正意义上实现了一键化生物信息分析。此外,基于计算云平台的微生物多样性分析可灵活设置分组,支持多种算法,呈现可视化的结果和交互式的报告。最后,基于计算云平台的微生物多样性分析内容全面,不仅涵盖微生物多样性分析的基础分析和高级分析,还包括部分个性化分析,更好满足用户需求。
在本实施例中,步骤S2中在进行测序数据参数分析时,用户可以自行选择分组方案,并且配置环境因子,选择需要的数据库,选择完成之后再进行分析。
在本实施例中,项目管理模块,还可用于查看和管理上传的相关文件或由分析产生的相关文件,可对相关文件进行上传、查找、复制、移动、删除和下载操作;项目管理模块还用于标记项目状态进度,项目状态进度可为未开始、进行中、已完成、已终止和问题;项目管理模块还用于查看任务运行的状态与日志信息;且项目管理模块,还用于共享项目,并管理成员权限。
在本实施例中,物种分类数据库存储在本地集群服务器内,使用线上的数据库包括16s、18s、its和fungi,也可上传自定义数据库。
请进一步参阅图3,基础分析任务提交模块可用于数据质控统计、OTU聚类、物种分类、Alpha多样性和Beta多样性研究。数据质控统计根据所选fastq文件判定文件中包含的样本数目,有效序列数目,有效碱基数目,序列平均长度,序列长度分布等信息。OTU聚类根据参数OTU序列相似度对序列进行归类操作,而物种分类则通过选择数据库,通过RDPclassifier贝叶斯算法对OTU代表序列进行分类学比对,得到每个OTU对应的物种分类信息。Alpha多样性反映微生物群落的丰度和多样性,包括一系列统计学分析指数估计环境群落的物种丰度和多样性,可选择多个指数进行分析。Beta多样性表示的是微生物群落构成的比较,可选择某种分析方法进行运算,在交互分析页面可进一步设置样本分组和设置不同的距离算法进行分析。在此生成的结果可在交互式分析模块中可视化查看,也可在项目文件中查看对应结果文件。
在本实施例中,交互式结果分析模块还用于高级生物信息学分析和个性化生物信息学分析,包括群落组成分析、组间显著性差异分析、样本分组分析、LEfSe多级物种差异判别分析和进化分析;交互式结果分析模块还用于更改分组方案和挑选分析样品。交互式结果分析模块包括图表工具,可实现更改颜色方案、形状方案、柱形方向;可显示图例、点名称、合并或排序功能;交互式结果分析模块分析结果可存入报告,在报告中展示;交互式结果分析模块分析结果图可以PNG、JPEG、PDF、SVG格式下载;交互式结果分析模块的报告格式可为html和pdf。项目管理模块、基础分析任务提交模块和交互式结果分析模块的操作均基于均基于html+Css+jquery的前端页面和PHP+Alpha服务器后台,交互分析模块接收到任务执行命令后调动Perl、C、python、R计算机语言的服务器端脚本对测序数据进行基本分析。基础分析任务提交模块在对测序数据进行分析的不同阶段,从其存储的分析软件中选取相应的分析软件对测序数据进行分析。
请进一步参阅图4,为基于本发明创建项目和任务步骤,点击分析平台进入我的项目,点击新建项目,填写项目名称,项目描述,选择领域标签,物种标签。点击已建立的项目名称,新建任务。请参阅图5,参数的设置主要包括数据质控统计、OTU聚类、物种分类、Alpha多样性和Beta多样性参数设置。在此可选择输入fastq格式序列文件也可选择包含每个样本序列的fastq序列文件夹。在此可对fastq文件中的样本信息进行检测,可编辑样本名称,并选择分析使用的样本,若有多行样本的分析名称相同则分析中合并为同一样本。与此同时,可选择样本分组文件与环境因子表,OTU序列相似度,一般默认为0.97,物种分类置信度,一般默认为0.7,采用RDP classifier贝叶斯算法对97%相似水平的OTU代表序列进行分类学比对,系统已有数据库包括16s,18s,its,fungi等,也可上传自定义数据库,满足格式要求即可。Alpha多样性可选择多样性估计指数和稀释曲线多样性指数进行分析,Beta多样性可选择多元分析方法和距离算法。
交互式结果分析模块的分析参阅图6,主要包括数据质控,物种注释与评估,Alpha多样性研究,Beta多样性研究,物种差异分析。其中数据质控包括样本信息统计和样本的序列长度分布两个模块。样本信息统计表统计了每个样本的序列数、碱基数、平均长度、最短序列长度和最长序列长度等信息。样本的序列长度分布通过统计和绘制柱形图查看样本序列在各个长度区间范围中的序列数分布情况。在柱形图的图表工具中可选择样本、分组方案、颜色以及步长。在序列长度分布图上可以选中实现图形的部分区域的放大,也可使用图形右下角的放大工具对整个图形进行放大。点击存入报告按钮,可将该图片存到报告相应位置。
物种注释与评估包括OTU分析、Venn图分析、群落组成分析和样本与物种关系图四个模块。其中OTU分析分为OTU统计和Pan/Core OTU。其中OTU统计用于显示OTU统计的相关信息,可对OTU表进行抽平和物种筛选等操作,其中抽平可按照最小样本序列数也可自定义样本序列数进行,物种筛选可按照不同分类水平的物种(OTU)进行,也可根据物种(OTU)在样本中的分布进行,也可根据物种(OTU)的序列数总和进行。将参数设置完成后,点击运行可生成新的OTU表格,OTU分析的结果显示分为OTU物种分类统计和等级丰度曲线(Rank-Abundance)。OTU物种分类统计包括信息统计和OTU表,信息统计可统计各个分类水平的物种(OTU)数目。OTU表可显示物种(OTU)名称和数目,并可根据物种(OTU)名称进行查找。Rank-Abundance曲线和OTU分类统计都可选择上述运行生成的结果表和选择当前显示的最低级别的分类水平。Pan/Core OTU的参数设置与OTU统计基本一致,选择OTU表、分类水平、分组方案后点击运行进行Pan/Core OTU的分析。分析结果分为Pan/Core曲线图和Pan/Core曲线表,运行结束后在Pan/Core结果选择运行后的Pan OTU或Core OTU结果,计算类别中选择显示Pan OTU还是Core OTU。Venn图分析可点击OTU表的下拉框选择要分析的OTU表,分类水平的下拉框选择进行分析的分类水平,Venn分析还需要分组信息,点击分组方案下拉框可选择分组或创建分组,点击运行进行分析。Venn结果包括Venn统计表和Venn图以及Venn物种分布饼图。点击保存可将图片保存至本地,点击存入报告则将图片存入静态报告中。群落组成分析,同上选择OTU表、分类水平、分组方案后即可运行,产生的结果可绘制柱图(多样本Bar图)、热图(Heatmap图)、Pie图和多级物种饼图。样本与物种分布关系以样本与物种共现性弦图展示,只需要选择OTU表即可生成对应的样本与物种共现性弦图。
Alpha多样性研究包括多样性指数和稀释性曲线两个模块,其中多样性指数分析包括多样性指数和组间T检验,多样性指数选择相应的OTU表、分类水平、分组方案和指数类型即可运行。可供选择的指数有:ace、bergerparker、boneh、bootstrap、bstick、chao、coverage、efron、geometric、goodscoverage、heip、invsimpson、jack、logseries、npshannon、nseqs、qstat、shannon、shannoneven、shen、simpsoneven、smithwilson、sobs、solow。结果为多样性指数柱状图和多样性指数表,多样性指数柱状图点击切换指数可切换显示某一指数的柱状图。针对Alpha多样性指数表,用组间T检验来比较两组样本中各指数的差异是否显著,计算的方法可为student’st test,Welch’s T test和Wilcoxon rank-sum test。若选择的分组超过两个,则将所有分组类别进行两两组合,分别分析每个两两分组的多样性指数差异是否显著,可点击切换组别的下拉按钮进行切换显示某个两两分组比较的结果表,点击指数类型旁边的图表即可显示该指数类型的柱状图。稀释性曲线分析包括稀释性曲线表和稀释性曲线图,选择OTU表,分类学水平,分组方案和指数类型即可运行产生结果。指数类型包括:ace、bootstrap、chao、coverage、heip、invsimpson、jack、npshannon、shannon、shannoneven、simpson、simpsoneven、smithwilson、sobs。针对稀释性曲线表,可选择切换指数按钮选择显示相应的稀释性曲线表。
Beta多样性研究包括Beta多样性分析、环境因子分析和样本分组分析三个模块。其中,Beta多样性分析包括Hcluster层级聚类、PCA主成分分析、PCoA主坐标分析和NMDS非度量多维分析。Hcluster层级聚类选择OTU表、分类水平、分组方案、距离算法和物种层级聚类方式等参数后即可运行。结果展示为Hcluster聚类图和样本距离热图。PCA主成分分析,选择OTU表、分类水平和分组方案后即可运行,也可选择环境因子数据进行分析,结果分为PCA图和PCA相关数据表。在PCA图,可利用图表工具设置X轴、Y轴,改写X轴、Y轴和图主标题名称,颜色方案,形状方案,显示环境因子和点名称。PCA相关数据表包括物种/环境因子相关数据和PCA图坐标表,其中物种/环境因子相关数据又包括物种主成分贡献度表和数量型环境因子表,PCA图坐标表又包括样本坐标表和数量型环境因子坐标表。PCoA主坐标分析需设置的参数有OTU表、分类水平、分组方案和距离算法,结果展示为PCoA图和PCoA相关数据表。PCoA图表工具可设置X轴、Y轴,颜色方案、形状方案和显示点名称,PCoA相关数据包括样本坐标表和矩阵特征值表。NMDS非度量多维分析输入的参数同PCoA一样,得到的结果分为NMDS图和NMDS相关数据表。环境因子分析包括RDA/CCA、db-RDA、Mantel Test和PearsonCorrelation分析4个部分。RDA/CCA分析参数设置包括OTU表、分类水平、分组方案、环境因子数据,结果也包括RDA/CCA图和RDA/CCA相关数据表包括样本坐标表、物种坐标表、DCA分析结果表和数量型环境因子坐标表。Db-RDA分析参数设置包括OTU表、分类水平、分组方案、环境因子数据和距离算法,结果也分为db-RDA图和db-RDA相关数据表。Mantel Test分析输入的参数有OTU表、分类水平、分组方案、群落距离矩阵算法、环境因子表、环境因子矩阵算法和控制单位,结果展示为Mantel Test判断结果和结果矩阵表,结果矩阵表又包括样本群落距离矩阵、样本环境因子距离矩阵和样本控制矩阵。Pearson Correlation分析输入的参数有OTU表、分类水平、分组方案和环境因子表,展示结果为相关性热图和相关性矩阵。样本分组分析模块包括Anosim/Adonis分析和PLS-DA分析。Anosim相似性分析输入的参数有OTU表、分类水平、分组方案、距离算法和置换次数,结果为组间距离盒状图和Anosim/Adonis分析结果表。PLS-DA分析只需输入OTU表、分类水平和分组方案即可,结果为PLS-DA图和PLS-DA相关数据表。
物种差异分析模块包括组间显著性差异检验和LEfSe多级物种差异判别分析。其中组间显著性差异检验包括多组比较、两组比较和两样本比较。多组比较需要输入的参数有OTU表、分类水平、分组方案、检验方法、多重检验校正和CI计算方法,结果展示为多物种差异检验柱形图和差异检验统计表,点击差异检验统计表中某一物种的柱形图、箱线图或Post-hoc图图标即可查看相应的单物种比较图。两组比较输入的参数为OTU表、分类水平、分组方案、检验方法、单双尾检验、显著性水平、多重检验校正和CI计算方法。结果展示为两组比较多物种差异检验柱形图和差异性检验统计表,点击差异性检验统计表中某一物种(OTU)的柱形图或箱线图图表即可查看相应的单物种比较图。两样本比较参数设置包括OTU表、分类水平、样本1、样本2、检验方法、单双尾检验、显著性水平、多重检验校正和CI计算方法。结果展示为多物种差异检验柱形图和差异检验统计表。LEfSe多级物种差异判别分析参数设置包括OTU表、分组方案、二级分组、LDA阈值和多组比较策略,生成的结果展示为LEfSe多级物种层级树图和LDA判别柱形图和LDA判别结果表。
进化分析模块主要是系统发生进化树,参数设置包括OTU表、分类水平、颜色设置和样本分组,结果展示为进化树图和环形进化树图。
本发明的分析报告参阅图7-8,在交互分析页面点击存入报告按钮,即可将分析所得结果存入报告相应位置。在报告中可查看使用软件及方法,以及生物学意义上的解释。
本发明所述的一种基于计算云平台的微生物多样性交互分析方法交互分析所产生的结果文件按照预设格式整合封装成相应的项目文件。产生的结果文件可下载,供进一步的分析。
本发明所述的一种基于计算云平台的微生物多样性交互分析方法,用户可以自由选择测序数据,自定义所需参数,利用所述配置文件对所述测序数据进行基本分析,并以图表和报告的形式呈现,因而相较于采用手动方式进行分析的现有技术,本发明采用自动的方式进行分析,能够提高微生物多样性分析的效率。
本发明实施例中,还包括高级生信分析和个性化生信分析,高级生信分析和个性化生信分析是在基本分析的基础上做进一步分析,提高基本分析所得数据的利用效率,有针对的、更深层的挖掘数据信息,使得微生物多样性分析方式不再局限于传统业务线流程的单一性,提高了微生物多样性分析的效率和数据利用率,一个基本数据可做无限次高级分析和个性化分析,节省了时间和实验成本。
本实施例中,基于计算云平台的微生物多样性交互分析方法集成业内普遍认可的QIIME、mothur对测序数据进行分析,生成的图表符合专业期刊的要求。在工作流程界面,按照步骤一到步骤六的顺序,选择感兴趣的拼接后的Fastq格式的文件,上传分组信息表以及环境因子表,选择比对数据库,设定分析参数,点击保存并运行,即可实现微生物多样性项目的交互分析。在交互分析页面中,用户可以自由执行挑选样本、更改分组、改变配色等操作,不必和分析员反复沟通等待,大大缩短了项目周期。
以上公开的仅为本发明的几个具体实施例,但是本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (10)

1.一种基于计算云平台的微生物多样性交互分析系统,其特征在于,包括
项目管理模块,用于对项目信息进行查看和管理,通过项目、任务、应用和文件对所有状态的分析项目进行综合管理;
基础分析任务提交模块,用于设置基础参数运行任务,并将结果以及原始数据按照预设格式整合封装成相应的项目文件;
交互式结果分析模块,用于根据用户请求生成分析结果,并将结果可视化展示;
所述项目管理模块通过基础分析任务提交模块与交互式结果分析模块相连接;
首先,向本地集群服务器上传测序数据,在项目管理模块中建立项目,同时在本地集群服务器上传客户的数据库或者选择使用线上的数据库,并且在该项目管理模块中可以进行项目锁定或者共享给他人操作;
然后,在基础分析任务提交模块中,用户可以通过可视化界面选择测序数据,并对测序数据进行分析,分析之后产生项目文件;分析时,先进行判定数据质控是否合格,若合格则进行参数分析;若不合格则直接返回报错;
最后,产生的项目文件传送至交互式结果分析模块中进行交互式分析,根据用户需求对项目文件进行二次分析和统计,得到直观呈现的报告。
2.一种基于计算云平台的微生物多样性交互分析方法,其特征在于,包括以下步骤:
步骤0,创建项目;
步骤1,向本地集群服务器上传测序数据,在项目管理模块中建立项目,同时在本地集群服务器上传客户的数据库或者选择使用线上的数据库,并且在该项目管理模块中可以进行项目锁定或者共享给他人操作;
步骤2,建立任务;
步骤3,在基础分析任务提交模块中,用户可以通过可视化界面对测序数据进行参数分析,分析之后产生项目文件;分析之前,先进行判定数据质控是否合格,若合格则进行参数分析;若不合格则直接返回报错;
步骤4,产生的项目文件传送至交互式结果分析模块中进行交互式分析,根据用户需求对项目文件进行二次分析和统计,得到直观呈现的报告。
3.根据权利要求2所述的基于计算云平台的微生物多样性交互分析方法,其特征在于,所述步骤3中在进行测序数据参数分析时,用户可以自行选择分组方案,并且配置环境因子,选择需要的数据库,选择进行的分析内容,选择完成之后再进行分析。
4.根据权利要求2所述的基于计算云平台的微生物多样性交互分析方法,其特征在于,所述项目管理模块,还可用于查看和管理上传的相关文件或由分析产生的相关文件,可对相关文件进行上传、查找、复制、移动、删除和下载操作;项目管理模块还用于标记项目状态进度,项目状态进度可为未开始、进行中、已完成、已终止和问题;项目管理模块还用于查看任务运行的状态与日志信息;且项目管理模块,还用于共享项目,并管理成员权限。
5.根据权利要求2所述的基于计算云平台的微生物多样性交互分析方法,其特征在于,物种分类数据库存储在本地集群服务器内,使用线上的数据库包括16s、18s、its和fungi,也可上传自定义数据库。
6.根据权利要求2所述的基于计算云平台的微生物多样性交互分析方法,其特征在于,所述基础分析任务提交模块可用于数据质控统计、OTU聚类、物种分类、Alpha多样性和Beta多样性研究。
7.根据权利要求2所述的基于计算云平台的微生物多样性交互分析方法,其特征在于,所述交互式结果分析模块还用于高级生物信息学分析和个性化生物信息学分析,包括群落组成分析、组间显著性差异分析、样本分组分析、LEfSe多级物种差异判别分析和进化分析;交互式结果分析模块还用于更改分组方案和挑选分析样品。
8.根据权利要求7所述的基于计算云平台的微生物多样性交互分析方法,其特征在于,所述交互式结果分析模块包括图表工具,可实现更改颜色方案、形状方案、柱形方向;可显示图例、点名称、合并或排序功能;交互式结果分析模块分析结果可存入报告,在报告中展示;交互式结果分析模块分析结果图可以PNG、JPEG、PDF、SVG格式下载;交互式结果分析模块的报告格式可为html和pdf。
9.根据权利要求2所述的基于计算云平台的微生物多样性交互分析方法,其特征在于,所述项目管理模块、基础分析任务提交模块和交互式结果分析模块的操作均基于html+Css+jquery的前端页面和PHP+Alpha服务器后台,交互分析模块接收到任务执行命令后调动Perl、C、python、R计算机语言的服务器端脚本对测序数据进行基本分析。
10.根据权利要求2所述的基于计算云平台的微生物多样性交互分析方法,其特征在于,所述基础分析任务提交模块在对所述测序数据进行分析的不同阶段,从其存储的分析软件中选取相应的分析软件对所述测序数据进行分析。
CN201710598335.1A 2017-07-21 2017-07-21 基于计算云平台的微生物多样性交互分析系统及其方法 Pending CN107368700A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710598335.1A CN107368700A (zh) 2017-07-21 2017-07-21 基于计算云平台的微生物多样性交互分析系统及其方法
CN201810797363.0A CN109192242A (zh) 2017-07-21 2018-07-19 基于计算云平台的微生物多样性交互分析系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710598335.1A CN107368700A (zh) 2017-07-21 2017-07-21 基于计算云平台的微生物多样性交互分析系统及其方法

Publications (1)

Publication Number Publication Date
CN107368700A true CN107368700A (zh) 2017-11-21

Family

ID=60306849

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201710598335.1A Pending CN107368700A (zh) 2017-07-21 2017-07-21 基于计算云平台的微生物多样性交互分析系统及其方法
CN201810797363.0A Pending CN109192242A (zh) 2017-07-21 2018-07-19 基于计算云平台的微生物多样性交互分析系统及其方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201810797363.0A Pending CN109192242A (zh) 2017-07-21 2018-07-19 基于计算云平台的微生物多样性交互分析系统及其方法

Country Status (1)

Country Link
CN (2) CN107368700A (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109166602A (zh) * 2018-08-29 2019-01-08 苏州微宏生物科技有限公司 厨余废弃物好氧堆肥的微生物宏基因分析系统及方法
CN109448788A (zh) * 2018-10-24 2019-03-08 广州基迪奥生物科技有限公司 基因组学及生物信息学的微生物组学在线分析平台架构
CN109582292A (zh) * 2018-11-01 2019-04-05 广州基迪奥生物科技有限公司 一种基于基因组学以及生物信息学的在线交互云平台
CN109637592A (zh) * 2018-12-21 2019-04-16 深圳晶泰科技有限公司 分子力场参数生成的计算任务管理分析系统及其运行方法
CN110008427A (zh) * 2019-03-29 2019-07-12 广州基迪奥生物科技有限公司 一种整合多组学知识库的交互式生物信息云分析平台
CN110176276A (zh) * 2019-04-12 2019-08-27 苏州赛美科基因科技有限公司 生物信息分析流程化管理方法及系统
CN110349626A (zh) * 2018-12-26 2019-10-18 北京百迈客云科技有限公司 基于生物云平台的测序数据分析系统及方法
CN110659790A (zh) * 2018-06-28 2020-01-07 北京金风科创风电设备有限公司 实验管理与数据分析系统
CN110706750A (zh) * 2019-10-28 2020-01-17 广州基迪奥生物科技有限公司 一种动态交互式微生物组学在线分析云平台及其生成方法
WO2020029513A1 (zh) * 2018-12-21 2020-02-13 深圳晶泰科技有限公司 分子力场参数生成的计算任务管理分析系统及其运行方法
CN110838338A (zh) * 2018-08-15 2020-02-25 上海美吉生物医药科技有限公司 生物分析项目的建立系统、方法、存储介质、及电子设备
CN112037861A (zh) * 2020-09-15 2020-12-04 中国科学院微生物研究所 微生物信息分析结果处理方法、装置、电子设备及介质
CN112149031A (zh) * 2020-08-24 2020-12-29 广州市标准化研究院 一种基于云服务的文化产业创意综合公共服务平台及方法
CN112345744A (zh) * 2019-08-06 2021-02-09 深圳迈瑞生物医疗电子股份有限公司 一种流水线系统及其测试方法
CN112397146A (zh) * 2020-12-02 2021-02-23 广东美格基因科技有限公司 一种基于云平台的微生物组学数据交互分析系统
CN113283743A (zh) * 2021-05-21 2021-08-20 中国科学院南京地理与湖泊研究所 一种流域中不同生态修复类型生境阈值的判定方法
CN113793640A (zh) * 2021-09-17 2021-12-14 艾德范思(北京)医学检验实验室有限公司 基于二代测序的微生物16s扩增子数据分析的装置及方法
CN115472298A (zh) * 2022-10-28 2022-12-13 方寸慧医(江苏)生物科技有限公司 基于ai的高通量测序数据智能分析系统及方法
CN115907782A (zh) * 2022-11-01 2023-04-04 中国食品药品检定研究院 一种全蝎药材产地推测系统
CN116010663A (zh) * 2023-03-21 2023-04-25 上海美吉生物医药科技有限公司 一种tmt项目图谱解析和数据分析的方法及系统
CN116386736A (zh) * 2023-04-11 2023-07-04 南京派森诺基因科技有限公司 基于二代测序的真核有参转录组产品全自动化分析方法
CN117251290A (zh) * 2023-10-16 2023-12-19 广东美格基因科技有限公司 一种基于云服务器租用的可配置式的组学数据自主分析系统

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111870617B (zh) * 2019-11-04 2022-06-10 深圳碳云智能数字生命健康管理有限公司 肠道益生菌补剂配方的确定方法、装置、存储介质及处理器
CN110879878A (zh) * 2019-11-23 2020-03-13 湖南湘江云计算中心有限责任公司 一种基于云计算的大数据分析系统及其方法
CN111488949B (zh) * 2020-04-30 2022-07-22 中国科学院南京地理与湖泊研究所 构建河流大型底栖动物对环境压力定量响应关系的方法
CN116153424B (zh) * 2023-04-18 2023-06-23 北京概普生物科技有限公司 单基因泛癌预后分析系统及分析方法
CN116913387A (zh) * 2023-05-19 2023-10-20 北京火山引擎科技有限公司 一种生物信息数据处理方法、装置、设备及相关介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002071059A1 (en) * 2001-03-05 2002-09-12 Gene Logic, Inc. A system and method for managing gene expression data
CN104331640B (zh) * 2014-10-17 2018-04-17 北京百迈客生物科技有限公司 基于生物云平台的项目结题报告分析系统和方法
CN105550536A (zh) * 2015-12-29 2016-05-04 北京百迈客生物科技有限公司 一种基于生物云平台的外显子测序数据分析方法及系统
CN105447336B (zh) * 2015-12-29 2018-06-19 北京百迈客生物科技有限公司 基于生物云平台的微生物多样性分析系统

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659790B (zh) * 2018-06-28 2022-09-13 北京金风科创风电设备有限公司 实验管理与数据分析系统
CN110659790A (zh) * 2018-06-28 2020-01-07 北京金风科创风电设备有限公司 实验管理与数据分析系统
CN110838338A (zh) * 2018-08-15 2020-02-25 上海美吉生物医药科技有限公司 生物分析项目的建立系统、方法、存储介质、及电子设备
CN110838338B (zh) * 2018-08-15 2023-09-29 上海美吉生物医药科技有限公司 生物分析项目的建立系统、方法、存储介质、及电子设备
CN109166602B (zh) * 2018-08-29 2022-04-12 苏州微宏生物科技有限公司 厨余废弃物好氧堆肥的微生物宏基因分析系统及方法
CN109166602A (zh) * 2018-08-29 2019-01-08 苏州微宏生物科技有限公司 厨余废弃物好氧堆肥的微生物宏基因分析系统及方法
CN109448788A (zh) * 2018-10-24 2019-03-08 广州基迪奥生物科技有限公司 基因组学及生物信息学的微生物组学在线分析平台架构
CN109448788B (zh) * 2018-10-24 2022-03-15 广州基迪奥生物科技有限公司 基因组学及生物信息学的微生物组学在线分析平台架构
CN109582292B (zh) * 2018-11-01 2022-02-18 广州基迪奥生物科技有限公司 一种基于基因组学以及生物信息学的在线交互云平台
CN109582292A (zh) * 2018-11-01 2019-04-05 广州基迪奥生物科技有限公司 一种基于基因组学以及生物信息学的在线交互云平台
CN109637592A (zh) * 2018-12-21 2019-04-16 深圳晶泰科技有限公司 分子力场参数生成的计算任务管理分析系统及其运行方法
CN109637592B (zh) * 2018-12-21 2022-04-12 深圳晶泰科技有限公司 分子力场参数生成的计算任务管理分析系统及其运行方法
WO2020029513A1 (zh) * 2018-12-21 2020-02-13 深圳晶泰科技有限公司 分子力场参数生成的计算任务管理分析系统及其运行方法
US11609807B2 (en) 2018-12-21 2023-03-21 Shenzhen Jingtai Technology Co., Ltd. Computing task management and analysis system for molecular force field parameter building and operation method thereof
CN110349626B (zh) * 2018-12-26 2024-02-02 北京百迈客生物科技有限公司 基于生物云平台的测序数据分析系统及方法
CN110349626A (zh) * 2018-12-26 2019-10-18 北京百迈客云科技有限公司 基于生物云平台的测序数据分析系统及方法
CN110008427A (zh) * 2019-03-29 2019-07-12 广州基迪奥生物科技有限公司 一种整合多组学知识库的交互式生物信息云分析平台
CN110176276B (zh) * 2019-04-12 2021-01-05 苏州赛美科基因科技有限公司 生物信息分析流程化管理方法及系统
CN110176276A (zh) * 2019-04-12 2019-08-27 苏州赛美科基因科技有限公司 生物信息分析流程化管理方法及系统
CN112345744A (zh) * 2019-08-06 2021-02-09 深圳迈瑞生物医疗电子股份有限公司 一种流水线系统及其测试方法
CN112345744B (zh) * 2019-08-06 2023-10-20 深圳迈瑞生物医疗电子股份有限公司 一种流水线系统及其测试方法
CN110706750A (zh) * 2019-10-28 2020-01-17 广州基迪奥生物科技有限公司 一种动态交互式微生物组学在线分析云平台及其生成方法
CN110706750B (zh) * 2019-10-28 2022-04-19 广州基迪奥生物科技有限公司 一种动态交互式微生物组学在线分析云平台及其生成方法
CN112149031B (zh) * 2020-08-24 2024-04-26 广州市标准化研究院 一种基于云服务的文化产业创意综合公共服务平台及方法
CN112149031A (zh) * 2020-08-24 2020-12-29 广州市标准化研究院 一种基于云服务的文化产业创意综合公共服务平台及方法
CN112037861A (zh) * 2020-09-15 2020-12-04 中国科学院微生物研究所 微生物信息分析结果处理方法、装置、电子设备及介质
CN113643757A (zh) * 2020-12-02 2021-11-12 广东美格基因科技有限公司 一种微生物组学数据交互分析系统
CN112397146B (zh) * 2020-12-02 2021-08-24 广东美格基因科技有限公司 一种基于云平台的微生物组学数据交互分析系统
CN113643757B (zh) * 2020-12-02 2024-04-02 广东美格基因科技有限公司 一种微生物组学数据交互分析系统
CN112397146A (zh) * 2020-12-02 2021-02-23 广东美格基因科技有限公司 一种基于云平台的微生物组学数据交互分析系统
CN113283743A (zh) * 2021-05-21 2021-08-20 中国科学院南京地理与湖泊研究所 一种流域中不同生态修复类型生境阈值的判定方法
CN113283743B (zh) * 2021-05-21 2023-06-20 中国科学院南京地理与湖泊研究所 一种流域中不同生态修复类型生境阈值的判定方法
CN113793640A (zh) * 2021-09-17 2021-12-14 艾德范思(北京)医学检验实验室有限公司 基于二代测序的微生物16s扩增子数据分析的装置及方法
CN113793640B (zh) * 2021-09-17 2024-03-08 艾德范思(北京)医学检验实验室有限公司 基于二代测序的微生物16s扩增子数据分析的装置及方法
CN115472298A (zh) * 2022-10-28 2022-12-13 方寸慧医(江苏)生物科技有限公司 基于ai的高通量测序数据智能分析系统及方法
CN115907782A (zh) * 2022-11-01 2023-04-04 中国食品药品检定研究院 一种全蝎药材产地推测系统
CN116010663B (zh) * 2023-03-21 2023-06-30 上海美吉生物医药科技有限公司 一种tmt项目图谱解析和数据分析的方法及系统
CN116010663A (zh) * 2023-03-21 2023-04-25 上海美吉生物医药科技有限公司 一种tmt项目图谱解析和数据分析的方法及系统
CN116386736A (zh) * 2023-04-11 2023-07-04 南京派森诺基因科技有限公司 基于二代测序的真核有参转录组产品全自动化分析方法
CN116386736B (zh) * 2023-04-11 2024-04-05 南京派森诺基因科技有限公司 基于二代测序的真核有参转录组产品全自动化分析方法
CN117251290A (zh) * 2023-10-16 2023-12-19 广东美格基因科技有限公司 一种基于云服务器租用的可配置式的组学数据自主分析系统

Also Published As

Publication number Publication date
CN109192242A (zh) 2019-01-11

Similar Documents

Publication Publication Date Title
CN107368700A (zh) 基于计算云平台的微生物多样性交互分析系统及其方法
US11860941B2 (en) Outcome analysis for graph generation
Höllt et al. Cytosplore: interactive immune cell phenotyping for large single‐cell datasets
Qiu et al. Extracting a cellular hierarchy from high-dimensional cytometry data with SPADE
US7730023B2 (en) Apparatus and method for strategy map validation and visualization
CN109086567A (zh) 基于云计算平台的有参考基因组的转录组项目的交互式分析系统及方法
US10503756B2 (en) Cluster processing and ranking methods including methods applicable to clusters developed through density based merging
CN107391963A (zh) 基于计算云平台的真核无参转录组交互分析系统及其方法
CN105447336B (zh) 基于生物云平台的微生物多样性分析系统
US20130060775A1 (en) Spanning-tree progression analysis of density-normalized events (spade)
WO2018085859A1 (en) Dimension grouping and reduction for model generation, testing, and documentation
Pehkonen et al. Theme discovery from gene lists for identification and viewing of multiple functional groups
CN107924384A (zh) 用于使用预测学习模型预测结果的系统和方法
US20090299646A1 (en) System and method for biological pathway perturbation analysis
CN112835570A (zh) 一种基于机器学习的可视化数学建模方法和系统
CN117541095A (zh) 一种农用地土壤环境质量类别划分的方法
CN108647729A (zh) 一种用户画像获取方法
CN113010615B (zh) 基于高斯混合模型聚类算法的分层级数据可视化方法
CN115472298B (zh) 基于ai的高通量测序数据智能分析系统及方法
Labib et al. Data mining for cancer management in Egypt case study: childhood acute lymphoblastic leukemia
van Helden et al. The arch-i-scan project: Artificial intelligence and 3d simulation for developing new approaches to roman foodways
Jalilian Modelling and classification of species abundance: a case study in the Barro Colorado Island plot
Qu et al. Enhancing understandability of omics data with shap, embedding projections and interactive visualisations
Kaya et al. Identification of Onopordum pollen using the extreme learning machine, a type of artificial neural network
Sopan et al. Exploring data distributions: Visual design and evaluation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171121