[go: up one dir, main page]

CN111462819A - 肠道微生物检测数据分析方法、自动化解读系统及介质 - Google Patents

肠道微生物检测数据分析方法、自动化解读系统及介质 Download PDF

Info

Publication number
CN111462819A
CN111462819A CN202010120049.6A CN202010120049A CN111462819A CN 111462819 A CN111462819 A CN 111462819A CN 202010120049 A CN202010120049 A CN 202010120049A CN 111462819 A CN111462819 A CN 111462819A
Authority
CN
China
Prior art keywords
data
analysis
annotation
result
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010120049.6A
Other languages
English (en)
Inventor
周勇
杨超
黄依蓝
夏卫
林晋州
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kmbgi Gene Tech Co ltd
Original Assignee
Kmbgi Gene Tech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kmbgi Gene Tech Co ltd filed Critical Kmbgi Gene Tech Co ltd
Priority to CN202010120049.6A priority Critical patent/CN111462819A/zh
Publication of CN111462819A publication Critical patent/CN111462819A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioethics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Computation (AREA)
  • Chemical & Material Sciences (AREA)
  • Software Systems (AREA)
  • Primary Health Care (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明公开了一种肠道微生物检测数据分析方法、自动化解读系统及介质,本发明方法包括获取用户肠道微生物测序数据;对测序数据提取样本数据并对样本数据进行过滤;将过滤后的测序数据进行物种注释分类和功能注释分类,得到注释结果;对注释结果进行常规分析,所述常规分析包括多样性分析以及益生菌含量和病原菌含量分析;获取菌群功能和疾病关联数据库,基于注释结果,根据菌群功能和疾病关联数据库对常规分析结果进行自动解读。本发明可以自动化执行分析和解读,从而减少工作的压力,生成的分析结果形式多样、可读性好、符合用户的需求,并方便地进行流程化和批量化操作,人工解读工作量小,直观和方便。

Description

肠道微生物检测数据分析方法、自动化解读系统及介质
技术领域
本发明涉及生物信息分析技术领域,具体涉及一种肠道微生物检测数据分析方法、自动化解读系统及介质。
背景技术
随着人类微生物组计划(HMP)和人类肠道宏基因组学(MetaHIT)项目的开展,越来越多研究表明,人体的生长发育、营养代谢和健康水平不仅仅受自身基因(宿主基因组)控制,还会受到人体共生微生物的影响,尤其是肠道菌群。有许多疾病和症状,例如结直肠癌、肥胖、糖尿病,自闭症、药物反应等均与肠道菌群存在紧密关联。
大规模测序技术的出现,为肠道菌群的研究提供了强有力的工具。目前,基于测序技术对肠道菌群的研究主要有两种方法:16s rDNA测序技术和宏基因组测序。而宏基因组测序技术因其分辨率高,检测范围广,信息量大,得到了越来越多的关注。宏基因组(metagenome),又称“元基因组”,是指某个特定环境中全部微小生物遗传物质的总和。宏基因组的测序方法以特定环境中的整个微生物群落作为研究的对象,不需要对微生物进行分离培养,而是提取环境微生物总DNA进行研究,采用新一代高通量测序技术对环境微生物样本的DNA直接测序。肠道微生物检测研究也采用了宏基因组的测序方法,通过研究肠道微生物宏基因组(即肠道所有微生物遗传物质的总和)结合生物信息学分析,了解微生物群落组成及其功能,该项研究可通过监控、调节微生物组等途径为健康生活提供新思路、新方法。
肠道微生物生物信息学分析通常采用重比对策略,即将经过拆分、质控、去宿主后的高质量测序序列,与参考基因组或标记基因集做比对。宏基因组物种注释的参考微生物包括细菌、古细菌、病毒和真菌四大类,它们都来源于当前流行的各大数据库,包括NCBI数据库(http://www.ncbi.nlm.nih.gov/genome)、人体微生物计划(http:// www.hmpdacc.org)、GOLD数据库(https://gold.jgi.doe.gov)、酵母基因组数据库(http://www.yeastgenome.org)、真菌基因组行动(http://www.broadinstitute.org)、人类口腔微生物数据库(http://www.homd.org/)、真菌数据库(http://fungidb.org)。基于这些数据库,目前开发出来了很多序列比对和物种注释软件,常用的包括MetaPhlAn2(https://bitbucket.org/biobakery/metaphlan2),Kraken(https://ccb.jhu.edu/ software/kraken/)和Genometa(https://code.google.com/archive/p/genometa/)。这些软件既可以比对微生物基因组,又可以对微生物分类,还可以统计微生物丰度,功能十分强大。
但是,当前肠道微生物信息分析技术存在着以下缺陷或不足:1)只能一步步的进行手动操作,不适合用来进行流程化和批量化操作;2)分析结果无法给出细菌具体功能以及与疾病关联的医学信息,导致解读人员每出具一份报告都需要阅读文献来对所测细菌的功能来进行注释,增加了人工解读工作量。
发明内容
鉴于以上技术问题,本发明的目的在于提供一种肠道微生物检测数据分析方法、自动化解读系统及介质,解决现有肠道微生物信息分析技术不适合用来进行流程化和批量化操作或分析结果不全的问题。
本发明采用技术方案如下:
肠道微生物检测数据分析方法,包括:
获取用户肠道微生物测序数据;
对测序数据提取样本数据并对样本数据进行过滤;
将过滤后的测序数据进行物种注释分类和功能注释分类,得到注释结果;
对注释结果进行常规分析,所述常规分析包括多样性分析以及益生菌含量和病原菌含量分析;
获取菌群功能和疾病关联数据库,基于注释结果,根据菌群功能和疾病关联数据库对常规分析结果进行自动解读。
进一步的,对样本数据进行过滤步骤包括:
去除样本数据的原始输入文件中的低质量序列,和/或过滤样本数据中的宿主污染数据;所述低质量序列包括长度不足,或低质量碱基数量超过5%,或N值比例超过10%的序列;过滤样本数据中的宿主污染数据包括去除能够比对到人类基因组上的序列。
进一步的,对过滤后的测序数据进行物种注释分类和功能注释分类步骤包括:
通过将测序数据比对到MarkGene数据库,获取物种注释结果;
通过将测序数据比对到Uniprot数据库,获取蛋白质家族丰度和通路结果;
通过将测序数据比对到CARD数据库,获取抗生素抗性基因丰度。
进一步的,对注释结果进行常规分析的步骤包括:
对所述物种注释结果进行alpha多样性分析,获取肠道微生物的丰富度指数、多样性指数和观察到的物种个数;
对所述物种注释结果通过无监督聚类方法判断聚类之后的结果所属的肠道微生物亚型;
对所述物种注释结果通过随机森林方法进行表型预测;
基于所述物种注释结果,获取用户肠道微生物检测数据中的益生菌和病原菌的数量和丰度;
基于Uniprot数据库比对结果,结合KEGG数据库和MetaCyc数据库进行通路注释,分析用户肠道微生物检测数据碳水化合物、脂质、氨基酸和维生素的合成代谢通路的丰度;
基于CARD数据库比对结果,采用抗生素抗性基因注释结果,评估用户肠道微生物检测数据中每种抗生素亚型的丰度。
进一步的,根据菌群功能及疾病关联数据库,对常规分析结果进行自动化解读步骤包括:
基于物种注释结果,并结合菌群功能和疾病关联数据库,对物种进行疾病相关注释;
基于物种注释结果和功能注释结果,并结合菌群功能和疾病关联数据库,介绍常规分析结果中益生菌和致病菌的基本信息、机制和调节方式;
进一步的,根据菌群功能及疾病关联数据库,对常规分析结果进行自动化解读步骤包括:
获取基于通路结果的注释结果,结合菌群功能和营养物质代谢数据库,判断用户营养物质代谢强弱,并介绍用户营养物质的基本信息和补充方式;
获取基于抗生素抗性基因丰度的注释结果,判断用户对抗生素抗性能力,并结合抗生素数据库介绍用户对于抗生素药物的抗性能力以及注意内容。
进一步的,还包括:对自动解读结果进行可视化展示和审核。
一种肠道微生物检测数据自动化解读系统,包括报告系统以及可视化展示模块;所述可视化展示模块,用于可视化展示和审核数据库导入模块储存的分析结果数据;
所述报告系统包括:
数据导入模块,用于获取肠道微生物测序数据;
参数配置模块;用于配置分析肠道微生物测序数据流程所需要的各项参数;所述各项参数包括:输入文件地址,和/或输出文件地址,和/或分析程序地址,和/或环境变量;
生物信息分析模块,用于在高性能集群上执行所述的肠道微生物检测数据分析方法,得到分析结果;
数据同步模块,用于将高性能集群上的分析结果同步到网站服务器上;
数据库导入模块,用于存储数据同步模块的分析结果,并将分析结果导入数据库。
进一步的,还包括设于客户端的用户界面模块和数据管理系统,所述报告系统以及可视化展示模块均与所述用户界面模块连接,所述数据管理系统用于系统运营人员进行数据审核、流程管理和用户管理,所述的数据管理系统包括用户信息管理模块、系统权限模块、报告管理模块和订单数据管理。
一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现所述的肠道微生物检测数据分析方法。
相比现有技术,本发明的有益效果在于:
本发明肠道微生物检测数据分析方法可以自动化执行分析和解读,从而减少工作的压力,生成的分析结果形式多样、可读性好、符合用户的需求,通过自动化分析和解读,生物信息分析方法科学准确,综合评估各种分析方法,能够快速准确并且全面的评估肠道微生物的组成,并方便地进行流程化和批量化操作,人工解读工作量小,直观和方便;
进一步的,通过可视化的展示平台,以图表等可视化的形式将解读结果展示给用户,可以直观的对分析结果进行处理和审核,相比较于传统文字报告比较智能和方便。
附图说明
图1为本发明肠道微生物检测数据分析方法的流程示意图;
图2为本发明生物信息分析模块实施例的肠道微生物宏基因组测序数据生物信息分析流程示意图;
图3为本发明肠道微生物检测数据自动化解读系统的后台数据库结构图;
图4为本发明肠道微生物检测数据自动化解读系统的可视化展示平台的报告系统的客户端展示结构示意图;
图5为本发明肠道微生物检测数据自动化解读系统实施例中用户界面模块架构设计示意图;
图6为本发明肠道微生物检测数据自动化解读系统实施例中用户界面模块展示的示意图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
实施例:
请参考图1-6所示,一种肠道微生物检测数据分析方法,请参考图1所示,包括:
步骤S10:获取用户肠道微生物测序数据;
在该步骤中,可通过上传或者下载用户的肠道微生物测序数据获取用户肠道微生物测序数据;另外,在获取用户肠道微生物测序数据时,还可以同时获取用户基本信息,根据用户的调查问卷准备分析流程可能需要的用户基本信息。
步骤S20:对测序数据提取样本数据并对样本数据进行过滤;
具体的,对样本数据进行过滤步骤包括:
去除样本数据的原始输入文件中的低质量序列,和/或过滤样本数据中的宿主污染数据;所述低质量序列包括长度不足,或低质量碱基数量超过5%,或N值比例超过10%的序列;过滤样本数据中的宿主污染数据包括去除能够比对到人类基因组上的序列。
步骤S30:将过滤后的测序数据进行物种注释分类和功能注释分类,得到注释结果;
具体的,对过滤后的测序数据进行物种注释分类和功能注释分类步骤包括:
通过将测序数据比对到MarkGene数据库,获取物种注释结果;
通过将测序数据比对到Uniprot数据库,获取蛋白质家族丰度和通路结果;
通过将测序数据比对到CARD数据库,获取抗生素抗性基因丰度。
步骤S40:对注释结果进行常规分析,所述常规分析包括多样性分析以及益生菌含量和病原菌含量分析;
具体的,对注释结果进行常规分析的步骤包括:
对所述物种注释结果进行alpha多样性分析,获取肠道微生物的丰富度指数、多样性指数和观察到的物种个数;
对所述物种注释结果通过无监督聚类方法判断聚类之后的结果所属的肠道微生物亚型;
对所述物种注释结果通过随机森林方法进行表型预测;
基于所述物种注释结果,获取用户肠道微生物检测数据中的益生菌和病原菌的数量和丰度;
基于Uniprot数据库比对结果,结合KEGG数据库和MetaCyc数据库进行通路注释,分析用户肠道微生物检测数据碳水化合物、脂质、氨基酸和维生素的合成代谢通路的丰度;
基于CARD数据库比对结果,采用抗生素抗性基因注释结果,评估用户肠道微生物检测数据中每种抗生素亚型的丰度。
步骤S50:获取菌群功能和疾病关联数据库,基于注释结果,根据菌群功能和疾病关联数据库对常规分析结果进行自动解读。
具体的,根据菌群功能及疾病关联数据库,对常规分析结果进行自动化解读步骤包括:
基于物种注释结果,并结合菌群功能和疾病关联数据库,对物种进行疾病相关注释;
基于物种注释结果和功能注释结果,并结合菌群功能和疾病关联数据库,介绍常规分析结果中益生菌和致病菌的基本信息、机制和调节方式;
作为优选实施例,根据菌群功能及疾病关联数据库,对常规分析结果进行自动化解读步骤还包括:
获取基于通路结果的注释结果,结合菌群功能和营养物质代谢数据库,判断用户营养物质代谢强弱,并介绍用户营养物质的基本信息和补充方式;
获取基于抗生素抗性基因丰度的注释结果,判断用户对抗生素抗性能力,并结合抗生素数据库介绍用户对于抗生素药物的抗性能力以及注意内容。
作为优选实施例,本发明肠道微生物检测数据分析方法还可包括:
步骤S60:对自动解读结果进行可视化展示和审核。
本发明的一种肠道微生物检测数据自动化解读系统,包括:报告系统以及可视化展示模块;可视化展示模块,用于可视化展示和审核数据库导入模块储存的分析结果数据;
所述报告系统包括:
数据导入模块,用于获取肠道微生物测序数据;
参数配置模块;用于配置分析肠道微生物测序数据流程所需要的各项参数;所述各项参数包括:输入文件地址,和/或输出文件地址,和/或分析程序地址,和/或环境变量;进一步,对为生物信息流程配置参数这一步骤,具体包括:为生物信息分析流程指定具体的输入文件和输出地址;配置分析流程所需要的程序地址和环境变量。
生物信息分析模块,用于在高性能集群上执行所述的肠道微生物检测数据分析方法,得到分析结果;
数据同步模块,用于将高性能集群上的分析结果同步到网站服务器上;
数据库导入模块,用于存储数据同步模块的分析结果,并将分析结果导入数据库。
作为实施例,还包括设于客户端的用户界面模块和数据管理系统,所述报告系统以及可视化展示模块均与所述用户界面模块连接,所述数据管理系统用于系统运营人员进行数据审核、流程管理和用户管理,所述的数据管理系统包括用户信息管理模块、系统权限模块、报告管理模块和订单数据管理。
本发明肠道微生物检测数据自动化解读系统的具体应用实施例如下:
肠道微生物检测数据自动化解读系统包括硬件平台和软件平台,所述硬件平台包括Linux系统服务器。所述软件平台包括客户端和服务端软件框架、Linux操作系统、数据库软件Mysql。所述客户端和服务端软件框架和Mysql数据库均运行于Linux系统环境。
所述Linux系统环境运行着数据管理系统和报告系统,具体的,报告系统包括自动化数据导入模块、报告生成模块、报告下载模块,报告生成模块涵盖报告生成算法以及HTML模板生成PDF报告。
所述报告系统内设置有上传数据模块、下载报告模块和出具报告模块。
数据管理系统主要服务于系统运营人员,用于数据审核、流程管理、以及用户管理。数据管理系统由用户信息管理模块、系统权限模块、报告管理模块、订单数据管理组成,用户信息管理模块主要用于用户浏览行为分析以及网站访问流量分析。系统权限模块对运营人员进行权限划分,不同等级的管理人员角色拥有不同的数据操作权限。报告管理模块主要用于报告状态管理,报告生成流程监控。订单管理模块用于订单状态管理。
进一步,所述数据管理模块内设置有客户信息管理模块、位点信息模块、体检信息模块和检测结果信息模块。
进一步,所述出具报告模块内设置有HTML报告模板、数据存储性-基因关系数据和HTML转pdf模块。
进一步,所述用户管理模块和报告系统连接端设置有用户界面模块,所述用户界面模块设置于终端即客户端内。
具体的,肠道微生物检测数据自动化解读系统主要由高性能集群上的肠道微生物信息分析流程和网站服务器上的可视化平台(即用户使用界面)组成。
在可视化平台中,可对分析结果数据进行可视化展示和审核,具体包括:在可视化平台的样本信息界面进行样本基本信息和临床信息的输入和展示;在可视化平台的数据审核界面进行数据审核,所述数据审核包括下机数据搜索、下机数据展示和受检样本检测结果展示;在可视化平台的数据中心界面展示所有的样本信息;在可视化平台的检测报告界面进行检测报告预览和打印,生成一个包含图文解释和临床解读的肠道微生物检测报告;在可视化平台的统计界面统计和展示已收录的样本数、已审核的样本数和已打印的样本数。
进一步,所述在可视化平台中对分析结果数据进行可视化展示和审核这一步骤,还可包括将生成的肠道微生物检测报告以网页或PDF的形式进行展示的步骤。
作为实施例,本发明的报告系统的分析报告通过数据分析报告生成系统生成,即上文的报告生成模块,具体的,包括数据导入模块S1.1、参数配置模块S1.2、生物信息分析模块S1.3、数据同步模块S1.4、数据库导入模块S1.5和用户界面模块S1.7。
所述数据导入模块S1.1,用于导入所述数据分析所需的源数据。在具体实施当中,可以利用常规的计算机显示器和键盘输入试验样品的表型数据,通常保存为电子表格或电子文本格式。另外,基因测序分析仪的测序结果通常为体积较大的压缩文件,例如,FASTQ.gz格式,可以通过FileZilla等专业软件上传到高性能集群或者通过硬盘拷贝,网络传输的方式传输。
所述参数配置模块S1.2,用于配置生物信息分析流程所需要的各项参数。具体的包括数据导入模块S1.1产生的测序结果文件路径、分析结果存放路径、分析程序的位置和参数等。
所述生物信息分析模块S1.3,用于在高性能集群上执行肠道宏基因组分析。请参考图2所示,是本发明提供的肠道微生物宏基因组测序数据生物信息分析流程示意图。具体包括:
去除掉原始输入文件中的低质量序列,包括长度不足或者低质量碱基数量超过5%,或者N值比例超过10%等;
将过滤后的reads使用BOWTIE2比对到人类基因组,去除能够比对到人类基因组上的序列,即过滤掉宿主污染。
使用MetaPhlAn2软件将测序数据比对到MarkGene数据库以得到物种注释结果;
使用HUManN2软件将测序数据比对到Uniprot数据库,以得到蛋白质家族丰度和通路结果;
使用MMseqs2软件将测序数据比对到CARD数据库,以得到抗生素抗性基因丰度,并评估抗生素亚类丰度。
基于MetaPhlAn2的物种注释结果,使用R软件进行alpha多样性分析,得到样本的丰富度指数、多样性指数和观察到的物种个数;
基于MetaPhlAn2的物种注释结果,使用无监督聚类方法,判断聚类之后的结果所属的肠道微生物亚型;
基于MetaPhlAn2的物种注释结果,使用随机森林方法,用预先建立的模型进行表型预测,预测个体的口味,饮水量,进食速度和运动时间等;
基于MetaPhlAn2的物种注释结果,结合卫生部公布的益生菌列表和病原微生物列表,进一步获得用户检测数据中的益生菌和病原菌的数量和丰度;
基于Uniprot数据库比对结果,结合KEGG数据库和MetaCyc数据库进一步进行通路注释,分析其碳水化合物,脂质,氨基酸和维生素的合成代谢通路的丰度;
基于CARD数据库比对结果,使用抗生素抗性基因注释结果,评估用户每种抗生素亚型的丰度。
所述数据同步模块S1.4,用于将高性能集群上的分析结果同步到网站服务器上。具体的是通过网络传输的方法将生物信息分析模块S1.3产生的标准格式分析结果自动拷贝到网站服务器指定位置。
所述数据库导入模块S1.5,用于将数据同步模块S1.4的标准分析结果传入数据库。请参考图3所示,为报告系统后台数据库设计示意图,是本发明使用的关系数据库实施例中的详细结构示意图,包括被检测人表、报告表、报告原始数据表、基线数据表和报告详情表。数据库导入操作具体包括:
(1)数据同步模块S1.4的标准分析结果文件同步成功后,回调报告系统导入函数并传入文件名参数,系统将对FTP文件服务器进行自动检索,将文本通过流读取到内存,进而更新到mysql数据库。
(2)原始数据将分别导入至数据库t_xcs_recreation_result(报告原始数据表)、t_xcs_recreation_report(报告详情表)中。标准分析结果中的t_xcs_recreation_result(报告原始数据表)与数据库t_xcs_recreation_result(报告原始数据表)属于一对一的关系,标准分析结果中的t_xcs_recreation_report(报告详情表)与数据库中的t_xcs_recreation_report(报告详情表)属于一对一关系。
(3)通过算法将报告原始表和报告详情表中的数据与基线表数据进行计算,得出结果值输出至报告系统服务端,再由服务端返回到客户端系统,客户端系统将数据进行渲染输出到用户界面。
本发明的可视化展示模块S1.6,用于将数据库导入模块S1.5储存的数据以模块的形式展示。请参照图4所示,为可视化展示模块S1.6展示的报告系统客户端展示结构示意图,报告系统客户端以用户界面显示,用户界面主要分成2大系统,报告系统和数据管理系统,报告系统主要服务于2C以及2B用户,通过微信公众号以及app软件向用户输出检测数据。
所述用户界面模块S1.7,是用户在客户端如私人笔记本、手机和平板电脑等直接接触到的界面。具体包括报告系统架构图设计,请参考图5所示,为报告系统用户端用户界面模块S1.7架构设计示意图,使用主流的c/s架构,以前后端分离进行独立开发。前端系统由JavaScript、css、html进行页面开发以及数据渲染,采用主流Vue框架进行工程搭建,独立进行部署在Linux系统中,与后端服务器进行完全解耦,当用户进行访问时,使用nginx进行反向代理,请求转发到前端系统,由前端系统通过http请求后端系统数据。后端系统使用Java语言开发,选用spring、mybatis框架进行搭建,遵循mvc的设计思想,将后端系统划分为表示层、应用层、数据层,降低代码耦合性,使结构更加清晰,表示层用于参数传递以及参数校验,应用层主要完成业务逻辑处理,数据层与数据库进行交互。使用tomcat作为后端系统容器进行独立部署,前端访问请求通过tomcat 8080端口和后端系统进行交互,前端系统输入数据将通过后端系统表示层、应用层、数据层持久到数据库,数据库输出数据也将通过后端系统数据层、应用层和表示层再返回给前端系统进行页面渲染。后端系统使用maven进行工程构建,以模块化思维进行代码模块拆分。
具体的,用户界面模块S1.7主要分为2个部分,专业版报告模块以及科普版报告模块。请参考图6所示,图6为实施例中用户界面模块的示意图,专业版报告主要包含菌群组成、营养代谢能力、疾病风险评估、用药指导、健康建议、多次检测比较等6大功能.科普版报告主要包括我的菌群、神算子、初老症、代谢能力、吃货、小毛病等6大功能。
本发明自动化解读报告系统,通过将源数据以参数的形式传递给生物信息分析流程并且进行数据分析,分析结果在数据库中得到累积保存,并且以图表等可视化的形式将解读结果展示给用户。此外,本发明提供的数据分析以及报告系统,可通过调研用户真实需求,对报告的展示内容或形式进行了相应的更改,生成的报告形式多样,可读性好,符合用户的需求。与已有技术相比,本发明自动化解读报告系统具有如下重要的价值:
(1)能自动化分析和解读。后台分析人员仅需要上传数据,配置好参数文件,系统可以自动化执行分析和解读以及产生报告,从而减少工作的压力。
(2)生物信息分析方法科学准确。生物信息分析模块结合前沿文献,综合评估各种分析方法,采取最准确和最快速的宏基因组信息分析方法,能够快速准确并且全面的评估肠道微生物的组成。
(3)具有综合的数据库支撑。生物信息分析结果会自动累积的保存在数据库中,保证了分析结果的可回溯性。并且数据库中保存了对于分析结果的解读相关数据库,例如菌群注释数据库,菌群和疾病相关性数据库等。
(4)具有对用户友好的可视化平台,相比较于传统文字报告,图表报告能够更容易理解为用户理解。
本发明还提供一种计算机存储介质,其上存储有计算机程序,本发明的方法如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在该计算机存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机存储介质不包括电载波信号和电信信号。
对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。

Claims (10)

1.肠道微生物检测数据分析方法,其特征在于,包括:
获取用户肠道微生物测序数据;
对测序数据提取样本数据并对样本数据进行过滤;
将过滤后的测序数据进行物种注释分类和功能注释分类,得到注释结果;
对注释结果进行常规分析,所述常规分析包括多样性分析以及益生菌含量和病原菌含量分析;
获取菌群功能和疾病关联数据库,基于注释结果,根据菌群功能和疾病关联数据库对常规分析结果进行自动解读。
2.根据权利要求1所述的肠道微生物检测数据分析方法,其特征在于,对样本数据进行过滤步骤包括:
去除样本数据的原始输入文件中的低质量序列,和/或过滤样本数据中的宿主污染数据;所述低质量序列包括长度不足,或低质量碱基数量超过5%,或N值比例超过10%的序列;过滤样本数据中的宿主污染数据包括去除能够比对到人类基因组上的序列。
3.根据权利要求1所述的肠道微生物检测数据分析方法,其特征在于,对过滤后的测序数据进行物种注释分类和功能注释分类步骤包括:
通过将测序数据比对到MarkGene数据库,获取物种注释结果;
通过将测序数据比对到Uniprot数据库,获取蛋白质家族丰度和通路结果;
通过将测序数据比对到CARD数据库,获取抗生素抗性基因丰度。
4.根据权利要求1所述的肠道微生物检测数据分析方法,其特征在于,对注释结果进行常规分析的步骤包括:
对物种注释结果进行alpha多样性分析,获取肠道微生物的丰富度指数、多样性指数和观察到的物种个数;
对物种注释结果通过无监督聚类方法判断聚类之后的结果所属的肠道微生物亚型;
对物种注释结果通过随机森林方法进行表型预测;
基于物种注释结果,获取用户肠道微生物检测数据中的益生菌和病原菌的数量和丰度;
基于Uniprot数据库比对结果,结合KEGG数据库和MetaCyc数据库进行通路注释,分析用户肠道微生物检测数据碳水化合物、脂质、氨基酸和维生素的合成代谢通路的丰度;
基于CARD数据库比对结果,采用抗生素抗性基因注释结果,评估用户肠道微生物检测数据中每种抗生素亚型的丰度。
5.根据权利要求1所述的肠道微生物检测数据分析方法,其特征在于,根据菌群功能及疾病关联数据库,对常规分析结果进行自动化解读步骤包括:
基于物种注释结果,并结合菌群功能和疾病关联数据库,对物种进行疾病相关注释;
基于物种注释结果和功能注释结果,并结合菌群功能和疾病关联数据库,介绍常规分析结果中益生菌和致病菌的基本信息、机制和调节方式。
6.根据权利要求2所述的肠道微生物检测数据分析方法,其特征在于,根据菌群功能及疾病关联数据库,对常规分析结果进行自动化解读步骤包括:
获取基于通路结果的注释结果,结合菌群功能和营养物质代谢数据库,判断用户营养物质代谢强弱,并介绍用户营养物质的基本信息和补充方式;
获取基于抗生素抗性基因丰度的注释结果,判断用户对抗生素抗性能力,并结合抗生素数据库介绍用户对于抗生素药物的抗性能力以及注意内容。
7.根据权利要求1-6任一项所述的肠道微生物检测数据分析方法,其特征在于,还包括:对自动解读结果进行可视化展示和审核。
8.一种肠道微生物检测数据自动化解读系统,其特征在于,包括报告系统以及可视化展示模块;所述可视化展示模块,用于可视化展示和审核数据库导入模块储存的分析结果数据;
所述报告系统包括:
数据导入模块,用于获取肠道微生物测序数据;
参数配置模块;用于配置分析肠道微生物测序数据流程所需要的各项参数;所述各项参数包括:输入文件地址,和/或输出文件地址,和/或分析程序地址,和/或环境变量;
生物信息分析模块,用于在高性能集群上执行如权利要求1-7任一项所述的肠道微生物检测数据分析方法,得到分析结果;
数据同步模块,用于将高性能集群上的分析结果同步到网站服务器上;
数据库导入模块,用于存储数据同步模块的分析结果,并将分析结果导入数据库。
9.根据权利要求8所述的肠道微生物检测数据自动化解读系统,其特征在于,还包括设于客户端的用户界面模块和数据管理系统,所述报告系统以及可视化展示模块均与所述用户界面模块连接,所述数据管理系统用于系统运营人员进行数据审核、流程管理和用户管理,所述的数据管理系统包括用户信息管理模块、系统权限模块、报告管理模块和订单数据管理。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-7任一项所述的肠道微生物检测数据分析方法。
CN202010120049.6A 2020-02-26 2020-02-26 肠道微生物检测数据分析方法、自动化解读系统及介质 Pending CN111462819A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010120049.6A CN111462819A (zh) 2020-02-26 2020-02-26 肠道微生物检测数据分析方法、自动化解读系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010120049.6A CN111462819A (zh) 2020-02-26 2020-02-26 肠道微生物检测数据分析方法、自动化解读系统及介质

Publications (1)

Publication Number Publication Date
CN111462819A true CN111462819A (zh) 2020-07-28

Family

ID=71679153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010120049.6A Pending CN111462819A (zh) 2020-02-26 2020-02-26 肠道微生物检测数据分析方法、自动化解读系统及介质

Country Status (1)

Country Link
CN (1) CN111462819A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112151117A (zh) * 2020-08-11 2020-12-29 康美华大基因技术有限公司 一种基于时间序列宏基因组数据的动态观测装置及其检测方法
CN112435713A (zh) * 2020-12-31 2021-03-02 申友基因组研究院(南京)有限公司 一种肠道微生物16SrRNA的NGS数据分析方法
CN112614544A (zh) * 2020-12-28 2021-04-06 杭州瑞普基因科技有限公司 Kraken2软件输出结果的优化方法及鉴定样本中物种类型的方法
CN113611357A (zh) * 2020-11-17 2021-11-05 上海美吉生物医药科技有限公司 基于宏基因组的抗性基因分析方法、装置、介质及终端
CN114067911A (zh) * 2020-08-07 2022-02-18 西安中科茵康莱医学检验有限公司 通过测序获取微生物物种及相关信息的方法、装置、计算机可读存储介质和电子设备
CN114582416A (zh) * 2020-11-30 2022-06-03 深圳未知君生物科技有限公司 微生物集富集的分析方法、分析装置和计算机介质
EP4099331A1 (en) * 2021-06-01 2022-12-07 Tata Consultancy Services Limited Method and system for preparing knowledgebase of microbes and microbial functions helping to reduce cancer risk

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017044880A1 (en) * 2015-09-09 2017-03-16 uBiome, Inc. Method and system for microbiome-derived diagnostics and therapeutics infectious disease and other health conditions associated with antibiotic usage
CN107463800A (zh) * 2017-07-19 2017-12-12 东莞博奥木华基因科技有限公司 一种肠道微生物信息分析方法及系统
CN107609347A (zh) * 2017-08-21 2018-01-19 上海派森诺生物科技股份有限公司 一种基于高通量测序技术的宏转录组数据分析方法
CN110097928A (zh) * 2019-04-17 2019-08-06 广东省微生物研究所(广东省微生物分析检测中心) 一种基于肠道菌群预测组织微量元素含量的预测方法和预测模型
CN110819705A (zh) * 2019-08-17 2020-02-21 昆明医科大学第一附属医院 Uc患者肠道菌群多样性及差异性的分析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017044880A1 (en) * 2015-09-09 2017-03-16 uBiome, Inc. Method and system for microbiome-derived diagnostics and therapeutics infectious disease and other health conditions associated with antibiotic usage
CN107463800A (zh) * 2017-07-19 2017-12-12 东莞博奥木华基因科技有限公司 一种肠道微生物信息分析方法及系统
CN107609347A (zh) * 2017-08-21 2018-01-19 上海派森诺生物科技股份有限公司 一种基于高通量测序技术的宏转录组数据分析方法
CN110097928A (zh) * 2019-04-17 2019-08-06 广东省微生物研究所(广东省微生物分析检测中心) 一种基于肠道菌群预测组织微量元素含量的预测方法和预测模型
CN110819705A (zh) * 2019-08-17 2020-02-21 昆明医科大学第一附属医院 Uc患者肠道菌群多样性及差异性的分析方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114067911A (zh) * 2020-08-07 2022-02-18 西安中科茵康莱医学检验有限公司 通过测序获取微生物物种及相关信息的方法、装置、计算机可读存储介质和电子设备
CN114067911B (zh) * 2020-08-07 2024-02-06 西安中科茵康莱医学检验有限公司 获取微生物物种及相关信息的方法和装置
CN112151117A (zh) * 2020-08-11 2020-12-29 康美华大基因技术有限公司 一种基于时间序列宏基因组数据的动态观测装置及其检测方法
CN112151117B (zh) * 2020-08-11 2023-02-03 康美华大基因技术有限公司 一种基于时间序列宏基因组数据的动态观测装置及其检测方法
CN113611357A (zh) * 2020-11-17 2021-11-05 上海美吉生物医药科技有限公司 基于宏基因组的抗性基因分析方法、装置、介质及终端
CN114582416A (zh) * 2020-11-30 2022-06-03 深圳未知君生物科技有限公司 微生物集富集的分析方法、分析装置和计算机介质
CN114582416B (zh) * 2020-11-30 2025-02-11 深圳未知君生物科技有限公司 微生物集富集的分析方法、分析装置和计算机介质
CN112614544A (zh) * 2020-12-28 2021-04-06 杭州瑞普基因科技有限公司 Kraken2软件输出结果的优化方法及鉴定样本中物种类型的方法
CN112614544B (zh) * 2020-12-28 2024-05-17 杭州瑞普基因科技有限公司 Kraken2软件输出结果的优化方法及鉴定样本中物种类型的方法
CN112435713A (zh) * 2020-12-31 2021-03-02 申友基因组研究院(南京)有限公司 一种肠道微生物16SrRNA的NGS数据分析方法
EP4099331A1 (en) * 2021-06-01 2022-12-07 Tata Consultancy Services Limited Method and system for preparing knowledgebase of microbes and microbial functions helping to reduce cancer risk

Similar Documents

Publication Publication Date Title
CN111462819A (zh) 肠道微生物检测数据分析方法、自动化解读系统及介质
Ni et al. M2IA: a web server for microbiome and metabolome integrative analysis
Chong et al. Using MicrobiomeAnalyst for comprehensive statistical, functional, and meta-analysis of microbiome data
Petersen et al. CellExplorer: A framework for visualizing and characterizing single neurons
Norsigian et al. A workflow for generating multi-strain genome-scale metabolic models of prokaryotes
CN105096225B (zh) 辅助疾病诊疗的分析系统、装置及方法
CN107463800A (zh) 一种肠道微生物信息分析方法及系统
Easterly et al. metaQuantome: an integrated, quantitative metaproteomics approach reveals connections between taxonomy and protein function in complex microbiomes
JP6096781B2 (ja) 生化学データ分析システム及び方法
CN107391963A (zh) 基于计算云平台的真核无参转录组交互分析系统及其方法
Bokulich et al. q2-longitudinal: longitudinal and paired-sample analyses of microbiome data. mSystems 3: e00219-18
WO2017147396A1 (en) Object oriented system and method having semantic substructures for machine learning
Wang et al. CFViSA: A comprehensive and free platform for visualization and statistics in omics-data
Su et al. Method development for cross-study microbiome data mining: challenges and opportunities
Desvignes et al. FishmiRNA: An evolutionarily supported microRNA annotation and expression database for ray-finned fishes
Manta et al. Development and evaluation of automated tools for auditory-brainstem and middle-auditory evoked potentials waves detection and annotation
Jang et al. Comprehensive microbiome causal mediation analysis using MiMed on user-friendly web interfaces
US20230245752A1 (en) System and method for biomarker analysis in sporting, wellness and healthcare
Perz et al. MNEMONIC: MetageNomic experiment mining to create an OTU network of inhabitant correlations
Vijay et al. Precision Nutrition Through Nutritional Informatics: Futuristic Technologies for Health Advancement
Ma et al. ElecFeX is a user-friendly toolbox for efficient feature extraction from single-cell electrophysiological recordings
Clarke et al. MPrESS: an R-package for accurately predicting power for comparisons of 16s rRNA microbiome taxa distributions including simulation by dirichlet mixture modeling
Miossec et al. Computational methods for human microbiome analysis
Paritala Comparative gut Microbiome Evaluation of two Distinct Organisms: A Critical Review
Dai et al. Onlinemeta: A Web Server for Meta-Analysis Based on Shiny Framework

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination