[go: up one dir, main page]

CN111164706B - 疾病相关的微生物组表征过程 - Google Patents

疾病相关的微生物组表征过程 Download PDF

Info

Publication number
CN111164706B
CN111164706B CN201880064153.9A CN201880064153A CN111164706B CN 111164706 B CN111164706 B CN 111164706B CN 201880064153 A CN201880064153 A CN 201880064153A CN 111164706 B CN111164706 B CN 111164706B
Authority
CN
China
Prior art keywords
kegg3
species
metabolism
genus
microbiome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880064153.9A
Other languages
English (en)
Other versions
CN111164706A (zh
Inventor
扎迦利·阿普特
杰西卡·里奇曼
丹尼尔·阿尔莫纳西德
英迪·佩德索
帕兹·塔皮亚
维多利亚·杜马斯
罗德里戈·奥尔蒂斯
卡塔利娜·瓦尔迪维亚
维克多·阿尔吉亚
伊丽莎白·M·毕克
莫林·希特菲尔德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Macrogenics Inc
Original Assignee
Prosomegen
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Prosomegen filed Critical Prosomegen
Publication of CN111164706A publication Critical patent/CN111164706A/zh
Application granted granted Critical
Publication of CN111164706B publication Critical patent/CN111164706B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Physiology (AREA)
  • Artificial Intelligence (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

用于表征一种或多种微生物有关状况的方法和/或系统的实施方式可以包括:确定与受试者集合相关联的微生物数据集;和使用微生物组表征模块集合,应用分析技术以基于微生物数据集针对一种或多种微生物有关状况执行表征过程。

Description

疾病相关的微生物组表征过程
相关申请的交叉引用
本申请要求2017年11月6日提交的美国临时申请序列号62/582,191、2017年8月14日提交的美国临时申请序列号62/545,039以及2018年4月16日提交的美国临时申请序列号62/658,308的权益,其全部内容通过引用各自结合到本文中。
技术领域
本公开一般涉及基因组学和微生物学。
背景技术
微生物组可以包括与生物体相关的共栖(commensal)、共生(symbiotic)和病原微生物的生态群落。人类微生物组的表征是一个复杂的过程。人类微生物组包括是人类细胞的10倍以上的微生物细胞,但是例如由于样品处理技术、遗传分析技术和用于处理大量数据的资源有限,人类微生物组的表征仍处于初期阶段。目前的知识已经清楚地建立了与多种健康状况的微生物组关联的作用,并已成为宿主遗传和环境因素对人类疾病发展的日益重视的媒介。怀疑微生物组在许多健康/疾病有关状态(例如,分娩准备、糖尿病、自身免疫性障碍、胃肠障碍、类风湿性障碍、神经障碍,等)中起到至少部分作用。此外,微生物组可以介导环境因素对人类、植物和/或动物健康的影响。考虑到微生物组在影响受试者健康方面深刻启示,应该追寻与微生物组表征、从表征中产生见解以及产生配置为矫正生态失调状态的治疗有关的工作。然而,用于分析人类微生物组和/或基于所获得的见解提供治疗措施的当前方法和系统留下了许多未回答的问题。
这样,在微生物学领域中需要一种新的且有用的方法和/或系统,用于表征、监测、诊断和/或干预一种或多种与微生物有关的健康状况和/或相关联的关系(例如,与微生物和/或状况等相关的特定特征),例如用于个体化用途和/或全人群用途。
附图说明
图1包括方法的实施方式的变型的流程图表示;
图2包括方法和系统的实施方式的变型的表示;
图3包括用于在方法的实施方式中生成表征模型的过程的变型;
图4包括在方法的实施方式中基于益生菌疗法操作的机制的变型;
图5包括在方法的实施方式中样品处理的变型;
图6包括通知提供的实施例;
图7包括方法的实施方式的变型的示意性表示;
图8A-8C包括利用模型执行表征过程的变型;
图9包括推广方法的实施方式的变型中的疗法;
图10包括微生物组表征模块的变型;
图11包括微生物组表征模块的变型;
图12包括微生物组表征模块的变型;
图13包括微生物组表征模块的变型;
图14包括微生物组表征模块的变型;
图15包括微生物组表征模块的变型;
图16包括微生物组表征模块的变型;
图17包括多位点分析的变型;
图18包括维恩图(Venn Diagram)的特定实施例,其具有来自用于肠道取样位点的不同统计技术(例如,单变量统计技术)的结果的比较;
图19包括从分析模块B的应用获得的降维(dimensionality reduction)的表示的特定实施例,各微生物组子系统被检测为由不同灰度级的颜色表示,并且相关模块由实心黑线表示;
图20包括微生物分类标准和功能之间相互作用的表示的特定实施例,功能由正方形表示,分类标准由圆圈表示;
图21包括微生物组特征解释的变化的特定实施例,该微生物组特征与分析的各症状(condition)相关联,值对应于所解释的变化的平均值以及第32和第68百分位数,并且状况由主要显示(manifestation)位点组织在各板(panel)上。
图22包括集群分析的表示的特定实施例,该集群分析使用基于微生物组的显著相关性(significance correlations)以获得被分析的状况的数据驱动排列(data-drivenarrangement);
图23包括微生物组表征模块和相关联方面的变型;
图24包括微生物有关条件当中微生物组有关的关联(association)的热图的特定实施例;和
图25包括显示集群内和集群间共患病(comorbidity)的个体数量的特定实施例。
具体实施方式
实施方式的以下描述并非旨在限制实施方式,而是使任何本领域技术人员能够制造和使用。
1.概述
如图1所示,用于表征一种或多种微生物有关状况(microorganism-relatedconditions)(例如,疾病有关状况,人类行为状况等)的方法100的实施方式可以包括:确定与受试者集合相关联的微生物数据集(例如,微生物序列数据集、诸如基于微生物序列数据集的微生物组组成多样性数据集、诸如基于微生物序列数据集的微生物组功能多样性数据集等)S110;和使用微生物组表征模块集合,基于微生物数据集(例如,基于衍生自微生物数据集的微生物组特征等)应用分析技术来针对一种或多种微生物有关状况(例如,人类行为状况,疾病有关状况,等)执行表征过程(例如,预处理、特征生成、特征处理、用于多个收集位点的多位点表征、用于多种微生物有关状况的交叉条件(cross-condition)分析、模型生成等)S130。
方法100的实施方式可以附加地或可替代地包括以下一项或多项:处理与该受试者集合的一种或多种微生物有关状况相关联的(例如,提供其有用信息的;对其描述;表示其;与其关联的等)补充数据集(例如,描述用户的一个或多个特性,如医疗状况历史(medical condition history)等)S120;确定用于确定预防、改善和/或以其他方式改变一种或多种微生物有关状况的疗法的疗法模型S140;处理与用户(例如,受试者、人类、动物、患者等)相关的一种或多种生物样品S150;使用表征过程,基于处理衍生自用户的生物样品的用户微生物数据集(例如,用户微生物序列数据集、用户微生物组组成数据集、用户微生物组功能数据集等)针对用户确定微生物有关表征(例如,人类行为表征、疾病有关表征等)S160;促进针对用户的一种或多种微生物有关状况的治疗干预(例如,基于微生物有关状况和/或疗法模型;等)S170;基于处理生物样品,监测针对用户的疗法的有效性,以评估随时间推移与针对用户的疗法相关联的微生物组组成和/或功能特征S180;和/或任何其他合适的操作。
方法100和/或系统200的实施方式可以起到应用一个或多个微生物组表征模块(例如,用于应用一种或多种分析技术等)来表征(例如,评估(assess)、评价(evaluate)、诊断、描述等)微生物有关状况和/或与微生物有关状况有关的用户(例如,人类行为状况、疾病有关状况等),诸如用于促进(facilitate)治疗干预(例如,疗法选择;疗法推广(promotion)和/或提供;疗法监测;疗法评价;等)。在一个实施例中,方法100可以包括:基于来自与该受试者集合相关联的生物样品的微生物核酸,确定与该受试者集合相关联的微生物序列数据集,其中该微生物核酸与该微生物有关状况相关联;使用微生物组表征模块集合,基于该微生物序列数据集应用分析技术集合(例如,至少一种统计检验,诸如单变量统计检验、降维技术、人工智能方法、本文中描述的其他方法等)来确定微生物组特征集合;基于微生物组特征集合(和/或任何其他合适的数据)生成微生物有关状况模型(例如,用于表型预测,诸如估计用户对微生物有关状况的倾向性分值(propensity score)等);以及基于微生物有关状况模型和来自用户的样品来确定针对用户的微生物有关状况的表征(例如,通过样品处理和计算处理生成用户微生物组特征值以与微生物有关状况模型一起使用等)。
附加地或可替代地,方法100和/或系统200的实施方式可以起到执行针对多种微生物有关状况(例如,多种微生物有关状况的表征等)的交叉条件分析(例如,使用一个或多个微生物组表征模块等)的作用,诸如在表征、诊断和/或治疗用户的情况下。在一个实施例中,方法100可以包括:基于来自与受试者集合相关联的生物样品的微生物核酸,确定与受试者集合相关联的微生物序列数据集,其中该微生物核酸与多种微生物有关状况相关联(例如,该微生物核酸与微生物组特征相关联等,该微生物组特征与多种微生物有关状况中的两种以上关联);使用微生物组表征模块集合,基于微生物序列数据集确定多条件微生物组特征集合,其中多条件(multi-condition)微生物组特征集合中的每个多条件微生物组特征均与多种微生物有关状况中的至少两个微生物有关状况相关联(例如,关于相关性(relevance)、关联性(correlation)、协方差在多种微生物有关状况中共享的特征等);基于多条件微生物组特征集合和来自用户的样品,针对用户确定多个微生物有关状况中的微生物有关状况(例如,子集、全部等)的多条件表征;以及基于该多条件表征,促进用于多种微生物有关状况中的微生物有关状况的治疗干预。
附加地或可替代地,方法100和/或系统200的实施方式可以识别与不同微生物有关状况相关联的微生物组特征,诸如用作生物标志物(例如,用于诊断过程、用于治疗过程等)。在实施例中,微生物有关表征可以与用户微生物组组成(例如,微生物组组成多样性等)、微生物组功能(例如,微生物组功能多样性等)和/或其他合适的微生物组相关方面中的至少一种或多种相关联。
附加地或可替代地,实施方式可以起到促进针对微生物有关状况的治疗干预的作用,诸如通过相关联疗法的推广(例如,关于特定生理位点肠道,皮肤,鼻,口,生殖器,其他合适的生理位点,其他收集位点,等)。附加地或可替代地,实施方式可以起到生成模型(例如,诸如用于表型预测和/或预测分值的微生物组表征模块、诸如用于特征处理的机器学习模型等)的作用,诸如可以用于基于用户的微生物组(例如,用户微生物组特征;作为临床诊断;作为伴随诊断等)来表征和/或诊断用户的模型、和/或可用于针对受试者关于一种或多种微生物有关状况选择和/或提供疗法(例如,基于益生菌的治疗措施,基于噬菌体的治疗措施,基于小分子的治疗措施,临床措施,等)。附加地或可替代地,实施方式可以执行本文中描述的任何合适的功能。
这样,可以使用一个或多个微生物组表征模块(例如,用于生成模型等)来处理来自受试者群体的数据(例如,与一种或多种微生物有关状况等相关联),以表征后续用户、诸如用于指示微生物有关的健康状态和/或改进领域,和/或促进治疗干预(例如,推广一种或多种疗法;促进用户的微生物组的组成和/或功能多样性向一种或多种期望的平衡状态集合的调整,诸如与改进的健康状态关联的状态,该改进的健康状态与一种或多种微生物有关状况相关联等)。方法100的变型还可以促进提供给用户的疗法的选择、监测(例如,功效监测等)和/或调节,诸如通过来自受试者的针对一种或多种微生物有关状况、随时间(在整个治疗方案的过程中,通过用户对微生物有关状况的经验程度;等)和/或跨收集位点收集和分析(例如,使用微生物组表征模块)的额外样品(例如,其中表征可以包括针对多种状况的交叉条件(cross-condition)表征等)。然而,方法100和/或系统200的任何合适的部分可以将来自人群、亚群、个体和/或其他合适的实体的数据用于任何合适的目的。
方法100和/或系统200的实施方式可以优选生成和/或推广(例如,提供;存在;通知关于(notify regarding)等)针对一种或多种微生物有关状况的表征和/或疗法,所述一种或多种微生物有关状况可以包括以下一种或多种:疾病、症状、病因(例如,诱因等)、障碍、相关联风险(例如,倾向性分值等)、相关严重性、行为(例如,咖啡因消耗、习惯、饮食等)、和/或与微生物有关状况相关联的任何其他合适的方面。微生物有关状况可以包括一种或多种疾病有关状况,该疾病有关状况可以包括以下任何一种或多种:皮肤有关状况(例如,痤疮、皮肌炎、湿疹、酒渣鼻、皮肤干燥、牛皮癣、头皮屑、光敏性、皮肤粗糙、瘙痒、剥落(flaking)、脱屑(scaling)、脱皮(peeling)、细纹或裂纹、深色皮肤个体的皮肤灰白、发红、诸如可流血并导致感染的裂纹的深裂纹、头皮皮肤的瘙痒和脱屑、诸如刺激性油性皮肤的油性皮肤、皮肤对诸如护发产品等产品的敏感性、头皮微生物组的不平衡等);胃肠道有关状况(例如,肠易激综合征、炎症性肠病、溃疡性结肠炎、乳糜泻、克罗恩(Crohn’s)病、腹胀、痔疮、便秘、反流、血便、腹泻);过敏有关状况(例如,与小麦、麸质、乳制品、大豆、花生、贝类、树生坚果、蛋类相关的过敏和/或不耐受等);运动有关状况(例如,痛风、类风湿性关节炎、骨关节炎、反应性关节炎、多发性硬化症、帕金森氏病等);癌症有关状况(例如,淋巴瘤、白血病、胚细胞瘤、生殖细胞瘤、癌、肉瘤、乳腺癌、前列腺癌、基底细胞癌、皮肤癌、结肠癌、肺癌、与任何合适的生理区域相关的癌症等);心血管有关状况(例如,冠心病、炎性心脏病、瓣膜性心脏病、肥胖症、中风等);贫血状况(例如,地中海贫血、镰状细胞、恶性、范可尼、溶血性、再生障碍性、铁缺乏症等);神经有关状况(例如,注意缺陷多动障碍(attentiondeficit hyperactivity disorder,ADHD)、注意缺陷障碍(attention deficit disorder,ADD)、焦虑症、阿斯伯格(Asperger)综合症,自闭症,慢性疲劳综合症,抑郁症,等);自身免疫有关状况(例如,口炎性腹泻(Sprue)、艾滋病(AIDS)、舍格伦综合征(Sjogren’s)、系统性红斑狼疮等);内分泌有关状况(例如,肥胖、格雷夫斯病(Graves’disease)、桥本氏甲状腺炎(Hashimoto’s thyroiditis)、代谢病、I型糖尿病、II型糖尿病等);莱姆(Lyme)病状况;沟通有关状况;睡眠有关状况;代谢有关状况;体重有关状况;疼痛有关状况;遗传相关状况;慢性疾病和/或任何其他合适类型的疾病有关状况。在变型中,方法100和/或系统200实施方式部分可以在推广针对患有一种或多种微生物有关状况(例如,皮肤有关状况,等)的用户(例如,提供,等)的一种或多种靶向疗法中使用。附加地或可替代地,微生物有关状况可以包括一种或多种人类行为状况,该人类行为状况可以包括以下任何一种或多种:咖啡因消耗,酒精消耗,其他食物类消耗,饮食补充剂消耗,益生菌有关行为(例如,消耗、避免等),其他饮食行为,习惯行为(例如,吸烟,诸如低、中和/或极端运动状况的运动状况等),更年期,其他生物过程,社会行为,其他行为,和/或任何其他合适的人类行为状况。状况可以与任何合适的表型(例如,对于人类、动物、植物、真菌体可测量的表型,等)相关联。
方法100和/或系统200的实施方式可以针对单个用户实施,诸如关于应用一个或多个微生物组表征模块用于处理(例如,跨一个或多个收集位点收集的)来自用户的一个或多个生物样品,用于微生物有关表征,促进治疗干预和/或用于任何其他合适的目的(例如,用于一种或多种微生物有关状况,等)。附加地或可替代地,实施方式可以针对受试者群体(例如,包括用户,不包括用户)实施,其中受试者群体可以包括与任何合适类型特性的其他受试者相似和/或不相似的受试者(例如,关于微生物有关状况、人口统计学特征行为、微生物组组成和/或功能,等);针对用户亚组实施(例如,共享特性,例如影响微生物有关特性和/或疗法确定的特性等);针对植物、动物、微生物和/或任何其他合适的实体实施。因此,从受试者集合(例如,受试者群体、受试者集合、用户亚组等)衍生的信息可以用于为后续用户提供额外的见解。在变型中,生物样品汇总集合(aggregate set)优选与各种用户相关联并针对各种用户进行处理,诸如包括以下一种或多种的用户:不同的人口统计学(例如,性别、年龄、婚姻状态、种族、国籍、社会经济状态、性取向等),不同的微生物有关状况(例如,健康和疾病状态、不同的遗传倾向(genetic dispositions);等),不同的生活情况(例如,单独生活、与宠物生活、与其他重要的事物生活、与儿童生活等),不同的饮食习惯(例如,杂食,素食(vegetarian),严格素食者(vegan),糖消耗,酸消耗,咖啡因消耗,等),不同的行为倾向性(behavioral tendencies)(例如,身体活动水平,药物使用,饮酒,等),不同移动性水平(例如,有关在给定时间段内经过的距离),和/或任何其他合适的特性(例如,影响微生物组组成和/或功能、与之关联、和/或以其他方式与之相关联的特性等)。在实施例中,随着用户数量的增加,在方法100的部分中实施的过程预测能力可以增加,诸如关于基于用户的微生物组表征各种用户(例如,关于针对用户的样品的不同收集位点等)。然而,针对任何合适的一个或多个实体,方法100和/或系统200的部分可以以任何合适的方式执行和/或配置。
本文中描述的数据(例如,微生物组表征模块输入、微生物组表征模块输出、微生物数据集、微生物组特征、微生物有关表征、疗法有关数据、用户数据、补充数据、通知等)可以与任何合适的时间指示符(temporal indicators)(例如,秒、分钟、小时、天、周等)相关联,该时间指示符包括以下一种或多种:指示数据何时被收集(例如,指示样品何时被收集的时间指示符;等)、确定、传输、接收和/或以其他方式处理的时间指示符;向由数据描述的内容提供上下文的时间指示符;(例如,与微生物有关特征相关联的时间指示符,诸如其中微生物有关表征描述了特定时间时微生物有关状况和/或用户微生物组状态等);时间指示符的变化(例如,微生物有关表征随时间的变化,诸如响应于接收疗法;样品收集、样品分析、向用户提供微生物有关表征或疗法、和/或方法100的其他合适的部分之间的等待时间(latency)等);和/或任何其他合适的与时间有关的指示符。
附加地或可替代地,参数、指标(metric)、输入、输出和/或其他合适的数据可以与值类型相关联,该值类型包括:分值(例如,微生物有关状况倾向性(propensity)分值;特征相关性分值;关联性分值、协方差分值、微生物组多样性分值、严重性分值等),个体值(例如,针对不同收集位点的个体微生物有关分值,诸如状况倾向性分值,等),汇总值(例如,针对不同收集位点、基于个体微生物有关分值的总体分值等),二进制值(例如,微生物组特征存在或不存在;微生物有关状况存在或不存在等),相对值(例如,相对分类组丰度、相对微生物组功能丰度、相对特征丰度等),分类(例如,针对用户的微生物有关状况分类和/或诊断、针对状况的微生物有关状况集群分类;特征分类;行为分类;人口统计学分类等),置信水平(例如,与微生物序列数据集相关联;与微生物组多样性分值相关联;与其他微生物有关表征相关联;与其他输出相关联等),标识符(例如,识别在处理数据中使用的微生物组表征模块,等),频谱上的值和/或其他任何合适类型的值。本文中描述的任何合适类型的数据都可以用作输入(例如,用于本文中描述的不同模块、模型和/或其他合适的组件)、生成为(例如,不同模型、模块的输出等的)输出、和/或对于与方法100和/或系统200相关联的任何合适的组件,以任何合适的方式操作。
本文中描述的方法100和/或过程的一个或多个实例和/或部分可以异步地(例如,顺序地)、同时地(例如,用微生物组表征模块的并行数据处理;同时的交叉条件分析;多重样品处理,诸如对应于与微生物有关状况相关联的靶序列的微生物核酸片段的多重扩增;执行样品处理和分析以用于基本同时地评价一组(a panel of)微生物有关状况;计算上确定微生物数据集、微生物组特征、和/或对于多个用户表征并行的微生物有关状况;诸如同时在不同线程上以并行计算以提高系统处理能力等)、与触发事件(例如,方法100的部分的执行)时间上相关(例如,基本同时,响应于,连续地,先于,随后,等)、和/或通过和/或使用本文描述的系统200、组件和/或实体的一个或多个实例以任何其他合适的顺序、以任何合适的时间和频率来执行。在一实施例中,方法100可以包括:基于使用样品处理系统的下一代测序平台(和/或其他合适的测序系统)的桥扩增底物(bridge amplificationsubstrate)处理一个或多个生物样品的微生物核酸来生成微生物数据集,以及在可操作以与下一代测序平台通信的计算设备中确定微生物组特征和微生物组功能多样性特征。然而,方法100和/或系统200可以任何合适的方式配置。
2.益处
微生物组分析可以使针对由微生物引起的和/或以其他方式与微生物相关联的微生物有关状况的准确和/或有效表征、和/或疗法提供(例如,根据方法100的部分等)成为可能。该技术的特定实施例可以克服传统方法在表征用户状况(例如,微生物有关状况)和/或促进治疗干预中所面临的若干挑战。第一,传统方法可能需要患者访问一个或多个护理提供者,以接收针对微生物有关状况的表征和/或疗法建议(例如,通过诸如血液测试的诊断性医疗程序;等),这可能相当于(amount to)与诊断和/或治疗之前经过的时间量、医疗护理质量的不一致和/或护理提供者访问的其他方面相关联的效率低下和/或健康风险。第二,用于人类基因组测序的传统基因测序和分析技术当应用于微生物组时可能不兼容和/或效率低下(例如,其中人类微生物组可包括是人类细胞10倍以上的微生物细胞;其中可行的分析技术和利用分析技术的手段可能不同;其中最佳样品处理技术可能不同,诸如用于减少扩增偏差;其中可能采用对微生物有关表征的不同方法;其中状况和关联性的类型可能不同;其中相关联状况的起因和/或针对相关联状况的可行疗法可能不同;其中序列参考数据库可能不同;其中微生物组可能在跨越用户的不同身体区域、例如在不同的收集位点上变化;等)。第三,测序技术(例如,下一代测序、相关联技术等)的兴起已经引起了技术问题(例如,针对大量生成的序列数据的数据处理和分析的问题;以多重方式处理多种生物样品的问题;信息显示问题;疗法预测问题;疗法提供问题,等),但由于与测序遗传物质相关联的速度和数据生成方面的空前发展,这些技术问题将不存在。方法100和/或系统200的特定实施例可以为至少上述挑战赋予以技术为根基的(technologically-rooted)解决方案。
第一,该技术的特定实施例可以将实体(例如,用户、生物样品、包括医疗设备的疗法促进系统等)转变为不同的状态或事物。例如,该技术可以将生物样品转变为能够测序和分析的成分,以生成微生物数据集和/或微生物组特征,该微生物数据集和/或微生物组特征可用于表征关于一种或多种微生物有关状况的用户(例如,诸如通过使用微生物组表征模块、下一代测序系统、多重扩增操作等)。在另一实施例中,该技术可以识别、推广(例如,提出、建议)、劝阻(discouraging)和/或提供疗法(例如,基于微生物组表征的个体化疗法等)和/或以其他方式促进治疗干预(例如,促进用户的微生物组组成、微生物组功能的改变等),这可以预防和/或改善一种或多种微生物有关状况,从而转变患者的微生物组和/或健康(例如,改进与微生物有关状况相关的健康状态;等)。在另一实施例中,该技术可以在用户的一个或多个不同生理位点(例如,一个或多个不同收集位点等)转变微生物组组成和/或功能,例如靶向和/或转变与肠道、鼻、皮肤、口和/或生殖器微生物组相关联的微生物。在另一实施例中,该技术可以控制治疗有关系统(例如,饮食系统;自动药物分配器;行为改变系统;诊断系统;疾病疗法促进系统等),以推广疗法(例如,通过针对疗法促进系统生成以执行的控制指令等),从而转变疗法促进系统。
第二,该技术的特定实施例可以诸如通过促进计算机执行非预先可执行的功能,来赋予计算机有关技术中的改进(例如,改进针对微生物有关状况在存储、检索和/或处理微生物有关数据方面的计算效率;与生物样品处理相关的计算处理等)。例如,该技术可以利用微生物组表征模块集合来以非通用方式将多种分析技术应用于非通用的微生物数据集和/或微生物组特征(例如,由于样品处理技术和/或测序技术方面的进步,该微生物数据集和/或微生物组特征是最近能够生成的和/或可行的,等),用以改进微生物有关表征和/或促进针对微生物有关状况的治疗干预。
第三,该技术的特定实施例可以在处理速度、微生物有关表征、准确性、微生物组有关疗法确定和推广、和/或关于微生物有关状况的其他合适方面方面赋予改进。例如,该技术可以利用具有非通用的微生物数据集的微生物组表征模块集合来确定、选择和/或以其他方式处理与一种或多种微生物有关状况特别相关的微生物组特征(例如,处理过的与微生物有关状况的相关性分值相关联的微生物组特征;与多种微生物有关状况相关的交叉条件微生物组特征等),这可以促进准确性(例如,通过使用最相关的微生物组特征;通过利用定制的分析技术等)、处理速度(例如,通过选择相关微生物组特征的子集;通过执行降维技术;通过利用定制的分析技术等)的改进,和/或关于表型预测(例如,微生物有关状况的指示等)、其他合适的表征、治疗干预促进和/或其他合适的目的的其他计算改进。在特定实施例中,该技术可以将特征选择规则(例如,用于组成、功能的微生物组特征选择规则;用于从补充数据集中提取的补充特征的微生物组特征选择规则等)与一种或多种微生物组表征模块一起应用,以从巨大的潜在的特征池(pool of features)(例如,从大量(a plethoraof)诸如序列数据的微生物组数据中可提取的;通过诸如单变量统计检验的统计检验可识别的;等)中选择优化的特征子集(例如,与一种或多种微生物有关状况相关的微生物组功能特征;微生物组组成多样性特征,诸如表示与微生物有关状况相关联的分类组的健康、存在、不存在和/或其他合适范围的参考相对丰度特征;可与与微生物有关状况和/或疗法响应关联的参考相对丰度特征比较的用户相对丰度特征;等),用于生成、应用、和/或以其他方式促进表征和/或疗法(例如,通过模型,等)。微生物组(例如,人类微生物组、动物微生物组等)的潜在规模可以转化为大量数据,给出了如何处理和分析大批数据以生成关于微生物有关状况的可操作的微生物组见解的问题。然而,特征选择规则和/或其他合适的计算机可实现规则可以使以下一项或多项成为可能:较短的生成和执行时间(例如,用于生成和/或应用模型;用于确定微生物有关表征和/或相关联疗法;等);优化的样品处理技术(例如,诸如在优化以改进特异性、减少扩增偏差和/或其他合适的参数的情况下,通过使用通过分类组、序列和/或与微生物有关状况相关的其他合适的数据识别引物类型、其他生物分子和/或其他样品处理成分,改进微生物核酸从生物样品的转变;等);促进结果的有效解释(interpretation)的模型简化;过度拟合的减少;与微生物有关状况有关的、随时间推移的与针对多个用户生成、存储和应用微生物组表征相关联的网络效应(例如,通过收集和处理增加数量的微生物组有关数据以改进微生物有关表征和/或疗法确定的预测能力等,该增加数量的微生物组有关数据与增加数量的用户相关联);数据存储和检索的改进(例如,存储和/或检索微生物组表征模块;存储诸如与具有不同微生物有关状况的不同用户和/或用户集合相关联的特定模型;存储与用户帐户相关联的微生物数据集;存储与一种或多种疗法和/或接受该疗法的用户相关联的疗法监测数据;存储与用户、用户集合和/或其他实体相关联的特征、微生物有关表征和/或其他合适的数据,以针对微生物有关状况改进个性化表征和/或疗法的递送,等);和/或对技术领域的其他合适的改进。
第四,该技术的特定实施例可以相当于包括样品处理系统、微生物有关表征系统(例如,包括微生物组表征模块集合,其中各模块可具有不同但互补的功能,等)和多个用户的整个网络上的发明性功能分布,其中样品处理系统可处理来自多个用户的生物样品的基本同时的处理(例如,以多重方式),其可被微生物有关表征系统利用来生成针对微生物有关状况的个性化表征和/或治疗(例如,针对用户的微生物组进行定制,该用户的微生物组诸如与用户的饮食行为、益生菌相关行为、病史、人口统计学、其他行为、偏好等有关)。
第五,该技术的特定实施例可以改进至少基因组学(genomics)、微生物学、微生物组有关计算、诊断、疗法、微生物组有关数字医学、一般数字医学、建模和/或其他相关领域的技术领域。在一实施例中,该技术可以利用微生物组表征模块集合来建模和/或表征不同的微生物有关状况,例如通过针对微生物有关状况进行的相关微生物特征的计算识别(例如,其可充当要在诊断中使用的生物标志物,促进治疗干预,等)。在另一实施例中,该技术可以执行交叉条件分析,以识别和评价交叉条件微生物组特征,该交叉条件微生物组特征与多种微生物有关状况(例如,疾病、表型等)相关(例如,跨多种微生物有关状况共享、跨多种微生物有关状况关联,等)。该微生物组特征的识别和表征可以通过降低共病和/或多病的微生物有关状况(例如,其可与环境因素相关联,从而与微生物组相关联,等)的风险和患病率,来促进改进的健康护理的实践(例如,在群体和个体水平上、诸如通过促进诊断和治疗干预等)。
第六,该技术可以利用专用的计算设备(例如,与诸如下一代测序系统的样品处理系统相关的;与微生物有关表征系统相关联的;与疗法促进系统相关联的系统等)执行与方法100和/或系统200相关联的合适的部分。
然而,在使用非通用计算机系统用于微生物有关表征、微生物组调节和/或用于执行方法100的其他合适部分的情况下,该技术的特定实施例可以提供任何其他合适的益处。
3.系统
如图2所示,系统200的实施方式(例如,用于表征微生物有关状况)可以包括以下任何一个或多个:处理系统(例如,样品处理系统等)210,其可操作以收集和/或处理来自一个或多个用户(例如,人类受试者、患者、动物受试者、环境生态系统、护理提供者等)的生物样品(例如,由用户收集并包括在容器中,该容器包括预处理试剂;等)以确定微生物数据集(例如,微生物遗传序列;微生物序列数据集等);微生物有关表征系统220,其可操作以确定用户微生物组特征(例如,微生物组组成特征;微生物组功能特征;多样性特征;相对丰度范围;诸如基于微生物数据集和/或其他合适的数据;等)、确定微生物有关表征(例如,微生物有关状况表征、疗法有关表征、针对用户的表征,等);和/或疗法促进系统230,其可操作以促进针对一种或多种微生物有关状况(例如,基于一种或多种微生物有关状况;等)的治疗干预(例如,推广疗法,等)。
在特定实施例中,系统200可以包括样品处理系统,该样品处理系统包括:测序系统(例如,下一代测序系统,等),该测序系统可操作以基于与受试者集合相关联的生物样品来确定微生物遗传序列,其中生物样品包括与微生物有关状况相关联的微生物核酸;微生物组表征模块221集合,其可操作以应用分析技术集合,该分析技术包括以下至少两项:统计检验(例如,单变量统计检验等)、降维技术、人工智能方法和/或本文中描述的其他合适方法,并且其中微生物组表征模块221集合包括:第一微生物组表征模块221',其可操作以应用分析技术集合中的第一分析技术(例如,一个或多个单变量统计检验和/或合适的统计检验等),以基于微生物遗传序列确定微生物组特征集合,其中微生物组特征集合与微生物有关状况相关联(例如,与微生物有关状况关联等);和第二微生物组表征模块221”,其可操作以应用分析技术集合中的第二分析技术(例如,降维技术),以基于微生物组特征集合(例如,其中第一微生物组表征模块221'的输出可以串行(serial)、链式(chained)的方式用作第二微生物组表征模块221”的输入,等)确定处理后的微生物组特征集(例如,降维的特征集;包括针对一种或多种微生物有关状况最相关特征的特征集等),其中处理后的微生物组特征集适用于改进微生物有关状况的表征(例如,通过从巨大的潜在特征池识别和利用定制特征的子集来改进准确性、处理速度,从而改进关于微生物有关表征的计算系统的功能、治疗干预促进、和/或本文中描述的其他合适功能等);和其基于处理后的微生物组特征集生成的微生物有关状况模型,其中,微生物有关状况模型可操作以针对用户确定微生物有关状况的表征。
系统200的处理系统210可起到接收和/或处理(例如,片段化、扩增、测序、生成相关数据集等)生物样品以将微生物核酸和/或生物样品的其他成分转化为数据(例如,可随后比对(aligned)和分析的遗传序列;微生物数据集等)的作用,来促进微生物有关表征和/或治疗干预的生成。处理系统210可以附加地或可替代地起到诸如通过邮递系统将样品试剂盒250(例如,包括样品容器、用于从一个或多个收集位点收集样品的使用说明等)提供给多个用户(例如,响应于样品试剂盒250的购买订单)的作用。处理系统210可以包括用于测序生物样品(例如,测序来自生物样品的微生物核酸)的一个或多个测序系统215(例如,下一代测序系统,用于靶向扩增子测序、元转录组(metatranscriptomic)测序、元基因组测序、合成测序(sequencing-by-synthesis)技术、毛细管测序技术、桑格(Sanger)测序、焦磷酸测序技术、纳米孔测序技术的测序系统,等),诸如在生成微生物数据(例如,微生物序列数据、用于微生物数据集的其他数据等)中。处理系统210可以附加地或可替代地包括文库制备系统,该文库制备系统可操作来以多重方式自动制备待通过测序系统测序的生物样品(例如,使用与遗传靶标(genetic target)兼容的引物来片段化和扩增,该遗传靶标与微生物有关状况相关联);和/或任何合适的组件。处理系统可以执行本文中描述的任何合适的样品处理技术。然而,处理系统210和相关联组件可以以任何合适的方式配置。
系统200的微生物组表征系统220可起到确定、分析、表征和/或以其他方式处理微生物数据集(例如,基于导致微生物遗传序列的处理后的生物样品;与参考序列的比对;等)、微生物组特征(例如,个体变量;变量组;与表型预测、与统计描述相关的特征;与从个体获得的样品相关联的变量;与微生物有关状况相关联的变量;以相对或绝对量完整或部分描述样品的微生物组组成和/或功能的变量等)、模型(例如,微生物有关状况模型等)和/或其他合适数据的作用,以促进微生物有关表征和/或治疗干预。在实施例中,微生物组表征系统220可以识别衍生自统计描述与一种或多种微生物有关状况相关联的样品(例如,与微生物有关状况有关的存在、不存在、风险、倾向和/或其他方面相关联的样品,等)之间的差别的特征信息,诸如其中不同的分析可将补充视图提供至区分不同样品(例如,区分与状况的存在或不存在相关的子组,等)的特征中。在特定实施例中,个体预测因子(predictor)、特定生物学过程和/或统计推断的潜在变量可在不同数据复杂性级别提供补充信息,以促进关于表征、诊断和/或治疗的变化的下游机会。在特定实施例中,微生物组表征系统220可以生成和/或应用疗法模型(例如,基于交叉条件分析等),来识别和/或表征用于治疗一种或多种微生物有关状况的疗法。在另一特定实施例中,微生物组表征系统220处理补充数据(例如,要用于改进微生物组表征模块221的应用的先前的知识;诸如与用户、微生物组特征、微生物有关状况、其他成分相关联的先验知识,等)。
微生物组表征系统220优选地包括一个或多个微生物组表征模块221(例如,独立模块、相互依赖的模块等),其可以起到将一种或多种分析技术应用于处理微生物数据集、微生物组特征、补充数据和/或其他合适的数据以促进微生物有关表征和/或治疗干预的作用(例如,如图23所示)。
任何合适的微生物组表征模块221(例如,利用任何合适的分析技术等)可以以任何合适的方式,以串行(例如,通过链接关于输出和输入的微生物组表征模块221)、同时、重复和/或任何合适的时间关系,以任何合适的组合应用。例如,微生物组表征模块221的输出可以构成微生物有关表征(例如,自身感兴趣的(interest)结果等),其被视为中间成分(例如,用作相同或不同微生物组表征模块221的输入、诸如疗法模型的模型的输入等),和/或被用于任何合适的目的。在特定实施例中,多个微生物组表征模块221可以链接(例如,诸如其中微生物组表征模块221的一个或多个输出可以用作相同或另一微生物组表征模块221的一个或多个输入,等)和/或以其他方式连接(例如,关于数据共享,关于有助于微生物有关表征,关于与一种或多种微生物有关状况的关联等),这可促进一个或多个特征选择(例如,选择微生物组特征的子集以供后续使用等)、特征加权(feature weighting)(例如,用于确定针对不同特征的不同加权,诸如增权或减权(down-weighting)特征,其可以在任何合适的微生物组表征模块221、模型和/或其他合适的过程等中使用,等)、热启动(例如,其中与第一微生物组表征模块221'相关联的输出和/或其他处理可以辅助和/或改进与第二微生物组表征模块221”相关联的处理,诸如关于改进统计学习和/或推断、帮助和/或以其他方式改进与,这可以与促进专注于最相关特征有关,等)。例如,第一微生物组表征模块221'可以(例如,通过应用第一分析技术)确定微生物组特征集合;第二微生物组表征模块221”可以应用(例如,可操作以应用)第二分析技术以执行特征选择、特征加权和热启动中的至少一个,来将微生物组特征集合处理成处理后的微生物组特征集。然而,微生物组表征模块221可以出于任何合适的目的,以任何合适的时间和频率针对任何数量的数据集、用户、微生物有关状况、疗法和/或其他合适的实体应用。
不同的微生物组表征模块221(例如,微生物组表征模块221的不同组合;应用不同分析技术的不同模块;不同的输入和/或输出类型;以诸如关于时间和/或频率的不同方式应用的;等)可以基于以下一项或多项应用(例如,执行、选择、检索、存储等):微生物有关状况(例如,根据所表征的一种或多种微生物有关状况,使用不同组合的微生物组表征模块221,诸如其中不同微生物组表征模块221具有用于处理关于不同微生物有关状况的数据的不同适用性水平,等)、用户(例如,基于不同用户数据和/或特征的不同微生物组表征模块221,该用户数据和/或特征诸如相应样品收集位点、人口统计学、遗传学、环境因素等)、微生物有关表征(例如,用于不同类型的表征、诸如疗法有关表征相对于诊断有关表征的不同微生物组表征模块221,诸如用于相对于确定微生物有关状况的倾向性分值识别相关微生物组组成;等)、疗法(例如,用于监测不同疗法的功效的不同微生物组表征模块221等)、和/或任何其他合适的成分。在实施例中,不同的微生物组表征模块221可针对不同类型的输入、输出、微生物有关表征、微生物有关状况(例如,需要表征的不同表型的测量)、和/或任何其他合适的实体定制。然而,微生物组表征模块221可以以任何合适的方式定制和/或使用,以促进微生物有关表征和/或治疗干预。
系统200的微生物组表征模块221、模型、其他组件和/或方法100的合适部分(例如,确定微生物组特征、确定微生物有关表征等)可以采用包括以下任何一项或多项的分析技术:统计检验(例如,单变量统计检验、多变量统计检验等)、降维技术、人工智能方法(例如,机器学习方法等)、对数据执行模式识别(例如,识别微生物有关状况与微生物组特征之间的关联性等)、融合来自多个源的数据(例如,基于来自与一种或多种微生物有关状况相关联的多个用户的微生物组数据和/或补充数据、诸如基于从数据提取的微生物组特征生成表征模型等)、值(例如,平均值等)的组合、压缩、转换(例如,数模转换,模数转换)、对数据执行统计估计(例如,普通最小二乘回归、非负最小二乘回归、主成分分析、岭回归等)、波调制、标准化、更新(例如,基于处理过的生物样品随时间推移的表征模型和/或疗法模型的更新;等)、排名(例如,微生物组特征;疗法;等)、加权(例如,微生物组特征等)、验证、过滤(例如,用于基线校正、数据裁剪等)、降噪、平滑、填充(例如,间隙填充)、对齐、模型拟合、分箱(binning)、加窗、剪辑(clipping)、变换、数学运算(例如,导数,移动平均值,求和,减法,相乘,除法,等)、数据关联、复用、解复用、内插、外推、聚类分析(clustering)、图像处理技术、其他信号处理操作、其他图像处理操作、可视化和/或任何其他合适的处理操作。人工智能方法可以包括以下任一项或多项:监督学习(例如,使用逻辑回归、使用反向传播神经网络、使用随机森林、决策树等)、无监督学习(例如,使用先验(Apriori)算法、使用K均值聚类分析)、半监督学习、深度学习算法(例如,神经网络、受限玻尔兹曼(Boltzmann)机、深度信念网络方法、卷积(convolutional)神经网络方法、递归(recurrent)神经网络方法、堆叠式自动编码器方法等)、强化学习(例如,使用Q学习算法、使用时间差学习)、回归算法(例如,普通最小二乘法、逻辑回归、逐步回归、多变量自适应回归样条(multivariate adaptiveregression splines)、局部估计散点平滑(locally estimated scatterplot smoothing)等)、基于实例的方法(例如,k最近邻、学习矢量量化、自组织映射等)、正则化方法(例如,岭回归、最小绝对收缩和选择算子(operator)、弹性网(elastic net),等)、决策树学习方法(例如,分类树和回归树、迭代二分法3(iterative dichotomiser3)、C4.5、卡方自动交互检测、决策树桩、随机森林、多变量自适应回归样条曲线、梯度提升机(gradient boostingmachines)等)、贝叶斯(Bayesian)方法(例如,朴素贝叶斯(naive Bayes)、平均单一依赖估计量(averaged one-dependence estimatiors)、贝叶斯信念网络等)、核方法(例如,支持矢量机、径向基函数、线性判别分析等)、聚类分析方法(例如k均值聚类分析、期望最大化等)、关联规则学习算法(例如,先验算法、深度优先(Eclat)算法等)、人工神经网络模型(例如,感知器(Perceptron)方法、反向传播方法、霍普菲尔德(Hopfield)网络方法、自组织映射方法,学习矢量量化方法等)、整合方法(例如,增强、自举聚合(boostrappedaggregation)、自适应增强(AdaBoost)、堆叠泛化、梯度提升机、随机森林方法等)和/或任何合适的人工智能方法。然而,可以以任何合适的方式采用数据处理。
在第一变型中,如图10所示,微生物组表征模块221(例如,分析模块A222)可以应用一个或多个统计检验(例如,单变量统计检验、多变量等),该统计检验可以包括t检验、柯尔莫哥洛夫-斯米尔诺夫(Kolmogorov-Smirnov)检验、回归模型和/或与统计检验有关的其他合适技术中的任何一项或多项。微生物组表征模块221可以应用统计检验来确定微生物组特征集合(例如,基于诸如包括微生物遗传序列的微生物数据集;基于先验知识,诸如微生物组特征与微生物有关状况之间的关联,表示受试者、用户有用信息的补充数据;等)。微生物组表征模块221可以应用多个统计检验(例如,单变量统计检验、多变量等),其可以通过采用不同的建模策略来相互补充,例如用于检测均值和方差的变化、或者存在和/或不存在模式。在一实施例中,不同类型的统计检验(例如,单变量统计检验、多变量等)(和/或其他合适的分析技术)的输出(例如,结果)可以结合、分组和/或以其他方式聚合,以便显示不同分析技术(例如,如图18所示,表明了部分A和部分C中不同的单一检验、和来自关于部分B的多重检验的输出并集(union))之间的关联(例如,相似性,差异)、诸如关于所识别的微生物组特征。在特定实施例中,第一微生物组表征模块221可以应用(例如,可操作以应用等)第一统计检验(例如,单变量统计检验等)以确定第一微生物组特征集合,第二微生物组表征模块221”(和/或使用相同的第一微生物组表征模块221')可以应用第二统计检验(例如,第二单变量统计检验等)以确定第二微生物组特征集合。来自多种分析技术输出的聚合可以包括来自不同分析技术不同输出之间的交集或并集,其中利用这些聚合的输出可用于实现特异性和敏感性的目标平衡(例如,较高的特异性与较低的敏感性;较高的敏感性与较低的特异性等)。任何适合的微生物数据集、微生物组表征模块221的输入和/或输出、和/或其他适合的数据可以用作输入,或者可以用作统计检验的输出,并且微生物组表征模块221的输出可以用作用于任何其他合适的微生物组表征模块221的输入。然而,微生物组表征模块221(例如,分析模块A222)可以以任何合适的方式配置。
在第二变型中,如图11所示,微生物组表征模块221(例如,分析模块B223)可以应用一种或多种降维技术,该降维技术包括以下任何一项或多项:有监督降维技术;无监督降维技术;缺失值比率;主成分分析(principal component analysis,PCA);概率PCA;矩阵分解技术;诸如潜在狄利克雷(dirichlet)分布或分层狄利克雷过程的组成混合物模型(compositional mixtures models);如等距映射(isomap)或局部线性嵌入、局部最小二乘回归、萨蒙(Sammon)映射、多维缩放、投影追踪的特征嵌入技术;和/或与降维有关的任何其他合适技术。应用降维技术可以减少数据集中的维数(例如,特征、样品等)。任何合适的微生物数据集、微生物组表征模块221的输入和/或输出、和/或其他合适的数据可以用作输入,或者可以为降维技术的输出(例如,使用由统计检验确定的微生物组特征作为降维技术的输入来减少特征数量等),并且微生物组表征模块221的输出可用作任何其他合适的微生物组表征模块221的输入(例如,用于统计检验;诸如随机森林、核机器、支持矢量机、回归方法的人工智能方法;分析模块A222;分析模块C224等)。应用微生物组表征模块221可以促进确定推断的潜在特征和表型有关数据之间的线性或非线性关联,该表型有关数据与一种或多种微生物有关状况相关联。微生物组表征模块221的输出可以包括微生物有关表征(例如,自身感兴趣的结果)、用于附加分析的输出(例如,通过提供具有预测值的个体特征和/或对于聚类和分类样品有用的潜在特征,等),和/或用于任何合适的目的。然而,微生物组表征模块221(例如,分析模块B223)可以以任何合适的方式配置。
在第三变型中,如图12所示,微生物组表征模块221(例如,分析模块C224)可以促进一种或多种机器学习模型(和/或其他合适的人工智能方法)的应用。在实施例中,微生物组表征模块221可以起到指导人工智能方法(例如,神经网络,自动编码器模型或生成对抗网络,等)的构架和/或参数估计的作用,诸如例如通过编码表型和/或其他微生物有关状况的非线性预测功能来指导。任何合适的微生物数据集、微生物组表征模块221的输入和/或输出、和/或其他合适的数据可以用作输入,或者可以为输出(例如,使用统计检验的输出、降维方法的输出、分析模块A222的输出、分析模块B223的输出、和/或使用任何合适的数据作为输入,等),并且微生物组表征模块221的输出可用作任何其他合适的微生物组表征模块221的输入。微生物组表征模块221的输出可以包括微生物有关表征(例如,诸如微生物有关状况的倾向性分值的表型预测等)、用于附加分析的输出(例如,用于描述预测值的特征的相关性分值,其可用于识别与表型预测和/或其他类型的预测最相关的特征,等),和/或可用于任何合适的目的。然而,微生物组表征模块221(例如,分析模块C224)可以以任何合适的方式配置。
在第四变型中,如图13所示,微生物组表征模块221(例如,分析模块D225)可以将一种或多种分析技术(例如,通过回归和/或等效方法的交互作用的二阶或更高阶测试;诸如随机森林和/或支持矢量机、数据压缩技术的机器学习算法;核机器等)应用于检测微生物数据(例如,不同的微生物组组成概况(profiles)等)、微生物组特征和/或从微生物组特征的转变(例如,比率、乘积、从降维算法的应用中获得的特征,等)获得的特征之间的统计交互作用。然而,微生物组表征模块221(例如,分析模块D225)可以以任何合适的方式配置。
在第五变型中,如图14所示,微生物组表征模块221(例如,分析模块E226)可以确定表型预测、风险指数、倾向性分值、其他指数和/或与微生物有关状况相关联的(例如,与针对用户诊断微生物有关状况相关联的等)其他合适指标,诸如通过应用包括以下至少一项或多项的分析技术:统计检验(例如,单变量统计检验、多变量统计检验等)、单变量技术、多变量技术、人工智能方法(例如,机器学习模型等)和/或其他合适的技术(例如,其中输出可用作微生物组组成、功能和/或与微生物有关状况相关联的其他合适的微生物组有关方面的总结(summary))。微生物组表征模块221可以诸如通过使用实证分析(empiricalanalyses)的标准化技术,来定义输出范围的最小值和/或最大值。在一实施例中,可以针对参考样品集合(例如,针对对应于参考样品的数据等)计算分值,其中可以记录和使用最小的和最大的观测值,从而根据将特定样品(例如,后续样品)的分值标准化,这可以促进分值处于0到1的范围。附加地或可替代地,微生物组表征模块221可以(例如,以在表征、诊断和/或治疗指导中的可识别值,等)确定校准分值。在一实施例中,微生物组表征模块221可以通过针对样品集合(例如,对应于健康受试者和具有一种或多种感兴趣的微生物有关状况的受试者)确定分值(例如,倾向性分值等);通过针对倾向性分值(例如,10)、具有一种或多种感兴趣的微生物有关状况的受试者分数(fraction)(例如,患病受试者的#/(患病受试者的#+健康受试者的#))的每个可能值计算将倾向性分值转换为校准分值(例如,处于0到1的范围),分值数值(score value)大于或等于校准分值,其中并且其中这可以被视为将患病个体的分数的概率密度函数作为倾向性分值数值的函数进行估计。然而,微生物组表征模块221(例如,分析模块E226)可以以任何合适的方式配置。
在第六变型中,如图15所示,微生物组表征模块221(例如,分析模块F226)可以将微生物组特征(例如,微生物组特征和微生物有关状况之间的关联、与用户特性的关联等)、微生物有关状况、用户、微生物数据集和/或其他合适的成分的先验知识(例如,生物学数据,用户数据,等),应用于改进与其他微生物组表征模块221(例如,分析模块A222、分析模块B223、分析模块C 224等)相关联的处理。在一实施例中,微生物组表征模块221可以将统计推断朝向具有较低错误率的改进的预测模型引导,从而改进计算系统的功能。在实施例中,可以通过利用硬特征(hard features)、过滤、加权方案、包括数据建模步骤中的外部变量、其他分析技术和/或任何其他合适的过程,来执行该知识(例如,先验信息,等)的包含(inclusion)。然而,微生物组表征模块221(例如,分析模块F226)可以任何合适的方式配置。
在第七变型中,如图16所示,微生物组表征模块221(例如,分析模块G227)可以处理被识别为与一种或多种微生物有关状况统计相关联的特征,以和其他特征对比,该其他特征不与一种或多种微生物有关状况相关联,例如识别在被发现与一种或多种微生物有关状况相关联或不相关联的那些特征中或多或少共同的总体特征。微生物组表征模块221可以生成和/或将映射(例如,微生物组特征的映射等)利用到诸如基因调控网络或生化途径的生物注释。然而,微生物组表征模块221(例如,分析模块G 227)可以以任何合适的方式配置。
如图17所示,微生物组表征系统220可以优选地执行从多个位点收集的相关联样品的多位点分析(例如,基于与不同收集位点相关联的多位点微生物数据集,用微生物组表征模块221执行多位点分析;基于微生物组表征模块221的输出生成多位点表征;等)。位点(例如,收集位点等)可以包括以下任何一个或多个区域:肠道、皮肤、鼻、口、生殖器、其他合适的生理位点、其他样品收集位点和/或任何其他合适的位点。可以在群体水平(例如,关于用于识别微生物组特征和/或生成诸如不同模型的相关联模型的不同群体,定制该不同模型以分析与多个收集位点相关联的数据集,等)、个体水平(例如,针对用户)上、和/或针对任何合适的实体,执行多位点分析。可以使用和/或基于一个或多个微生物组表征模块221(例如,基于其输出等)和/或任何其他合适的组件(例如,远程计算系统、用户设备等)来执行多位点分析。例如,系统200可以包括:样品处理网络,其可操作以处理(例如,收集、测序等)包括从多个收集位点收集的位点多样性样品的生物样品,该收集位点包括肠道、生殖器、口、皮肤和鼻中的至少两个;和第一微生物组表征模块221,其可操作以应用第一统计检验(例如,单变量统计检验等)(和/或其他合适的分析技术),以基于位点多样性样品确定微生物组特征集合的微生物组特征的第一子集,其中来自微生物组特征的第一子集的微生物组特征的各子集对应于来自多个收集位点的不同收集位点(例如,基于针对不同收集位点的不同微生物组组成和/或功能的针对不同收集位点的不同或相似类型的微生物组特征,等)。在该实施例中,系统200可以包括第二微生物组表征模块221,其可操作以应用附加的统计检验(例如,单变量统计检验;与第一统计检验相比不同类型的统计检验,例如不同的单变量统计检验;等)以基于位点多样性样品确定微生物组特征集合的微生物组特征的第二子集(例如,其中微生物组特征的第一子集对应于第一统计检验,并且其中第一子集的不同子集对应于不同的收集位点;其中微生物组特征的第二子集对应于附加的统计检验,并且其中第二子集的不同子集对应于不同的收集位点;等),并且其中基于微生物组特征的第一子集和第二子集生成微生物有关状况模型(例如,用于多位点分析的模型;其中可以基于微生物组特征生成多个微生物有关状况模型,诸如针对不同收集位点和/或针对与不同收集位点相关联的不同微生物有关状况的不同模型,等)。
多位点分析可以包括位点方面(site-wise)表征的整合、组合和/或以其他方式聚合位点方面表征(例如,从不同微生物数据集计算的不同位点方面个体倾向性分值、该不同微生物数据集对应于在不同收集位点处收集的样品,等)、位点方面治疗干预促进、和/或在多位点分析的情况下的任何其他合适过程。可以通过应用以下至少一项或多项来执行多位点分析(例如,使用微生物组表征模块221等):包括处理分值或概率的贝叶斯和频率论(Frequentist)方法的统计技术,和/或其他合适的分析技术。在变型中,可以组合与(例如,单个用户的、多个用户等的)不同收集位点相关联的个体指标(例如,用于一种或多种微生物有关状况的倾向性分值和/或其他指标)以例如通过使用个体指标值的平均值来确定总体指标(例如,总体疾病倾向性分值和/或其他指标,等)。可以使用标准公式来计算标准偏差,以将不确定度从个体位点方面数据(例如,针对个体的个体倾向性分值等)传播到总体指标(例如,总体疾病倾向性分值等)中。在实施例中,总体指标(例如,多位点表征等)可以描述相对任何单个位点方面指标的附加信息,并且其中位点方面指标可以提供互补的和非冗余的信息。在特定实施例中,互补性可以表明对应于不同位点的微生物组有关表征(例如,指标等)不完全关联(例如,微生物组组成、功能和/或其他合适的表征的一个位点不能完美地预测其他位点的微生物组组成、功能和/或其他合适的表征,等)。多位点分析可以说明采样位点之间信息的冗余性(例如,其中不这样做可能导致有偏差的总体指标,例如通过向它们之间具有强关联性的位点给予高度重视(importance),等)。在一个变型中,微生物组表征系统220可以使用关于采样之间(例如,在对应于不同位点多样性样品的微生物数据集之间,等)的协方差/关联性的信息,该信息可以从相应的数据估计,诸如用以确定改进的总体指标(例如,具有增加的准确性等)。在一实施例中,可以多变量统计方法(例如,用于估计协方差和/或关联性等),应用于解释非冗余信息。在一特定实施例中,可以使用对应于正在考虑的位点的微生物组特征(例如,微生物组组成、微生物组功能、微生物组特征、微生物数据集、微生物组概况的其他合适的方面,等)之间的特定协方差/关联性模式来估计均值和标准偏差。均值和方差可以通过来估计,S是正在考虑的位点数,xi是位点方面分值,并且其中σi和σij分别是第i个位点方面分值的方差和第i个位点与第j个位点之间的协方差参数。这些协方差和/或关联性的估计可以使用多变量统计方法来执行。在一特定实施例中,对于具有多位点微生物数据的用户,微生物组表征系统220可以:诸如通过使用PCA并选择足以表征数据的潜在变量的子集,将降维技术分别应用于各位点的数据;和/或用来自各位点的潜在变量,可以使用多变量方法、例如通过使用典型关联分析,来估计协方差/关联性,但是任何合适的分析技术和/或微生物组表征模块221可以用于多位点分析。
在一特定实施例中,如图17所示,可以通过以下一项或多项来确定总体倾向性分值(例如,针对一种或多种微生物有关状况):从两个以上收集位点收集来自用户的样品;确定多位点微生物数据集(例如,包括位点方面微生物数据;通过实验室处理和/或下游生物信息学方法;等);确定位点方面的倾向性分值(例如,基于用微生物组表征模块221确定的位点方面微生物组特征;通过位点方面微生物有关状况倾向性估计算法;通过包括机器学习模型、回归模型、聚类算法中至少之一的分析技术,该聚类算法基于先前学习的参数或非参数函数针对疾病倾向性评分微生物组概况,等);和基于位点方面倾向性分值、位点对位点微生物组概况的非显著的关联模式的信息、和/或其他合适的数据确定总体倾向性分值。多位点分析(例如,组合来自不同位点的补充信息以生成总体指标,等)可以提供微生物有关状况倾向性的整体测量(holistic measure),这例如可以与患者物候(phenology)整合以指导诊断和治疗决策(例如,促进治疗干预等)。然而,微生物组表征系统和/或其他合适的组件可以以任何合适的方式配置,以促进多位点分析(例如,将分析技术应用于多位点分析目的;生成多位点表征;等)。
微生物组表征系统可优选针对多种微生物有关状况执行交叉条件分析(例如,使用一个或多个微生物组表征模块221;基于微生物组表征模块221的输出生成多条件表征,诸如多条件微生物组特征;等)。例如,微生物组表征系统可基于微生物数据、微生物组特征和/或与多种微生物有关状况相关联(例如,诊断有多种微生物有关状况、由多种微生物有关状况表征等)的用户的其他合适的微生物组特性,表征微生物有关状况之间的关系。在一特定实施例中,可以基于针对个体微生物有关状况的表征(例如,来自微生物组表征模块221的针对单个微生物有关状况的输出,等)执行交叉条件分析。交叉条件分析可以包括条件特定特征(例如,仅与单个微生物有关状况相关联,等)、多条件特征(例如,与两个以上微生物有关状况相关,等)、和/或任何其他合适类型的特征的识别。交叉条件分析可以包括诸如通过评价不同对的微生物有关状况,确定报告关联性、一致性的参数和/或描述两种以上微生物有关状况之间的关系的其他类似参数,其中具有较高参数值排名的对可以与微生物组特征的更大相似度(例如,共享)相关联。在一实施例中,交叉条件分析可以包括来自多个微生物有关状况的、关于相关联微生物组特性(例如,微生物数据、微生物组特征等)的数据的联合分析。交叉条件分析可包括分析技术的应用,分析技术包括以下任何一项或多项:多变量模型、典型关联模型、多标签人工智能方法(例如,多标签监督的、多标签无监督的、多标签半监督的机器学习或人工智能方法,等)、和/或任何其他合适的分析技术(例如,用于微生物组表征模块221在分析单个微生物有关状况和比较所得的表征中的应用,等)。然而,微生物组表征系统和/或其他合适的组件可以以任何合适的方式配置,以促进交叉条件分析(例如,将分析技术应用于交叉条件分析目的;生成交叉条件表征,等)。
微生物组表征系统220优选地包括远程计算系统(例如,用于应用微生物组表征模块221,等),但是可以附加地或可替代地包括任何合适的计算系统(例如,本地计算系统、用户设备、处理系统组件等)。然而,微生物组表征系统220可以以任何合适的方式配置。
系统200的疗法促进系统230可以起到针对一种或多种微生物有关状况促进治疗干预(例如,推广一种或多种疗法等)的作用(例如,促进用户微生物组组成和功能多样性的调节,以改进关于一种或多种微生物有关状况的用户状态,等)。疗法促进系统230可以诸如基于多位点表征、多条件表征、其他表征、和/或任何其他合适的数据,针对任何数量的微生物有关状况促进治疗干预,该任何数量的微生物有关状况与任何数量的收集位点相关联。疗法促进系统230可以包括以下任何一个或多个:通信系统(例如,将疗法建议、选择、劝阻和/或其他合适的疗法有关信息通讯给用户设备和/或护理提供者设备;使得护理提供者和关于微生物有关状况的受试者之间能够远程医疗;等)、在用户设备上可执行的应用程序(例如,针对用户指示微生物组组成和/或功能等)、医疗设备(例如,诸如用于从不同收集位点收集样品的生物采样设备、药物提供设备、手术系统等)、用户设备(例如,生物统计(biometric)传感器)和/或任何其他合适的组件。一个或多个疗法促进系统230可以是可控制的、可与微生物组表征系统220通讯的、和/或以其他方式与微生物组表征系统220相关联。例如,微生物组表征系统220可以为疗法促进系统230生成一种或多种微生物有关状况的表征,以呈现(例如,传输、通讯等)给相应的用户(例如,在接口240处等)。在另一实施例中,疗法促进系统230可以更新和/或以其他方式修改设备(例如,用户智能手机)的应用程序和/或其他软件,以推广疗法(例如,在待办事项列表应用程序中推广生活方式的改变,以改进与一种或多种微生物有关状况相关联的用户状态,等)。然而,疗法促进系统230可以以任何其他方式配置。
如图9所示,系统200可以附加地或可替代地包括接口240,该接口240可以起到改进微生物组特征、微生物有关状况信息(例如,倾向性指标、疗法建议、与其他用户的比较、其他表征等)的呈现的作用。在实施例中,接口240可以呈现微生物有关状况信息,该微生物有关状况信息包括:微生物组组成(例如,分类组、相对丰度等)、功能多样性(例如,与特定功能相关联的基因相对丰度)、以及诸如相对于共享人口统计学特性的用户组(例如,吸烟者、锻炼者、采用不同饮食养生的用户、益生菌的消耗者、抗生素用户、经历特定疗法的组等)的、针对一种或多种微生物有关状况的倾向性指标。然而,接口240可以以任何合适的方式配置。
虽然系统200的组件通常被描述为不同的组件,但是它们可以以任何方式在物理和/或逻辑上整合。例如,计算系统(例如,远程计算系统,用户设备,等)可以实施微生物组表征系统220(例如,应用微生物组有关状况模型以针对用户生成微生物有关状况的表征,等)和疗法促进系统230(例如,通过呈现与微生物组组成和/或功能相关联的见解来促进治疗干预;呈现治疗建议和/或信息;在智能手机的日历应用程序中安排每日事件以通知用户采取基于表征识别的益生菌疗法,等)的部分和/或全部。然而,系统200的功能可以以任何合适的方式分布在任何合适的系统组件之中。附加地或可替代地,系统200和/或方法100可以包括与在2015年1月9日提交的14/593,424号美国专利申请中描述的组件和/或功能类似的任何合适的组件和/或功能,该专利申请的全部内容通过该引用合并于此。然而,系统200的组件可以以任何合适的方式配置。
4.1生成微生物数据集
框S110可以包括确定与受试者集合相关联的微生物数据集(例如,微生物序列数据集、诸如基于微生物序列数据集的微生物组组成多样性数据集、诸如基于微生物序列数据集的微生物组功能多样性数据集等)S110。框S110可以起到处理生物样品(例如,与受试者群体、受试者的亚群体、共享人口统计学特性和/或其他合适特性的受试者亚组相关联的生物样品聚合集合)的作用,以便确定与相应的微生物组相关联的组成、功能、药物基因组学和/或其他合适的方面,诸如关于一种或多种微生物有关状况。组成和/或功能方面可包括在微生物水平上(和/或其他合适的粒度(granularity))的一个或多个方面,包括与微生物跨不同组的界(kingdom)、门、纲、目、科、属、种、亚种、品系和/或任何其他合适的种下(infraspecies)分类单元(taxon)(例如,按各组的总丰度、各组的相对丰度、所代表的组的总数来测量的,等)中的分布有关的参数。组成和/或功能方面也可以依据操作分类单位(operational taxonomic units,OTUs)表示。组成和/或功能方面可以附加地或可替代地包括在遗传水平上的组成方面(例如,由多位点序列分型确定的区域,16S序列,18S序列,ITS序列,其他遗传标志物,其他系统发育标志物,等)。组成和功能方面可以包括与特定功能(例如,酶活性、转运功能、免疫活性等)相关联的基因的存在或不存在或量。因此,框S110的输出可以用于促进用于框S130的表征过程和/或方法100的其他合适部分(例如,其中框S110可导致微生物组组成数据集、微生物组功能数据集和/或从中可提取微生物组特征的其他合适的微生物数据集的输出,等)的微生物组特征(例如,可用于识别微生物组特征的微生物序列数据级的生成,等)的确定,其中特征可以是基于微生物的(例如,细菌属的存在)、基于遗传的(例如,基于特定遗传区域和/或序列的代表)、基于功能的(例如,特定的催化活性的存在)和/或任何其他合适的微生物组特征。
在一个变型中,框S110可以包括基于关于基因家族的、衍生自细菌和/或古生菌的系统发育标志物(例如,用于生成微生物数据集,等)的评估和/或处理,该基因家族与以下一项或多项相关联:核糖体蛋白S2、核糖体蛋白S3、核糖体蛋白S5、核糖体蛋白S7、核糖体蛋白S8、核糖体蛋白S9、核糖体蛋白S10、核糖体蛋白S11、核糖体蛋白S12/S23、核糖体蛋白S13、核糖体蛋白S15P/S13e、核糖体蛋白S17、核糖体蛋白S19、核糖体蛋白L1、核糖体蛋白L2、核糖体蛋白L3、核糖体蛋白L4/L1e、核糖体蛋白L5、核糖体蛋白L6、核糖体蛋白L10、核糖体蛋白L11、核糖体蛋白L14b/L23e、核糖体蛋白L15、核糖体蛋白L16/L10E、核糖体蛋白L18P/L5E、核糖体蛋白L22、核糖体蛋白L24、核糖体蛋白L25/L23、核糖体蛋白L29、翻译延伸因子EF-2、翻译起始因子IF-2、金属内肽酶、ffh信号识别颗粒蛋白,苯丙氨酰-tRNA合成酶β亚基、苯丙氨酰-tRNA合成酶α亚基、tRNA假尿苷合酶B、胆色素原脱氨酶、核糖体蛋白L13、磷酸核糖基甲酰甘氨脒环连接酶(phosphoribosylformylglycinamidine cyclo-ligase)和核糖核酸酶HII。附加地或可替代地,标志物可以包括:靶序列(例如,与微生物分类组相关联的序列;与功能方面相关联的序列;与微生物有关状况关联的序列;指示用户对不同疗法的反应性的序列;跨群体和/或任何其他合适的受试者集合的不变量的序列,例如以使用共享引物序列的引物类型促进多重扩增;保守序列;包括突变、多态性的序列;核苷酸序列;氨基酸序列;等)、蛋白质(例如,血清蛋白、抗体等)、肽、碳水化合物、脂质、其他核酸、全细胞、代谢物、天然产物、遗传易感性生物标志物物、诊断性生物标志物、预后性生物标志物、预测性生物标志物、其他分子生物标志物、基因表达标志物、成像生物标志物和/或其他合适的标志物。然而,标志物可以包括与微生物组组成、微生物组功能和/或微生物有关状况相关联的任何其他合适的标志物。
因此,针对各生物样品聚合集合的表征微生物组组成和/或功能方面,优选地包括样品处理技术(例如,湿实验室技术;如图5所示)的组合,该样品处理技术包括但不限于扩增子测序(例如16S、18S、ITS)、唯一分子标识符(Unique Molecular Identifier,UMI)、3步聚合酶链反应(3step PCR)、聚类规则间隔短回文重复序列(clustered regularlyinterspaced short palindromic repeatsequences,Crispr)、宏基因组学方法、元转录组学(metatranscriptomics)、随机引物的使用和计算技术(例如,利用生物信息学工具),以定量地和/或定性地表征与来自受试者或受试者群体的各生物样品相关联的微生物组和功能方面。
在变型中,框S110中的样品处理可以包括以下任何一项或多项:裂解生物样品、破坏生物样品的细胞中的膜、从生物样品中分离不期望的元素(例如,RNA、蛋白质)、纯化生物样品中的核酸(例如,DNA)、从生物样品中扩增核酸、进一步纯化生物样品的扩增的核酸、以及对生物样品的扩增的核酸进行测序。在一实施例中,框S110可以包括:从用户集合收集生物样品(例如,由用户使用包括样品容器的采样试剂盒收集的生物样品,等),其中生物样品包括与微生物有关状况相关联的微生物核酸(例如,包括与微生物有关状况关联的靶序列的微生物核酸,等)。在另一实施例中,框S110可以包括向用户集合提供采样试剂盒集合,该采样试剂盒集合中的各采样试剂盒包括样品容器(例如,包括例如裂解试剂的预处理试剂;等),该样品容器可操作以从用户集合中的一个用户接收生物样品。
在变型中,裂解生物样品和/或破坏生物样品的细胞中的膜优选地包括物理方法(例如,珠打、氮解压缩、均质化、超声处理),其省略了在基于测序表示某些细菌组中产生偏差的某些试剂。附加地或可替代地,框S110中的裂解或破坏可以涉及化学方法(例如,使用清洁剂、使用溶剂、使用表面活性剂等)。附加地或可替代地,框S110中的裂解或破坏可以涉及生物学方法。在变型中,分离不期望的元素可以包括使用核糖核酸酶(RNase)去除RNA和/或使用蛋白酶去除蛋白质。在变型中,纯化核酸可包括以下一项或多项:(例如,使用基于醇类的沉淀法)从生物样品中沉淀核酸、基于液-液的纯化技术(例如,苯酚-氯仿提取)、基于色谱法的纯化技术(例如,柱吸附)、涉及结合部分结合颗粒(moiety-bound particles)(例如,磁珠、浮力珠、具有尺寸分布的珠子、超声响应珠等)的使用的纯化技术,该部分结合颗粒被配置为结合核酸并配置为在洗脱环境(例如,具有洗脱溶液、提供pH值变化、提供温度变化等)的存在下释放核酸、以及任何其他合适的纯化技术。
在变型中,纯化的核酸的扩增可包括以下一项或多项:基于聚合酶链反应(polymerase chain reaction,PCR)的技术(例如,固相PCR、反转录-PCR(RT-PCR)、定量PCR(qPCR)、多重PCR、降落式(touchdown)PCR、纳米(nano)PCR、巢式(nested)PCR、热启动PCR等)、解旋酶依赖性扩增(helicase-dependent amplification,HDA)、环介导等温扩增(loop mediated isothermal amplification,LAMP)、自我维持序列复制(self-sustainedsequence replication,3SR)、基于核酸序列的扩增(nucleic acid sequence basedamplification,NASBA)、链置换扩增(strand dsplacement amplification,SDA)、滚环扩增(rolling circle amplification,RCA)、连接酶链反应(ligase chain reaction,LCR)和任何其他合适的扩增技术。在纯化的核酸的扩增中,所用的引物优选选择以防止或最小化扩增偏差,以及配置为扩增(例如,16S区域的、18S区域的、ITS区域的等)核酸区域/序列,该核算区域或序列对诊断、对制剂(例如,对益生菌制剂)和/或对任何其他合适的目,在分类学上、在系统发育上是提供有用信息的。因此,配置为避免扩增偏差的通用引物(例如,用于16S RNA的F27-R338引物集,用于16S RNA的F515-R806引物集,等)可以在扩增中使用。附加地或可替代地,包括特定于生物样品、用户、微生物有关状况、分类群(taxa)、靶序列和/或任何其他合适成分的合并的条形码序列和/或UMI,其可促进测序后(post-squencing)识别过程(例如,用于将序列读数(sequence reads)映射到微生物组组成和/或微生物组功能方面;等)。框S110的变型中使用的引物可以附加地或可替代地包括衔接子区域,该衔接子区域配置为与涉及互补衔接子(complementary adaptor)的测序技术(例如,宜曼达(Illumina)测序)配合。附加地或可替代地,框S110可以实施配置为(例如,使用新纪元(Nextera)试剂盒)促进处理的任何其他步骤。在一特定实施例中,执行扩增和/或样品处理操作可以以多重方式进行(例如,对于单个生物样品、对于跨多个用户的多个生物样品等)。在另一特定实施例中,执行扩增可包括标准化步骤以平衡库并检测独立于起始材料量中的所有扩增子,例如3步PCR、基于珠子(bead)的标准化和/或其他合适的技术。
在变型中,纯化的核酸的测序可以包括涉及靶向扩增子测序、元转录组测序和/或宏基因组测序的方法,实施技术包括以下一项或多项:合成测序技术(例如,Illumina测序)、毛细管测序技术(例如,桑格测序)、焦磷酸测序技术和纳米孔测序技术(例如,使用牛津纳米孔技术)。
在一特定实施例中,来自生物样品集合的生物样品的核酸的扩增和测序包括:涉及使用寡核苷酸衔接子桥式扩增(bridge amplification)底物上的生物样品的DNA片段的固相PCR,其中扩增涉及引物,该引物具有正向索引序列(forward index sequence)(例如,对应于NextSeq/HiSeq平台的Illumina正向索引)、正向条形码序列、转座酶序列(例如,对应于MiSeq/NextSeq/HiSeq平台的转座酶结合位点)、接头(例如,配置为减少均一性并改善序列结果的零个、一个或两个碱基片段)、另外的随机碱基、UMI、用于靶向特定靶标区域(例如,16S区域、18S区域、ITS区域)的序列、反向索引序列(例如,对应于MiSeq/HiSeq平台的Illumina反向索引)和反向条形码序列。在特定实施例中,测序可以包括使用合成测序技术的Illumina测序(例如,使用HiSeq平台,使用MiSeq平台,使用NextSeq平台,等)。在另一特定实施例中,方法100可以包括:识别与一种或多种遗传靶标兼容的一种或多种类引物类型,该一种或多种遗传靶标与一种或多种微生物有关状况(例如,人类行为状况、疾病有关状况等)相关联;诸如通过片段化微生物核酸进行和/或基于与遗传靶标兼容的一种或多种识别的引物类型使用片段化的微生物核酸执行多重扩增,来基于一种或多种引物类型(例如,以及包括在所收集的生物样品中的微生物核酸,等)针对一个或多个用户(例如,受试者集合)生成微生物数据集(例如,微生物序列数据集等),所述遗传靶标与人类行为状况相关联;和/或基于衍生自微生物数据集的微生物有关表征推广(例如,提供)针对用户状况的疗法(例如,能够选择性调节关于期望的分类单元(taxon)的群体尺寸和期望的微生物组功能的至少之一的用户的微生物组,等)。
在变型中,框S110、和/或方法100的其他合适部分中使用的引物(例如,对应于引物序列的引物类型;等)可以包括与蛋白质基因相关联的引物(例如,针对跨多个分类群的保守蛋白基因序列编码,诸如以能够对多个靶标和/或分类群多重扩增;等)。引物可以附加地或可替代地与以下相关联:微生物有关状况(例如,与包括微生物序列生物标志物的遗传靶标兼容的引物,该微生物序列生物标志物用于与诸如人类行为状况和/或疾病有关状况的微生物有关状况关联的微生物;等)、微生物组组成特征(例如,与对应于微生物组组成特征的遗传靶标兼容的识别的引物,该微生物组组成特征与分类群组相关联,该分类群组与微生物有关状况关联;自其衍生相对丰度特征的遗传序列,等)、功能多样性特征、补充特征和/或其他合适的功能和/或数据。引物(和/或本文中描述的其他合适的分子、标志物和/或生物材料)可具有任何合适的尺寸(例如,序列长度、碱基对数量、保守序列长度、可变区长度等)。附加地或可替代地,可以在样品处理中使用任何合适数量的引物,以用于执行表征(例如,微生物有关表征;等)、改进样品处理(例如,通过减少扩增偏差,等)、和/或用于任何合适的目的。引物可以与任何合适数量的靶标、序列、分类群、状况和/或其他合适方面相关联。可以通过框S110中描述的过程、和/或方法100的任何其他合适的部分,选择在框S110(例如,基于在生成分类数据库中使用的参数的引物选择)、和/或方法100的其他合适部分中使用的引物。在一实施例中,框S110可以包括:识别与微生物有关状况相关联的微生物核酸序列的引物类型(例如,用于可操作以扩增与微生物有关状况关联的微生物核酸序列的引物的引物类型;等);和基于引物类型和微生物核酸生成微生物序列数据集(例如,使用用于扩增微生物核酸的引物类型的引物;和测序扩增的核酸以生成微生物序列数据集;等)。在一特定实施例中,框S110可以包括:片段化微生物核酸片段;和基于片段化的微生物核酸和与微生物有关状况相关联的所识别的引物类型、用片段化的微生物核酸执行多重扩增。附加地或可替代地,引物(和/或与引物相关联的过程)可以包括和/或类似于2015年10月21日提交的14/919,614号美国专利申请中描述的引物(和/或与引物相关的过程),该专利申请的全部内容通过该引用合并于此。然而,引物的识别和/或使用可以以任何合适的方式配置。
样品处理的某些变型可以包括在测序前进一步纯化扩增的核酸(例如,PCR产物),其起到去除多余的扩增元素(例如,引物、脱氧核糖核苷三磷酸(dNTP)、酶、盐等)的功能。在实施例中,可以使用以下任何一种或多种来促进额外的纯化:纯化试剂盒、缓冲液、醇、pH值指示剂、离液盐、核酸结合过滤器、离心和/或任何其他合适的纯化技术。
在变型中,框S110中的计算处理可以包括以下任何一项或多项:微生物组衍生序列的识别(例如,与受试者序列和污染物相对)、微生物组衍生序列的比对和映射(例如,使用单端比对、无缺口(ungapped)比对、缺口比对、配对中的一项或多项的片段化序列的比对)、和生成与同生物样品相关联的微生物组的组成和/或功能方面相关联(例如,从其衍生)的特征。
微生物组衍生序列的识别可以包括将来自样品处理的序列数据映射到受试者参考基因组(例如,由基因组参考联盟(Genome Reference Consortium)提供),以便去除受试者基因组衍生序列。然后,在将序列数据映射到受试者参考基因组之后,剩余的未识别序列可以基于序列相似性和/或基于参考的方法(例如,使用VAMPS、使用MG-RAST、使用QIIME数据库)进一步聚类到可操作分类单元(operational taxonomic unit,OTU)中,使用比对算法(例如,基本局部比对搜索工具(Basic Local Alignment Search Tool),现场可编程门阵列(field programmable gate array,FPGA)加速比对工具、使用BWA的BWT索引、使用SOAP的BWT索引、使用Bowtie的BWT索引等)进行比对(例如,使用基因散列算法、使用内德勒曼-文施算法(Needleman-Wunsch algorithm)、使用史密斯-沃德曼算法(Smith-Watermanalgorithm))、并映射到参考细菌基因组(例如,由国家生物技术信息中心提供)。未识别序列的映射可以附加地或可替代地包括对参考古细菌基因组、病毒基因组和/或真核生物基因组的映射。此外,可以关于现有数据库和/或关于定制生成的数据库执行分类单元的映射。
一经识别了与生物样品相关联的微生物组的微生物的代表性组,就可以执行生成与微生物组的组成和功能方面相关联(例如,从其衍生)的特征,该微生物组与生物样品相关。在一变型中,生成特征可以包括基于多位点序列分型(multilocus sequence typing,MSLT)生成特征,以便识别对方法100后续框中的表征有用的标志物。附加地或可替代地,所生成的特征可以包括生成描述某些微生物分类组的存在与否、和/或所展示微生物分类组之间的比例的特征。附加地或可替代地,生成特征可以包括生成描述以下一项或多项的特征:表示的分类组的数量、表示的分类组的网络、不同分类组的表示中的关联性、不同分类组之间的相互作用、由不同分类组产生的产物、由不同分类组产生的产物之间的相互作用、死亡微生物和活微生物之间的比例(例如,针对不同的表示的分类组,基于RNA分析)、系统发育距离(例如,依据康托洛维奇-鲁宾斯坦(Kantorovich-Rubinstein)距离、沃瑟斯坦(Wasserstein)距离等)、任何其他合适的分类组有关特征、任何其他合适的遗传或功能方面。
附加地或可替代地,生成特征可以包括生成描述不同微生物群的相对丰度的特征,例如使用sparCC方法、使用基因组相对丰度和平均尺寸(Genome Relative Abundanceand Average size,GAAS)方法和/或使用利用混合模型理论的基因组相对丰度(GenomeRelative Abundance using Mixture Model theory,GRAMMy)方法,该利用混合模型理论的基因组相对丰度方法使用序列相似性数据来执行一个或多个微生物群的相对丰度的最大可能性估计。附加地或可替代地,生成特征可以包括生成如衍生自丰度指标的分类变化的统计测量。附加地或可替代地,生成特征可以包括生成与相对丰度因子(例如,关于影响其他分类单元丰度的分类单元丰度变化)相关联(例如,从…衍生)的特征。附加地或可替代地,生成特征可以包括隔离和/或组合地生成描述一个或多个分类组的存在的定性特征。附加地或可替代地,生成特征可以包括与遗传标志物(例如,代表性的16S、18S和/或ITS序列)有关的特征的生成,该遗传标志物表征与生物样品相关联的微生物组的微生物。附加地或可替代地,生成特征可以包括生成与特定基因和/或具有特定基因的生物体的功能关联有关的特征。附加地或可替代地,生成特征可以包括生成与分类单元和/或归因于分类单元的产物的致病性有关的特征。然而,框S120可以包括衍生自生物样品的核酸的测序和映射的任何其他合适的特征的生成。例如,特征可以是组合的(例如,涉及对、三个一组)、关联的(例如,与不同特征之间的关联性有关)和/或与特征的变化(例如,时间变化、跨样品位点的变化等、空间变化等)有关。然而,处理生物样品、生成微生物数据集和/或与框S110相关联的其他方面可以以任何合适的方式执行。
4.2处理补充数据集
方法100可以附加地或可替代地包括框S120,框S120可以包括处理(例如,接收、收集、转换等)针对用户集合与一种或多种微生物有关状况(例如,诸如与用户行为相关联的人类行为状况;诸如相关联的病史、症状、用药的疾病有关状况;等)(例如,提供其信息的;描述;其指示;等)相关联的补充数据集。框S120可以起到获取与受试者集合中的一个或多个受试者相关的数据的作用,该数据可以用于训练、验证、应用和/或以其他方式告知微生物有关表征过程(例如,在框S130中)。在框S120中,补充数据集优选地包括调查衍生数据,但是可以附加地或可替代地包括以下任何一项或多项:特定位点数据(例如,提供不同收集位点的信息的数据,等)、微生物有关状况数据(例如,提供微生物有关状况的信息数据,等)、从传感器衍生的前后关系的数据(contextual data)(例如,可穿戴设备数据,等)、医疗数据(例如,当前和历史的医疗数据;医疗设备衍生数据;与医学测试相关联的数据;等)、社交媒体数据、用户数据(例如,相关联传感器数据、人口统计学数据,等)、移动电话数据(例如,移动电话应用程序数据,等)、网络应用程序数据、先验生物学知识(例如,提供微生物有关状况、微生物组特性、微生物组特性和微生物有关状况之间的关联的信息,等)和/或任何其他合适类型的数据。在包括接收调查衍生数据的框S120的变型中,调查衍生数据优选地提供与受试者相关联的生理信息、人口统计学信息和行为信息。生理信息可以包括与生理特征(例如,身高、体重、体质指数、体脂百分比、体毛水平等)有关的信息。人口统计学信息可以包括与人口统计学特征(例如,性别、年龄、种族、婚姻状况、兄弟姐妹数量、社会经济地位、性取向等)有关的信息。行为信息可以包括与以下一项或多项有关的信息:健康状况(例如,健康和疾病状态)、生活状况(例如,单独生活、与宠物一起生活、与重要他人一起生活、与儿童一起生活等)、饮食习惯(例如,酒精消耗,咖啡因消耗,杂食,素食,严格素食,糖消耗,酸消耗,小麦、蛋、大豆、坚果、花生、贝类和/或其他合适食品项目的消耗,等)、行为倾向(例如,体育活动水平、药物使用、饮酒、习惯养成等)、不同移动性水平(例如,诸如低、中和/或极端体育锻炼活动的锻炼量;与在给定时间段内行进的距离有关;由诸如运动和/或位置传感器的移动性传感器指示的;等)、不同性活动水平(例如,与伴侣的数量和性取向有关)以及任何其他合适的行为信息。调查衍生数据可以包括定量数据和/或可转换为定量数据的定性数据(例如,使用严重性程度、将定性响应映射到定量分值,等)。
在促进调查衍生数据的接收中,框130可包括向受试者群体中的一个受试者、或向与受试者群体中的一个受试者相关联的实体提供一个或多个调查。可以当面(例如,与样品提供和从受试者接收相协调地)、电子地(例如,在由受试者设置账户期间,在受试者的电子设备上执行的应用程序中,在通过互联网连接可访问的网络应用程序中,等)和/或以其他任何合适的方式提供调查。
附加地或可替代地,补充数据集的部分可以衍生自与受试者相关联的传感器(例如,可穿戴计算设备的传感器、移动设备的传感器、与用户相关联的生物计量传感器,等)。这样,框S130可以包括接收以下一项或多项:体育活动或体育动作有关数据(例如,来自受试者的移动设备或可穿戴电子设备的加速度计和陀螺仪数据)、环境数据(例如,温度数据、海拔数据、气候数据、光照参数数据等)、患者营养或与饮食有关数据(例如,来自食品企业记录(food establishment check-in)的数据、来自分光光度分析的数据、用户输入的数据、与益生菌和/或益生元食品项目相关联的营养数据、消耗的食物类型、消耗的食物量、饮食等)、生物计量数据(例如,通过患者的移动计算设备内的传感器记录的数据、通过与患者的移动计算设备通信的可穿戴或其他外周设备记录的数据)、位置数据(例如,使用GPS元件)和任何其他合适的数据。在变型中,传感器数据可以包括在以下一项或多项中采样的数据:光学传感器(例如,图像传感器、光传感器等)、音频传感器、温度传感器、挥发性化合物传感器、重量传感器、湿度传感器、深度传感器、位置传感器(GPS接收器等)、惯性传感器(例如,加速器、陀螺仪、磁力计等)、生物统计(biometric)传感器(例如,心率传感器、指纹传感器、生物阻抗传感器等)、压力传感器、流量传感器、功率传感器(例如,霍尔效应传感器)和/或任何其他合适的传感器。
附加地或可替代地,补充数据集的部分可以衍生自受试者的医疗记录数据和/或临床数据。这样,补充数据集的部分可以衍生自受试者的一个或多个电子健康记录(EHR)。
附加地或可替代地,框S120的补充数据集可以包括任何其他合适的诊断信息(例如,临床诊断信息),所述诊断信息可以与衍生自特征的分析相结合,以支持方法100的后续框中的受试者的表征。例如,衍生自结肠镜检查、活检、血液检查、诊断成像、其他合适的诊断程序、调查有关信息和/或任何其他合适检查的信息可以用于补充(例如,用于方法100的任何合适部分)。
附加地或可替代地,补充数据集可以包括疗法有关数据,该疗法有关数据包括以下一项或多项:治疗方案(regimen)、疗法类型、建议疗法、用户使用的疗法、疗法依从性(adherence)等。例如,补充数据集可以包括对建议疗法的用户依从性(例如,药物依从性、益生菌依从性、体育锻炼依从性、饮食依从性等)。然而,处理补充数据集可以以任何合适的方式执行。
4.3执行表征过程
框S130可以包括,例如基于(例如,在框S110中衍生的,等)微生物数据集和/或其他合适数据(例如,补充数据集;等)、用一个或多个微生物组表征模块来应用分析技术、以针对一种或多种微生物有关状况执行表征过程(例如,预处理、特征生成、特征处理、针对多个收集位点的多位点表征、针对多种微生物有关状况的交叉条件分析、模型生成等)S130。框S130可起到识别、确定、提取和/或以其他方式处理特征和/或特征组合的作用,该特征和/或特征组合可以用于基于用户或用户组的微生物组组成(例如,微生物组组成多样性特征等)、功能(例如,微生物组功能多样性特征等)和/或其他合适的微生物组特征(例如,诸如通过用于确定微生物有关表征的表征模型的生成和应用,等)针对用户和/或用户集合来确定微生物有关表征。这样,表征过程可以用作诊断工具,该诊断工具可以基于受试者的微生物组组成和/或功能特征,关于受试者的一种或多种健康状况状态(例如,微生物有关状况状态)、行为特质、医疗状况、人口统计学特质和/或任何其他合适的特质来表征受试者(例如,依据行为特质(behavioral trait)、依据医疗状况、依据人口统计学特质等)。这些表征可以用于确定、建议和/或提供疗法(例如,诸如通过疗法模型确定的个性化疗法,等)和/或以其他方式促进治疗干预。
执行表征过程S130可以包括预处理微生物数据集、微生物组特征和/或其他合适的数据,以促进下游处理(例如,确定微生物有关表征等)。在一个实施例中,执行表征过程可以包括通过以下至少一项来过滤微生物数据集(例如,诸如在应用分析技术集合以确定微生物组特征之前,过滤微生物序列数据集,等):a)去除对应于(例如,与一种或多种微生物有关状况相关联的,等)生物样品集合的第一样品离群值(outlier)的第一样品数据,诸如其中第一样品离群值由主成分分析、降维技术和多变量方法论的至少之一确定;b)去除对应于生物样品集合的第二样品离群值的第二样品数据,其中,第二样品离群值可基于针对微生物组特征集合的相应数据质量来确定(例如,去除对应于具有低于阈值条件的高质量数据的若干微生物组特征的样品,等);和c)基于不满足阈值样品数量条件的微生物组特征的样品数量,从微生物组特征集合中去除一个或多个微生物组特征,其中样品数量对应于与微生物组特征的高质量数据相关联的样品数量。然而,可以使用任何合适的分析技术、以任何合适的方式执行预处理。
在执行表征过程中,框S130可以使用计算方法(例如,统计方法、机器学习方法、人工智能方法、生物信息学方法等)来将受试者表征为表现与一种或多种微生物有关状况相关联的特征(例如,具有一种或多种微生物有关状况的用户集合的特征特性,等)。
框S130优选地包括以一个或多个微生物组表征模块来应用一种或多种分析技术(例如,用于确定微生物组特征、生成微生物有关表征,等)。例如,应用分析技术集合来确定微生物组特征集合可以包括例如,基于微生物序列数据集等)确定微生物组特征的初始集合(;和以微生物组表征模块集合的第一微生物组表征模块(例如,分析模块B等)、在微生物组特征的初始集合上应用一种或多种降维技术以确定微生物组特征集合(例如,其中微生物组特征集合包括比微生物组特征的初始集合更少的微生物组特征,等),诸如其中降维技术可以包括缺失值比、主成分分析、概率主成分分析、矩阵分解技术、成分混合模型和特征嵌入技术中的至少一项。在一实施例中,确定微生物组特征的初始集合可以包括以微生物组表征模块集合的第二微生物组表征模块(例如,分析模块A等)、应用一个或多个统计检验(例如,单变量统计检验、多变量等)以例如,基于微生物序列数据集等)确定微生物组特征的初始集合(,例如其中统计检验(例如,单变量统计检验、多变量等)可包括t检验、柯尔莫哥洛夫-斯米尔诺夫检验和回归模型的至少之一。在一实施例中,方法100可以包括以微生物组表征模块集合的第二微生物组表征模块(例如,分析模块C等)、应用机器学习方法(和/或其他合适的人工智能方法等)以确定微生物组特征集合的相关性分值,其中生成微生物有关状况模型可以包括基于微生物组特征集合和相关性分值生成微生物有关状况模型(例如,用于确定一种或多种微生物有关状况的表征等)。
执行表征过程(和/或方法100和/或系统200的其他合适的部分)可以针对任何合适类型和/或数量的微生物有关状况。在一变型中,执行表征过程可以针对一种或多种皮肤有关状况。在一个例中,对于与一种或多种皮肤有关状况(例如,皮肤光敏性;头皮屑;皮肤干燥;存在(presence);不存在(absence);等)相关联的受试者,方法100可以包括:确定微生物数据集(例如,从来自生物样品的测序微生物核酸生成的微生物序列数据集,该微生物样品为受试者、诸如在不同收集位点收集,等);以及用微生物组表征模块集合中的微生物组表征模块(例如,分析模块A等),基于对应于受试者不同收集位点的微生物数据集,应用多个统计检验(例如,柯尔莫哥洛夫-斯米尔诺夫、β-二项式回归和零膨胀β-二项式回归检验、单变量统计检验、多变量统计检验等)来确定微生物组特征子集,各微生物组特征子集对应于不同的收集位点、不同的微生物有关状况(例如,不同的皮肤有关状况等)、不同的所应用的统计检验(例如,如表1、表2、表3、表4和表5所示,等)、不同的这些实体和/或任何其他合适实体的组合。在该实施例中,执行表征过程可以包括用微生物组表征模块集合的第二微生物组表征模块(例如,分析模块B等),应用降维技术(例如,有监督的和/或无监督的降维技术等)来获取从微生物组特征(例如,微生物组特征、微生物数据集等)计算的距离矩阵,其中此类数据可与机器学习方法(和/或其他合适的人工智能方法)一起使用以选择特征的子集(例如,针对一种或多种微生物有关状况的最相关特征,等)。在特定实施例中,执行表征过程可以包括:确定特征相关性分值和/或与特征重要性相关联的其他合适指标(例如,通过应用随机森林技术);以及使用特征相关性分值和/或其他合适指标与补充数据(例如,提供微生物组特征的信息的先验生物学知识,诸如用第三微生物组表征模块、分析模块F等)以(例如,使用任何合适的软件工具)获得微生物组功能特征的样品水平量化。在另一特定实施例中,诸如基于所分析样品上的微生物组功能特征和子系统的主成分的丰度概况之间的一个或多个关联系数的确定,将微生物组特征可以整合到(例如,诸如通过软件分配而分配到,等)微生物组子系统中(例如,微生物组特征的聚合、微生物组特征的组,等)。
在另一变型中,执行表征过程可以为针对一种或多种胃肠道有关状况。在一实施例中,对于与一种或多种胃肠道有关状况(例如,炎性肠病;存在;不存在;等)相关联的受试者,方法100可以包括:确定微生物数据集(例如,对应于不同的收集位点;等);以及用微生物组表征模块集合的微生物组表征模块,基于对应于受试者不同收集位点的微生物数据集、应用多个统计检验(例如,柯尔莫哥洛夫-斯米尔诺夫、β-二项式回归和零膨胀β-二项式回归检验等)来确定微生物组特征子集,各微生物组特征子集对应于不同的收集位点、不同的微生物有关状况(例如,不同的皮肤有关状况等)、不同的所应用的统计检验(例如,如表15、表16、表17、表18和表19所示,等)、不同的这些实体和/或任何其他合适实体的组合(例如,其中可以比较不同的个体结果,诸如用以识别针对给定收集位点和微生物有关状况跨不同的所应用的统计检验的微生物组特征的交集,如图18所示,其分别示出了484和141微生物组特征的并集和交集,等)。在该实施例中,执行表征过程可以包括:用微生物组表征模块集合的第二微生物组表征模块(例如,分析模块B等)、应用降维技术(例如,有监督的和/或无监督的降维技术等)来构建微生物组特征之间的相关网络,其可用于例如通过合适的软件工具和/或安装包(package)、识别相互关联的特征的集合(例如,微生物组子系统等)。在该实施例中,执行表征过程可以包括针对各微生物组子系统(例如,每个相互关联的微生物组特征集合等)确定总结变量(summary variable),例如通过应用PCA方法来针对每个样品获得单一数字,该单一数字为受试者针对包括在微生物组子系统中的微生物组特征总结微生物组特征(例如,微生物组概况等)。在该实施例中,软件工具和/或其他合适的技术可以用于网络构建和微生物组子系统检测,例如用于凭经验地确定适当的分析参数。在特定实施例中,对于软阈值功率,可以选择介于1和20之间的可能值集合(例如,选择2的功率值以描述保持高连接性和相对清晰的子系统检测的网络,等),例如图19所示,其描述了从应用微生物组表征模块(例如,分析模块B等)获得的降维的代表,在该微生物组表征模块上,所检测的各微生物组子系统由不同灰度的颜色表示。应用降维技术可以导致:以主成分集合为例的原始数据(例如,用于各微生物组子系统之一)的低维代表,其中降维可达到47.7x倍(例如,约两个数量级;通过将最初考虑用于分析的430个微生物组特征转换为9个变量;等);和各微生物组特征与所识别的微生物组子系统之间的直接映射(例如,如表20所示,其描述了所获得的映射,在该映射上,每个微生物组特征被分配至微生物组子系统,并且还根据所分析样品上的特征和子系统主成分之间的相关性获得了软分配;等)。在该实施例中,执行表征过程可以包括用微生物组表征模块集合的第三微生物组表征模块(例如,分析模块F)、利用补充数据(例如,微生物组特征的先验生物学知识等)以获得微生物组功能特征的样品水平定量(例如,在合适的软件工具上实施),以便整合到微生物组子系统中,用于通过计算所分析样品上的微生物组功能特征和子系统的主成分的丰度概况之间的相关系数来获得微生物组功能特征到微生物组子系统的软分配(例如,如表21所示)。微生物组表征模块的输出(例如,降维技术的输出;分析模块B的输出)可用于生成、执行和/或以其他方式处理一个或多个机器学习模型(例如,其中分析模块B的输出可用作分析模块C和/或其他合适的微生物组表征模块的输入,等)。在一特定实施例中,微生物组子系统主成分可以用作炎性肠病状况的预测因子,其具有两个标签:报告状况的案例(case)、和不报告具有状况的对照,其中可以生成机器学习分类器(例如,随机森林分类器),用于确定特征相关性分值和/或其他特征重要性指标(例如,用于确定最重要的微生物组子系统的主成分预测因子(predictor)等)。在该特定实施例中,如表22所示,特征重要性指标识别了编号为5、2、6、0、3、1、4、7、8的不同微生物组子系统的相关性等级,其中微生物组子系统5被识别为最相关,其特征重要性比第二个更具预测性的子系统大~1.5倍、比最预测性最差的子系统大~10倍,其中与子系统5相关联的微生物组特征在表23中表示,并且与子系统5更紧密相关联的微生物组功能特征显示于表24,并且其中分类法和功能之间的相互作用的图形表示可参见图20。补充数据可以由微生物组表征模块(例如,分析模块F)使用,其中微生物组特征与小分子和药物代谢之间关系的先验生物学知识可以用于识别可能影响与子系统5、其他微生物组子系统和/或其他合适的微生物组特征相关联的可能影响代谢的药物,其中在该特定实施例中,子系统5的22个微生物组特征中6个对代谢总共12个分子和药物有作用(例如,如表25所示),其中12个分子中有4个对炎症(例如,与炎性肠病相关联的,等)有作用,并且其中这样的过程可以识别相关分子以确定药物治疗的选择,如在阿卡波糖、以及饮食和生活方式改变的情况下、如在白藜芦醇、牛磺酸和类黄酮的情况下,和/或以其他方式促进治疗干预。在特定实施例中,确定表征可包括,诸如基于微生物有关状况模型、来自用户的样品、微生物组特征集合和药物代谢之间的已知关联、和/或任何其他合适的数据,确定与一种或多种微生物有关状况相关联的药物代谢表征。
在变型中,执行表征过程可以包括执行与多个收集位点相关联的一个或多个多位点分析(例如,用微生物组表征模块;生成多位点表征等)。例如,确定微生物有关表征(例如,针对一个或多个微生物有关状况等)可以包括:从用户收集对应于多个收集位点的位点多样性样品集合,该收集位点包括肠道、生殖器、口、皮肤和鼻中的至少两个;(例如,使用利用微生物有关状况模块生成的微生物有关状况模型,等)基于位点多样性样品集合确定位点方面的疾病倾向性指标集合,其中位点方面的疾病倾向性指标集合中的各位点方面的疾病倾向性指标对应于多个收集位点中的不同收集位点(例如,并且与一种或多种微生物有关状况相关联,等);以及基于位点方面的疾病倾向性指标集合、针对用户确定总体疾病倾向性指标(例如,其中总体疾病倾向性指标与一种或多种微生物有关状况相关联。在该实施例中,方法100可包括基于位点多样性样品集合确定与多个收集位点相关联的微生物数据集,其中确定总体疾病倾向性指标可包括:基于微生物数据集确定协方差指标和关联性指标中的至少一个,其中协方差指标和关联性指标中的至少一个与多个收集位点相关联;和基于位点方面的疾病倾向性指标集合、以及协方差指标和关联性指标中的至少一个,针对用户确定总体疾病倾向性指标。然而,多位点分析可以以任何合适的方式执行。
在变型中,执行表征过程可以包括针对多个微生物有关状况(例如使用微生物组表征模块等)执行一种或多种交叉条件分析。在一实施例中,方法100可以包括针对报告26种(和/或其他合适数量的)不同微生物有关状况的受试者分析元数据和微生物组特性(例如,微生物组组成、功能等),该26种不同的微生物有关状况中的一种或多种包括酒渣鼻、乳糜泻、光敏性、小麦过敏、麸质不耐受(例如,麸质过敏等)、乳制品过敏、腹胀、类风湿性关节炎、炎性肠综合症(IBS)、痔疮疾病、便秘、反流、多发性硬化症、骨关节炎、溃疡性结肠炎、克罗恩病、腹泻、大豆过敏、花生过敏、树坚果过敏、蛋类过敏、牛皮癣、桥本氏甲状腺炎、格雷夫氏病、炎性肠病和血便。微生物组表征模块(例如,分析模块B和分析模块C等)可应用于构建预测模型,该预测模型提供特定状况特征和多状况特征(例如,跨多种微生物有关状况共享的,等)的信息,其中执行交叉条件分析可以包括,例如基于多条件特征确定微生物组相关参数,该微生物组相关参数告知两种状况之间共享的微生物有关状况相关联的程度。执行交叉条件分析可以包括:将降维技术应用于从微生物组特性(例如,微生物组特征、微生物数据集等)计算出的距离矩阵;以及以机器学习模型和/或其他合适的人工智能方法使用潜在变量。在一特定实施例中,执行交叉条件分析可包括(例如,针对对应于不同受试者的不同样品,等)确定微生物组特征之间的布雷-柯蒂斯(Bray-Curtis)差异;将所得到的样品相异度矩阵应用为奇异值分解的输入,以衍生出主成分和本征值;以及对解释超过数据总方差的1/1000的主成分执行附加的分析。可以执行后续的交叉条件分析,例如包括,用微生物组表征模块(例如,分析模块C)应用机器学习模型和/或其他合适的人工智能方法、诸如贝叶斯多核回归来获得由微生物组特性解释的交叉条件关联性的定量。执行交叉条件分析可以包括使用多变量方差成分模型定量由微生物组特性解释的状况之间的关联性、以及由微生物组特征解释的微生物有关状况之间的协方差,该多变量方差成分模型估计与微生物组相关的各微生物有关状况(例如,表型)的方差。在一特定实施例中,执行交叉条件分析可包括拟合以下形式的二元方差成分模型:y=u+u0+u1+∈,其中u1~N(0,G1),其中 并且其中u0捕获由定量的对两种表型的共同作用,而u1捕获由定量的表型特定作用。在特定实施例中,表型的协方差可被构造为导致的微生物组介导的相关估计,针对各特质由微生物组解释的表型方差的分数分别为在特定实施例中,可以将共相关(co-correlation)计算为共类似于定量遗传学术语中的共遗传性。对于任一特质,x可以对应于从样品Bray-Curtis相似性矩阵的奇异值分解获得的主成分的子集。可以使用合适的软件工具来拟合模型。性别、年龄和/或其他合适的用户数据可以作为固定效应协变量(fixed-effect covariate)包括在分析中。在另一实施例中,方法100可以包括确定多条件微生物组特征,其中确定多条件微生物组特征包括用微生物组表征模块集合的第一微生物组表征模块(例如,分析模块B等)、将降维技术应用于基于微生物序列数据集确定的微生物组特征的初始集合;用微生物组表征模块集合的第二微生物组表征模块、确定多个微生物有关状况的不同状况之间的交叉条件关联指标;并且基于该交叉条件关联指标、多条件微生物组特征集合和来自用户的样品,确定多条件表征。在该实施例中,针对用户确定多条件表征可以包括基于多个微生物有关状况中的当前用户状况(例如,基于微生物有关状况之间的共病性、基于微生物有关状况之间的关联性;等)、多条件微生物组特征集合、来自用户的样品和交叉条件关联指标,确定多个微生物有关状况中的附加的用户状况的表征。在该实施例中,用第二微生物组表征模块确定交叉条件关联指标可包括针对多个微生物有关状况中的不同状况,应用多变量模型、典型关联模型和多标签人工智能方法中的至少一种。然而,可以以任何合适的方式来执行,确定交叉条件关联指标、与交叉条件分析相关联的其他合适指标和/或执行其他合适的交叉条件分析。
执行交叉条件分析可以包括识别微生物有关状况的组(例如,集群),例如具有共享的微生物组特性(例如,共享的微生物组关联,等)的相似模式的微生物有关状况的组。例如,方法100可以包括:基于多条件微生物组特征(例如,使用微生物组表征模块确定的,等),确定来自多个微生物有关状况的微生物有关状况组集合;和基于微生物有关状况组集合(例如,和多条件表征,等),促进针对微生物有关状况的治疗干预。在一实施例中,识别组可以包括:执行无监督的层次聚类(hierarchical clustering),其中输入可包括成比例的关联矩阵通过行之间的斯皮尔曼相关(Spearman correlation)计算距离矩阵以估计行的距离;以及将距离矩阵用作层次聚类的输入。在该实施例中,贝叶斯多核回归可用于识别由微生物数据(例如,微生物组特征)解释的表型方差的实质性但可变分数(fraction),其中,在一特定实施例中,所解释的方差(R2)的范围从对溃疡性结肠炎的63%到对光敏性的10%(例如,如图21和表26所示)。在该实施例中,多变量混合模型的应用可以被用于估计325对疾病之间的微生物组有关关联性co-r12,其中结果可用于使用基于微生物组的关联性的聚类分析以获得正在分析的微生物有关状况的数据驱动排列(例如,如图22和25所示),并且其中分层组织可导致六个微生物有关状况组(例如,聚类,如表27所示;如图25所示,其中沿对角线的数字表明在给定组内具有共病性的个体,例如其中它们报告相同组的微生物有关状况,并且其中非对角线的数字表明具有跨组的共病性的个体,诸如报告对应于非对角线点的各组的至少一种状况;等)。可以识别统计上有意义的条件对。在该实施例中,多重检验校正可导致将325个中的75个(23%)识别为显著相关联的关联性(邦费罗尼(Bonferroni)校正的p值<0.05),其可包括15对的10对中的75个组间关联中的52个(69%),其中聚类V和聚类VI具有比预期更聚类间(intercluster)显著的相关性(二项式p值=2×10-10;观察的=76%,30个中的23个;预期的=24%,325个中的79个),并且其中这些聚类由自身免疫和过敏状况(例如,其中相关性的总结可显示于表27中,等)表征。在实施例中,交叉条件分析可指示疾病共病性,诸如关于人类肠道微生物组和/或对应于其他位点的其他合适的微生物组,等)。在实施例中,衍生数据支持人类肠道微生物组与多种状况(例如,共病状况,等)之间的关联,诸如其中衍生数据可以显示微生物组,该微生物组解释在多种自身免疫疾病的情况下方差的显著变化(例如,对于溃疡性结肠炎,R2=0.69;对于桥本氏甲状腺炎,R2=0.49;对于克罗恩病,R2=0.69;等)。
在该实施例中,交叉条件分析可以导致六个微生物有关状况组的识别:聚类I(例如,如表28所示,关于共现(co-occurrence),等),其包括小麦和麸质有关障碍、以及酒渣鼻和皮肤光敏性;聚类II,其包括乳制品过敏(例如,如表29所示,等)、类风湿性关节炎(rheumatoid arthritis,RA)和腹胀;聚类III,其包括肠易激综合症(IBS)(例如,如表30所示,关于与炎症性肠病(inflammatory bowel disease,IBD)和其他微生物有关状况的共现,等)、反流、便秘和痔疮;聚类IV,其包括多发性硬化症(multiple sclerosis,MS)和骨关节炎(osteoarthritis,OA);聚类V,其包括溃疡性结肠炎和克罗恩病、IBD的两种亚型、和在两种状况中普遍存在的症状性腹泻;聚类VI,其包括剩余的(remaining)食物过敏(例如,大豆过敏、花生过敏、树坚果过敏和蛋类过敏)和自身免疫性疾病(例如,牛皮癣、桥本氏甲状腺炎、格雷夫病和IBD)。在一实施例中,微生物有关状况组集合可以包括以下至少之一:第一组,其包括过敏有关状况;第二组,其包括运动有关(locomotor-related)状况;和第三组,其包括胃肠道有关状况,并且其中促进治疗干预可包括基于多条件表征和第一、第二与第三组中的至少之一(例如,基于将微生物有关状况分类为聚类,等)来促进针对微生物有关状况的治疗干预。在一实施例中,可以计算具有不同数量的共病的女性和男性的分数(例如,如表31所示)。
执行交叉条件分析可在促进治疗干预中使用。执行交叉条件分析可用于分组微生物有关状况以识别生物学相关的状况组,其可通过在用户的微生物组特征和共病状况的风险上对用户进行分层,来促进治疗干预,诸如用于包括初级防御、早期筛查、个性化疗法的发展和/或任何其他合适疗法应用的多水平治疗干预。微生物有关状况的微生物组驱动分类(例如,聚类等)可以使得用户分层,用于促进预防、诊断、治疗和/或其他合适的治疗干预有关过程,诸如用于优先安排疗法和/或改进相同组的状况和/或劝阻在组当中显示出相反结果的疗法。例如,促进治疗干预可包括以下至少一项:a)基于将用户分配到(例如,使用本文中描述的分析技术,通过一个或多个微生物组表征模块识别的;等)微生物有关状况组集合中的至少一个微生物有关状况组,针对用户推广(promoting)第一疗法;b)基于属于微生物有关状况组集合中的相同微生物有关状况组的微生物有关状况之间的关联,针对用户推广第二疗法;和c)基于属于微生物有关状况组集合中的不同微生物有关状况组的微生物有关状况之间的关联,针对用户劝阻第三疗法。然而,可以以任何合适的方式使用交叉条件分析和/或任何其他合适的表征过程以促进治疗干预。
在一变型中,表征可以基于与表现出目标状态(例如,微生物有关状况状态)的第一组受试者和未表现出目标状态(例如,“正常”状态)的第二组受试者之间的相似点和/或差异的统计分析(例如,概率分布的分析)相关联(例如,从其衍生)的特征。在实施该变型中,可以使用柯尔莫哥洛夫-斯米尔诺夫(KS)检验、置换检验、克莱默-冯米塞斯(Cramér-vonMises)检验、任何其他统计检验(例如,t检验、z检验、卡方(chi-squared)检验、与分布相关联的检验)和/或其他合适的分析技术中的一种或多种。特别地,一种或多种这样的统计假设检验可用于评估在表现出目标状态(例如,患病状态)的第一组受试者和未表现出目标状态(例如,具有正常状态)的第二组受试者中具有不同丰度的特征集合。。更详细地,可以基于与第一组受试者和第二组受试者相关联的百分比丰度和/或属于多样性的任何其他合适参数,来约束所评估的特征集合,以便增加或降低表征置信度(confidence)。在该实施例的特定实施方式中,特征可以衍生自细菌的分类单元,该细菌的分类单元在第一组受试者和第二组受试者一定百分比中为丰富,其中第一组受试者和第二组受试者之间的分类的相对丰度可从KS检验中确定,具有显著性指示(例如,以p值表示)。因此,框S130的输出可以包括标准化的相对丰度值(例如,具有微生物有关状况的受试者相比于没有微生物有关状况的受试者中,分类单元的风度大25%;患病受试者相比于健康受试者),具有显著性指示(例如,p值为0.0013)。特征生成的变化可以附加地或可替代地实施或衍生自功能特征或元数据特征(例如,非细菌标志物)。附加地或可替代地,可以基于统计分析(例如,应用于微生物序列数据集和/或其他合适的微生物数据集等)衍生出任何合适的微生物组特征,该统计分析包括以下任何一项或多项:预测分析、多假设测试、随机森林检验、主成分分析和/或其他合适的分析技术。
在执行表征过程中,框S130可以附加地或可替代地将来自微生物组组成多样性数据集和微生物组功能多样性数据集的至少一个的输入数据转换成特征向量,可以测试该特征向量在预测受试者群体表征中的功效。来自补充数据集的数据可用于提供表征集合的一个或多个表征的指示,其中表征过程使用候选特征和候选分类的训练数据集进行训练,以识别在准确预测分类中具有高度(或低度)预测能力的特征和/或特征组合。这样,利用训练数据集的表征过程的细化识别出与受试者的特定分类具有高度关联性的特征集(例如,受试者特征、特征组合)。
在变型中,在预测表征过程的分类中有效的特征向量(和/或任何合适的特征集)可以包括与以下一项或多项有关的特征:微生物组多样性指标(例如,关于跨分类组的分布,关于跨古生菌、细菌、病毒和/或真核生物组的分布)、在一个个体的微生物组中分类组的存在、在一个个体的微生物组中的特定遗传序列(例如,16S序列)的表示、一个个体的微生物组中分类组的相对丰度、微生物组适应力(resilience)指标(例如,响应于从补充数据集确定的扰动)、编码具有给定功能的蛋白质或RNA(例如,酶、转运蛋白、来自免疫系统的蛋白质、激素、干扰RNA等)的基因的丰度、以及与微生物组多样性数据集和/或补充数据集相关联(例如,从其衍生)的任何其他合适的特征。在变型中,微生物组特征可以与以下至少一项相关联(例如,包括、对应于、代表等):来自微生物组特征(例如,用户微生物组特征等)的微生物组特征的存在、来自微生物组特征的微生物组特征的不存在、与微生物有关状况相关联的不同分类组的相对丰度;与不同分类组相关的至少两个微生物组特征之间的比例、不同分类组之间的相互作用以及不同分类组之间的系统发育距离。在一特定实施例中,微生物组特征可以包括一种或多种相对丰度特性,该相对丰度特性与微生物组组成多样性特性(例如,与不同分类群相关联的相对丰度等)和微生物组功能多样性特征(例如,对应于不同功能特征的序列相对丰度;等)的至少一个相关联。相对丰度特性和/或其他合适的微生物组特征(和/或本文中描述的其他合适的数据)可以基于以下进行提取和/或以其他方式确定:标准化、衍生自线性潜在变量分析和非线性潜在变量分析的至少之一的特征向量、线性回归、非线性回归、核方法、特征嵌入方法、机器学习方法、统计推断方法和/或其他合适的分析技术。附加地或可替代地,可以在特征向量中使用特征的组合,其中可以在提供组合的特征作为特征集的一部分中分组和/或加权特征。例如,一个特征或特征集可以包括一个个体的微生物组中代表的细菌种类的数量的加权合成、一个个体的微生物组中细菌的特定属的存在、一个个体的微生物组中特定的16S序列的表示、和第一门细菌对第二门细菌的相对丰度。然而,特征向量可以附加地或可替代地以任何其他合适的方式确定。
如图3所示,在框S130的一个这样的可替代变型中,可以根据随机森林预测因子(random forest predictor,RFP)算法来生成和训练表征过程,RFP算法将装袋(bagging)(例如,自助聚合(bootstrap aggregation))和来自训练数据集的随机特征集合的选择结合,以构建与随机特征集合相关联的决策树集合T。在使用随机森林算法中,来自决策树集合的N个案例随机采样,进行替换以创建决策树的子集,并且针对各节点,从所有预测特征中选择m个预测特征进行评估。在节点处(例如,根据目标函数)提供最佳分割的预测特征用于执行分割(例如,在节点处分割为双叉(bifurcation),在节点处分割为三叉(trifurcation))。通过从大型数据集中采样多次,可以在识别预测分类中强的特征方面大幅度提高表征过程的强度。在该变型中,可以在处理期间包括为了防止偏差(例如,采样偏差)和/或解决偏差量的措施,诸如以增加模型的稳健性(robustness)。
在一种变型中,框S130和/或方法100的其他部分可以包括将计算机实施规则(例如,模型、特征选择规则等)应用于处理群体水平数据,但是可以附加地或可替代地包括将计算机实施规则应用于,在特定人口统计学基础上(例如,共享诸如治疗方案、饮食方案、体育活动方案、种族、年龄、性别、体重、睡眠行为的人口统计学特征的亚组)、在特定状况基础上(例如,表现出特定微生物有关状况的亚组、微生物有关状况的组合、微生物有关状况的触发因素、相关联症状,等)、在样品特定类型的基础上(例如,将不同计算机实施规则应用于处理衍生自不同收集位点的微生物组数据;等)、在用户基础上(例如,针对不同用户的不同计算机实施规则)和/或任何其他合适的基础上,处理微生物组有关数据。这样,框S130可以包括将来自用户群体的用户分配到一个或多个亚组;和应用不同计算机实施规则来针对不同亚组确定特征(例如,所使用的特征类型集合;从特征生成的表征模型的类型;等)。然而,应用计算机实施规则可以以任何合适的方式来执行。
在另一变型中,框S130可包括处理(例如,生成、训练、更新、执行、存储等)用于一个或多个微生物有关状况(例如,用于针对用户输出描述关于微生物有关状况的用户微生物组特性的表征,等)的一个或多个表征模型(例如,微生物有关状况表征模型等)。表征模型优选利用微生物组特征作为输入,并且优选输出微生物有关表征和/或其任何合适的成分;但是可以使用表征模型且合适的输入以生成任何合适的输出。在一实施例中,框S130可以包括将补充数据、微生物组组成多样性特征和微生物组功能多样性特征、其他微生物组特征、微生物组表征模块的输出和/或其他合适的数据针对一种或多种微生物有关状况转换成一个或多个表征模型(例如,基于补充数据和微生物组特征训练微生物有关表征模型;等)。在另一实施例中,方法100可以包括:基于来自用户群体的样品集合,针对与一种或多种微生物有关状况相关联的用户群体确定群体微生物序列数据集(例如,包括针对该群体的不同用户的微生物序列输出;等);针对受试者群体收集与一种或多种微生物有关状况的诊断相关联的补充数据集;和基于群体微生物序列数据集和补充数据集,生成微生物有关状况表征模型。
在另一变型中,如图8A-8C所示,可以针对不同的微生物有关状况、不同的用户人口统计特征(demographics)(例如,基于年龄、性别、体重、身高、种族;等)、不同的生理学位点(例如,肠道位点模型、鼻位点模型、皮肤位点模型、口位点模型、生殖器位点模型等)、个人用户、补充数据(例如,结合微生物组特征、微生物有关状况、和/或其他合适成分的先前的知识的模型;与生物统计传感器数据和/或调查响应数据相关联的特征相比于独立于补充数据的模型,等)、和/或其他合适的标准,生成不同的微生物有关表征模型和/或其他合适的模型(例如,用不同算法、用不同特征集合、用不同输入和/或输出类型生成的,以诸如关于时间、频率、应用模型的组件的不同方式应用的,等)。
在变型中,确定微生物有关表征和/或任何其他合适的表征可以包括诸如通过以下任何一项或多项确定关于特定生理位点(例如,肠道、健康的肠道、皮肤、鼻、口、生殖器、其他合适的生理位点,其他样品收集位点,等)的微生物有关表征:基于表征模型确定微生物有关表征,该表征模型基于特定位点数据衍生(例如,定义与一个或多个生理位点相关联的微生物有关状况和微生物组特征之间的关联性);基于在一个或多个生理位点、和/或任何其他合适的位点有关过程中收集的用户生物样品确定微生物有关表征。在实施例中,机器学习方法(例如,分类器、深度学习算法)、参数优化方法(例如,贝叶斯参数优化)、验证方法(例如,交叉验证方法)、统计检验(例如,单变量统计技术、多变量统计技术、诸如典型关联分析的关联分析等)、降维技术和/或其他合适的分析技术(例如,本文中描述的)可应用于确定位点有关(例如,生理位点有关,等)表征(例如,针对一个或多个样品收集位点、诸如针对各类型的样品收集位点,使用一种或多种方法,等)、其他合适的表征、疗法和/或任何其他合适的输出。在一特定实施例中,执行表征过程(例如,确定微生物有关表征;确定微生物组特征;基于微生物有关表征模型;等)可以包括应用以下至少一种:机器学习方法、参数优化方法、统计检验、降维方法和/或其他合适的方法(例如,其中诸如微生物组组成多样性特征集合和/或微生物组功能多样性特征集合的微生物组特征可以与在肠道位点、皮肤位点、鼻位点、口位点、生殖器位点至少之一处收集的微生物相关联,等)。在另一特定实施例中,针对多个样品收集位点执行的表征过程可用于生成单个表征,该单个表征可被组合以确定聚合(aggregate)表征(例如,聚合微生物组分值、诸如针对本文中描述的一种或多种状况,等)。然而,方法100可以包括确定任何合适的位点有关(例如,特定位点的)输出,和/或以任何合适的方式、用位点特异性和其他位点关系(relatedness)执行方法100的任何合适的部分(例如,收集样品、处理样品、确定疗法)。
受试者的表征可以附加地或可替代地实施高假阳性检验和/或高假阴性检验的使用,以进一步分析在根据方法100的实施方式生成的支持分析中表征过程的敏感性。然而,执行表征过程S130可以以任何合适的方式执行。
4.3.1皮肤有关表征过程
执行表征过程S130可以包括执行皮肤有关表征过程(例如,针对一种或多种皮肤有关状况的确定表征;确定和/或应用一种或多种皮肤有关表征模型,诸如应用与一个或多个微生物组表征模块相关联的一种或多种分析技术的模型;用一个或多个微生物组表征模块应用一种或多种分析技术以针对诸如共病的皮肤有关状况生成一种或多种皮肤有关状况的皮肤有关表征;确定皮肤有关表征,以在确定和/或推广针对一种或多种皮肤有关状况的一种或多种疗法中使用;等)S135,诸如针对一个或多个用户(例如,针对对应于来自受试者集合的样品的数据,用于针对用户生成皮肤有关表征;针对单一用户,用于诸如通过使用一种或多种皮肤有关表征模型,针对该用户生成皮肤有关表征;等)和/或针对一种或多种皮肤有关状况(例如,使用任何合适类型和数量的微生物组表征模块、交叉条件分析等)。
在一变型中,执行皮肤有关表征过程可以包括确定与一种或多种皮肤有关状况相关联的微生物组特征。在一实施例中,执行皮肤有关表征过程可以包括应用一种或多种分析技术(例如,统计分析)以识别具有与一种或多种皮肤有关状况(例如,与单一皮肤有关状况相关联的特征,与多种皮肤有关状况和/或其他合适的皮肤有关状况相关联的交叉条件特征,等)的最高关联性的微生物组特征集合(例如,微生物组组成特征、微生物组组成多样性特征、微生物组功能特征、微生物组功能多样性特征等)。在一特定实施例中,执行皮肤有关表征过程可以促进针对一种或多种皮肤有关状况的治疗干预,诸如通过促进与疗法相关联的干预,该疗法对一个或多个用户关于一种或多种皮肤有关状况的状态具有积极作用。在另一特定实施例中,执行皮肤有关表征过程(例如,确定与一种或多种皮肤有关状况的最高关联的特征,等)可以基于随机森林预测因子算法,该随机森林预测因子算法用衍生自受试者群体(例如,具有一种或多种皮肤有关状况的受试者;不具有一种或多种皮肤有关状况的受试者;等)子集的训练数据集训练,并用衍生自受试者群体子集的验证数据集进行验证。然而,确定微生物组特征和/或与一种或多种皮肤有关状况相关联的其他合适的方面可以以任何合适的方式来执行。
在变型中,执行皮肤有关表征过程S135可以包括针对一种或多种光敏性有关状况执行光敏性相关状况表征过程。在一实施例中,皮肤有关表征过程可以基于统计学分析来识别与光敏性相关联状况具有最高关联性的特征集合,基于用衍生自受试者群体子集的训练数据集训练的、并用衍生自受试者群体子集的验证数据集验证的随机森林预测因子算法,一种或多种疗法对该与光敏性相关联状况有积极作用。在实施例中,光敏性相关联状况特征可以包括通过皮肤对日光的电磁光谱成分的异常反应而表征的皮肤状况。在实施例中,光敏性相关联状况可以通过皮肤检查、光测试和光斑测试和/或其他合适的方法来诊断。光敏性相关联状况可以与特定微生物群多样性和/或与肠道微生物的相对丰度有关的健康状况、与任何合适的生理位点相关联的微生物、微生物组功能多样性、和/或其他合适的微生物组有关方面相关联。
与一种或多种光敏性相关联状况(和/或其他合适的皮肤有关状况)相关联(例如,正相关;负相关;对诊断有用;等)的微生物组特征可以包括与以下分类群中的一个或多个的任意组合相关联的特征(例如,描述其丰度的特征;描述其相对丰度的特征;描述与其相关联的功能方面的特征;描述从其衍生的特征;描述其存在和/或不存在的特征;等):拟普雷沃菌属(Alloprevotella)(属)、普雷沃菌属(Prevotella)WAL 2039G种(种)、乳腺炎棒状杆菌(Corynebacterium mastitidis)(种)、拟杆菌科(Bacteroidaceae)(科)、布劳特菌属(Blautia)(属)、拟杆菌属(Bacteroides)(属)、脱硫弧菌属(Desulfovibrio)(属)、梭菌属(Clostridium)(属)、普通拟杆菌(Bacteroides vulgatus)(种)、普拉栖粪杆菌(Faecalibacterium prausnitzii)(种)、粪布劳特菌(Blautia faecis)(种)、腐败另枝菌(Alistipes putredinis)(种)、拟杆菌AR20种(种)、拟杆菌AR29种(种)、产酸拟杆菌(Bacteroides acidifaciens)(种)、迪尔玛菌属(Dielma)(属)、斯莱克菌属(Slackia)(属)、埃格特菌属(Eggerthella)(属)、阿德勒克罗伊茨菌属(Adlercreutzia)(属)、副普雷沃菌属(Paraprevotella)(属)、另枝菌属(Alistipes)(属)、霍尔德曼氏菌属(Holdemania)(属)、艾森伯格氏菌属(Eisenbergiella)(属)、肠杆菌属(Enterorhabdus)(属)、产液阿德勒克罗伊茨菌(Adlercreutzia equolifaciens)(种)、琥珀酸考拉杆菌(Phascolarctobacterium succinatutens)(种)、食葡糖罗斯拜瑞菌(Roseburiainulinivorans)(种)、考拉杆菌377种(种)、匹格脱硫弧菌(Desulfovibrio piger)(种)、埃格特菌HGA1种(种)、内脂因子长形产乳杆菌(Lactonifactor longoviformis)(种)、另枝菌HGB5种(种)、丝状霍尔德曼氏菌(Holdemania filiformis)(种)、柯林斯肠炎胎弧菌菌(Collinsella intestinalis)(种)、猕猴奈瑟菌(Neisseria macacae)(种)、梭菌科(Clostridiaceae)(科)、血孪生球菌(Gemella sanguinis)(种)、脆弱拟杆菌(Bacteroidesfragilis)(种)、肠杆菌科(Enterobacteriaeae)(科)、毛螺菌科(Lachnospiraceae)(科)、巴斯德菌科(Pasteurellaceae)(科)、巴斯德菌目(Pasteurellales)(目)、肠杆菌目(Enterobacteriales)(目)、鞘氨醇杆菌目(Sphingobacteriales)(目)、嗜血杆菌属(Haemophilus)(属)、明串珠菌属(Leuconostoc)(属)、短波单胞菌属(Brevundimonas)(属)、口普雷沃菌(Prevotella oris)(种)、臭气杆菌属(Odoribacter)(属)、二氧化碳噬纤维菌属(Capnocytophaga)(属)、黄杆菌属(Flavobacterium)(属)、布伦纳假单胞菌(Pseudomonas brenneri)(种)、鲸黄杆菌(Flavobacterium ceti)(种)、短波单胞菌FXJ8.080种(种)、瘤胃球菌科(Ruminococcaceae)(科)、弧菌科(Vibrionaceae)(科)、黄杆菌科(Flavobacteriaceae)(科)、梭杆菌科(Fusobacteriaceae)(科)、紫单胞菌科(Porphyromonadaceae)(科)、短杆菌科(Brevibacteriaceae)(科)、红杆菌科(Rhodobacteraceae)(科)、间孢囊菌科(Intrasporangiaceae)(科)、双歧杆菌科(Bifidobacteriaceae)(科)、鞘氨醇杆菌科(Sphingobacteriaceae)(科)、柄杆菌科(Caulobacteraceae)(科)、弯曲杆菌科(Campylobacteraceae)(科)、拟杆菌纲(Bacteroidia)(纲)、梭杆菌纲(Fusobacteriia)(纲)、黄杆菌纲(Flavobacteriia)(纲)、双歧杆菌目(Bifidobacteriales)(目)、奈瑟菌目(Neisseriales)(目)、拟杆菌目(Bacteroidales)(目)、红杆菌目(Rhodobacterales)(目)、黄杆菌目(Flavobacteriales)(目)、弧菌目(Vibrionales)(目)、梭杆菌目(Fusobacteriales)(目)、柄杆菌目(Caulobacterales)(目)、梭杆菌门(Fusobacteria)(门)、放线棒菌属(Actinobaculum)(属)、小弯杆菌属(Varibaculum)(属)、镰刀链杆菌属(Fusicatenibacter)(属)、短杆菌属(Brevibacterium)(属)、粪杆菌属(Faecalibacterium)(属)、弯曲杆菌属(Campylobacter)(属)、放线杆菌属(Actinobacillus)(属)、卟啉单胞菌(Porphyromonas)(属)、梭杆菌属(Fusobacterium)(属)、金黄杆菌属(Chryseobacterium)(属)、巨球菌(Megasphaera)(属)、罗氏菌属(Rothia)(属)、奈瑟菌属(Neisseria)(属)、乳杆菌BL302种(种)、普列比乌斯拟杆菌(bacteroides plebeius)(种)、溃疡棒状杆菌(Corynebacterium ulcerans)(种)、寒武小弯杆菌(Varibaculum cambriense)(种)、韦克斯勒布劳特菌(Blautia wexlerae)(种)、葡萄球菌WB18-16种(种)、口腔分类单元链球菌(Streptococcus oral taxon)G63种(种)、疮疱丙酸杆菌(Propionibacterium acnes)(种)、厌氧球菌(Anaerococcus)9401487种(种)、副流感嗜血杆菌(Haemophilus parainfluenzae)(种)、表皮葡萄球菌(Staphylococcus epidermidis)(种)、解脲弯曲杆菌(Campylobacter ureolyticus)(种)、两面神菌(Janibacter)M3-5种(种)、蒂莫宁普雷沃菌(Prevotella timonensis)(种)、嗜胨菌(Peptoniphilus)DNF00840种(种)、芬戈尔德菌(Finegoldia)S8 F7种(种)、解糖胨普雷沃菌(Prevotella disiens)(种)、卡式卟啉单胞菌(Porphyromonas catoniae)(种)、牙周梭杆菌(Fusobacterium periodonticum)(种)、和/或其他合适的分类群(例如,本文中所述);和/或可以包括与以下一项或多项的任何组合相关的功能特征(例如,描述其丰度的特征;描述其相对丰度的特征;描述与其相关的功能方面的特征;描述从其衍生特征;描述其存在和/或不存在的特征;等):传染性疾病(KEGG2)、表征欠佳(Poorly Characterized)(KEGG2)、代谢疾病(KEGG2)、免疫系统疾病(KEGG2)、细胞过程和信号传导(KEGG2)、限制性内切酶(KEGG3)、核苷酸切除修复(KEGG3)和/或其他合适的功能特征(例如,如本文中所述)。在变型中,用户的表征可以包括基于以对诊断和/或治疗的典型方法是附加的或可替代的方式、监测以上特征的一种或多种,将用户表征为具有一种或多种光敏性皮肤相关状况的人。
在变型中,执行皮肤有关表征过程S135可以包括针对一种或多种皮肤干燥相关状况执行皮肤干燥相关状况表征过程。在一实施例中,皮肤有关表征处理可以基于统计分析来识别具有与干燥皮肤相关联状况最高关联性的特征集合,基于用衍生自受试者群体子集的训练数据集训练的、并用衍生自受试者群体子集的验证数据集进行验证的随机森林预测因子算法一种或多种疗法对该干燥皮肤相关联状况有积极作用。在实施例中,皮肤干燥相关联状况可以包括以下一种或多种:皮肤粗糙、瘙痒、剥落、脱屑或脱皮、细纹或裂纹、深色皮肤个体的皮肤灰白、发红、可流血和可导致感染的深裂纹、和/或其他合适的皮肤干燥相关联状况。皮肤干燥相关联状况可以与特定微生物群多样性和/或与肠道微生物的相对丰度有关的健康状况、与任何合适的生理位点相关的微生物、微生物组功能多样性和/或其他合适的微生物组有关方面相关。
与一种或多种皮肤干燥有关状况(和/或其他合适的皮肤有关状况)相关联(例如,正相关;负相关;对诊断有用;等)的微生物组特征可以包括与以下分类群中的一个或多个的任意组合相关的特征(例如,描述其丰度的特征;描述其相对丰度的特征;描述与其相关的功能方面的特征;描述从其衍生自特征;描述其存在和/或不存在的特征;等):棒状杆菌科(Corynebacteriaceae)(科)、芽孢杆菌纲(Bacilli)(纲)、乳杆菌目(Lactobacillales)(目)、放线菌目(目)、厚壁菌门(Firmicutes)(门)、棒状杆菌属(Corynebacterium)(属)、皮杆菌科(Dermabacteraceae)(科)、乳杆菌科(Lactobacillaceae)(科)、丙酸杆菌科(Propionibacteriaceae)(科)、放线菌纲(Actinobacteria)(纲)、皮杆菌属(Dermabacter)(属)、戴阿利斯特杆菌属(Dialister)(属)、费克蓝姆菌属(Facklamia)(属)、乳杆菌(属)、丙酸杆菌(Propionibacterium)(属)、溃疡棒状杆菌(种)、人费克蓝姆菌(Facklamiahominis)(种)、棒状杆菌种(种)、丙酸杆菌MSP09A种(种)、费克蓝姆菌1440-97种(种)、葡萄球菌C9I2种(种)、厌氧球菌9402080种(种)、解葡萄糖苷棒状杆菌(Corynebacteriumglucuronolyticum)(种)、人皮杆菌(Dermabacter hominis)(种)、肠杆菌科(科)、假单胞菌科(Pseudomonadaceae)(科)、葡萄球菌科(Staphylococcaceae)(科)、γ-变形菌纲(Gammaproteobacteria)(纲)、芽孢杆菌目(目)、肠杆菌目(目)、双歧杆菌属(Bifidobacterium)(属)、假单胞菌属(Pseudomonas)(属)、厌氧球菌属(属)、克鲁维菌属(Kluyvera)(属)、阿托波菌属(Atopobium)(属)、葡萄球菌属(属)、乳杆菌BL302种(种)、乳腺炎棒状杆菌(种)、长双歧杆菌(Bifidobacterium longum)(种)、双子厌氧球菌种(Anaeroglobus geminatus)(种)、厌氧球菌S9 PR-16种(种)、蒂莫宁普雷沃菌(种)、乔治亚娜克鲁维菌(种)、放线棒菌属(属)、芬戈尔德菌(Finegoldia)(属)、克罗诺杆菌属(Cronobacter)(属)、不动杆菌(Acinetobacter)WB22-23种(种)、八叠厌氧球菌(Anaerococcus octavius)(种)、芬戈尔德菌S9 AA1-5种(种)、葡萄球菌C-D-MA2种(种)、嗜胨菌(Peptoniphilus)7-2种(种)、阪崎克罗诺杆菌(Cronobacter sakazakii)(种)、巴斯德菌科(科)、酸杆菌纲(Acidobacteriia)(纲)、鞘氨醇杆菌纲(Sphingobacteriia)(纲)、鞘氨醇杆菌目(目)、酸杆菌门(Acidobacteria)(门)、卟啉单胞菌(属)、嗜血杆菌属(属)、不动杆菌属(属)、厌氧球菌8405254种(种)、鞘氨醇单胞菌科(Sphingomonadaceae)(科)、鞘氨醇单胞菌目(Sphingomonadales)(目)、库克菌属(Kocuria)(属)、孪生球菌属(属)、韦荣球菌(Veillonella)CM60种(种)、乳杆菌7_1_47FAA(种)、孪生球菌933-88种(种)、卡式卟啉单胞菌(种)、副流感嗜血杆菌(种)、拟杆菌AR20种(种)、普通拟杆菌(种)、拟杆菌D22种(种)、多拉长脂链霉素菌(Dorea Longicatena)(种)、粪副拟杆菌(Parabacteroides merdae)(种)、拟杆菌AR29种(种)、多拉菌属(Dorea)(属)、柯林斯菌属(属)、拟杆菌属(属)、颤螺菌科(Oscillospiraceae)(科)、瘤胃球菌科(科)、拟杆菌科(科)、疣微菌科(Verrucomicrobiaceae)(科)、红蝽菌科(Coriobacteriaceae)(科)、梭菌目(目)、拟杆菌目(目)、疣微菌目(Verrucomicrobiales)(目)、红蝽菌目(Coriobacteriales)(目)、高温厌氧菌目(Thermoanaerobacterales)(目)、梭菌纲(Clostridia)(纲)、拟杆菌纲(纲)、疣微菌纲(Verrucomicrobiae)(纲)、疣微菌门(Verrucomicrobia)(门)、拟杆菌门(Bacteroidetes)(门)、和/或其他合适的分类群(例如,本文中所述);和/或可以包括与以下一项或多项的任何组合相关的功能特征(例如,描述其丰度的特征;描述其相对丰度的特征;描述与其相关的功能方面的特征;描述从其衍生自特征;描述其存在和/或不存在的特征;等):转录(KEGG2)、细胞过程和信号传导(KEGG2)、氨基酸代谢(KEGG2)、细胞生长和死亡(KEGG2)、复制和修复(KEGG2)、其他氨基酸的代谢(KEGG2)、神经退行性疾病(KEGG2)、辅助因子和维生素的代谢(KEGG2)、运输和分解代谢(KEGG2)、内分泌系统(KEGG2)、免疫系统疾病(KEGG2)、排泄系统(KEGG2)、酶家族(KEGG2)、膜运输(KEGG2)、碳水化合物代谢(KEGG2)、其他次生代谢产物的生物合成(KEGG2)、萜类化合物和聚酮化合物的代谢(KEGG2)、传染性疾病(KEGG2)、遗传信息处理(KEGG2)、神经系统(KEGG2)、环境适应(KEGG2)、核苷酸代谢(KEGG2)、信号分子与相互作用(KEGG2)、信号转导(KEGG2)、无机离子的运输与代谢(KEGG3)、染色体(KEGG3)、细胞循环–柄杆菌属(KEGG3)、核糖体生物发生(KEGG3)、DNA复制蛋白(KEGG3)、转录因子(KEGG3)、甘氨酸、丝氨酸和苏氨酸代谢(KEGG3)、硫代谢(KEGG3)、其他离子耦合的转运蛋白(KEGG3)、缬氨酸、亮氨酸和异亮氨酸的生物合成(KEGG3)、氮代谢(KEGG3)、肽聚糖的生物合成(KEGG3)、同源重组(KEGG3)、过氧化物酶体(KEGG3)、硫中继系统(KEGG3)、肽酶(KEGG3)、蛋白激酶(KEGG3)、错配修复(KEGG3)、二甲苯降解(KEGG3)、核糖体(KEGG3)、RNA聚合酶(KEGG3)、色氨酸代谢(KEGG3)、组氨酸代谢(KEGG3)、维生素代谢(KEGG3)、细胞运动和分泌(KEGG3)、嘧啶代谢(KEGG3)、细胞骨架蛋白(KEGG3)、DNA复制(KEGG3)、氨基糖和核苷酸糖代谢(KEGG3)、叶酸生物合成(KEGG3)、光合生物中的碳固定(KEGG3)、磷脂酰肌醇信号传导系统(KEGG3)、赖氨酸降解(KEGG3)、硒化合物代谢(KEGG3)、果糖和甘露糖代谢(KEGG3)、肌醇磷酸代谢(KEGG3)、蛋白质折叠和相关处理(KEGG3)、氧化物酶体增殖激活受体(PPAR)信号传导途径(KEGG3)、脂质代谢(KEGG3)、缬氨酸、亮氨酸和异亮氨酸降解(KEGG3)、乙醛酸和二羧酸代谢(KEGG3)、精氨酸和脯氨酸代谢(KEGG3)、柠檬烯和蒎烯降解(KEGG3)、D-丙氨酸代谢(KEGG3)、卟啉和叶绿素代谢(KEGG3)、C5-支链二元酸代谢(KEGG3)、分子伴侣和折叠催化物(KEGG3)、脂肪酸代谢(KEGG3)、谷胱甘肽代谢(KEGG3)、磷酸戊糖途径(KEGG3)、磷酸转移酶系统(Phosphotransferase system,PTS)(KEGG3)、泛酸和辅酶A(CoA)生物合成(KEGG3)、近端小管碳酸氢盐回收(KEGG3)、半乳糖代谢(KEGG3)、淀粉和蔗糖代谢(KEGG3)、原发性免疫缺陷(KEGG3)、半胱氨酸和甲硫氨酸代谢(KEGG3)、泛醌和其他萜类醌生物合成(KEGG3)、DNA修复和重组蛋白(KEGG3)、酪氨酸代谢(KEGG3)、苯丙氨酸、酪氨酸和色氨酸生物合成(KEGG3)、氨酰-tRNA生物合成(KEGG3)、丙氨酸、天冬氨酸和谷氨酸代谢(KEGG3)、光合作用(KEGG3)、其他转运蛋白(KEGG3)、丁酸酯代谢(KEGG3)、细菌分泌系统(KEGG3)、甘油磷脂代谢(KEGG3)、氧化磷酸化(KEGG3)、I型糖尿病(KEGG3)、糖酵解/糖异生(KEGG3)、光合作用蛋白(KEGG3)、转运蛋白(KEGG3)、萜类骨架生物合成(KEGG3)、不饱和脂肪酸的生物合成(KEGG3)、信号转导机制(KEGG3)、酮体的合成和降解(KEGG3)、核苷酸切除修复(KEGG3)、分泌系统(KEGG3)、阿尔茨海默病(KEGG3)、玉米素生物合成(KEGG3)、II型糖尿病(KEGG3)、D-谷氨酰胺和D-谷氨酸代谢(KEGG3)、牛磺酸和亚牛磺酸代谢(KEGG3)、谷氨酸能突触(KEGG3)、植物-病原体相互作用(KEGG3)、维生素B6代谢(KEGG3)、柠檬酸循环(TCA循环)(KEGG3)、乙苯降解(KEGG3)、碱基切除修复(KEGG3)、复制、重组和修复蛋白(KEGG3)、真核生物的核糖体生物发生(KEGG3)、氨基苯甲酸酯降解(KEGG3)、细菌运动蛋白(KEGG3)、安莎霉素类的生物合成(KEGG3)、离子通道(KEGG3)、代谢(KEGG2)、表征欠佳(KEGG2)、次生代谢物的生物合成和生物降解(KEGG3)、硫辛酸代谢(KEGG3)、氨基酸有关酶(KEGG3)、转录蛋白(KEGG3)、抗坏血酸盐和藻酸盐代谢(KEGG3)、硫胺素代谢(KEGG3)、功能未知(KEGG3)、糖胺聚糖降解(KEGG3)、其他(KEGG3)、戊糖和葡萄糖醛酸酯相互转化(KEGG3)、生物素代谢(KEGG3)、苯丙氨酸代谢(KEGG3)、糖鞘脂生物合成-神经节系列(Glycosphingolipid biosynthesis-ganglio series)(KEGG3)、毛孔离子通道(KEGG3)、膜和细胞内结构分子(KEGG3)、嘌呤代谢(KEGG3)、叶酸一碳库(One carbon pool by folate)(KEGG3)、磷酸酯和次磷酸酯代谢(KEGG3)、溶酶体(KEGG3)、药物代谢-其他酶(KEGG3)、青霉素和头孢菌素生物合成(KEGG3)、亨廷顿病(Huntington's disease)(KEGG3)、烟酸盐和烟酰胺代谢(Nicotinate and nicotinamide metabolism)(KEGG3)、药物代谢-细胞色素P450(KEGG3)、脂多糖生物合成蛋白(KEGG3)、通过细胞色素P450的外源性物质代谢(KEGG3)、结核病(KEGG3)、多环芳烃降解(KEGG3)、和/或其他任何合适的功能特征(例如,如本文中描述的)。在变型中,用户的表征可以包括基于以对诊断和/或治疗的典型方法是附加的或可替代的方式监测以上特征的一种或多种,,将用户表征为具有一种或多种光敏性皮肤相关相关状况的人。
在变型中,执行皮肤有关表征过程S135可以包括针对一种或多种头皮有关状况执行头皮有关状况表征过程。在一实施例中,皮肤有关表征过程可以基于统计分析,以识别具有与头皮有关状况最高关联性的特征集合,基于用衍生自受试者群体子集的训练数据集训练的、并用衍生自受试者群体子集的验证数据集进行验证的随机森林预测因子算法,一种或多种疗法对该头皮有关状况有积极作用。在实施例中,头皮有关状况可以包括诸如由皮肤干燥、刺激性油性皮肤、对护发产品的敏感性引起的头皮屑(例如,以剥落、瘙痒、头皮皮肤结垢为特征;等)和/或其他合适的头皮有关状况,可导致头皮微生物组失衡的其他状况和/或其他与头皮有关状况中的一种或多种。头皮有关状况可以与特定微生物群多样性和/或与肠道微生物的相对丰度有关的健康状况、与任何合适的生理位点相关联的微生物、微生物组功能多样性和/或其他合适的微生物组有关方面相关联。
与一种或多种头皮有关状况(和/或其他合适的皮肤有关状况)相关联(例如,正相关;负相关;对诊断有用;等)的微生物组特征可以包括与以下分类群中的一种或多种的任意组合相关联的特征(例如,描述其丰度的特征;描述其相对丰度的特征;描述与其相关的功能方面的特征;描述从其衍生的特征;描述其存在和/或不存在的特征;等):放线菌纲(纲)、乳杆菌目(目)、放线菌目(Actinomycetales)(目)、厚壁菌门(门)、皮杆菌科(科)、乳杆菌科(科)、丙酸杆菌科(科)、棒状杆菌科(科)、乳杆菌(属)、棒状杆菌属(属)、丙酸杆菌(属)、皮杆菌属(属)、另位球菌属(Eremococcus)(属)、弗莱堡棒状杆菌(Corynebacteriumfreiburgense)(种)、克里克拉另位球菌属(KEGG3)(Eremoc(KEGG3)occus coleocola)(种)、棒状杆菌种(种)、葡萄球菌C9I2种(种)、厌氧球菌8405254种(种)、解葡萄糖苷棒状杆菌(种)、人皮杆菌(种)、红蝽菌科(科)、肠杆菌科(科)、葡萄球菌科(科)、肠杆菌目(目)、芽孢杆菌目(目)、双歧杆菌属(属)、葡萄球菌属(Staphylococcus)(属)、阿托波菌属(属)、巨球菌(属)、乳腺炎棒状杆菌(种)、链球菌BS35a种(种)、大芬戈尔德菌(Finegoldia magna)(种)、金黄色葡萄球菌(Staphylococcus aureus)(种)、流感嗜血杆菌(Haemophilusinfluenza)(种)、棒状杆菌NML 97-0186种(种)、口腔分类单元链球菌G59种(种)、多拉菌属(属)、罗斯拜瑞菌11SE39种(种)、多拉长脂链霉素菌(种)、普雷沃菌科(科)、韦荣球菌科(Veillonellaceae)(科)、颤螺菌科(科)、革兰氏阴性菌纲(Negativicutes)、硒单胞菌目(Selenomonadales)(目)、芬戈尔德菌(属)、颤螺菌属(Oscillospira)(属)、肠道单胞菌属(Intestinimonas)(属)、弗雷范尔特菌属(Flavonifractor)(属)、普雷沃菌属(属)、莫亚拉菌属(Moryella)(属)、光冈链杆菌(Catenibacterium mitsuokai)(种)、产气柯林斯菌(Collinsella aerofaciens)(种)、嗜胨菌2002-2300004种(种)、犬棒状杆菌(Corynebacterium canis)(种)、芬戈尔德菌S9 AA1-5种(种)、口颊普雷沃菌(Prevotellabuccalis)(种)、浑浊戴阿利斯特杆菌(Dialister invisus)(种)、莫拉克斯菌属(Moraxella)(属)、奈瑟菌属(属)、粘液奈瑟菌(Neisseria mucosa)(种)、理研菌科(Rikenellaceae)(科)、和/或其他合适的分类群(例如,本文中所述);和/或可以包括与以下一项或多项的任何组合相关的功能特征(例如,描述其丰度的特征;描述其相对丰度的特征;描述与其相关的功能方面的特征;描述从其衍生的特征;描述其存在和/或不存在的特征;等):辅助因子和维生素的代谢(KEGG2)、酶家族(KEGG2)、脂质代谢(KEGG2)、免疫系统疾病(KEGG2)、糖酵解/糖异生(KEGG3)、原发性免疫缺陷(KEGG3)、丙酮酸盐代谢(KEGG3)、运输和分解代谢(KEGG2)、神经退行性疾病(KEGG2)、内分泌系统(KEGG2)、氨基酸代谢(KEGG2)、细胞过程和信号传导(KEGG2)、信号分子与相互作用(KEGG2)、其他氨基酸的代谢(KEGG2)、复制和修复(KEGG2)、转录(KEGG2)、细胞生长和死亡(KEGG2)、膜运输(KEGG2)、其他次生代谢产物的生物合成(KEGG2)、萜类化合物和聚酮化合物的代谢(KEGG2)、无机离子的运输与代谢(KEGG3)、维生素代谢(KEGG3)、缬氨酸、亮氨酸和异亮氨酸的生物合成(KEGG3)、过氧化物酶体(KEGG3)、核糖体生物发生(KEGG3)、硒化合物代谢(KEGG3)、组氨酸代谢(KEGG3)、染色体(KEGG3)、硫代谢(KEGG3)、PPAR信号传导通路(KEGG3)、卟啉和叶绿素代谢(KEGG3)、磷脂酰肌醇信号传导系统(KEGG3)、肌醇磷酸代谢(KEGG3)、硫中继系统(KEGG3)、甘氨酸、丝氨酸和苏氨酸代谢(KEGG3)、DNA复制蛋白(KEGG3)、泛酸和CoA生物合成(KEGG3)、转录因子(KEGG3)、蛋白质折叠和相关处理(KEGG3)、II型糖尿病(KEGG3)、蛋白激酶(KEGG3)、叶酸生物合成(KEGG3)、赖氨酸降解(KEGG3)、RNA聚合酶(KEGG3)、D-丙氨酸代谢(KEGG3)、光合生物中的碳固定(KEGG3)、氮代谢(KEGG3)、甘油磷脂代谢(KEGG3)、安莎霉素类的生物合成(KEGG3)、缬氨酸、亮氨酸和异亮氨酸降解(KEGG3)、细胞骨架蛋白(KEGG3)、肽酶(KEGG3)、脂肪酸代谢(KEGG3)、细胞循环-柄杆菌属(KEGG3)、磷酸转移酶系统(PTS)(KEGG3)、嘧啶代谢(KEGG3)、阿尔茨海默病(KEGG3)、丁酸酯代谢(KEGG3)、色氨酸代谢(KEGG3)、信号转导机制(KEGG3)、磷酸戊糖途径(KEGG3)、其他离子耦合的转运蛋白(KEGG3)、同源重组(KEGG3)、复制、重组和修复蛋白(KEGG3)、二甲苯降解(KEGG3)、错配修复(KEGG3)、乙醛酸和二羧酸代谢(KEGG3)、精氨酸和脯氨酸代谢(KEGG3)、肽聚糖的生物合成(KEGG3)、分子伴侣和折叠催化物(KEGG3)、I型糖尿病(KEGG3)、DNA复制(KEGG3)、细菌分泌系统(KEGG3)、酪氨酸代谢(KEGG3)、柠檬酸循环(TCA循环)(KEGG3)、氨基糖和核苷酸糖代谢(KEGG3)、核糖体(KEGG3)、柠檬烯和蒎烯降解(KEGG3)、细胞运动和分泌(KEGG3)、牛磺酸和亚牛磺酸代谢(KEGG3)、氧化磷酸化(KEGG3)、果糖和甘露糖代谢(KEGG3)、维生素B6代谢(KEGG3)、离子通道(KEGG3)、酮体的合成和降解(KEGG3)、其他转运蛋白(KEGG3)、半乳糖代谢(KEGG3)、多环芳烃降解(KEGG3)、转运蛋白(KEGG3)、DNA修复和重组蛋白(KEGG3)、淀粉和蔗糖代谢(KEGG3)、丙氨酸、天冬氨酸和谷氨酸代谢(KEGG3)、真核生物的核糖体生物发生(KEGG3)、分泌系统(KEGG3)、不饱和脂肪酸的生物合成(KEGG3)、半胱氨酸和甲硫氨酸代谢(KEGG3)、碱基切除修复(KEGG3)、氨基苯甲酸酯降解(KEGG3)、光合作用(KEGG3)、光合作用蛋白(KEGG3)、毛孔离子通道(KEGG3)、脂质生物合成蛋白(KEGG3)、D-谷氨酰胺和D-谷氨酸代谢(KEGG3)、和/或任何其他合适的功能特征(例如,本文中所述等)。在变型中,用户的表征可以包括基于以对诊断和/或治疗的典型方法是附加的或可替代的方式检测以上特征的一种或多种,将用户表征为具有一种或多种光敏性皮肤相关状况的人。
然而,确定一种或多种皮肤有关表征可以以任何合适的方式来执行。
4.4确定疗法模型
方法100可以附加地或可替代地包括框S140,框S140可以包括生成配置成调节根据表征过程表征的受试者中微生物分布的疗法模型。框S140可以起到以下作用:识别、排序、优先考虑(prioritize)、确定、预测、劝阻和/或以其他方式促进对疗法(例如,基于益生菌的疗法、基于噬菌体的疗法、基于小分子的疗法等)的疗法确定,诸如可以使受试者的微生物组组成和/或功能特征(例如,针对任何合适位点的微生物组,等)朝着在推广受试者健康中所期望的平衡状态转变的疗法;和/或确定用于以其他方式修改一种或多种微生物有关状况的状态的疗法(例如,修改与人类行为状况相关的用户行为,等)。微生物有关状况模型可包括一种或多种疗法模型。在框S140中,疗法可以从包括以下一种或多种的疗法中选择:益生菌疗法、基于噬菌体的疗法、基于小分子的疗法、认知/行为疗法、物理康复疗法、临床疗法、基于药物的疗法、饮食有关疗法、和/或旨在以任何其他合适的方式操作以推广用户健康的任何其他合适疗法。在基于细菌噬菌体的疗法的特定实施例中,对受试者中所代表的某些细菌(或其他微生物)特异的细菌噬菌体的一个或多个群体(例如,以菌落形成单元来表示)可用于下调或以其他方式消除某些细菌的群体。这样,基于细菌噬菌体的疗法可用于减少受试者中所代表的细菌的不期望群体的大小。作为补充,基于细菌噬菌体的疗法可用于增加未被所用细菌噬菌体靶向的细菌群体的相对丰度。
在益生菌疗法的另一个特定实施例中,如图4所示,该疗法模型的候选疗法可以执行以下一项或多项:通过提供物理屏障(例如,通过定植抗性的方式)阻止病原体进入上皮细胞、通过刺激杯状细胞(goblet cell)诱导粘液性屏障的形成、(例如,通过刺激闭合小环1(zona-occludens 1)的上调、通过阻止紧密连接蛋白(tight junction protein)再分布)增强受试者的上皮细胞之间顶端紧密连接的完整性、产生抗微生物因子、(例如,通过树突细胞的信号传导和调节T细胞的诱导)刺激抗炎性细胞因子的产生、触发免疫反应、以及执行将受试者的微生物组从失调状态中调整出去的任何其他合适功能。在另一个特定实施例中,疗法可以包括基于医疗设备的疗法(例如,与人类行为修改相关联的、与疾病有关状况的治疗相关联的、等)。
在变型中,疗法模型优选地基于来自大的受试者群体的数据,其可以包括在框S110中从其衍生出微生物组多样性数据集的受试者群体,其中良好地表征了充分暴露于各种治疗措施之前和之后的微生物组组成和/或功能特征或健康状态。这些数据可用于在识别治疗措施中训练和验证疗法提供模型,该治疗措施基于不同的微生物有关表征为受试者提供期望结果。在变型中,作为有监督的机器学习算法,支持向量机(support vectormachine)可以用于生成疗法提供模型。然而,上述任何其他合适的机器学习算法都可以促进疗法提供模型的生成。
附加地或可替代地,疗法模型可关于从被识别为身体健康的受试者群体的受试者评估的“正常”或基线微生物组组成和/或功能特征的识别而衍生。根据表征为身体健康的受试者群体的受试者子集的识别(例如,使用表征过程的特征),在框S140中可以生成朝着身体健康受试者的微生物组组成和/或功能特征调节微生物组组成和/或功能特征的疗法。框S140因此可包括识别一种或多种基线微生物组组成和/或功能特征(例如,针对人口统计学集合的每一个的一个基线微生物组)、以及可使处于生态失调状态的受试者的微生物组朝着所识别的基线微生物组组成和/或功能特征之一转换的潜在治疗剂型和治疗方案。然而,疗法模型可以以任何合适的方式生成和/或完善。
与同疗法模型相关联的益生菌疗法相关联的微生物组成优选包括微生物,该微生物是可培养的(例如,能够被扩展以提供可扩展(scalable)疗法)且非致死性的(例如,在它们期望的治疗剂量中是非致死性的)。此外,微生物组成可包括单一类型微生物,该单一类型微生物对受试者的微生物组具有急性作用或中度作用。附加地或可替代地,微生物组成可以包括多种类型微生物的平衡组合,该多种类型微生物的平衡组合配置为在朝着期望状态驱动受试者微生物组中彼此协作。例如,益生菌疗法中多种类型细菌的组合可以包括第一细菌类型,第一细菌类型生成被第二细菌类型使用的产物,第二细菌类型在积极影响受试者的微生物组中具有强作用。附加地或可替代地,在益生菌疗法中多种类型细菌的组合可以包括产生具有相同功能的蛋白质的几种细菌类型,该具有相同功能的蛋白质积极影响受试者微生物组。
益生菌组成可以天然衍生或合成衍生。例如,在一种应用中,益生菌组成可以天然衍生自(例如,如使用表征过程和疗法模型识别的,具有基线微生物组组成和/或功能特征的一个或多个受试者的)粪便物或其他生物物质。附加地或可替代地,如使用表征过程和治疗模型所识别的,益生菌组成可以基于基线微生物组组成和/或功能特征,来人工合成地衍生(例如,使用台式(benchtop)方法衍生)。在变型中,可用于益生菌疗法的微生物剂可包括以下一种或多种:酵母菌(例如,布拉迪酵母菌(Saccharomyces boulardii))、革兰氏阴性菌(例如,尼斯勒大肠杆菌(E.coli Nissle))、革兰氏阳性菌(例如,重组双歧杆菌(Bifidobacteria bifidum)、婴儿双歧杆菌(Bifidobacteria infantis)、鼠李糖乳杆菌(Lactobacillus rhamnosus)、乳酸乳球菌(Lactococcus lactis)、植物乳杆菌(Lactobacillus plantarum)、嗜酸乳杆菌(Lactobacillus acidophilus)、干酪乳杆菌(Lactobacillus casei)、多发酵芽孢杆菌(Bacillus polyfermenticus)等),以及任何其他合适类型的微生物剂。
在一变型中,疗法可以包括针对一种或多种皮肤有关状况的益生菌疗法(例如,用于改进与一种或多种皮肤有关状况相关联的健康状态;等),其中益生菌疗法可以包括以下任何一项或多项的组合:溃疡棒状杆菌、人费克蓝姆菌、棒状杆菌种、丙酸杆菌MSP09A种、费克蓝姆菌1440-97种、葡萄球菌C9I2种、厌氧球菌9402080种、解葡萄糖苷棒状杆菌、人皮杆菌、乳杆菌BL302种、乳腺炎棒状杆菌、长双歧杆菌、双子厌氧球菌、厌氧球菌S9 PR-16种、蒂莫宁普雷沃菌、乔治亚娜克鲁维菌、不动杆菌WB22-23种、八叠厌氧球菌、芬戈尔德菌S9AA1-5种、葡萄球菌C-D-MA2种、嗜胨菌7-2种、阪崎克罗诺杆菌、厌氧球菌8405254种、韦荣球菌CM60种、乳杆菌7_1_47FAA种、孪生球菌933-88种、卡式卟啉单胞菌、副流感嗜血杆菌、拟杆菌AR20种、普通拟杆菌、拟杆菌D22种、多拉长脂链霉素菌、粪副拟杆菌、拟杆菌AR29种、普雷沃菌WAL 2039G种、普拉栖粪杆菌、粪布劳特菌、腐败另枝菌、产酸拟杆菌、产液阿德勒克罗伊茨菌、琥珀酸考拉杆菌、食葡糖罗斯拜瑞菌、考拉杆菌377种、匹格脱硫弧菌、埃格特菌HGA1种、内脂因子长形乳杆菌、另枝菌HGB5种、丝状霍尔德曼氏菌、肠道柯林斯菌、猕猴奈瑟菌(Neisseria macacae)、血孪生球菌、脆弱拟杆菌、口普雷沃菌、布伦纳假单胞菌、鲸黄杆菌、短波单胞菌FXJ8.080种、普列比乌斯拟杆菌、寒武小弯杆菌、韦克斯勒布劳特菌、葡萄球菌WB18-16种、口腔分类单元链球菌G63种、疮疱丙酸杆菌、厌氧球菌9401487种、表皮葡萄球菌、解脲弯曲杆菌、两面神菌M3-5种、嗜胨菌DNF00840种、芬戈尔德菌S8 F7种、解糖胨普雷沃菌、牙周梭杆菌、弗莱堡棒状杆菌、克里克拉另位球菌、链球菌BS35a种、大芬戈尔德菌、金黄色葡萄球菌、流感嗜血杆菌、棒状杆菌NML 97-0186种、口腔分类单元链球菌G59种、罗斯拜瑞菌11SE39种、光冈链杆菌、产气柯林斯菌、嗜胨菌2002-2300004种、犬棒状杆菌、口颊普雷沃菌、浑浊戴阿利斯特杆菌、粘液奈瑟菌、和/或任何合适的分类群(例如,本文中描述的)和/或噬菌体向量(例如,细菌噬菌体、病毒等)的任何其他合适微生物。在一特定实施例中,益生菌疗法和/或其他合适的益生菌疗法可以以10万至100亿个菌落形成单位(colony-forming unit,CFU)的剂量推广(例如,建议;以其他方式提供;等),如从预测响应于疗法患者微生物组的正向调整的疗法模型中所确定的。在实施例中,可以根据为他/她的以下一项或多项定制的方案指示受试者摄食包含益生菌制剂的胶囊剂:生理学(例如,体重指数、体重、身高)、人口统计学(例如,性别、年龄)、生态失调的严重程度、对药物的敏感性和/或任何其他合适的因素。
在一变型中,对于表现出一种或多种皮肤有关状况的受试者,所述皮肤有关状况包括一种或多种光敏性相关状况、皮肤干燥相关状况、头皮相关状况和/或其他合适的皮肤有关状况,与皮肤有关状况相关的微生物可以基于存在于受试者微生物组中的微生物中相对丰度可识别模式的组成或多样性提供数据集,并且该与皮肤有关状况相关的微生物可以用作使用生物信息学管道(bioinformatics pipelines)和/或以上描述的表征的诊断工具和/或治疗工具。
在另一变型中,微生物数据集(例如,基于存在于受试者微生物组中的微生物中相对丰度可识别模式的组成或多样性)可以用作使用生物信息学管道和以上描述的表征的诊断工具。然而,益生菌疗法和/或其他合适的疗法可以包括与本文中所述的任何合适的分类群相关的微生物的任何合适组合。
益生菌和/或其他合适的消耗品可以以10万至100亿个CFU的剂量(和/或其他合适的剂量)提供,例如从预测响应于疗法的患者微生物组积极调整的疗法模型中所确定的。在一特定实施例中,可以根据为他/她的以下一项或多项定制的方案指示受试者摄入包含益生菌制剂的胶囊:生理学(例如,体重指数、体重、身高)、人口统计学(例如,性别、年龄)、生态失调的严重程度、对药物的敏感性和/或任何其他合适的因素。对于表现出微生物有关状况的受试者,相关联微生物(例如,对应于关联微生物组组成特征)可以基于存在于受试者微生物组中的微生物中相对丰度可识别模式的组成或多样性提供数据集,并且可以用作使用生物信息学管道和以上描述的表征的诊断工具。
4.5处理用户生物样品
方法100可以附加地或可替代地包括框S150,框S150可以包括处理来自用户的一个或多个生物样品(例如,来自用户的不同收集位点的生物样品,等)。框S150可以起到促进受试者的微生物数据集的生成的作用,例如在衍生用于表征过程的输入(例如,用于诸如通过应用一个或多个微生物组表征模块针对用户生成微生物有关表征,等)中使用。这样,框S150可以包括从一个或多个用户接收、处理和/或分析一个或多个生物样品(例如,针对同一用户随时间变化的多个生物样品、针对不同用户的不同生物样品,等)。在框S150中,生物样品优选以非侵入性方式从受试者和/或受试者的环境生成。在变型中,样品接收的非侵入性方式可以使用以下任何一项或多项:可渗透的基底(例如,配置为擦拭受试者的身体区域的拭子(swab)、卫生纸、海绵等)、不可渗透的基底(例如,载玻片(slide)、胶带等)、配置为接收来自受试者身体区域的样品的容器(例如,药瓶、试管、袋子等)、以及任何其他合适的样品接收元件。在一特定实施例中,可以以非侵入性方式(例如,使用拭子和药瓶)从受试者的鼻、皮肤、生殖器、口和肠中的一个或多个收集生物样品。然而,生物样品可以附加地或可替代地以半侵入性方式或侵入性方式接收。在变型中,样品接收的侵入性方式可以使用以下任何一项或多项:针、注射器、活检元件、刺血针、以及用于以半侵入性或侵入性方式收集样品的任何其他合适的仪器。在特定实施例中,样品可以包括血液样品、血浆/血清样品(例如,以能够提取无细胞的DNA)和组织样品。
在以上变型和实施例中,生物样品可以在没有另外实体(例如,与受试者相关的护理员、医疗保健专业人员、自动或半自动样品收集装置等)的促进的情况下取自受试者的身体,或者可替代地可以在另外实体的协助下取自受试者的身体。在一实施例中,其中在样品提取过程中生物样品在没有其他实体的促进的情况下取自受试者,样品提供试剂盒可以提供给受试者。在该实施例中,试剂盒可包括用于样品获取的一个或多个拭子、配置为接收拭子以用于储存的一个或多个容器、样品提供和用户账户设置的说明、配置为将样品与受试者关联的元件(例如,条形码标识符、标签等)、和允许来自受试者的样品(例如,通过邮件递送系统)递送到样品处理操作的接收器(receptacle)。在另一实施例中,其中生物样品在另外实体的帮助下从受试者提取,一个或多个样品可以在临床或研究背景中从受试者收集(例如,在临床任命期间)。然而,生物样品可以以任何其他合适的方式从受试者接收。
此外,处理和分析来自受试者的生物样品(例如,用以生成用户微生物数据集等)优选以与上面关于框S110描述的样品接收的实施方案、变型和/或实施例之一、和/或方法100的任何其他合适部分相似的方式执行。这样,可以针对受试者,使用与用于接收和处理生物样品的过程相类似的过程执行框S150中生物样品的接收和处理,那些用于接收和处理生物样品的过程用于生成方法100的表征过程和/或疗法模型,以便提供过程的一致性。然而,框S150中的生物样品接收和处理可以可替代地以任何其他合适的方式执行。
4.6确定微生物有关特征
方法100可以附加地或可替代地包括框S160,框S160可以包括:诸如基于处理衍生自用户的生物样品的一个或多个微生物数据集(例如,用户微生物序列数据集、微生物组组成数据集、微生物组功能多样性数据集;为提取微生物组特征的微生物数据集的处理;等),利用表征过程针对用户确定微生物有关表征。框S160可以起到针对用户表征一种或多种微生物有关状况的作用,诸如通过从受试者的微生物组衍生数据提取特征、并将特征用作以上在框S130中描述的表征过程的实施方案、变型或实施例中的输入(例如,将用户微生物组特征值用作微生物组有关状况表征模型中的输入,等)。在一实施例中,框S160可以包括基于用户微生物组特征和微生物有关状况表征模型针对用户生成微生物有关表征(例如,在框S130中生成的)。微生物有关表征可以针对任何数量和/或其组合的微生物有关状况(例如,微生物有关状况的组合、单一微生物有关状况和/或其他合适的微生物有关状况等)。微生物有关表征可包括以下一项或多项:诊断(例如,微生物有关状况的存在与否;等);风险(例如,微生物有关状况的发展和/或存在的风险分值;关于微生物有关表征的信息(例如,症状、体征、触发因素、相关联状况等);比较(例如,与其他亚组、群体、用户、诸如历史微生物组组成和/或功能多样性的用户历史健康状态的比较;与微生物有关状况相关联的比较;等),和/或任何其他合适的数据。
在另一变型中,微生物有关表征可以包括与微生物组多样性分值相关联(例如,与其相关;与其负相关;与其正相关;等)的微生物组多样性分值(例如,关于微生物组组成、功能等),该微生物组多样性分值与一种或多种微生物有关状况相关。在实施例中,微生物有关表征可以包括随时间推移的微生物组多样性分值(例如,针对随时间推移收集的用户的多个生物样品计算的)、与其他用户的微生物组多样性分值的比较、和/或任何其他合适类型的微生物组多样性分值(例如,确定微生物组多样性分值;使用微生物组多样性分值以确定和/或提供疗法;等)可以以任何合适的方式执行。
框S160中的确定微生物有关表征优选包括识别与受试者的微生物组组成和/或功能特征相关联的特征和/或特征的组合、将特征输入表征过程、以及接收将受试者表征为属于以下一项或多项的输出:行为组、性别组、饮食组、疾病状态组以及能够通过表征过程识别的任何其他合适组。框S160可以附加地或可替代地包括与受试者的表征相关联的置信指标的生成和/或输出。例如,置信指标可以衍生自:用于生成表征的特征的数量、用于生成表征的特征的相对权重或排名、表征过程中的偏差测量和/或与表征过程的方面相关联的任何其他合适的参数。然而,利用用户微生物组特征可以以任何合适的方式来执行,以生成任何合适的微生物有关表征。
在一些变型中,可以用补充特征对从受试者的微生物数据集提取的特征进行补充(例如,从针对用户收集的补充数据中提取的;诸如调查衍生特征、病史衍生特征、传感器数据等),其中这些数据、用户微生物组数据和/或其他合适的数据可用于进一步完善框S130、框S160和/或方法100的其他合适部分的表征过程。
确定微生物有关表征优选地包括诸如通过采用框S130中描述的方法、和/或通过采用本文中描述的任何合适的方法,提取和应用针对用户(例如,基于用户微生物数据集)的微生物组特征(例如,用户微生物组组成多样性特征;用户微生物组功能多样性特征;等)、表征模型、和/或其他合适组件。
在变型中,如图6所示,框S160可以包括例如在Web界面、移动应用程序和/或任何其他合适的界面处呈现微生物有关表征(例如,从表征中提取的信息等),但是信息的呈现可以以任何合适的方式执行。然而,受试者的微生物数据集可以附加地或可替代地以任何其他合适的方式使用,以增强方法100的模型,并且框S160可以以任何合适的方式执行。
4.7促进治疗干预
如图9所示,方法100可以附加地或可替代地包括框S170,框S170可以包括(例如,基于微生物有关表征和/或疗法模型)促进针对一个或多个用户的一种或多种微生物有关状况的治疗干预(例如,推广疗法、提供疗法、促进疗法的提供等)。框S170可以起到针对用户推荐、推广、提供和/或以其他方式促进关于一种或多种疗法的治疗干预的作用,例如使用户的微生物组组成和/或功能多样性朝着关于期望的一种或多种微生物有关状况的平衡状态转变(和/或以其他方式改进微生物有关状况的状态等)。框S170可以包括根据受试者的微生物组组成和功能特征向其提供定制疗法,其中定制疗法可以包括微生物配方,该微生物制剂配置为校正具有所识别表征的受试者的生态失调特性。这样,基于训练的疗法模型,框S140的输出可用于直接向受试者推广定制的疗法配方和方案(例如,剂量、使用说明)。附加地或可替代地,疗法提供可以包括推荐可用治疗措施,该可用治疗措施配置为使微生物组组成和/或功能特征朝着期望状态转变。在变型中,疗法可包括以下任何一项或多项:消耗品、局部疗法(例如,洗剂、膏剂、防腐剂等)、药物(例如,与任何合适的药物类型和/或剂量相关联的药物等)、噬菌体、环境治疗、行为改变(例如,饮食改变疗法、压力减轻疗法、身体活动有关疗法等)、诊断程序、其他医学有关程序和/或与微生物有关状况相关联的任何其他合适的疗法。消耗品可包括以下任何一种或多种:食品和/或饮品(例如,益生菌和/或益生元食品和/或饮品类等)、营养补充剂(例如,维生素、矿物质、纤维、脂肪酸、氨基酸、益生元、益生菌等)、消耗性药物和/或任何其他合适的治疗措施。
例如,根据疗法模型的输出,商业可获得的益生菌补充剂的组合可以包括针对受试者的适合的益生菌疗法。在另一实施例中,方法100可以包括基于微生物有关状况模型(例如,和/或用户微生物组特征)针对微生物有关状况确定针对用户的微生物有关状况的风险;以及基于微生物有关状况的风险向用户推广疗法。
在一变型中,推广疗法可以包括推广诊断程序(例如,用于促进诸如人类行为状况和/或疾病有关状况的微生物有关状况的检测,其可刺激其他疗法的后续推广,诸如用于调节用户微生物组以改进与一种或多种微生物有关状况相关联的用户健康状态;等)。诊断程序可以包括以下任何一项或多项:病史分析、影像学检查、细胞培养测试、抗体测试、皮肤点刺测试、斑贴测试、血液测试、挑战测试、执行方法100的部分、和/或用于促进微生物有关状况的检测(例如,观察、预测等)的任何其他合适程序。附加地或可替代地,诊断设备有关信息和/或其他合适的诊断信息可以处理为补充数据集的一部分(例如,关于框S120,其中这样的数据可以在确定和/或应用表征模型、疗法模型、和/或其他合适的模型中使用;等),和/或关于方法100的任何合适部分收集、使用和/或以其他方式处理(例如,针对用户施用诊断程序以监测关于框S180的疗法功效等)。
在另一变型中,框S170可以包括推广基于细菌噬菌体(bacteriophage-based)的疗法。更详细地,特异于受试者中代表的某些细菌(或其他微生物)特异的细菌噬菌体的一个或多个群体(例如,以菌落形成单位表示),可用于下调或以其他方式消除某些细菌的群体。这样,基于细菌噬菌体的疗法可用于减少受试者中代表的细菌的不期望群体的大小。作为补充,基于细菌噬菌体的疗法可用于增加未被所用细菌噬菌体靶向的细菌群体的相对丰度。
在另一变型中,框S170中的疗法提供可以包括向受试者提供关于推荐的疗法、其他形式的疗法、微生物有关表征和/或其他合适的数据的通知。在特定实施例中,向用户提供疗法可以包括:诸如通过在Web界面上显示通知(例如,通过与用户相关联并识别用户的用户帐户;等),(例如,与针对用户提供衍生自微生物有关表征的信息基本同时地,等)提供疗法推荐和/或其他合适的疗法有关信息(例如,疗效;与其他个人用户、用户亚组、和/或用户群体的比较;疗法比较;历史疗法和/或相关联疗法有关信息;诸如用于认知行为疗法的心理疗法指南;等)。可以通过执行应用程序、web界面和/或配置为通知提供的消息客户端的电子设备(例如,个人计算机,移动设备,平板电脑,可穿戴式、头戴式可穿戴计算设备,腕式可穿戴式计算设备等)向受试者提供通知。在一实施例中,与受试者相关联的个人计算机或便携式计算机的网络界面可以通过受试者提供对该受试者的用户帐户的访问,其中用户帐户包括关于用户的微生物有关状况、用户微生物组方面的具体表征(例如,关于与微生物有关状况的相关性;等)的信息,和/或关于(例如,在框S140和/或S170中生成的)建议的治疗措施的通知。在另一实施例中,在个人电子设备(例如,智能电话、智能手表、头戴式智能设备)中执行的应用程序可以配置为(例如,在显示器、触觉上(haptically)、以听觉方式等)提供关于由框S170的疗法模型生成的疗法建议的通知。附加地或可替代地,可以直接通过与受试者相关联的实体(例如,看护人、配偶、重要的其他人、医疗保健专业人员等)提供通知和/或益生菌疗法。在一些其他变型中,通知可以附加地或可替代地提供给与受试者相关联的实体(例如,医疗保健专业人员等),诸如其中该实体能够促进疗法的提供(例如,借助于处方、借助于通过使用计算设备的光学和/或声音传感器的数字远程医疗会议来指导治疗会议,等)。然而,推广通知和/或其他合适的疗法可以以任何合适的方式执行。
4.8监测疗法效果
如图7所示,该方法可以附加地或可替代地包括框S180,其列举了:基于处理生物样品,监测疗法对受试者的有效性,以针对用户评估在与益生菌疗法相关联的时间点集合处的微生物组组成和/或功能特征。框S180可以起到聚集附加数据的作用,该附加数据作用关于由给定表征的受试者疗法模型所建议的益生菌疗法的正作用、负作用和/或有效性缺乏。因此,在通过疗法模型(例如,通过在整个治疗中接收和分析来自受试者的生物样品,通过在整个治疗中接收来自受试者的调查衍生数据)推广的治疗进程期间,受试者的监测可以用于针对由框S130的表征过程提供的各表征、以及框S140和S170中提供的各推荐治疗措施,生成疗法有效性模型。
在框S180中,可以提示受试者在合并了疗法的治疗方案的一个或多个关键时间点时提供附加的生物样品,并且可以(例如,以与关于框S120描述的方式相似的方式)处理和分析该附加的生物样品以生成表征受试者的微生物组组成和/或功能特征的调节的指标。例如,与以下一项或多项有关的指标和/或任何合适的指标可以用于评估来自微生物组组成和/或功能特征的变化的疗法有效性:早期时间点时受试者微生物组中代表的一个或多个分类组的相对丰度变化,代表受试者的微生物组的特定分类组的变化,受试者微生物组的第一分类组细菌的丰度和第二分类组细菌的丰度之间的比例,受试者微生物组中的一种或多种功能家族的相对丰度变化。附加地或可替代地,来自受试者的、属于受试者在治疗时的经历(例如,经历的副作用、改进的个人评估、行为改变、症状改进等)的调查衍生数据可以用于确定框S180中疗法的有效性。例如,方法100可以包括:接收来自用户的治疗后生物样品;收集来自用户的补充数据集,其中补充数据集描述用户对疗法(例如,确定的和推广的疗法)的依从性和/或其他合适的用户特征(例如,行为、状况等);基于微生物有关状况表征模型和治疗后生物样品,生成关于微生物有关状况的第一用户的治疗后微生物有关表征;以及基于治疗后微生物有关表征(例如,基于治疗后微生物有关表征与治疗前微生物有关表征之间的比较;等)和/或用户对疗法的依从性(例如,基于用户微生物组关于微生物有关状况的积极或消极结果改变疗法;等),针对微生物有关状况向用户推广更新疗法。附加地或可替代地,其他合适的数据(例如,描述与人类行为状况相关的用户行为的补充数据;描述诸如观察到的症状的疾病有关状况的补充数据;等)可以在确定治疗后表征(例如,关于微生物有关状况的治疗前到治疗后的变化程度等)、更新的疗法(例如,基于有效性和/或对所推广的疗法的依从性确定更新的疗法等)中使用。疗法有效性、附加生物样品的处理(例如,用以确定附加的微生物有关表征、疗法等)和/或与关于微生物有关状况的连续的生物样品收集、处理和分析相关联的其他合适方面,可以以任何合适的时间和频率执行,以生成、更新和/或以其他方式处理模型(例如,表征模型、疗法模型等)、和/或用于任何其他合适的目的(例如,作为与方法100的其他部分相关联的输入)。然而,框S180可以以任何合适的方式执行。
然而,方法100可以包括任何其他合适的框或步骤,其被配置为促进来自受试者的生物样品的接收、来自受试者的生物样品的处理、分析衍生自生物样品的数据以及生成模型,该模型可用于根据受试者的特定微生物组组成和/或功能特征提供定制诊断和/或基于益生菌的疗法。
系统和/或方法的实施方案可以包括各种系统组件和各种方法过程的每种组合和置换(permutation),各种系统组件和各种方法过程包括任何变型、实施例和特定实施例,其中本文中描述的方法和/或过程可以通过和/或使用本文中描述的系统、元件和/或实体的一个或多个实例,异步(例如,依序)、同时(例如,平行)、或以任何其他合适的顺序执行。
本文中描述的变型中的任何一种(例如,实施方案、变型、实施例、特定实施例、图示等)和/或本文中描述的变型的任何部分可以附加地或可替代地组合、排除和/或以其他方式应用。
该系统和方法及其实施方案可以至少部分地体现和/或实施为配置成接收存储计算机可读指令的计算机可读介质的机器。指令优选地通过计算机可执行组件来执行,该计算机可执行组件优选与系统整合。计算机可读介质可以存储在任何合适的计算机可读介质上,例如RAM、ROM、闪存、电可擦除只读存储器(EEPROM)、光学设备(CD或DVD)、硬盘驱动器、软盘驱动器或任何合适的设备。该计算机可执行组件优选是通用或专用处理器,但是任何合适的专用硬件或硬件/固件组合设备可以可替代地或附加地执行指令。
如本领域技术人员将从先前的详细描述以及从附图和权利要求书中认识到的,可以在不脱离所附权利要求中限定的范围的情况下对实施方案进行修改和改变。
表1.
表2.
表3
表4
表5
表6
表7
表8
表9
表10
表11
表12
表13
表14
表15
表16
表17
表18
表19
表20
表21
表22
表23
分类群ID 分类名称
544 柠檬酸杆菌属
817 脆弱拟杆菌
872 脱硫弧菌属
901 匹格脱硫弧菌
28118 内脏臭气杆菌
28221 δ-变形菌纲
35832 嗜胆菌
35833 沃氏嗜胆菌
47678 粪拟杆菌
100883 粪杆菌属
194924 脱硫弧菌科
213115 脱硫弧菌目
216572 颤螺菌科
283168 臭气杆菌属
292800 普氏梭杆菌
310298 粪拟杆菌
408103 柠檬酸杆菌BW4种
447027 另枝菌EBA6-25cl2种
556262 粪杆菌D6种
650643 另枝菌RMA 9912种
693988 嗜胆菌4_1_30种
946234 弗雷范尔特菌属
表24
表25
表26
表27
症状
表28
乳糜泻 麸质不耐受 小麦过敏
乳糜泻 1827
麸质不耐受 1796 1818
小麦过敏 751 740 905
表29
乳制品过敏 乳糖不耐受
乳制品过敏 415
乳糖不耐受
表30
表31
状况数 女性% 男性%
0 xx Xx
1 27.3 24.7
2 22.3 16.8
3 17.2 9.9
4 11.9 5.0
5 7.9 3.6
6 4.6 1.5
7 3.4 1.2
8+ 4.3 1.2

Claims (15)

1.一种用于微生物有关状况的表征的系统,所述系统包括:
样品处理系统,其包括测序系统,所述测序系统可操作以基于与受试者集合相关联的样品、来确定微生物遗传序列,其中所述样品包含与所述微生物有关状况相关的微生物核酸,所述微生物核酸来自从多个收集位点收集的位点多样性样品,所述收集位点包括肠、生殖器、口、皮肤和鼻的至少两个;
微生物组表征模块集合,其可操作以应用分析技术集合,所述分析技术集合包括统计检验、降维技术和人工智能方法的至少两项,并且其中所述微生物组表征模块集合包括:
第一微生物组表征模块,其可操作以应用所述分析技术集合的第一分析技术、来基于所述微生物遗传序列确定微生物组特征集合,其中所述微生物组特征集合与所述微生物有关状况相关联;和
第二微生物组表征模块,其可操作以应用所述分析技术集合中的第二分析技术、来基于所述微生物组特征集合确定处理的微生物组特征集合,其中所述处理的微生物组特征集合适于改进所述微生物有关状况的表征;以及
微生物有关状况模型,其基于所述处理的微生物组特征集合而生成,其中所述微生物有关状况模型可操作以针对用户确定所述微生物有关状况的表征,所述表征包括基于所述位点多样性样品集合和所述微生物有关状况模型的位点方面的疾病倾向性指标集合,其中所述位点方面的疾病倾向性指标集合中的各位点方面的疾病倾向性指标,对应于所述多个收集位点的不同收集位点,并且与所述微生物有关状况相关联。
2.根据权利要求1所述的系统,其中所述第一分析技术包括统计检验,所述统计检验包括t检验、柯尔莫哥洛夫-斯米尔诺夫检验和回归模型的至少一种,并且其中所述第一微生物组表征模块可操作以应用所述统计检验来基于所述微生物遗传序列确定所述微生物组特征集合。
3.根据权利要求1和2中任一项所述的系统,
其中所述第一微生物组表征模块可操作以应用所述统计检验、来基于所述位点多样性样品确定所述微生物组特征集合的第一微生物组特征子集,其中来自所述第一微生物组特征子集的各微生物组特征子集对应于来自所述多个收集位点的不同收集位点,
其中所述第二微生物组表征模块为可操作的以应用附加的统计检验、来基于所述位点多样性样品确定所述微生物组特征集合的第二微生物组特征子集,并且
其中基于所述第一微生物组特征子集和所述第二微生物组特征子集,生成所述微生物有关状况模型。
4.根据权利要求1和2中任一项所述的系统,其中所述第二微生物组表征模块可操作以应用所述第二分析技术,来执行特征选择、特征加权和热启动的至少一项,用以将所述微生物组特征集合处理为所述处理的微生物组特征集合。
5.根据权利要求1所述的系统,其中所述微生物有关状况模型包括基于所述处理的微生物组特征集合生成的皮肤有关表征模型,其中所述皮肤有关特征模型可操作以针对所述用户确定光敏性相关状况的所述表征,并且其中所述微生物组特征集合包括与以下至少一项相关的特征:拟普雷沃菌属(属)、普雷沃菌WAL 2039G种(种)、乳腺炎棒状杆菌(种)、拟杆菌科(科)、布劳特菌属(属)、拟杆菌属(属)、脱硫弧菌属(属)、梭菌属(属)、普通拟杆菌(种)、普拉栖粪杆菌(种)、粪布劳特菌(种)、腐败另枝菌(种)、拟杆菌AR20种(种)、拟杆菌AR29种(种)、产酸拟杆菌(种)、迪尔玛菌属(属)、斯莱克菌属(属)、埃格特菌属(属)、阿德勒克罗伊茨菌属(属)、副普雷沃菌属(属)、另枝菌属(属)、霍尔德曼氏菌属(属)、艾森伯格氏菌属(属)、肠杆菌属(属)、产液阿德勒克罗伊茨菌(种)、琥珀酸考拉杆菌(种)、食葡糖罗斯拜瑞菌(种)、考拉杆菌377种(种)、匹格脱硫弧菌(种)、埃格特菌HGA1种(种)、内脂因子长形产乳杆菌种(种)、另枝菌HGB5种(种)、丝状霍尔德曼氏菌(种)、肠道柯林斯菌(种)、猕猴奈瑟菌(种)、梭菌科(科)、血孪生球菌(种)、脆弱拟杆菌(种)、肠杆菌科(科)、毛螺菌科(科)、巴斯德菌科(科)、巴斯德菌目(目)、肠杆菌目(目)、鞘氨醇杆菌目(目)、嗜血杆菌属(属)、明串珠菌属(属)、短波单胞菌属(属)、口普雷沃菌(种)、臭气杆菌属(属)、二氧化碳嗜纤维菌属(属)、黄杆菌属(属)、布伦纳假单胞菌(种)、鲸黄杆菌(种)、短波单胞菌FXJ8.080种(种)、瘤胃球菌科(科)、弧菌科(科)、黄杆菌科(科)、梭杆菌科(科)、紫单胞菌科(科)、短杆菌科(科)、红杆菌科(科)、间孢囊菌科(科)、双歧杆菌科(科)、鞘氨醇杆菌科(科)、柄杆菌科(科)、弯曲杆菌科(科)、拟杆菌纲(纲)、梭杆菌纲(纲)、黄杆菌纲(纲)、双歧杆菌目(目)、奈瑟菌目(目)、拟杆菌目(目)、红杆菌目(目)、黄杆菌目(目)、弧菌目(目)、梭杆菌目(目)、柄杆菌目(目)、梭杆菌门(门)、放线棒菌属(属)、小弯杆菌属(属)、镰刀链杆菌属(属)、短杆菌属(属)、粪杆菌属(属)、弯曲杆菌属(属)、放线杆菌属(属)、卟啉单胞菌(属)、梭杆菌属(属)、金黄杆菌属(属)、巨球菌属(属)、罗氏菌属(属)、奈瑟菌属(属)、乳杆菌BL302种(种)、普列比乌斯拟杆菌(种)、溃疡棒状杆菌(种)、寒武小弯杆菌(种)、韦克斯勒布劳特菌(种)、葡萄球菌WB18-16种(种)、口腔分类单元链球菌G63种(种)、疮疱丙酸杆菌(种)、厌氧球菌9401487种(种)、副流感嗜血杆菌(种)、表皮葡萄球菌(种)、解脲弯曲杆菌(种)、两面神菌M3-5种(种)、蒂莫宁普雷沃菌(种)、嗜胨菌NF00840种(种)、芬戈尔德菌S8 F7种(种)、解糖胨普雷沃菌(种)、卡式卟啉单胞菌(种)、牙周梭杆菌(种)、传染性疾病KEGG2、表征欠佳KEGG2、代谢疾病KEGG2、免疫系统疾病KEGG2、细胞过程和信号传导KEGG2、限制性内切酶KEGG3、核苷酸切除修复KEGG3,或者
其中所述微生物有关状况模型包括基于所述处理的微生物组特征集合生成的皮肤有关表征模型,其中所述皮肤有关表征模型可操作以针对所述用户确定皮肤干燥相关联状况的表征,并且其中所述微生物组特征集合包括与以下至少一项相关的特征:棒状杆菌科(科)、芽孢杆菌纲(纲)、乳杆菌目(目)、放线菌目(目)、厚壁菌门(门)、棒状杆菌属(属)、皮杆菌科(科)、乳杆菌科(科)、丙酸杆菌科(科)、放线菌纲(纲)、皮杆菌属(属)、戴阿利斯特杆菌属(属)、费克蓝姆菌属(属)、乳杆菌(属)、丙酸杆菌(属)、溃疡棒状杆菌(种)、人费克蓝姆菌(种)、棒状杆菌种(种)、丙酸杆菌MSP09A种(种)、费克蓝姆菌1440-97种(种)、葡萄球菌C9I2种(种)、厌氧球菌9402080种(种)、解葡萄糖苷棒状杆菌(种)、人皮杆菌(种)、肠杆菌科(科)、假单胞菌科(科)、葡萄球菌科(科)、γ-变形菌纲(纲)、芽孢杆菌目(目)、肠杆菌目(目)、双歧杆菌属(属)、假单胞菌属(属)、厌氧球菌属(属)、克鲁瓦菌属(属)、阿托波菌属(属)、葡萄球菌属(属)、乳杆菌BL302种(种)、乳腺炎棒状杆菌(种)、长双歧杆菌(种)、双子厌氧球菌种(种)、厌氧球菌S9 PR-16种(种)、蒂莫宁普雷沃菌(种)、乔治亚娜克鲁维菌(种)、放线棒菌属(属)、芬戈尔德菌(属)、克罗诺杆菌属(属)、不动杆菌B22-23种(种)、八叠厌氧球菌(种)、芬戈尔德菌S9 AA1-5种(种)、葡萄球菌C-D-MA2种(种)、嗜胨菌7-2种(种)、阪崎克罗诺杆菌(种)、巴斯德菌科(科)、酸杆菌纲(纲)、鞘氨醇杆菌纲(纲)、鞘氨醇杆菌目(目)、酸杆菌门(门)、卟啉单胞菌(属)、嗜血杆菌属(属)、不动杆菌属(属)、厌氧球菌8405254种(种)、鞘氨醇单胞菌科(科)、鞘氨醇单胞菌目(目)、库克菌属(属)、孪生球菌属(属)、韦荣球菌CM60种(种)、乳杆菌7_1_47FAA种(种)、孪生球菌933-88种(种)、卡式卟啉单胞菌(种)、副流感嗜血杆菌(种)、拟杆菌AR20种(种)、普通拟杆菌(种)、拟杆菌D22种(种)、多拉长脂链霉素菌(种)、粪副拟杆菌(种)、拟杆菌AR29种(种)、多拉菌属(属)、柯林斯菌属(属)、拟杆菌属(属)、颤螺菌科(科)、瘤胃球菌科(科)、拟杆菌科(科)、疣微菌科(科)、红蝽菌科(科)、梭菌目(目)、拟杆菌目(目)、疣微菌目(目)、红蝽菌目(目)、高温厌氧菌目(目)、梭菌纲(纲)、拟杆菌纲(纲)、疣微菌纲(纲)、疣微菌门(门)、拟杆菌门(门)、转录KEGG2、细胞过程和信号传导KEGG2、氨基酸代谢KEGG2、细胞生长和死亡KEGG2、复制和修复KEGG2、其他氨基酸的代谢KEGG2、神经退行性疾病KEGG2、辅助因子和维生素的代谢KEGG2、运输和分解代谢KEGG2、内分泌系统KEGG2、免疫系统疾病KEGG2、排泄系统KEGG2、酶家族KEGG2、膜运输KEGG2、碳水化合物代谢KEGG2、其他次生代谢产物的生物合成KEGG2、萜类化合物和聚酮化合物的代谢KEGG2、传染性疾病KEGG2、遗传信息处理KEGG2、神经系统KEGG2、环境适应KEGG2、核苷酸代谢KEGG2、信号分子与相互作用KEGG2、信号转导KEGG2、无机离子的运输与代谢KEGG3、染色体KEGG3、细胞循环–柄杆菌属KEGG3、核糖体生物发生KEGG3、DNA复制蛋白KEGG3、转录因子KEGG3、甘氨酸、丝氨酸和苏氨酸代谢KEGG3、硫代谢KEGG3、其他离子耦合的转运蛋白KEGG3、缬氨酸、亮氨酸和异亮氨酸的生物合成KEGG3、氮代谢KEGG3、肽聚糖的生物合成KEGG3、同源重组KEGG3、过氧化物酶体KEGG3、硫中继系统KEGG3、肽酶KEGG3、蛋白激酶KEGG3、错配修复KEGG3、二甲苯降解KEGG3、核糖体KEGG3、RNA聚合酶KEGG3、色氨酸代谢KEGG3、组氨酸代谢KEGG3、维生素代谢KEGG3、细胞运动和分泌KEGG3、嘧啶代谢KEGG3、细胞骨架蛋白KEGG3、DNA复制KEGG3、氨基糖和核苷酸糖代谢KEGG3、叶酸生物合成KEGG3、光合生物中的碳固定KEGG3、磷脂酰肌醇信号传导系统KEGG3、赖氨酸降解KEGG3、硒化合物代谢KEGG3、果糖和甘露糖代谢KEGG3、肌醇磷酸代谢KEGG3、蛋白质折叠和相关处理KEGG3、PPAR信号传导途径KEGG3、脂质代谢KEGG3、缬氨酸、亮氨酸和异亮氨酸降解KEGG3、乙醛酸和二羧酸代谢KEGG3、精氨酸和脯氨酸代谢KEGG3、柠檬烯和蒎烯降解KEGG3、D-丙氨酸代谢KEGG3、卟啉和叶绿素代谢KEGG3、C5-支链二元酸代谢KEGG3、分子伴侣和折叠催化物KEGG3、脂肪酸代谢KEGG3、谷胱甘肽代谢KEGG3、磷酸戊糖途径KEGG3、磷酸转移酶系统KEGG3、泛酸和CoA生物合成KEGG3、近端小管碳酸氢盐回收KEGG3、半乳糖代谢KEGG3、淀粉和蔗糖代谢KEGG3、原发性免疫缺陷KEGG3、半胱氨酸和甲硫氨酸代谢KEGG3、泛醌和其他萜类醌生物合成KEGG3、DNA修复和重组蛋白KEGG3、酪氨酸代谢KEGG3、苯丙氨酸、酪氨酸和色氨酸生物合成KEGG3、氨酰-tRNA生物合成KEGG3、丙氨酸、天冬氨酸和谷氨酸代谢KEGG3、光合作用KEGG3、其他转运蛋白KEGG3、丁酸酯代谢KEGG3、细菌分泌系统KEGG3、甘油磷脂代谢KEGG3、氧化磷酸化KEGG3、I型糖尿病KEGG3、糖酵解/糖异生KEGG3、光合作用蛋白KEGG3、转运蛋白KEGG3、萜类骨架生物合成KEGG3、不饱和脂肪酸的生物合成KEGG3、信号转导机制KEGG3、酮体的合成和降解KEGG3、核苷酸切除修复KEGG3、分泌系统KEGG3、阿尔茨海默病KEGG3、玉米素生物合成KEGG3、II型糖尿病KEGG3、D-谷氨酰胺和D-谷氨酸代谢KEGG3、牛磺酸和亚牛磺酸代谢KEGG3、谷氨酸能突触KEGG3、植物-病原体相互作用KEGG3、维生素B6代谢KEGG3、柠檬酸循环KEGG3、乙苯降解KEGG3、碱基切除修复KEGG3、复制、重组和修复蛋白KEGG3、真核生物的核糖体生物发生KEGG3、氨基苯甲酸酯降解KEGG3、细菌运动蛋白KEGG3、安莎霉素类的生物合成KEGG3、离子通道KEGG3、代谢KEGG2、表征欠佳KEGG2、次生代谢物的生物合成和生物降解KEGG3、硫辛酸代谢KEGG3、氨基酸有关酶KEGG3、转录蛋白KEGG3、抗坏血酸盐和藻酸盐代谢KEGG3、硫胺素代谢KEGG3、功能未知KEGG3、糖胺聚糖降解KEGG3、其他KEGG3、戊糖和葡萄糖醛酸酯相互转化KEGG3、生物素代谢KEGG3、苯丙氨酸代谢KEGG3、糖鞘脂生物合成-神经节系列KEGG3、毛孔离子通道KEGG3、膜和细胞内结构分子KEGG3、嘌呤代谢KEGG3、通过叶酸一碳库KEGG3、磷酸酯和次磷酸酯代谢KEGG3、溶酶体KEGG3、药物代谢-其他酶KEGG3、青霉素和头孢菌素生物合成KEGG3、亨廷顿病KEGG3、烟酸盐和烟酰胺代谢KEGG3、药物代谢-细胞色素P450 KEGG3、脂多糖生物合成蛋白KEGG3、通过细胞色素P450的外源性物质代谢KEGG3、结核病KEGG3、多环芳烃降解KEGG3,或者
其中所述微生物有关状况模型包括基于所述处理的微生物组特征集合生成的皮肤有关表征模型,其中所述皮肤有关表征模型可操作以针对所述用户确定头皮有关状况的表征,并且其中所述微生物组特征集合包括与以下至少一项相关联的特征:放线菌纲(纲)、乳杆菌目(目)、放线菌目(目)、厚壁菌门(门)、皮杆菌科(科)、乳杆菌科(科)、丙酸杆菌科(科)、棒状杆菌科(科)、乳杆菌(属)、棒状杆菌属(属)、丙酸杆菌(属)、皮杆菌属(属)、另位球菌属(属)、弗莱堡棒状杆菌(种)、克里克拉另位球菌属KEGG3(种)、棒状杆菌种(种)、葡萄球菌C9I2种(种)、厌氧球菌8405254种(种)、解葡萄糖苷棒状杆菌(种)、人皮杆菌(种)、红蝽菌科(科)、肠杆菌科(科)、葡萄球菌科(科)、肠杆菌目(目)、芽孢杆菌目(目)、双歧杆菌属(属)、葡萄球菌属(属)、阿托波菌属(属)、巨球菌(属)、乳腺炎棒状杆菌(种)、链球菌BS35a种(种)、大芬戈尔德菌(种)、金黄色葡萄球菌(种)、流感嗜血杆菌(种)、棒状杆菌NML 97-0186种(种)、口腔分类单元链球菌G59种(种)、多拉菌属(属)、罗斯拜瑞菌11SE39种(种)、多拉长脂链霉素菌(种)、普雷沃菌科(科)、韦荣球菌科(科)、颤螺菌科(科)、革兰氏阴性菌纲、硒单胞菌目(目)、芬戈尔德菌(属)、颤螺菌属(属)、肠道单胞菌属(属)、弗雷范尔特菌属(属)、普雷沃菌属(属)、莫亚拉菌属(属)、光冈链杆菌(种)、产气柯林斯菌(种)、嗜胨菌2002-2300004种(种)、犬棒状杆菌(种)、芬戈尔德菌S9 AA1-5种(种)、口颊普雷沃菌(种)、浑浊戴阿利斯特杆菌(种)、莫拉菌属(属)、奈瑟菌属(属)、粘液奈瑟菌(种)、理研菌科(科)、辅助因子和维生素的代谢KEGG2、酶家族KEGG2、脂质代谢KEGG2、免疫系统疾病KEGG2、糖酵解/糖异生KEGG3、原发性免疫缺陷KEGG3、丙酮酸盐代谢KEGG3、运输和分解代谢KEGG2、神经退行性疾病KEGG2、内分泌系统KEGG2、氨基酸代谢KEGG2、细胞过程和信号传导KEGG2、信号分子与相互作用KEGG2、其他氨基酸的代谢KEGG2、复制和修复KEGG2、转录KEGG2、细胞生长和死亡KEGG2、膜运输KEGG2、其他次生代谢产物的生物合成KEGG2、萜类化合物和聚酮化合物的代谢KEGG2、无机离子的运输与代谢KEGG3、维生素代谢KEGG3、缬氨酸、亮氨酸和异亮氨酸的生物合成KEGG3、过氧化物酶体KEGG3、核糖体生物发生KEGG3、硒化合物代谢KEGG3、组氨酸代谢KEGG3、染色体KEGG3、硫代谢KEGG3、PPAR信号传导通路KEGG3、卟啉和叶绿素代谢KEGG3、磷脂酰肌醇信号传导系统KEGG3、肌醇磷酸代谢KEGG3、硫中继系统KEGG3、甘氨酸、丝氨酸和苏氨酸代谢KEGG3、DNA复制蛋白KEGG3、泛酸和CoA生物合成KEGG3、转录因子KEGG3、蛋白质折叠和相关处理KEGG3、II型糖尿病KEGG3、蛋白激酶KEGG3、叶酸生物合成KEGG3、赖氨酸降解KEGG3、RNA聚合酶KEGG3、D-丙氨酸代谢KEGG3、光合生物中的碳固定KEGG3、氮代谢KEGG3、甘油磷脂代谢KEGG3、安莎霉素类的生物合成KEGG3、缬氨酸、亮氨酸和异亮氨酸降解KEGG3、细胞骨架蛋白KEGG3、肽酶KEGG3、脂肪酸代谢KEGG3、细胞循环-柄杆菌属KEGG3、磷酸转移酶系统KEGG3、嘧啶代谢KEGG3、阿尔茨海默病KEGG3、丁酸酯代谢KEGG3、色氨酸代谢KEGG3、信号转导机制KEGG3、磷酸戊糖途径KEGG3、其他离子耦合的转运蛋白KEGG3、同源重组KEGG3、复制、重组和修复蛋白KEGG3、二甲苯降解KEGG3、错配修复KEGG3、乙醛酸和二羧酸代谢KEGG3、精氨酸和脯氨酸代谢KEGG3、肽聚糖的生物合成KEGG3、分子伴侣和折叠催化物KEGG3、I型糖尿病KEGG3、DNA复制KEGG3、细菌分泌系统KEGG3、酪氨酸代谢KEGG3、柠檬酸循环KEGG3、氨基糖和核苷酸糖代谢KEGG3、核糖体KEGG3、柠檬烯和蒎烯降解KEGG3、细胞运动和分泌KEGG3、牛磺酸和亚牛磺酸代谢KEGG3、氧化磷酸化KEGG3、果糖和甘露糖代谢KEGG3、维生素B6代谢KEGG3、离子通道KEGG3、酮体的合成和降解KEGG3、其他转运蛋白KEGG3、半乳糖代谢KEGG3、多环芳烃降解KEGG3、转运蛋白KEGG3、DNA修复和重组蛋白KEGG3、淀粉和蔗糖代谢KEGG3、丙氨酸、天冬氨酸和谷氨酸代谢KEGG3、真核生物的核糖体生物发生KEGG3、分泌系统KEGG3、不饱和脂肪酸的生物合成KEGG3、半胱氨酸和甲硫氨酸代谢KEGG3、碱基切除修复KEGG3、氨基苯甲酸酯降解KEGG3、光合作用KEGG3、光合作用蛋白KEGG3、毛孔离子通道KEGG3、脂质生物合成蛋白KEGG3、D-谷氨酰胺和D-谷氨酸代谢KEGG3。
6.一种表征微生物有关状况的系统,所述系统包括:
基于来自与用户相关联的样品的微生物核酸、针对所述用户确定微生物序列数据集的部件,所述样品包括对应于多个收集位点的位点多样性样品集合,所述收集位点包括肠、生殖器、口、皮肤和鼻的至少两个,其中所述位点多样性样品集合包括来自所述用户的所述样品;和
基于所述微生物序列数据集和微生物有关状况模型,针对所述用户确定所述微生物有关状况的表征,用微生物组表征模块集合、基于分析技术集合的应用生成所述微生物有关状况模型,以确定微生物组特征集合的部件,
其中,所述分析技术集合包括统计检验、降维技术和人工智能方法的至少一项,
其中所述微生物组表征模块集合包括:
第一微生物组表征模块,其可操作以应用所述分析技术集合的第一分析技术,以及
第二微生物组表征模块,其可操作以应用所述分析技术集合的第二分析技术,并且
其中所述表征包括基于所述位点多样性样品集合和所述微生物有关状况模型的位点方面的疾病倾向性指标集合,其中所述位点方面的疾病倾向性指标集合中的各位点方面的疾病倾向性指标,对应于所述多个收集位点的不同收集位点,并且与所述微生物有关状况相关联。
7.根据权利要求6所述的系统,其中应用所述分析技术集合以确定所述微生物组特征集合包括:
基于所述微生物序列数据集确定微生物组特征的初始集合;和
用所述微生物组表征模块集合的所述第一微生物组表征模块,在所述微生物组特征的初始集合上应用所述降维技术,以确定所述微生物组特征集合,其中所述降维技术包括缺失值比率、主成分分析、概率主成分分析、矩阵分解技术、成分混合模型和特征嵌入技术的至少一种。
8.根据权利要求7所述的系统,其中确定所述微生物组特征的初始集合包括用所述微生物组表征模块集合的所述第二微生物组表征模块,与所述微生物序列数据集一起应用所述统计检验,以确定所述微生物组特征的初始集合,其中所述统计检验包括t检验、柯尔莫哥洛夫-斯米尔诺夫检验和回归模型的至少一种。
9.根据权利要求7所述的系统,其中应用所述分析技术集合包括,用所述微生物组表征模块集合的所述第二微生物组表征模块,应用机器学习方法,以确定所述微生物组特征集合的相关性分值,其中基于所述微生物组特征集合和所述相关性分值生成所述微生物有关状况。
10.根据权利要求7所述的系统,其中确定所述表征包括基于所述微生物有关状况模型、来自所述用户的所述样品、以及所述微生物组特征集合与药物代谢之间的已知关联,确定与所述微生物有关状况相关联的药物代谢表征。
11.根据权利要求6所述的系统,其中针对所述用户确定所述微生物有关状况的表征包括:
基于所述位点方面的疾病倾向性指标集合,针对所述用户确定总体疾病倾向性指标,其中所述总体疾病倾向性指标与所述微生物有关状况相关联。
12.根据权利要求11所述的系统,其还包括基于所述位点多样性样品集合确定与所述多个收集位点相关联的微生物数据集的部件,其中确定所述总体疾病倾向性指标包括:
基于所述微生物数据集,确定协方差指标和关联性指标的至少一个,其中所述协方差指标和所述关联性指标的至少一个与所述多个收集位点相关联;和
基于所述位点方面的疾病倾向性指标集合与所述协方差指标和所述关联性指标的至少一个,针对所述用户确定所述总体疾病倾向性指标。
13.根据权利要求6所述的系统,其中在应用所述分析技术集合以确定所述微生物组特征之前,基于所述微生物序列数据集的过滤、通过以下至少一项生成所述微生物有关状况模型:a)去除对应于所述样品集合的第一样品离群值的第一样品数据,其中所述第一样品离群值通过主成分分析、降维技术和多变量方法的至少一项来确定;b)去除对应于所述样品集合的第二样品离群值的第二样品数据,其中所述第二样品离群值基于所述微生物组特征集合的相应数据质量确定;以及c)基于不满足阈值样品数量条件的所述微生物组特征的样品数量,从所述微生物组特征集合去除微生物组特征,其中所述样品数量对应于与所述微生物组特征的高质量数据相关联的样品数量。
14.根据权利要求6所述的系统,其中针对所述用户确定所述微生物有关状况的表征包括,基于用户微生物组特征集合和所述微生物有关状况模型、针对所述用户确定光敏性相关联状况的皮肤有关表征,其中所述用户微生物组特征集合包括与以下至少一项相关联的特征:拟普雷沃菌属(属)、普雷沃菌WAL 2039G种(种)、乳腺炎棒状杆菌(种)、拟杆菌科(科)、布劳特菌属(属)、拟杆菌属(属)、脱硫弧菌属(属)、梭菌属(属)、普通拟杆菌(种)、普拉栖粪杆菌(种)、粪布劳特菌(种)、腐败另枝菌(种)、拟杆菌AR20种(种)、拟杆菌AR29种(种)、产酸拟杆菌(种)、迪尔玛菌属(属)、斯莱克菌属(属)、埃格特菌属(属)、阿德勒克罗伊茨菌属(属)、副普雷沃菌属(属)、另枝菌属(属)、霍尔德曼氏菌属(属)、艾森伯格氏菌属(属)、肠杆菌属(属)、产液阿德勒克罗伊茨菌(种)、琥珀酸考拉杆菌(种)、食葡糖罗斯拜瑞菌(种)、考拉杆菌377种(种)、匹格脱硫弧菌(种)、埃格特菌HGA1种(种)、内脂因子长形产乳杆菌种(种)、另枝菌HGB5种(种)、丝状霍尔德曼氏菌(种)、肠道柯林斯菌(种)、猕猴奈瑟菌(种)、梭菌科(科)、血孪生球菌(种)、脆弱拟杆菌(种)、肠杆菌科(科)、毛螺菌科(科)、巴斯德菌科(科)、巴斯德菌目(目)、肠杆菌目(目)、鞘氨醇杆菌目(目)、嗜血杆菌属(属)、明串珠菌属(属)、短波单胞菌属(属)、口普雷沃菌(种)、臭气杆菌属(属)、二氧化碳嗜纤维菌属(属)、黄杆菌属(属)、布伦纳假单胞菌(种)、鲸黄杆菌(种)、短波单胞菌FXJ8.080种(种)、瘤胃球菌科(科)、弧菌科(科)、黄杆菌科(科)、梭杆菌科(科)、紫单胞菌科(科)、短杆菌科(科)、红杆菌科(科)、间孢囊菌科(科)、双歧杆菌科(科)、鞘氨醇杆菌科(科)、柄杆菌科(科)、弯曲杆菌科(科)、拟杆菌纲(纲)、梭杆菌纲(纲)、黄杆菌纲(纲)、双歧杆菌目(目)、奈瑟菌目(目)、拟杆菌目(目)、红杆菌目(目)、黄杆菌目(目)、弧菌目(目)、梭杆菌目(目)、柄杆菌目(目)、梭杆菌门(门)、放线棒菌属(属)、小弯杆菌属(属)、镰刀链杆菌属(属)、短杆菌属(属)、粪杆菌属(属)、弯曲杆菌属(属)、放线杆菌属(属)、卟啉单胞菌(属)、梭杆菌属(属)、金黄杆菌属(属)、巨球菌(属)、罗氏菌属(属)、奈瑟菌属(属)、乳杆菌BL302种(种)、普列比乌斯拟杆菌(种)、溃疡棒状杆菌(种)、寒武小弯杆菌(种)、韦克斯勒布劳特菌(种)、葡萄球菌WB18-16种(种)、口腔分类单元链球菌G63种(种)、疮疱丙酸杆菌(种)、厌氧球菌9401487种(种)、副流感嗜血杆菌(种)、表皮葡萄球菌(种)、解脲弯曲杆菌(种)、两面神菌M3-5种(种)、蒂莫宁普雷沃菌(种)、嗜胨菌NF00840种(种)、芬戈尔德菌S8 F7种(种)、解糖胨普雷沃菌(种)、卡式卟啉单胞菌(种)、牙周梭杆菌(种)、传染性疾病KEGG2、表征欠佳KEGG2、代谢疾病KEGG2、免疫系统疾病KEGG2、细胞过程和信号传导KEGG2、限制性内切酶KEGG3、核苷酸切除修复KEGG3,或者
其中针对所述用户确定所述微生物有关状况的表征包括,基于用户微生物组特征集合和所述微生物有关状况模型、针对所述用户确定皮肤干燥相关联状况的皮肤有关表征,其中所述用户微生物组特征集合包括与以下至少一项相关联的特征:棒状杆菌科(科)、芽孢杆菌纲(纲)、乳杆菌目(目)、放线菌目(目)、厚壁菌门(门)、棒状杆菌属(属)、皮杆菌科(科)、乳杆菌科(科)、丙酸杆菌科(科)、放线菌纲(纲)、皮杆菌属(属)、戴阿利斯特杆菌属(属)、费克蓝姆菌属(属)、乳杆菌(属)、丙酸杆菌(属)、溃疡棒状杆菌(种)、人费克蓝姆菌(种)、棒状杆菌种(种)、丙酸杆菌MSP09A种(种)、费克蓝姆菌1440-97种(种)、葡萄球菌C9I2种(种)、厌氧球菌9402080种(种)、解葡萄糖苷棒状杆菌(种)、人皮杆菌(种)、肠杆菌科(科)、假单胞菌科(科)、葡萄球菌科(科)、γ-变形菌纲(纲)、芽孢杆菌目(目)、肠杆菌目(目)、双歧杆菌属(属)、假单胞菌属(属)、厌氧球菌属(属)、克鲁瓦菌属(属)、阿托波菌属(属)、葡萄球菌属(属)、乳杆菌BL302种(种)、乳腺炎棒状杆菌(种)、长双歧杆菌(种)、双子厌氧球菌种(种)、厌氧球菌S9 PR-16种(种)、蒂莫宁普雷沃菌(种)、乔治亚娜克鲁维菌(种)、放线棒菌属(属)、芬戈尔德菌(属)、克罗诺杆菌属(属)、不动杆菌B22-23种(种)、八叠厌氧球菌(种)、芬戈尔德菌S9 AA1-5种(种)、葡萄球菌C-D-MA2种(种)、嗜胨菌7-2种(种)、阪崎克罗诺杆菌(种)、巴斯德菌科(科)、酸杆菌纲(纲)、鞘氨醇杆菌纲(纲)、鞘氨醇杆菌目(目)、酸杆菌门(门)、卟啉单胞菌(属)、嗜血杆菌属(属)、不动杆菌属(属)、厌氧球菌8405254种(种)、鞘氨醇单胞菌科(科)、鞘氨醇单胞菌目(目)、库克菌属(属)、孪生球菌属(属)、韦荣球菌CM60种(种)、乳杆菌7_1_47FAA种(种)、孪生球菌933-88种(种)、卡式卟啉单胞菌(种)、副流感嗜血杆菌(种)、拟杆菌AR20种(种)、普通拟杆菌(种)、拟杆菌D22种(种)、多拉长脂链霉素菌(种)、粪副拟杆菌(种)、拟杆菌AR29种(种)、多拉菌属(属)、柯林斯菌属(属)、拟杆菌属(属)、颤螺菌科(科)、瘤胃球菌科(科)、拟杆菌科(科)、疣微菌科(科)、红蝽菌科(科)、梭菌目(目)、拟杆菌目(目)、疣微菌目(目)、红蝽菌目(目)、高温厌氧菌目(目)、梭菌纲(纲)、拟杆菌纲(纲)、疣微菌纲(纲)、疣微菌门(门)、拟杆菌门(门)、转录KEGG2、细胞过程和信号传导KEGG2、氨基酸代谢KEGG2、细胞生长和死亡KEGG2、复制和修复KEGG2、其他氨基酸的代谢KEGG2、神经退行性疾病KEGG2、辅助因子和维生素的代谢KEGG2、运输和分解代谢KEGG2、内分泌系统KEGG2、免疫系统疾病KEGG2、排泄系统KEGG2、酶家族KEGG2、膜运输KEGG2、碳水化合物代谢KEGG2、其他次生代谢产物的生物合成KEGG2、萜类化合物和聚酮化合物的代谢KEGG2、传染性疾病KEGG2、遗传信息处理KEGG2、神经系统KEGG2、环境适应KEGG2、核苷酸代谢KEGG2、信号分子与相互作用KEGG2、信号转导KEGG2、无机离子的运输与代谢KEGG3、染色体KEGG3、细胞循环–柄杆菌属KEGG3、核糖体生物发生KEGG3、DNA复制蛋白KEGG3、转录因子KEGG3、甘氨酸、丝氨酸和苏氨酸代谢KEGG3、硫代谢KEGG3、其他离子耦合的转运蛋白KEGG3、缬氨酸、亮氨酸和异亮氨酸的生物合成KEGG3、氮代谢KEGG3、肽聚糖的生物合成KEGG3、同源重组KEGG3、过氧化物酶体KEGG3、硫中继系统KEGG3、肽酶KEGG3、蛋白激酶KEGG3、错配修复KEGG3、二甲苯降解KEGG3、核糖体KEGG3、RNA聚合酶KEGG3、色氨酸代谢KEGG3、组氨酸代谢KEGG3、维生素代谢KEGG3、细胞运动和分泌KEGG3、嘧啶代谢KEGG3、细胞骨架蛋白KEGG3、DNA复制KEGG3、氨基糖和核苷酸糖代谢KEGG3、叶酸生物合成KEGG3、光合生物中的碳固定KEGG3、磷脂酰肌醇信号传导系统KEGG3、赖氨酸降解KEGG3、硒化合物代谢KEGG3、果糖和甘露糖代谢KEGG3、肌醇磷酸代谢KEGG3、蛋白质折叠和相关处理KEGG3、PPAR信号传导途径KEGG3、脂质代谢KEGG3、缬氨酸、亮氨酸和异亮氨酸降解KEGG3、乙醛酸和二羧酸代谢KEGG3、精氨酸和脯氨酸代谢KEGG3、柠檬烯和蒎烯降解KEGG3、D-丙氨酸代谢KEGG3、卟啉和叶绿素代谢KEGG3、C5-支链二元酸代谢KEGG3、分子伴侣和折叠催化物KEGG3、脂肪酸代谢KEGG3、谷胱甘肽代谢KEGG3、磷酸戊糖途径KEGG3、磷酸转移酶系统KEGG3、泛酸和CoA生物合成KEGG3、近端小管碳酸氢盐回收KEGG3、半乳糖代谢KEGG3、淀粉和蔗糖代谢KEGG3、原发性免疫缺陷KEGG3、半胱氨酸和甲硫氨酸代谢KEGG3、泛醌和其他萜类醌生物合成KEGG3、DNA修复和重组蛋白KEGG3、酪氨酸代谢KEGG3、苯丙氨酸、酪氨酸和色氨酸生物合成KEGG3、氨酰-tRNA生物合成KEGG3、丙氨酸、天冬氨酸和谷氨酸代谢KEGG3、光合作用KEGG3、其他转运蛋白KEGG3、丁酸酯代谢KEGG3、细菌分泌系统KEGG3、甘油磷脂代谢KEGG3、氧化磷酸化KEGG3、I型糖尿病KEGG3、糖酵解/糖异生KEGG3、光合作用蛋白KEGG3、转运蛋白KEGG3、萜类骨架生物合成KEGG3、不饱和脂肪酸的生物合成KEGG3、信号转导机制KEGG3、酮体的合成和降解KEGG3、核苷酸切除修复KEGG3、分泌系统KEGG3、阿尔茨海默病KEGG3、玉米素生物合成KEGG3、II型糖尿病KEGG3、D-谷氨酰胺和D-谷氨酸代谢KEGG3、牛磺酸和亚牛磺酸代谢KEGG3、谷氨酸能突触KEGG3、植物-病原体相互作用KEGG3、维生素B6代谢KEGG3、柠檬酸循环KEGG3、乙苯降解KEGG3、碱基切除修复KEGG3、复制、重组和修复蛋白KEGG3、真核生物的核糖体生物发生KEGG3、氨基苯甲酸酯降解KEGG3、细菌运动蛋白KEGG3、安莎霉素类的生物合成KEGG3、离子通道KEGG3、代谢KEGG2、表征欠佳KEGG2、次生代谢物的生物合成和生物降解KEGG3、硫辛酸代谢KEGG3、氨基酸有关酶KEGG3、转录蛋白KEGG3、抗坏血酸盐和藻酸盐代谢KEGG3、硫胺素代谢KEGG3、功能未知KEGG3、糖胺聚糖降解KEGG3、其他KEGG3、戊糖和葡萄糖醛酸酯相互转化KEGG3、生物素代谢KEGG3、苯丙氨酸代谢KEGG3、糖鞘脂生物合成-神经节系列KEGG3、毛孔离子通道KEGG3、膜和细胞内结构分子KEGG3、嘌呤代谢KEGG3、叶酸一碳库KEGG3、磷酸酯和次磷酸酯代谢KEGG3、溶酶体KEGG3、药物代谢-其他酶KEGG3、青霉素和头孢菌素生物合成KEGG3、亨廷顿病KEGG3、烟酸盐和烟酰胺代谢KEGG3、药物代谢-细胞色素P450KEGG3、脂多糖生物合成蛋白KEGG3、通过细胞色素P450的外源性物质代谢KEGG3、结核病KEGG3、多环芳烃降解KEGG3,或者
其中针对所述用户确定所述微生物有关状况的表征包括,基于用户微生物组特征集合和所述微生物有关状况模型、针对所述用户确定头皮有关状况的皮肤有关表征,其中所述用户微生物组特征集合包括与以下至少一项相关联的特征:放线菌纲(纲)、乳杆菌目(目)、放线菌目(目)、厚壁菌门(门)、皮杆菌科(科)、乳杆菌科(科)、丙酸杆菌科(科)、棒状杆菌科(科)、乳杆菌(属)、棒状杆菌属(属)、丙酸杆菌(属)、皮杆菌属(属)、另位球菌属(属)、弗莱堡棒状杆菌(种)、克里克拉另位球菌属KEGG3(种)、棒状杆菌种(种)、葡萄球菌C9I2种(种)、厌氧球菌8405254种(种)、解葡萄糖苷棒状杆菌(种)、人皮杆菌(种)、红蝽菌科(科)、肠杆菌科(科)、葡萄球菌科(科)、肠杆菌目(目)、芽孢杆菌目(目)、双歧杆菌属(属)、葡萄球菌属(属)、阿托波菌属(属)、巨球菌(属)、乳腺炎棒状杆菌(种)、链球菌BS35a种(种)、大芬戈尔德菌(种)、金黄色葡萄球菌(种)、流感嗜血杆菌(种)、棒状杆菌NML 97-0186种(种)、口腔分类单元链球菌G59种(种)、多拉菌属(属)、罗斯拜瑞菌11SE39种(种)、多拉长脂链霉素菌(种)、普雷沃菌科(科)、韦荣球菌科(科)、颤螺菌科(科)、革兰氏阴性菌纲、硒单胞菌目(目)、芬戈尔德菌(属)、颤螺菌属(属)、肠道单胞菌属(属)、弗雷范尔特菌属(属)、普雷沃菌属(属)、莫亚拉菌属(属)、光冈链杆菌(种)、产气柯林斯菌(种)、嗜胨菌2002-2300004种(种)、犬棒状杆菌(种)、芬戈尔德菌S9AA1-5种(种)、口颊普雷沃菌(种)、浑浊戴阿利斯特杆菌(种)、莫拉菌属(属)、奈瑟菌属(属)、粘液奈瑟菌(种)、理研菌科(科)、辅助因子和维生素的代谢KEGG2、酶家族KEGG2、脂质代谢KEGG2、免疫系统疾病KEGG2、糖酵解/糖异生KEGG3、原发性免疫缺陷KEGG3、丙酮酸盐代谢KEGG3、运输和分解代谢KEGG2、神经退行性疾病KEGG2、内分泌系统KEGG2、氨基酸代谢KEGG2、细胞过程和信号传导KEGG2、信号分子与相互作用KEGG2、其他氨基酸的代谢KEGG2、复制和修复KEGG2、转录KEGG2、细胞生长和死亡KEGG2、膜运输KEGG2、其他次生代谢产物的生物合成KEGG2、萜类化合物和聚酮化合物的代谢KEGG2、无机离子的运输与代谢KEGG3、维生素代谢KEGG3、缬氨酸、亮氨酸和异亮氨酸的生物合成KEGG3、过氧化物酶体KEGG3、核糖体生物发生KEGG3、硒化合物代谢KEGG3、组氨酸代谢KEGG3、染色体KEGG3、硫代谢KEGG3、PPAR信号传导通路KEGG3、卟啉和叶绿素代谢KEGG3、磷脂酰肌醇信号传导系统KEGG3、肌醇磷酸代谢KEGG3、硫中继系统KEGG3、甘氨酸、丝氨酸和苏氨酸代谢KEGG3、DNA复制蛋白KEGG3、泛酸和CoA生物合成KEGG3、转录因子KEGG3、蛋白质折叠和相关处理KEGG3、II型糖尿病KEGG3、蛋白激酶KEGG3、叶酸生物合成KEGG3、赖氨酸降解KEGG3、RNA聚合酶KEGG3、D-丙氨酸代谢KEGG3、光合生物中的碳固定KEGG3、氮代谢KEGG3、甘油磷脂代谢KEGG3、安莎霉素类的生物合成KEGG3、缬氨酸、亮氨酸和异亮氨酸降解KEGG3、细胞骨架蛋白KEGG3、肽酶KEGG3、脂肪酸代谢KEGG3、细胞循环-柄杆菌属KEGG3、磷酸转移酶系统KEGG3、嘧啶代谢KEGG3、阿尔茨海默病KEGG3、丁酸酯代谢KEGG3、色氨酸代谢KEGG3、信号转导机制KEGG3、磷酸戊糖途径KEGG3、其他离子耦合的转运蛋白KEGG3、同源重组KEGG3、复制、重组和修复蛋白KEGG3、二甲苯降解KEGG3、错配修复KEGG3、乙醛酸和二羧酸代谢KEGG3、精氨酸和脯氨酸代谢KEGG3、肽聚糖的生物合成KEGG3、分子伴侣和折叠催化物KEGG3、I型糖尿病KEGG3、DNA复制KEGG3、细菌分泌系统KEGG3、酪氨酸代谢KEGG3、柠檬酸循环KEGG3、氨基糖和核苷酸糖代谢KEGG3、核糖体KEGG3、柠檬烯和蒎烯降解KEGG3、细胞运动和分泌KEGG3、牛磺酸和亚牛磺酸代谢KEGG3、氧化磷酸化KEGG3、果糖和甘露糖代谢KEGG3、维生素B6代谢KEGG3、离子通道KEGG3、酮体的合成和降解KEGG3、其他转运蛋白KEGG3、半乳糖代谢KEGG3、多环芳烃降解KEGG3、转运蛋白KEGG3、DNA修复和重组蛋白KEGG3、淀粉和蔗糖代谢KEGG3、丙氨酸、天冬氨酸和谷氨酸代谢KEGG3、真核生物的核糖体生物发生KEGG3、分泌系统KEGG3、不饱和脂肪酸的生物合成KEGG3、半胱氨酸和甲硫氨酸代谢KEGG3、碱基切除修复KEGG3、氨基苯甲酸酯降解KEGG3、光合作用KEGG3、光合作用蛋白KEGG3、毛孔离子通道KEGG3、脂质生物合成蛋白KEGG3、D-谷氨酰胺和D-谷氨酸代谢KEGG3。
15.根据权利要求6所述的系统,其中所述微生物有关状况包括皮肤有关状况,其中所述系统还包括:基于所述表征向所述用户推广针对所述皮肤有关状况的益生菌疗法的部件,并且其中所述益生菌疗法与微生物相关联,所述微生物与以下任何一种相关:溃疡棒状杆菌、人费克蓝姆菌、棒状杆菌种、丙酸杆菌MSP09A种、费克蓝姆菌1440-97种、葡萄球菌C9I2种、厌氧球菌9402080种、解葡萄糖苷棒状杆菌、人皮杆菌、乳杆菌BL302种、乳腺炎棒状杆菌、长双歧杆菌、双子厌氧球菌、厌氧球菌S9 PR-16种、蒂莫宁普雷沃菌、乔治亚娜克鲁维菌、不动杆菌WB22-23种、八叠厌氧球菌、芬戈尔德菌S9 AA1-5种、葡萄球菌C-D-MA2种、嗜胨菌7-2种、阪崎克罗诺杆菌、厌氧球菌8405254种、韦荣球菌CM60种、乳杆菌7_1_47FAA种、孪生球菌933-88种、卡式卟啉单胞菌、副流感嗜血杆菌、拟杆菌AR20种、普通拟杆菌、拟杆菌D22种、多拉长脂链霉素菌、粪副拟杆菌、拟杆菌AR29种、普雷沃菌WAL 2039G种、普拉栖粪杆菌、粪布劳特菌、腐败另枝菌、产酸拟杆菌、产液阿德勒克罗伊茨菌、琥珀酸考拉杆菌、食葡糖罗斯拜瑞菌、考拉杆菌377种、匹格脱硫弧菌、埃格特菌HGA1种、内脂因子长形产乳杆菌种、另枝菌HGB5种、丝状霍尔德曼氏菌、肠道柯林斯菌、猕猴奈瑟菌、血孪生球菌、脆弱拟杆菌、口普雷沃菌、布伦纳假单胞菌、鲸黄杆菌、短波单胞菌FXJ8.080种、普列比乌斯拟杆菌、寒武小弯杆菌、韦克斯勒布劳特菌、葡萄球菌WB18-16种、口腔分类单元链球菌G63种、疮疱丙酸杆菌、厌氧球菌9401487种、表皮葡萄球菌、解脲弯曲杆菌、两面神菌M3-5种、嗜胨菌DNF00840种、芬戈尔德菌S8 F7种、解糖胨普雷沃菌、牙周梭杆菌、弗莱堡棒状杆菌、克里克拉另位球菌、链球菌BS35a种、大芬戈尔德菌、金黄色葡萄球菌、流感嗜血杆菌、棒状杆菌NML97-0186种、口腔分类单元链球菌G59种、罗斯拜瑞菌11SE39种、光冈链杆菌、产气柯林斯菌、嗜胨菌2002-2300004种、犬棒状杆菌、口颊普雷沃菌、浑浊戴阿利斯特杆菌、粘液奈瑟菌。
CN201880064153.9A 2017-08-14 2018-07-27 疾病相关的微生物组表征过程 Active CN111164706B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201762545039P 2017-08-14 2017-08-14
US62/545,039 2017-08-14
US201762582191P 2017-11-06 2017-11-06
US62/582,191 2017-11-06
US201862658308P 2018-04-16 2018-04-16
US62/658,308 2018-04-16
PCT/US2018/044141 WO2019036176A1 (en) 2017-08-14 2018-07-27 METHOD OF CHARACTERIZING THE MICROBIOMA ASSOCIATED WITH A DISEASE

Publications (2)

Publication Number Publication Date
CN111164706A CN111164706A (zh) 2020-05-15
CN111164706B true CN111164706B (zh) 2024-01-16

Family

ID=63364144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880064153.9A Active CN111164706B (zh) 2017-08-14 2018-07-27 疾病相关的微生物组表征过程

Country Status (8)

Country Link
US (1) US20190050534A1 (zh)
EP (1) EP3669377A1 (zh)
JP (1) JP7208223B2 (zh)
KR (1) KR20200054203A (zh)
CN (1) CN111164706B (zh)
AU (1) AU2018318756B2 (zh)
SG (1) SG11202001335UA (zh)
WO (1) WO2019036176A1 (zh)

Families Citing this family (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3011046A4 (en) 2013-06-18 2017-03-01 Prodermiq, Inc. Customized skin care products and personal care products based on the analysis of skin flora
WO2014210368A1 (en) 2013-06-28 2014-12-31 D-Wave Systems Inc. Systems and methods for quantum processing of data
WO2016065075A1 (en) 2014-10-21 2016-04-28 uBiome, Inc. Method and system for microbiome-derived diagnostics and therapeutics
US20190211378A1 (en) * 2015-09-09 2019-07-11 uBiome, Inc. Method and system for microbiome-derived diagnostics and therapeutics for cerebro-craniofacial health
EP3350761B1 (en) 2015-09-17 2023-12-20 Prodermiq, Inc. Predicting skin age based on the analysis of skin flora and lifestyle data
GB201519088D0 (en) * 2015-10-28 2015-12-09 Metabogen Ab The use of bacteria formulations
US10817796B2 (en) 2016-03-07 2020-10-27 D-Wave Systems Inc. Systems and methods for machine learning
RU2762607C2 (ru) 2016-09-13 2021-12-21 Аллерган, Инк. Стабилизированные небелковые композиции клостридиального токсина
US11531852B2 (en) 2016-11-28 2022-12-20 D-Wave Systems Inc. Machine learning systems and methods for training with noisy labels
CN110753966A (zh) 2017-03-10 2020-02-04 普罗皮肤检测股份有限公司 基于皮肤菌群分析的定制化护肤产品和个人护理产品
US10735271B2 (en) * 2017-12-01 2020-08-04 Cisco Technology, Inc. Automated and adaptive generation of test stimuli for a network or system
US11586915B2 (en) 2017-12-14 2023-02-21 D-Wave Systems Inc. Systems and methods for collaborative filtering with variational autoencoders
US10692605B2 (en) * 2018-01-08 2020-06-23 International Business Machines Corporation Library screening for cancer probability
JP7678424B2 (ja) 2018-05-10 2025-05-16 学校法人順天堂 画像解析方法、装置、コンピュータプログラム、及び深層学習アルゴリズムの生成方法
US11900264B2 (en) 2019-02-08 2024-02-13 D-Wave Systems Inc. Systems and methods for hybrid quantum-classical computing
US11625612B2 (en) 2019-02-12 2023-04-11 D-Wave Systems Inc. Systems and methods for domain adaptation
CN109816612A (zh) * 2019-02-18 2019-05-28 京东方科技集团股份有限公司 图像增强方法和装置、计算机可读存储介质
WO2020176369A1 (en) * 2019-02-25 2020-09-03 Biome Health, Inc. Indices of microbial diversity relating to health
US10982283B2 (en) * 2019-02-25 2021-04-20 Biome Health, Inc. Indices of microbial diversity relating to health
KR102260881B1 (ko) * 2019-03-12 2021-06-07 아주대학교산학협력단 피쳐 선택장치, 그 방법 및 그 프로그램이 기록된 기록매체
JP7381003B2 (ja) * 2019-04-26 2023-11-15 学校法人順天堂 疾患解析を支援する方法、装置、及びコンピュータプログラム、並びにコンピュータアルゴリズムを訓練する方法、装置、及びプログラム
EP4013889A4 (en) * 2019-08-13 2023-08-16 Tata Consultancy Services Limited SCHIZOPHRENIA RISK ASSESSMENT SYSTEM AND METHOD
WO2021028861A2 (en) * 2019-08-13 2021-02-18 Tata Consultancy Services Limited System and method for assessing the risk of prediabetes
CN114555834A (zh) * 2019-09-02 2022-05-27 迈奥诊断公司 用于改善全身健康的皮肤微生物组监测
US20210173855A1 (en) * 2019-12-10 2021-06-10 Here Global B.V. Method, apparatus, and computer program product for dynamic population estimation
KR102472648B1 (ko) * 2020-01-02 2022-12-01 인제대학교 산학협력단 염증성 장질환 환자의 미생물 군집 평가 방법
US11410064B2 (en) * 2020-01-14 2022-08-09 International Business Machines Corporation Automated determination of explanatory variables
KR20210095511A (ko) * 2020-01-23 2021-08-02 주식회사 에이치이엠파마 장내 미생물 분석 결과를 제공하는 방법 및 서버
CA3166487A1 (en) * 2020-02-07 2021-08-12 Simon Green Methods for detecting primary immunodeficiency
US11430121B2 (en) 2020-03-31 2022-08-30 Siemens Healthcare Gmbh Assessment of abnormality regions associated with a disease from chest CT images
CN113564224B (zh) * 2020-04-13 2025-04-11 台达电子工业股份有限公司 口腔粘膜下纤维化恶性转化的生物标记
US11810291B2 (en) 2020-04-15 2023-11-07 Siemens Healthcare Gmbh Medical image synthesis of abnormality patterns associated with COVID-19
KR102492977B1 (ko) * 2020-05-25 2023-01-31 주식회사 마크로젠 마이크로바이옴을 이용한 건강 정보 제공 방법 및 분석장치
US11011277B1 (en) * 2020-06-02 2021-05-18 Sean Kelly Heat maps of infectious agents and methods of using same to screen subjects and/or determine an infection risk
US20210398654A1 (en) * 2020-06-22 2021-12-23 Siemens Healthcare Gmbh Automatic detection of covid-19 in chest ct images
CN113957160B (zh) * 2020-07-20 2024-03-29 深圳华大生命科学研究院 检测膀胱癌的标志物及检测该标志物的引物对及其应用
US20220020481A1 (en) 2020-07-20 2022-01-20 Abbott Laboratories Digital pass verification systems and methods
KR102346398B1 (ko) * 2020-09-01 2022-01-03 주식회사 에이아이바이오틱스 장내 미생물을 분석하여 평가 하는 시스템 및 평가 방법
KR20220042651A (ko) * 2020-09-28 2022-04-05 건국대학교 산학협력단 맞춤형 포스트바이오틱스 스크리닝 방법
WO2022078985A2 (en) * 2020-10-13 2022-04-21 Givaudan Sa Microbiome signature
KR102241357B1 (ko) * 2020-10-20 2021-04-16 주식회사 에이치이엠 머신러닝 모델을 이용하여 대장용종을 진단하는 방법 및 장치
CN112435714B (zh) * 2020-11-03 2021-07-02 北京科技大学 一种肿瘤免疫亚型分类方法及系统
US20230420134A1 (en) * 2020-11-16 2023-12-28 Micronoma, Inc. Cancer diagnosis and classification by non-human metagenomic pathway analysis
CN112489721B (zh) * 2020-11-25 2021-11-12 清华大学 镜像蛋白信息存储和编码技术
CN116615787A (zh) * 2020-12-14 2023-08-18 马斯公司 用于分类宠物信息的系统和方法
TWI763215B (zh) * 2020-12-29 2022-05-01 財團法人國家衛生研究院 篩選用於預測生理狀態的特徵的電子裝置和方法
US11158417B1 (en) 2020-12-29 2021-10-26 Kpn Innovations, Llc. System and method for generating a digestive disease nourishment program
CN113035280B (zh) * 2021-03-02 2022-03-11 四川大学 一种基于深度学习的rbp结合位点预测算法
CN113092652B (zh) * 2021-03-19 2022-09-30 浙江工商大学 一种用于评估个体过敏程度的试剂盒
KR102373888B1 (ko) 2021-03-26 2022-03-15 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 변비 유무를 판별하는 방법 및 진단장치
KR102373885B1 (ko) * 2021-03-26 2022-03-15 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 아토피 유무를 판별하는 방법 및 진단장치
KR102304399B1 (ko) * 2021-03-26 2021-09-24 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 고혈당을 판별하는 방법 및 진단 장치
KR102373886B1 (ko) 2021-03-26 2022-03-15 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 장염 유무를 판별하는 방법 및 진단 장치
KR102779136B1 (ko) * 2021-04-19 2025-03-12 한국과학기술연구원 음수 미포함 행렬 분해를 이용한 마이크로바이옴 데이터로부터의 미생물 상호작용 네트워크 분석 방법
CN113284560B (zh) * 2021-04-28 2022-05-17 广州微远基因科技有限公司 病原检测背景微生物判断方法及应用
KR102328214B1 (ko) * 2021-05-17 2021-11-19 (주)제이엘케이 의료 데이터의 전처리를 통한 의료 데이터베이스 구축 시스템 및 동작 방법
KR20220158948A (ko) * 2021-05-25 2022-12-02 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 복부팽만 유무를 판별하는 방법 및 진단 장치
KR20220158950A (ko) * 2021-05-25 2022-12-02 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 소화기 장애 유무를 판별하는 방법 및 진단 장치
KR102577229B1 (ko) * 2021-05-25 2023-09-12 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 복통 유무를 판별하는 방법 및 진단 장치
KR102577230B1 (ko) * 2021-05-25 2023-09-12 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 장 질환 유무를 판별하는 방법 및 진단 장치
US20250281101A1 (en) * 2021-09-30 2025-09-11 The General Hospital Corporation Systems and methods for assessing medical conditions such as inflammation, autoimmunity, and autism spectrum disorder (asd), and treatments thereof
JP2023057330A (ja) * 2021-10-11 2023-04-21 株式会社コーセー 肌状態の推定方法
CN114381507B (zh) * 2021-11-25 2024-02-13 杭州拓宏生物科技有限公司 格雷夫斯病标志微生物及其应用
WO2023164493A1 (en) * 2022-02-23 2023-08-31 Jona, Inc. System and method for using the microbiome to improve healthcare
CN114917330B (zh) * 2022-04-12 2025-10-10 天津纳尔生物科技有限公司 一种用于防治肉鸡球虫病免疫液的制备方法及其应用
WO2023204570A1 (ko) * 2022-04-19 2023-10-26 코스맥스 주식회사 피부 마이크로바이옴에 기초한 피부 정보 제공 장치 및 방법
CN119183531A (zh) * 2022-05-13 2024-12-24 南特细胞公司 使用人工智能分析微生物组的系统和方法
KR102672182B1 (ko) * 2022-05-30 2024-06-03 인천대학교 산학협력단 합성곱 신경망을 기반으로 생성된 성격 유형 판단 모델 및 성향 분석 모델을 기초로, 사용자의 성격 유형을 판단하고, 사용자의 성향을 분석할 수 있는 전자 장치 및 그 동작 방법
CN115881229B (zh) * 2022-12-16 2024-01-09 迪辅乐生物(上海)有限公司 基于肠道微生物信息的过敏预测模型构建方法
US20240331880A1 (en) * 2023-04-03 2024-10-03 342022, Inc. Causal inference-based investigation of antimicrobial resistance
TWI826332B (zh) * 2023-06-08 2023-12-11 宏碁股份有限公司 建立疾病預測模型的方法及系統
CN116779041B (zh) * 2023-06-25 2025-12-16 浙江大学 基于机器学习的微生物高维数据处理和关键菌属识别方法
CN117789981B (zh) * 2023-12-26 2025-01-14 康美华大基因技术有限公司 一种脂肪肝风险预测方法、装置、系统及存储介质
JP7787632B1 (ja) 2024-03-18 2025-12-17 学校法人順天堂 神経変性疾患及び前駆障害の判定方法及び判定装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7297113B1 (en) * 2003-04-25 2007-11-20 United States Of America As Represented By The Secretary Of The Navy Microsensor system and method for measuring data
US10169541B2 (en) 2014-10-21 2019-01-01 uBiome, Inc. Method and systems for characterizing skin related conditions
WO2016168350A1 (en) * 2015-04-13 2016-10-20 uBiome, Inc. Method and system for microbiome-derived characterization, diagnostics and therapeutics for cutaneous conditions

Also Published As

Publication number Publication date
EP3669377A1 (en) 2020-06-24
AU2018318756A1 (en) 2020-03-05
WO2019036176A1 (en) 2019-02-21
SG11202001335UA (en) 2020-03-30
AU2018318756B2 (en) 2021-12-02
JP7208223B2 (ja) 2023-01-18
JP2020530931A (ja) 2020-10-29
KR20200054203A (ko) 2020-05-19
US20190050534A1 (en) 2019-02-14
CN111164706A (zh) 2020-05-15

Similar Documents

Publication Publication Date Title
CN111164706B (zh) 疾病相关的微生物组表征过程
US10380325B2 (en) Method and system for microbiome-derived diagnostics and therapeutics
US10366789B2 (en) Method and system for microbiome-derived diagnostics and therapeutics for neurological health issues
US10366793B2 (en) Method and system for characterizing microorganism-related conditions
US10346592B2 (en) Method and system for microbiome-derived diagnostics and therapeutics for neurological health issues
US10381112B2 (en) Method and system for characterizing allergy-related conditions associated with microorganisms
AU2022202660A1 (en) Method and system for characterization for appendix-related conditions associated with microorganisms
US20200202979A1 (en) Nasal-related characterization associated with the nose microbiome
US20180342322A1 (en) Method and system for characterization for appendix-related conditions associated with microorganisms
EP3776285A1 (en) Method and system for characterizing microorganism-related conditions
EP3775257A1 (en) Method and system for characterizing allergy-related conditions associated with microorganisms
US20190019575A1 (en) Nasal-related characterization associated with the nose microbiome

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240723

Address after: Seoul, South Kerean

Patentee after: MacroGenics, Inc.

Country or region after: Republic of Korea

Address before: American Maryland

Patentee before: Prosomegen

Country or region before: U.S.A.

TR01 Transfer of patent right