[go: up one dir, main page]

CN118645245A - 基于动静结合语义特征的术后风险预测方法、装置及介质 - Google Patents

基于动静结合语义特征的术后风险预测方法、装置及介质 Download PDF

Info

Publication number
CN118645245A
CN118645245A CN202410958453.9A CN202410958453A CN118645245A CN 118645245 A CN118645245 A CN 118645245A CN 202410958453 A CN202410958453 A CN 202410958453A CN 118645245 A CN118645245 A CN 118645245A
Authority
CN
China
Prior art keywords
intraoperative
features
static
dynamic
vector matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410958453.9A
Other languages
English (en)
Inventor
王亚强
高拴梁
郝学超
周瑞豪
李培艺
彭夕然
朱涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu University of Information Technology
West China Hospital of Sichuan University
Original Assignee
Chengdu University of Information Technology
West China Hospital of Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu University of Information Technology, West China Hospital of Sichuan University filed Critical Chengdu University of Information Technology
Priority to CN202410958453.9A priority Critical patent/CN118645245A/zh
Publication of CN118645245A publication Critical patent/CN118645245A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明公开一种基于动静结合语义特征的术后风险预测方法、装置及介质,其中方法包括:响应于输入的术前特征和术中静态特征,对术前特征和术中静态特征分别进行清洗和处理得到术前特征向量矩阵和术中静态特征向量矩阵;对术中动态特征进行抽取得到术中动态特征向量矩阵;将术前特征向量矩阵、术中静态特征向量矩阵以及术中动态特征向量矩阵融合得到融合向量矩阵;构建预测模型,利用融合向量矩阵对所述预测模型进行训练得到训练好的预测模型,通过对动态和静态数据分别进行处理后映射到统一的语义空间中进行表征,再基于各自的表征进行融合,确保了动态和静态数据在数据结构上和语义空间内的一致性,增强模型的预测能力。

Description

基于动静结合语义特征的术后风险预测方法、装置及介质
技术领域
本发明涉及临床医学领域的围术期风险监测与管理相关的应用技术领域,更具体地,涉及一种基于动静结合语义特征的术后风险预测方法、装置及介质。
背景技术
既往围绕术后风险预测的研究主要包括:(1)基于回顾性的研究,通过分析历史医疗记录来挖掘与术后风险预测有相关作用的风险因素;(2)基于风险因素实施预测的研究,如利用逻辑回归,随机森林等统计机器学习方法构建术后风险预测模型,此外,深度学习方法(如循环神经网络)在时间序列数据上展现出了优秀的通用预测能力,但在临床医学领域,此类端到端的黑盒模型由于缺乏足够的可解释性,使得从中提取量化和可信的临床实施性建议变得具有挑战性。
目前用于术后风险评估的指标多为术前静态的指标,如年龄、BMI、手术部位、肺功能等,却忽略了术中动态生命体征和静态特征的纳入研究,如肺通气力学参数、氧合指数、出入量,手术时长等。在预测术后风险时未能有效利用术中动静语义特征,无法在术中生命体征发生变化时及时、量化的捕捉术后风险的动态变化,进而限制了术中阶段精准个体化的风险防控,对动态指导围术期诊疗具有明显的局限性。
发明内容
提供了本发明以解决现有技术中存在的上述问题。因此,需要一种基于动静结合语义特征的术后风险预测方法、装置及介质,以至少达到如下至少一个目的:
(1)该方法对术中动态生命体征和静态特征研究了各自的表征方法;
(2)通过融合表征构建出具有高度语义一致性的动静输入特征;
(3)基于输入特征通过可解释性分析可以进一步提供科学可信的术中保护建议。
根据本发明的第一方面,提供了一种基于动静结合语义特征的术后风险预测方法,所述方法包括:
响应于输入的术前特征和术中静态特征,对所述术前特征和术中静态特征分别进行清洗和处理得到术前特征向量矩阵和术中静态特征向量矩阵
对术中动态特征进行抽取得到术中动态特征向量矩阵
将所述术前特征向量矩阵、术中静态特征向量矩阵以及术中动态特征向量矩阵融合得到融合向量矩阵
构建预测模型,利用所述融合向量矩阵对所述预测模型进行训练得到训练好的预测模型,基于训练好的预测模型实现术后风险预测。
进一步地,所述术前特征为手术前能获得的基线参数,包括年龄、性别、体重指数、病史、最新的生理测量参数、最新的实验室测量参数以及手术位置、麻醉类型和ASA分类,所述手术前能获得的基线参数分为离散型特征和连续型特征,通过如下方法对术前特征进行清洗得到术前特征向量矩阵
对于离散型特征,通过标签拆分、标签映射、基于规则的缺失值填补进行处理;
对于连续型特征,通过多重插补的方法对缺失值进行填补处理;
填补处理后的离散型特征和连续型特征共同组成术前特征向量矩阵
进一步地,所述术中静态特征包括生命体征、呼吸机参数、术中输液量,术中输血量以及血流动力学信息,通过如下方法对所述术中静态特征进行处理得到术中静态特征向量矩阵
对于生命体征和呼吸机参数,通过计算术中均值作为所述生命体征和呼吸机参数对应的静态特征值;
对于术中输液量和术中输血量,以手术期间的累积量作为所述术中输液量和术中输血量对应的静态特征值;
对于血流动力学信息,计算低于平均动脉压65毫米汞柱以下的曲线下面积作为所述血流动力学信息对应的静态特征值;
所述生命体征和呼吸机参数对应的静态特征值、所述术中输液量和术中输血量对应的静态特征值以及所述血流动力学信息对应的静态特征值共同组成术中静态特征向量矩阵
进一步地,所述术中动态特征包括吸气峰压、平台压、呼气末正压、驱动压、肺组织动态顺应性、机械功率和标准化机械功率,通过如下方法对术中动态特征进行抽取得到术中动态特征向量矩阵
获取术中时序数据,并对所述术中时序数据进行对齐;所述术中时序数据包括术中时序序列,所述术中时序序列包括术中特征特征及其对应的时间;
对于含缺失记录和采样不规则的多变量的术中时间序列,根据数据的平均采样频率,设置时间滑动窗口,对所述时间滑动窗口内的时序数据进行聚合或根据前向滑动窗口进行均值填充;
基于填充后的术中时间序列,根据度量指标进行术中动态特征抽取以得到术中动态特征向量矩阵,所述度量指标包括最值、方差、标准差、术中时间序列的复杂度度量以及近似熵中的一种及其组合。
进一步地,利用所述融合向量矩阵对所述预测模型进行训练,具体包括:
对动静融合特征矩阵进行边缘值处理后,以去除相关度大于0.75的特征,利用五折交叉验证划分训练/测试集,在训练集上采用过采样方法以增强不平衡分布的数据;
利用经过处理后的训练/测试集对所述预测模型进行训练。
进一步地,在利用所述融合向量矩阵对所述预测模型进行训练得到训练好的预测模型之后,所述方法还包括:
为所述融合向量矩阵中的各个特征对应分配一个贡献值,所述贡献值用于量化对应特征对模型预测的影响;
根据各个特征对应的贡献值对所述融合向量矩阵中的特征进行筛选。
根据本发明的第二方面,提供一种基于动静结合语义特征的术后风险预测装置,所述装置包括:
静态特征处理单元,被配置为响应于输入的术前特征和术中静态特征,对所述术前特征和术中静态特征分别进行清洗和处理得到术前特征向量矩阵和术中静态特征向量矩阵
动态特征抽取单元,被配置为对术中动态特征进行抽取得到术中动态特征向量矩阵
特征融合单元,被配置为将所述术前特征向量矩阵、术中静态特征向量矩阵以及术中动态特征向量矩阵融合得到融合向量矩阵
模型训练预测单元,被配置为构建预测模型,利用所述融合向量矩阵对所述预测模型进行训练得到训练好的预测模型,基于训练好的预测模型实现术后风险预测。
进一步地,所述装置还包括:
模型评估单元,所述模型评估单元被配置为基于模型性能指标对训练好的预测模型进行评估,所述模型性能指标包括受试者工作特性曲线下面积、准确率、灵敏度、特异度、查准率、查全率以及F1分数。
进一步地,所述装置还包括:
可解释性分析单元,所述可解释性分析单元被配置为:
为所述融合向量矩阵中的各个特征对应分配一个贡献值,所述贡献值用于量化对应特征对模型预测的影响;
根据各个特征对应的贡献值对所述融合向量矩阵中的特征进行筛选。
根据本发明的第三方面,提供一种可读存储介质,所述可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上所述的方法。
本发明至少具有以下有益效果:
(1)针对动态数据与静态数据在语义空间内的不一致性问题,提出了一种动静语义特征的高维映射表征方法,将动态特征和静态特征映射到统一的高维语义空间,以更好的反映和理解特征的内在联系并突出动态特征,建立与术后风险相映射的预测模型,结合可解释性分析揭示输入特征与术后风险之间的关系,为临床医生提供可信和可实施的建议。
(2)针对不同数据类型的融合问题,设计一种用于动静结合语义特征融合处理的标准化流程,通过对动态和静态数据分别进行处理后映射到统一的语义空间中进行表征,再基于各自的表征进行融合,确保了动态和静态数据在数据结构上和语义空间内的一致性,使得模型能够有效学习到不同数据类型之间潜在关联,进而揭示了术前特征对术中动态特征的影响,增强了模型的预测能力。
(3)针对不同模型的构建及应用存在差异性的问题,提出一种模型标准化构建与应用框架,设计不同的标准化模块涵盖了从数据处理到模型构建与应用的各个阶段,解决数据分布不均衡,模型训练优化等问题,基于可解释性分析为模型的实际应用的提供了可行的方案,使得该应用框架不仅提高了模型预测的准确性和可靠性,也为实际的术后风险的应用开发提供了指导。
(4)本发明提出并设计了一种基于动静语义特征融合的术后风险预测框架,并以术后肺部并发症(Postoperative Pulmonary Complications,PPCs)风险预测为例实施了验证。本发明可以辅助临床医生进行包括肺部并发症在内的术后风险决策,进而有效保护患者的生命安全,提供更加精准的干预和管理术中呼吸机的使用。
附图说明
图1示出了根据本发明实施例的术后风险预测框架结构图。
图2示出了根据本发明实施例的一种基于动静结合语义特征的术后风险预测方法的流程图。
图3示出了根据本发明实施例的术中动态特征提取过程及数据示例图;
图4示出了根据本发明实施例的模型训练及预测过程图;
图5示出了根据本发明实施例的一种基于动静结合语义特征的术后风险预测方法的部分流程图;
图6示出了根据本发明实施例的一种基于动静结合语义特征的术后风险预测方法的局部流程图;
图7示出了根据本发明实施例的对术后肺部并发症风险的全局特征贡献度SHAP图;
图8示出了根据本发明实施例的的一种基于动静结合语义特征的术后风险预测装置的结构图;
图9示出了根据本发明实施例的一种基于动静结合语义特征的术后风险预测装置在设置有模型评估单元时的结构图;
图10示出了根据本发明实施例的一种基于动静结合语义特征的术后风险预测装置在设置有可解释性分析单元时的结构图。
具体实施方式
为使本领域技术人员更好的理解本发明的技术方案,下面结合附图和具体实施方式对本发明作详细说明。下面结合附图和具体实施例对本发明的实施例作进一步详细描述,但不作为对本发明的限定。本文中所描述的各个步骤,如果彼此之间没有前后关系的必要性,则本文中作为示例对其进行描述的次序不应视为限制,本领域技术人员应知道可以对其进行顺序调整,只要不破坏其彼此之间的逻辑性导致整个流程无法实现即可。
本发明实施例提供提供一种基于动静结合语义特征的术后风险预测方法,该方法通过构建一个基于动静语义特征融合的术后风险预测框架,该框架利用术前静态检查数据,术中静态事件数据和术中动态生命体征数据,为术后风险的早期识别和预测提供了更为全面的视角,基于表征后的动静语义特征在融合后保证了数据结构和语义空间的一致性。此外本实施例也为模型的构建与分析应用设计了标准化的模块。一方面基于该框架有效提升了术后风险的预测准确率,另一方面通过可解释性分析有望揭示可干预风险因素间的相互关系,助力个性化的术后风险应用构建,有效预防和降低术后风险的发生。
本发明利用统计机器学习模型在结构化数据的分类任务中所表现的高准确率、可解释性等优势,通过将术前和术中静态特征以及术中动态特征映射到统一的高维语义空间,并建立与术后风险映射的预测模型,形成统一的术后风险预测框架。框架的结构如图1所示,其中,表示术前静态特征经过清洗后得到的向量矩阵,表示术中静态特征处理后得到的向量矩阵,表示术中动态特征提取后得到的向量矩阵,对应的大小分别为,其中m为患者样本数,n为特征数,表示融合了动态特征和静态特征的向量矩阵,维度为为模型预测时输入的新向量矩阵,维度为为模型预测的概率,维度为,其中为新输入数据的患者样本数。
图1描述的框架由六个模块组成,包括:静态特征处理模块、动态特征抽取模块、特征融合模块、模型训练及预测模块、模型评估模块和可解释性分析模块。各模块的功能如下。
如图2所示,为基于动静结合语义特征的术后风险预测方法的流程图,该方法包括如下步骤S100至步骤S400,步骤S100至步骤S400分别由静态特征处理模块、动态特征抽取模块、特征融合模块、模型训练及预测模块实施完成。
步骤S100,响应于输入的术前特征和术中静态特征,对所述术前特征和术中静态特征分别进行清洗和处理得到术前特征向量矩阵和术中静态特征向量矩阵
具体来说,该步骤S100通过静态特征处理模块进行实现,其中静态特征处理模块包含两个部分,即术前特征清洗和术中静态特征处理。术前特征指手术前可获得的基线参数,包括人口统计学(如年龄、性别和体重指数)、病史(如吸烟、糖尿病和心力衰竭)、最新的生理测量(如血压、呼吸频率和心率)、最新的实验室测量(如白蛋白、白细胞和血糖),以及手术位置、麻醉类型和ASA分类等。上述特征可进一步分为离散和连续特征,其中离散型特征(如性别等)通过标签拆分、标签映射、基于规则的缺失值填补进行处理,连续型特征(如年龄等)经过多重插补的(Miceforest)方法对缺失值进行填补,共同组成了结构化术前特征向量矩阵
术中静态特征包括术中生命体征(如血压和心率)、呼吸机参数(如吸入氧浓度和通气频率)、手术时间、麻醉时间、失血量、输液总量、输血使用、尿量、药物(如异丙酚、苯肾上腺素)、血流动力学信息、中心静脉压、脉搏血氧计和心率等。在既往研究基础上,选择与预测标签(术后肺部并发症)具有较弱相关作用的生命体征和呼吸参数,通过计算术中均值作为静态的特征值,术中输液,输血等以手术期间的累积量作为特征值。对于血流动力学信息计算低于平均动脉压65毫米汞柱以下的曲线下面积,经过上述处理后得到术中静态特征向量矩阵
步骤S200,对术中动态特征进行抽取得到术中动态特征向量矩阵
据图来说,该步骤S200通过动态特征抽取模块实现,其中动态特征抽取模块的术中动态特征提取过程及数据示例如图3所示,鉴于已报告的影响术后肺部并发症的潜在危险因素,本实施例选择吸气峰压(Peak)、平台压(Plat)、呼气末正压(PEEP)、驱动压(ΔP)、肺组织动态顺应性(CRS)、机械功率(MP)和标准化机械功率作为术中呼吸系统潜在有价值的动态参数,进一步筛选了手术开始15分钟后和手术结束前15分钟期间的稳定记录的时序数据。针对含缺失记录和采样不规则的多变量时间序列,本实施例根据数据的平均采样频率为30s,从相同的手术开始时间出发,设置 30s的时间滑动窗口, (本实施例认为该时间窗口内的各生命体征变量在时间上是对齐的),进一步对窗口内的时序数据进行聚合或根据前向滑动窗口进行均值填充。在上述动态呼吸参数中,驱动压、肺组织动态顺应性、机械功率和标准化机械功率需根据设备采集的生命体征进行计算,如。此外为深入提取所述术中呼吸参数的动态特征进行表征,采取了两种动态特征抽取方法。
其一,通过人工定义多种度量指标,包括统计学度量如最值、方差、标准差等,以及描述时序趋势的特征如术中时间序列的复杂度度量,近似熵等(表1)共计收集了若干个通气相关的动态特征。
表1. 术中呼吸动态特征说明
其二使用TSFRESH 工具来自动提取特征,此工具能够全面分析术中时间序列的属性并提取与术后风险高度相关的特征。
步骤S300,将所述术前特征向量矩阵、术中静态特征向量矩阵以及术中动态特征向量矩阵融合得到融合向量矩阵
具体来说,该步骤S300通过特征融合模块实现,特征融合模块基于向量矩阵进行拼接“”后得到融合向量矩阵,以此融合了术前术中各阶段的患者数据,各向量矩阵经处理后转化到了统一的向量空间下,实现了在语义空间内的一致性表述。一方面丰富了对患者围术期状态的描述,另一方面解决了不同数据类型(静态数据和动态数据)的融和表征问题。进而通过对特征的定量分析得出进一步的实施建议。此外本实施例以单一向量矩阵作为模型输入数据,对比特征融合向量的实验结果表明,融合了动静特征后模型具有更好的术后风险预测效果。
步骤S400,构建预测模型,利用所述融合向量矩阵对所述预测模型进行训练得到训练好的预测模型,基于训练好的预测模型实现术后风险预测。
具体来说,该步骤S400通过模型训练及预测模块实现,其中模型训练及预测模块的实施过程如图4所示,动静融合特征矩阵经过边缘值处理后,去除彼此相关度大于0.75的特征,使用五折交叉验证来划分训练/测试集,以及针对标签分布不均衡(术后老年患者肺部并发症的发生率为16.787%)的问题,在训练集上采用Borderline-SMOTE过采样方法来增强不平衡分布的数据,经过上述预处理步骤后得到用于模型训练输入的向量矩阵。使用该矩阵在不同的机器学习模型上进行训练,并基于模型评估模块得到的各项评估指标进行模型优化。为进一步构建模型应用,基于模型评估和可解释性分析结果选择具有最优表现的模型,并在此基础上开发了简化模型和预测模型,只需输入所需特征即可快速获取预测的结果。该模块可以设置为各类常见的统计机器学习模型,如逻辑回归(LogisticRegression)、岭回归(Ridge Regression)、随机森林(Random Forest)、多层感知机(Multi-Layer Perceptron)、梯度增强决策树(Gradient Boosting Decision Tree)和极致梯度提升模型(eXtreme Gradient Boosting,XGBoost)(本实施例后续为验证框架的有效性,以上述模型为例实施了实验验证)。
在一些实施例中,如图5所示,该基于动静结合语义特征的术后风险预测方法还包括:
步骤S500,为基于模型性能指标对训练好的预测模型进行评估,所述模型性能指标包括受试者工作特性曲线下面积、准确率、灵敏度、特异度、查准率、查全率以及F1分数。
请结合图1,该步骤S500通过模型评估模块实现,模型评估模块为评估模型表现,记录了95%置信区间内的各项模型性能指标,包括受试者工作特性曲线下面积(AUROC)、准确率(Accuracy)、灵敏度(Sensitivity)、特异度(Specificity)、查准率(Precision)、查全率(Recall)以及F1分数(F1-score)。此外,采用Lift、Brier分数和预期校准误差(Expectedcalibration error)进行了模型校准的评估。基于该模块可作为模型优化和模型间评估的比较基准。
在一些实施例中,如图6所示,该基于动静结合语义特征的术后风险预测方法还包括:
步骤S600,为所述融合向量矩阵中的各个特征对应分配一个贡献值,所述贡献值用于量化对应特征对模型预测的影响;根据各个特征对应的贡献值对所述融合向量矩阵中的特征进行筛选。
该步骤S600通过可解释性分析模块实现。可解释性分析模块用于为定量分析模型输入特征与术后肺部并发症的关系,采用了Shapley Additive Explanations (SHAP)方法,它为模型输入的每个特征分配一个“贡献值”,以此进行全局可解释性分析。通过这种方式,能够量化每个特征对模型预测的影响,进而根据全局特征的贡献度,识别并选择对预测术后肺部并发症风险影响最大的前20个关键特征(图7)进行分析,并基于这些特征进一步开发并验证一个简化模型,旨在简化所需的特征并提供准确的预测结果。此外,通过局部嵌入的可解释性分析,能够定量地揭示特征值与术后肺部并发症之间的具体关系。基于这些深入分析,可以得出相关的实施建议,旨在指导临床医生根据模型识别的关键因素来制定更精确的治疗计划。
为进一步说明本发明的可行性和进步性,基于如上所描述的方法,进行了实验,实验结果如表2所示,在所有开发的模型中,使用包含术前变量和人工设计开发含术中动态呼吸的特征集合,其在XGBoost模型的综合预测能力表现最好,平均AUROC值0.878(95%CI0.866-0.891),准确率为87.133%(95%CI 85.966–88.299%),敏感度为64.562%(95%CI59.524%–69.608%),特异度为90.921%(95%CI 88.984%–92.858%)。模型校准的评估指标Lift分数为3.802 (95%CI 3.550-4.053),Brier分数为0.099 (95%CI 0.094-0.104),预期校准误差为0.107 (95%CI 0.094-0.120),此外该模型的阳性预测值(PositivePredictive Value, PPV)为54.643%(95%CI 51.079–58.209%),阴性预测值(NegativePredictive Value, NPV)为93.868 %(95%CI 93.144%–94.592%)。与现有发表的ARISCAT模型相比,本实施例开发的所有模型的平均AUROC值都表现出更好的性能。
表2. 与 ARISCAT 相比,基于人工设计的动态呼吸特征在第三个数据集的机器学习模型的性能
*对 AUROC 进行平均以获得 5 则交叉验证结果的估计值。数据以平均值 (95%CI) 形式表示。
缩写:AUPRC,精确率召回曲线下面积;AUPRC:精确率召回曲线下面积; AUROC:受试者工作特性曲线下面积; CI:置信区间。 XGBoost:极致梯度提升; MLP:多层感知机;GBDT:梯度提升决策树; ARISCAT,评估术后肺部并发症的手术患者呼吸风险的工具。
在前瞻性内部验证的数据集上基于表现最好的模型(XGBoost)得到的AUROC为0.882,敏感度为0.316,特异度为0.943(表1)。在此基础上,为进一步分析模型的可解释性,采用SHAP方法对输入特征的贡献进行了分析,按其对结果影响的重要性进行了排序(图7)。可分析得出相较于其他类型手术,神经外科、胸部、腹部、心脏及大血管手术的术后肺部并发症(PPCs)发生率更高。虽然手术位置本身是不可改变的,但与开放手术相比,腹腔镜手术的胸腹手术导致的术后肺部并发症风险更小。
虽然根据可解释性分析得到的结果可以分析出,应避免手术期间 MP、CRS和 ΔP的剧烈波动以减少术后肺部并发症风险的发生,但在实际过程中实施此策略具有挑战性,因为患者具有多样性,一种固定的通气策略并不总是适用,这不仅对患者的咨询至关重要,还对制定个性化且规范化的围手术期呼吸管理策略至关重要。通过局部嵌入解释的方法的进一步验证揭示了输入特征与结果间的相互作用。如当MP的值连续低于均值的持续时间超过32.60分钟、术中MP最小值低于2.447J min-1或ΔP方差超过0.53且患者ASA分级高于II时,PPCs风险显著增加。预测因子与PPCs风险的作用阈值可能有助于解释为什么仅仅调节ΔP或较低的VT并不能降低发生率。
本发明实施例还提供一种基于动静结合语义特征的术后风险预测装置,如图8所示,该装置800包括:
静态特征处理单元801,被配置为响应于输入的术前特征和术中静态特征,对所述术前特征和术中静态特征分别进行清洗和处理得到术前特征向量矩阵和术中静态特征向量矩阵
动态特征抽取单元802,被配置为对术中动态特征进行抽取得到术中动态特征向量矩阵
特征融合单元803,被配置为将所述术前特征向量矩阵、术中静态特征向量矩阵以及术中动态特征向量矩阵融合得到融合向量矩阵
模型训练预测单元804,被配置为构建预测模型,利用所述融合向量矩阵对所述预测模型进行训练得到训练好的预测模型,基于训练好的预测模型实现术后风险预测。
在一些实施例中,如图9所示,所述装置还包括:
模型评估单元805,所述模型评估单元被配置为基于模型性能指标对训练好的预测模型进行评估,所述模型性能指标包括受试者工作特性曲线下面积、准确率、灵敏度、特异度、查准率、查全率以及F1分数。
在一些实施例中,如图9所示,所述装置还包括:
可解释性分析单元806,所述可解释性分析单元被配置为:
为所述融合向量矩阵中的各个特征对应分配一个贡献值,所述贡献值用于量化对应特征对模型预测的影响;
根据各个特征对应的贡献值对所述融合向量矩阵中的特征进行筛选。
在一些实施例中,所述术前特征为手术前能获得的基线参数,包括年龄、性别、体重指数、病史、最新的生理测量参数、最新的实验室测量参数以及手术位置、麻醉类型和ASA分类,所述手术前能获得的基线参数分为离散型特征和连续型特征,所述静态特征处理单元被进一步配置为通过如下方法对术前特征进行清洗得到术前特征向量矩阵
对于离散型特征,通过标签拆分、标签映射、基于规则的缺失值填补进行处理;
对于连续型特征,通过多重插补的方法对缺失值进行填补处理;
填补处理后的离散型特征和连续型特征共同组成术前特征向量矩阵
在一些实施例中,所述术中静态特征包括生命体征、呼吸机参数、术中输液量,术中输血量以及血流动力学信息,所述静态特征处理单元被进一步配置为通过如下方法对所述术中静态特征进行处理得到术中静态特征向量矩阵
对于生命体征和呼吸机参数,通过计算术中均值作为所述生命体征和呼吸机参数对应的静态特征值;
对于术中输液量和术中输血量,以手术期间的累积量作为所述术中输液量和术中输血量对应的静态特征值;
对于血流动力学信息,计算低于平均动脉压65毫米汞柱以下的曲线下面积作为所述血流动力学信息对应的静态特征值;
所述生命体征和呼吸机参数对应的静态特征值、所述术中输液量和术中输血量对应的静态特征值以及所述血流动力学信息对应的静态特征值共同组成术中静态特征向量矩阵
在一些实施例中,所述术中动态特征包括吸气峰压、平台压、呼气末正压、驱动压、肺组织动态顺应性、机械功率和标准化机械功率,所述动态特征抽取单元被进一步配置为通过如下方法对术中动态特征进行抽取得到术中动态特征向量矩阵
获取术中时序数据,并对所述术中时序数据进行对齐;所述术中时序数据包括术中时序序列,所述术中时序序列包括术中特征特征及其对应的时间;
对于含缺失记录和采样不规则的多变量的术中时间序列,根据数据的平均采样频率,设置时间滑动窗口,对所述时间滑动窗口内的时序数据进行聚合或根据前向滑动窗口进行均值填充;
基于填充后的术中时间序列,根据度量指标进行术中动态特征抽取以得到术中动态特征向量矩阵,所述度量指标包括最值、方差、标准差、术中时间序列的复杂度度量以及近似熵中的一种及其组合。
在一些实施例中,所述模型训练预测单元被进一步配置为:
对动静融合特征矩阵进行边缘值处理后,以去除相关度大于0.75的特征,利用五折交叉验证划分训练/测试集,在训练集上采用过采样方法以增强不平衡分布的数据;
利用经过处理后的训练/测试集对所述预测模型进行训练。
需要注意,本实施例所描述的各个装置结构与在先描述的方法属于同一技术构思,通过相同的原理达到同样的技术效果,此处不赘述。
本发明实施例还提供一种可读存储介质,所述可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上任一实施例所述的方法。
此外,尽管已经在本文中描述了示例性实施例,其范围包括任何和所有基于本发明的具有等同元件、修改、省略、组合(例如,各种实施例交叉的方案)、改编或改变的实施例。权利要求书中的元件将被基于权利要求中采用的语言宽泛地解释,并不限于在本说明书中或本申请的实施期间所描述的示例,其示例将被解释为非排他性的。因此,本说明书和示例旨在仅被认为是示例,真正的范围和精神由以下权利要求以及其等同物的全部范围所指示。
以上描述旨在是说明性的而不是限制性的。例如,上述示例(或其一个或更多方案)可以彼此组合使用。例如本领域普通技术人员在阅读上述描述时可以使用其它实施例。另外,在上述具体实施方式中,各种特征可以被分组在一起以简单化本发明。这不应解释为一种不要求保护的发明的特征对于任一权利要求是必要的意图。相反,本发明的主题可以少于特定的发明的实施例的全部特征。从而,以下权利要求书作为示例或实施例在此并入具体实施方式中,其中每个权利要求独立地作为单独的实施例,并且考虑这些实施例可以以各种组合或排列彼此组合。本发明的范围应参照所附权利要求以及这些权利要求赋权的等同形式的全部范围来确定。

Claims (10)

1.一种基于动静结合语义特征的术后风险预测方法,其特征在于,所述方法包括:
响应于输入的术前特征和术中静态特征,对所述术前特征和术中静态特征分别进行清洗和处理得到术前特征向量矩阵和术中静态特征向量矩阵
对术中动态特征进行抽取得到术中动态特征向量矩阵
将所述术前特征向量矩阵、术中静态特征向量矩阵以及术中动态特征向量矩阵融合得到融合向量矩阵
构建预测模型,利用所述融合向量矩阵对所述预测模型进行训练得到训练好的预测模型,基于训练好的预测模型实现术后风险预测。
2.根据权利要求1所述的方法,其特征在于,所述术前特征为手术前能获得的基线参数,包括年龄、性别、体重指数、病史、最新的生理测量参数、最新的实验室测量参数以及手术位置、麻醉类型和ASA分类,所述手术前能获得的基线参数分为离散型特征和连续型特征,通过如下方法对术前特征进行清洗得到术前特征向量矩阵
对于离散型特征,通过标签拆分、标签映射、基于规则的缺失值填补进行处理;
对于连续型特征,通过多重插补的方法对缺失值进行填补处理;
填补处理后的离散型特征和连续型特征共同组成术前特征向量矩阵
3.根据权利要求1所述的方法,其特征在于,所述术中静态特征包括生命体征、呼吸机参数、术中输液量,术中输血量以及血流动力学信息,通过如下方法对所述术中静态特征进行处理得到术中静态特征向量矩阵
对于生命体征和呼吸机参数,通过计算术中均值作为所述生命体征和呼吸机参数对应的静态特征值;
对于术中输液量和术中输血量,以手术期间的累积量作为所述术中输液量和术中输血量对应的静态特征值;
对于血流动力学信息,计算低于平均动脉压65毫米汞柱以下的曲线下面积作为所述血流动力学信息对应的静态特征值;
所述生命体征和呼吸机参数对应的静态特征值、所述术中输液量和术中输血量对应的静态特征值以及所述血流动力学信息对应的静态特征值共同组成术中静态特征向量矩阵
4.根据权利要求1所述的方法,其特征在于,所述术中动态特征包括吸气峰压、平台压、呼气末正压、驱动压、肺组织动态顺应性、机械功率和标准化机械功率,通过如下方法对术中动态特征进行抽取得到术中动态特征向量矩阵
获取术中时序数据,并对所述术中时序数据进行对齐;所述术中时序数据包括术中时序序列,所述术中时序序列包括术中特征特征及其对应的时间;
对于含缺失记录和采样不规则的多变量的术中时间序列,根据数据的平均采样频率,设置时间滑动窗口,对所述时间滑动窗口内的时序数据进行聚合或根据前向滑动窗口进行均值填充;
基于填充后的术中时间序列,根据度量指标进行术中动态特征抽取以得到术中动态特征向量矩阵,所述度量指标包括最值、方差、标准差、术中时间序列的复杂度度量以及近似熵中的一种及其组合。
5.根据权利要求1所述的方法,其特征在于,利用所述融合向量矩阵对所述预测模型进行训练,具体包括:
对动静融合特征矩阵进行边缘值处理后,以去除相关度大于0.75的特征,利用五折交叉验证划分训练/测试集,在训练集上采用过采样方法以增强不平衡分布的数据;
利用经过处理后的训练/测试集对所述预测模型进行训练。
6.根据权利要求1所述的方法,其特征在于,在利用所述融合向量矩阵对所述预测模型进行训练得到训练好的预测模型之后,所述方法还包括:
为所述融合向量矩阵中的各个特征对应分配一个贡献值,所述贡献值用于量化对应特征对模型预测的影响;
根据各个特征对应的贡献值对所述融合向量矩阵中的特征进行筛选。
7.一种基于动静结合语义特征的术后风险预测装置,其特征在于,所述装置包括:
静态特征处理单元,被配置为响应于输入的术前特征和术中静态特征,对所述术前特征和术中静态特征分别进行清洗和处理得到术前特征向量矩阵和术中静态特征向量矩阵
动态特征抽取单元,被配置为对术中动态特征进行抽取得到术中动态特征向量矩阵
特征融合单元,被配置为将所述术前特征向量矩阵、术中静态特征向量矩阵以及术中动态特征向量矩阵融合得到融合向量矩阵
模型训练预测单元,被配置为构建预测模型,利用所述融合向量矩阵对所述预测模型进行训练得到训练好的预测模型,基于训练好的预测模型实现术后风险预测。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
模型评估单元,所述模型评估单元被配置为基于模型性能指标对训练好的预测模型进行评估,所述模型性能指标包括受试者工作特性曲线下面积、准确率、灵敏度、特异度、查准率、查全率以及F1分数。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
可解释性分析单元,所述可解释性分析单元被配置为:
为所述融合向量矩阵中的各个特征对应分配一个贡献值,所述贡献值用于量化对应特征对模型预测的影响;
根据各个特征对应的贡献值对所述融合向量矩阵中的特征进行筛选。
10.一种存储有指令的非暂时性计算机可读存储介质,当所述指令由处理器执行时,执行根据权利要求1~6中任一项所述的方法。
CN202410958453.9A 2024-08-13 2024-08-13 基于动静结合语义特征的术后风险预测方法、装置及介质 Pending CN118645245A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410958453.9A CN118645245A (zh) 2024-08-13 2024-08-13 基于动静结合语义特征的术后风险预测方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410958453.9A CN118645245A (zh) 2024-08-13 2024-08-13 基于动静结合语义特征的术后风险预测方法、装置及介质

Publications (1)

Publication Number Publication Date
CN118645245A true CN118645245A (zh) 2024-09-13

Family

ID=92666060

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410958453.9A Pending CN118645245A (zh) 2024-08-13 2024-08-13 基于动静结合语义特征的术后风险预测方法、装置及介质

Country Status (1)

Country Link
CN (1) CN118645245A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119252492A (zh) * 2024-12-04 2025-01-03 中国人民解放军空军军医大学 基于大数据的腹腔镜风险预测模型及其构建方法
CN120260936A (zh) * 2025-06-05 2025-07-04 上海交通大学医学院附属仁济医院 基于人工智能的多模态前列腺癌生化复发风险分层预测系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119252492A (zh) * 2024-12-04 2025-01-03 中国人民解放军空军军医大学 基于大数据的腹腔镜风险预测模型及其构建方法
CN120260936A (zh) * 2025-06-05 2025-07-04 上海交通大学医学院附属仁济医院 基于人工智能的多模态前列腺癌生化复发风险分层预测系统
CN120260936B (zh) * 2025-06-05 2025-09-16 上海交通大学医学院附属仁济医院 基于人工智能的多模态前列腺癌生化复发风险分层预测系统

Similar Documents

Publication Publication Date Title
CN101938939B (zh) 用于测量和预测患者呼吸稳定性的装置
RU2728855C9 (ru) Количественный показатель предупреждения об ухудшении работы сердечно-сосудистой системы
CN118645245A (zh) 基于动静结合语义特征的术后风险预测方法、装置及介质
US20030101076A1 (en) System for supporting clinical decision making through the modeling of acquired patient medical information
US20090149724A1 (en) System and method for predicting septic shock
CN110051324B (zh) 一种急性呼吸窘迫综合征死亡率预测方法及系统
US20120239435A1 (en) Automated annotation of clinical data
US20190392952A1 (en) Computer-implemented methods, systems, and computer-readable media for diagnosing a condition
CN107249434B (zh) 鲁棒分类器
Jaffe Using the features of the time and volumetric capnogram for classification and prediction
US20150019237A1 (en) Holistic patient advisory system, method, and software
JP2013511781A (ja) 治療プロトコールテンプレート生成・分岐論理システム
KR20190132290A (ko) 환자 진단 학습 방법, 서버 및 프로그램
US20240274297A1 (en) Surgical warning
CN118553435A (zh) 一种医疗临床数据处理方法、系统、设备及存储介质
WO2023200930A1 (en) System and methods for continuously assessing performance of predictive analytics in a clinical decision support system
Umoh et al. Optimizing Hypertension Risk Classification through Machine Learning
CN118766423A (zh) 一种基于大数据监测的重症监护状态报警方法及系统
CN118553372A (zh) 基于人工智能的医疗数据管理系统
Umut et al. Prediction of sepsis disease by Artificial Neural Networks
US20250037835A1 (en) Generating recommendations for ventilation
CN120072264B (zh) 一种胸痛智能分诊方法及系统
EP4546370A1 (en) Generating recommendations for ventilation
US20250325237A1 (en) Clinical education method and system
Lee Developing predictive models for risk of postoperative complications and hemodynamic instability in patients undergoing surgery

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination