CN111653359A - 一种出血性疾病的智能预测模型构建方法和预测系统 - Google Patents
一种出血性疾病的智能预测模型构建方法和预测系统 Download PDFInfo
- Publication number
- CN111653359A CN111653359A CN202010480854.XA CN202010480854A CN111653359A CN 111653359 A CN111653359 A CN 111653359A CN 202010480854 A CN202010480854 A CN 202010480854A CN 111653359 A CN111653359 A CN 111653359A
- Authority
- CN
- China
- Prior art keywords
- information
- characteristic information
- bleeding
- hemorrhagic disease
- representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 208000031169 hemorrhagic disease Diseases 0.000 title claims abstract description 63
- 238000010276 construction Methods 0.000 title claims abstract description 8
- 208000032843 Hemorrhage Diseases 0.000 claims abstract description 105
- 230000000740 bleeding effect Effects 0.000 claims abstract description 89
- 208000034158 bleeding Diseases 0.000 claims abstract description 85
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 49
- 208000024891 symptom Diseases 0.000 claims abstract description 46
- 201000010099 disease Diseases 0.000 claims abstract description 43
- 238000004364 calculation method Methods 0.000 claims abstract description 39
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000013507 mapping Methods 0.000 claims abstract description 8
- 230000019771 cognition Effects 0.000 claims abstract description 3
- 238000012512 characterization method Methods 0.000 claims description 14
- 230000014509 gene expression Effects 0.000 claims description 11
- 238000010801 machine learning Methods 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000013145 classification model Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 238000012821 model calculation Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 108700024394 Exon Proteins 0.000 claims description 3
- 239000008280 blood Substances 0.000 claims description 2
- 210000004369 blood Anatomy 0.000 claims description 2
- 208000001780 epistaxis Diseases 0.000 description 12
- 206010028748 Nasal obstruction Diseases 0.000 description 5
- 208000019425 cirrhosis of liver Diseases 0.000 description 5
- 210000004185 liver Anatomy 0.000 description 5
- 206010000060 Abdominal distension Diseases 0.000 description 4
- 206010006784 Burning sensation Diseases 0.000 description 4
- 206010016654 Fibrosis Diseases 0.000 description 4
- 208000016988 Hemorrhagic Stroke Diseases 0.000 description 4
- 206010023126 Jaundice Diseases 0.000 description 4
- 208000003251 Pruritus Diseases 0.000 description 4
- 206010037549 Purpura Diseases 0.000 description 4
- 241001672981 Purpura Species 0.000 description 4
- 206010041519 Spider naevus Diseases 0.000 description 4
- 230000007882 cirrhosis Effects 0.000 description 4
- 208000020658 intracerebral hemorrhage Diseases 0.000 description 4
- 206010003445 Ascites Diseases 0.000 description 3
- 206010008111 Cerebral haemorrhage Diseases 0.000 description 3
- 208000034507 Haematemesis Diseases 0.000 description 3
- 206010019233 Headaches Diseases 0.000 description 3
- 208000006083 Hypokinesia Diseases 0.000 description 3
- 206010028740 Nasal dryness Diseases 0.000 description 3
- 206010041660 Splenomegaly Diseases 0.000 description 3
- 208000032851 Subarachnoid Hemorrhage Diseases 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 231100000869 headache Toxicity 0.000 description 3
- 208000006750 hematuria Diseases 0.000 description 3
- 210000001331 nose Anatomy 0.000 description 3
- ATUOYWHBWRKTHZ-UHFFFAOYSA-N Propane Chemical compound CCC ATUOYWHBWRKTHZ-UHFFFAOYSA-N 0.000 description 2
- 206010040860 Skin haemorrhages Diseases 0.000 description 2
- 208000007502 anemia Diseases 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000007803 itching Effects 0.000 description 2
- 210000004400 mucous membrane Anatomy 0.000 description 2
- 210000000492 nasalseptum Anatomy 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000009885 systemic effect Effects 0.000 description 2
- 208000004998 Abdominal Pain Diseases 0.000 description 1
- 201000008283 Atrophic Rhinitis Diseases 0.000 description 1
- 206010014080 Ecchymosis Diseases 0.000 description 1
- 208000031969 Eye Hemorrhage Diseases 0.000 description 1
- 208000012671 Gastrointestinal haemorrhages Diseases 0.000 description 1
- 206010018276 Gingival bleeding Diseases 0.000 description 1
- 208000031220 Hemophilia Diseases 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- 208000000616 Hemoptysis Diseases 0.000 description 1
- 208000031953 Hereditary hemorrhagic telangiectasia Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 208000032382 Ischaemic stroke Diseases 0.000 description 1
- 206010030113 Oedema Diseases 0.000 description 1
- 206010030302 Oliguria Diseases 0.000 description 1
- 206010039088 Rhinitis atrophic Diseases 0.000 description 1
- 206010039101 Rhinorrhoea Diseases 0.000 description 1
- 206010039509 Scab Diseases 0.000 description 1
- 206010041235 Snoring Diseases 0.000 description 1
- 206010043189 Telangiectasia Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 206010003549 asthenia Diseases 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000005013 brain tissue Anatomy 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 208000002173 dizziness Diseases 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 208000007565 gingivitis Diseases 0.000 description 1
- 208000035861 hematochezia Diseases 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000007917 intracranial administration Methods 0.000 description 1
- 230000003907 kidney function Effects 0.000 description 1
- 230000003908 liver function Effects 0.000 description 1
- 210000003141 lower extremity Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 208000010753 nasal discharge Diseases 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 201000001245 periodontitis Diseases 0.000 description 1
- 239000001294 propane Substances 0.000 description 1
- 206010039083 rhinitis Diseases 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 208000009056 telangiectasis Diseases 0.000 description 1
- 206010043554 thrombocytopenia Diseases 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供了一种出血性疾病的智能预测模型构建方法,包括以下步骤:建立身体出血外显的信息表征的特征信息与出血性疾病症状特征信息映射关系的数据库;根据获取到的身体出血外显的信息表征与出血性疾病症状特征信息表示的匹配关系,建立身体出血外显的信息表征与出血性疾病对之间特征信息的语义相似度的计算模型。本发明通过出血性疾病的智能预测模型构建,实现身体出血外显的信息表征的特征信息与疾病之间关系的语义认知,从而智能地预测或评估和辅助诊断出血性疾病的类别、出血的原因和可能的疾病。
Description
技术领域
本发明涉及一种疾病的智能预测模型构建方法和预测系统,特别是涉及出血性疾病的能预测模型构建方法预测方法和预测系统。
背景技术
人的身体在健康的条件下,一般是不会有异常出血的情况。但是一旦身体出现了异常出血的状况(比如呕血、咯血、牙出血、鼻出血、皮肤出血、血尿、便血、脑出血、眼出血等等),往往就是某些疾病的征兆。比如牙龈出血,其原因:一类情况多由牙龈炎或牙周炎引起,出血量不多但可自行停止;另一类量多且不容易止血。其病因主要与全身性的疾病有关联。这类全身疾病通常包括:高血压、血友病、贫血、肝硬化、肝炎等;再比如,如果脑出血和蛛网膜下腔出血(SAH),往往是出血性卒中的征兆。出血性卒中系指多种病因导致的原发性颅内出血性疾病。
一般传统的身体异常出血后的临床预测或评估方法是:询问病史、体格检查、实验室检查、其他检查(如骨髓检查、肝肾功能检查、免疫学检验、遗传学检验及组织病理学检查等),检查过程繁琐而且复杂。近年来,有报道说,针对出血性卒中,在精确计算出血量的基础上,已有学者尝试通过多种临床信息进行临床评估,例如采用CT图像结合临床变量,构建出可以预测蛛网膜下腔出血后继发缺血性卒中的模型,其受试者工作特征曲线(ROC)曲线下面积(AUC)为0.74。可以预见,随着人工智能(AI)技术、大数据分析技术的不断进步,未来不仅可以完成对出血量、出血部位、脑组织受压等结构改变的精准描述,同时还可以进一步结合功能影像学实现对出血性卒中的精准诊断,成为精准评估、预测、治疗的基础。
发明内容
本发明一方面提供了一种出血性疾病的智能预测模型构建方法,包括以下步骤:
建立身体出血外显的信息表征的特征信息与出血性疾病症状(或者征兆)特征信息映射关系的数据库(即分词和短语库,或者描述性分词、短语库);从所述数据库中获取具有匹配关系的身体出血外显的信息表征与出血性疾病对,并从获取到的身体出血外显的信息表征和出血性疾病对中分别抽取各自特征信息的表示;
根据获取到的身体出血外显的信息表征与出血性疾病症状特征信息表示的匹配关系,建立身体出血外显的信息表征与出血性疾病对之间特征信息的语义相似度的计算模型。
优选的,所述数据库的构建的步骤包括:从各类文本中提取相应的分词和短语,然后对提取到的分词和短语的特征信息进行标定,得到身体出血外显的信息表征的特征信息与出血性疾病症状特征信息对的特征信息。
进一步的,为更精确的划分提高模型计算的准确率,所述数据库的构建步骤还包括,根据身体出血外显的信息表征的语义特征对身体出血外显的信息表征进行聚类,得到身体出血外显的信息表征类;根据身体出血(人体出血)外显的信息表征类对相应的疾病进行划分和聚类,得到疾病类(由身体出血外显的信息表征类对相应的疾病构成的聚类)。
可选的,所述聚类过程中由身体出血外显的信息表征构成的特征集合中所包含的待选特征的数量范围可以预设。
更进一步的,所述聚类过程中针对每个特征集合使用m个训练样本在该特征集合包含的每个待选特征下的特征值和待选特征对应的分类标签,训练分类模型,获得该特征集合对应的分类准确率m个。
为更精确的划分和提高模型计算的准确率,在本发明的一些实施例中,所述身体出血外显的信息表征和/或出血性疾病对的表示包括多个义原描述和关系符号描述。
进一步的,获取身体出血外显的信息表征的目标特征信息和疾病的目标症状或者征兆特征信息,利用计算模型,对疾病的目标症状(或者征兆)特征信息和身体出血外显的信息表征的目标特征信息进行语义相似度计算。
本发明还提供了一种出血性疾病的智能预测系统,包括数据库模块,模型模块、计算模块,所述数据库模块,用于构建一个具有匹配关系的、身体出血外显的信息表征的特征信息与出血性疾病症状特征信息映射关系的数据库;所述模型模块,用于根据获取到的身体出血外显的信息表征与出血性疾病症状的特征信息的表示和匹配关系,利用机器学习和神经网络分类的方法,建立身体出血外显的信息表征的特征信息与出血性疾病症状间特征信息语义相似度的计算模型;所述计算模块,用于获取身体出血外显的信息表征目标特征信息和出血性疾病目标症状特征信息以及身体出血各种空间关系因子,利用计算模型对它们进行语义相似度估计和计算。
附图说明
下面结合附图和实施例对本发明作进一步说明:
图1为本发明的出血性疾病的智能预测模型构建方法的基本流程图;
图2为本发明的数据库构件过程中出血外显的信息表征的特征信息与出血性疾病症状特征信息聚类过程示意图。
具体实施方式
参考附图1,一种出血性疾病的智能预测模型构建方法,包括以下步骤:
建立身体出血外显的信息表征的特征信息与出血性疾病症状特征信息映射关系的数据库;从所述数据库中获取具有匹配关系的身体出血外显的信息表征与出血性疾病对,并从获取到的身体出血外显的信息表征和出血性疾病对中分别抽取各自特征信息的表示;
根据获取到的身体出血外显的信息表征与出血性疾病症状特征信息表示的匹配关系,建立身体出血外显的信息表征与出血性疾病对之间特征信息的语义相似度的计算模型。
在本发明的一些实施例中,所述数据库的构建的步骤还包括:从各类文本中提取相应的分词和短语,然后对提取到的分词和短语的特征信息进行标定,得到身体出血外显的信息表征的特征信息与出血性疾病症状特征信息对的特征信息。需要说明的是,本发明所指的各类文本包括但不限于可转换为二进制由计算机读取的文本文件,例如,由各类医学书籍、报刊、杂质等媒介转换为计算机可直接读取的txt、pdf等文件形式的文本文件。
参考附图2,进一步的,为更精确的划分提高预测的准确率,所述数据库的构建步骤还包括,根据身体出血外显的信息表征的语义特征对身体出血外显的信息表征进行聚类,得到身体出血外显的信息表征类;根据身体出血外显的信息表征类对相应的疾病进行划分和聚类,得到疾病类。
可选的,所述聚类过程中由身体出血外显的信息表征构成的特征集合中所包含的待选特征的数量范围可以预设。比如,鼻出血类特征集合:1、鼻出血、紫癜、轻度黄疸、肝掌、蜘蛛痣,脾大、乏力、腹胀、腹水---可能为肝硬化;2、鼻出血、牙龈渗血、皮肤出血点、淤斑、呕血、黑便、血尿、脑出血等-可能为血小板减少症;3、鼻出血、鼻塞、头疼、鼻涕多,甚至打鼾-可能为鼻中隔偏曲;4、鼻出血、鼻腔干燥、痂皮、鼻阻塞、头痛、吹哨声-鼻中隔穿孔;5、鼻出血、鼻内发干,鼻腔分泌物减少,发痒、灼热感、经常挖鼻-可能为干燥性鼻炎;6、鼻出血、鼻及鼻咽干燥感、鼻塞、头疼、头昏-可能为萎缩性鼻炎;7、鼻出血、鼻塞,鼻前部瘙痒,烧灼感,少量渗液、前部皮肤及粘膜粉红色小结节----可能为鼻结核;8、鼻出血、呕血、黑便、腹痛、毛细血管扩张症、血尿、贫血---可能为遗传性出血性毛细血管扩张症等等)中包含的待选特征(比如,鼻内发干,鼻腔分泌物减少,发痒、灼热感、经常挖鼻等等)数量的范围。(注:比如,鼻出血外显特征信息如果有紫癜、轻度黄疸、肝掌、蜘蛛痣,脾大、乏力、腹胀、腹水等,那么,其特征信息基本可以推测为肝硬化;因为疾病肝硬化的症状一般为乏力、腹胀、轻度黄疸、肝掌、蜘蛛痣,面色晦暗,尿少、双下肢水肿,鼻出血、紫癜等。他们之间的特征信息有很强的相似性)。则初始特征集合包含的待选特征的数量可以为该范围的最大值,即从全部的N个待选特征中依次去掉重要性度量值(比如,如果出现紫癜、轻度黄疸、肝掌、蜘蛛痣、脾大、乏力、腹胀、腹水等特征信息,同时还有鼻塞,鼻前部瘙痒,烧灼感,少量渗液、前部皮肤及粘膜粉红色小结节等特征信息,那么,可以看到,实际上后面的这些特征信息不是或者很少是肝硬化的特征信息,所以其分词或者短语重要性度量值都很小,或者没有关系)最小的待选特征,直到剩下该范围的最大值相应数量的待选特征,得到初始特征集合;特征集合中的待选特征数量达到该范围的最小值时,该特征集合可以作为最后一个特征集合。需要说明的是,针对已经确定的特征集合,在模型训练时不需要按照获得特征集合的顺序进行。待选特征按照重要性度量值从大倒小的顺序为:A1~A16。所确定的多个特征集包括:A1~A16;A1~A15;A1~A14;……;A1~A2;A1。假设预设特征集合中包含的待选特征数量的范围为5~10,则所确定的多个特征集合包括:A1~A10;A1~A9;A1~A8;A1~A7;A1~A6;A1~A5。
更进一步的,所述聚类过程中针对每个特征集合使用m个训练样本在该特征集合包含的每个待选特征下的特征值和待选特征对应的分类标签,训练分类模型,获得该特征集合对应的分类准确率m个。例如,针对身体出血外显的信息表征的特征信息集合A1~A10,根据某个样本在A1~A10下的特征值,使用分类模型来确定该样本的分类,若确定出的分类结果与该样本的分类标签相同,则分类正确;否则分类错误。得到m个样本的分类结果后即可确定m个样本中分类准确的概率,将其确定为特征集合A1~A10对应的分类准确率。按照上述的方式即可确定每个特征集合对应的分类准确率。将分类准确率最高的特征集合包含的待选特征确定为选定特征。此处,当分类准确率最高的特征集合有两个或者以上时,将其中待选特征数量最少的特征集合包含的待选特征确定为选定特征。这样做的目的是为了构建一个基本的数据库,为推理和匹配所用。
为更精确的划分和提高模型预测的准确率,在本发明的一些实施例中,所述身体出血外显的信息表征和/或出血性疾病对的表示包括多个义原描述和关系符号描述。进一步的,具体计算模型和计算方法如下:
由于上述特征信息表示(分词或者短语)不是组织在一个树状的层次体系中,而是一种网状结构;因此可以借助义原和符号对概念进行描述。对于两个词条Wl(身体出血外显的信息表征的目标特征信息)和W2(疾病的目标症状或者征兆特征信息),W1有个n特征信息义项(概念,分词或者短语):Sll,S12,…,S1n,W2有个m特征信息义项(概念,分词或者短语):S21,S22,…,S2m,那么,W1和W2的相似度是各个特征信息义项(概念,分词或者短语)的相似度之最大值,也就是说:
在上述计算模型中,为了更加精确地计算出它们之间的语义相似度,我们把它们的描述可以表示为一个特征结构,该特征结构含有以下四个特征:
1)、第一基本义原描述:其值为一个基本义原,将两个概念的这一部分的相似度记为Siml(Sl,S2);
2)、其它基本义原描述:对应于语义表达式中除第一基本义原描述式以外的所有基本义原描述式,其值为一个基本义原的集合,将两个概念的这一部分的相似度记为Sim2(S1,S2);
3)、关系义原描述:对应于语义表达式中所有的关系义原描述式,其值是一个特征结构,对于该特征结构的每一个特征,其属性是一个关系义原,其值是一个基本义原,或一个具体词。将两个概念的这一部分的相似度记为Sim3(S1,S2);
4)、关系符号描述:对应于语义表达式中所有的关系符号描述式,其值也是一个特征结构,对于该特征结构的每一个特征,其属性是一个关系义原,其值是一个集合,该集合的元素是一个基本义原,或一个具体词。将两个概念的这一部分的相似度记为Sim4(S1,S2)。
由此可见,由于各个义原所处的层次不一样,因而它们对词语相似度的影响程度也不一样,也就是说部分相似性在整体相似性中所占的权重是不一样的,权重(百分比)用β表示,于是,概念的整体相似度可以记为:
其中,β(1≤i≤4)是可调节的参数,且有:β1+β2+β3+β4=1,β1≥β2≥P3≥β4。后者反映了Siml(Sl,S2)到Sim4(Sl,S2)对于总体相似度所起到的作用依次递减。由于第一独立义原描述式反映了一个概念最主要的特征,所以应该将其权值定义得比较大,一般应在0.5以上。在以上计算中,最后求加权平均时,各部分取相等的权值。这样,就把两个词语之间的相似度问题归结到了两个概念之间的相似度问题。然后利用机器学习和神经分类的方法,建立身体出血外显的信息表征的特征信息与出血性疾病症状间特征信息语义相似度的计算模型;常见的计算语义相似度的深度学习模型包括DSSM(Deep Structured SemanticModels)、CNN-DSSM(Convolutional latent Semantic Model)、LSTM-DSSM(Long-Short-Term Memory Deep Structured Semantic Models)。
为进一步提高预测的准确率,所述计算模型还包括将影响身体出血的间接空间关系因子λ(包括直接关系:比如出血的数量、诱发原因、性状、部位等;间接关系:年龄、性别、家族历史等),设定为可变或固定的权重,例如将直接关系设为固定权重λ,间接关系设为可变权重,作为相似度的权重系数(与调节参数相似度β相加或相乘)参与血认知模型里面进行匹配和加权计算。
本发明还公开了一种出血性疾病的智能预测系统,包括数据库模块,模型模块、计算模块,所述数据库模块,用于构建一个具有匹配关系的、身体出血外显的信息表征的特征信息与出血性疾病症状特征信息映射关系的数据库;所述模型模块,用于根据获取到的身体出血外显的信息表征与出血性疾病症状的特征信息的表示和匹配关系,利用机器学习和神经网络分类的方法,建立身体出血外显的信息表征的特征信息与出血性疾病症状间特征信息语义相似度的计算模型;所述计算模块,用于获取身体出血外显的信息表征目标特征信息和出血性疾病目标症状特征信息以及身体出血各种空间关系因子,利用计算模型对它们进行语义相似度估计和计算。
在本发明的一些实施例中,为提高模型构建速度和计算准确率,将初步数据处理过程交由非模型模块处理。具体为,所述出血性疾病的智能预测系统包括数据库模块,特征提取模块、聚类模块参考对选取模块、影响因子模块、模型模块、相似度计算估计模块,所述数据库模块,用于构建一个具有匹配关系的、身体出血外显的信息表征的特征信息与出血性疾病症状特征信息映射关系的数据库;
所述特征提取模块,用于从数据库中获取具有匹配关系的身体出血外显的信息表征与出血性疾病对,并从获取到的所述身体出血外显的信息表征与出血性疾病中分别抽取特征信息的表示;
所述聚类模块,用于根根据疾病的语义特征对疾病进行聚类得到疾病类(由一个或多个疾病、身体出血外显的信息共同构成的聚类),以及根据疾病类相应的身体出血外显的信息表征进行划分和聚类得到身体出血外显的信息表征类;
所述参考对选取模块,用于从每个类中选取参考疾病症状和相应的身体出血外显的信息表征构成参考对;
所述影响因子模块,用于身体出血直接影响的空间关系因子对语义相似度的影响进行量化;
所述模型模块,用于根据获取到的身体出血外显的信息表征与出血性疾病症状的特征信息的表示和匹配关系,利用机器学习和神经网络分类的方法,建立身体出血外显的信息表征的特征信息与出血性疾病症状间特征信息语义相似度的计算模型;
所述相似度计算估计模块,用于获取身体出血外显的信息表征目标特征信息和出血性疾病目标症状特征信息以及身体出血各种空间关系因子,利用计算模型对它们进行语义相似度估计和计算。相似度计算模块还用于由各类相似度估计函数加权获得目标疾病与身体出血外显的信息表征的目标特征信息间的相似度估计函数。
为了相对科学的筛查到底属于哪一个疾病,可以通过身体出血外显的信息表征的特征信息和疾病临床症状特征信息比对后的特征信息(选定特征)的权重进行计算。因为对于确认一类疾病组或具体疾病自诊所发挥的作用各有不同,因此体现为权重信息。不同的临床症状特征(选定特征)对于不同的疾病诊断的贡献是不同的,相应地,赋予不同的权重,就能够初步诊断出一类或者一个具体的疾病。比如:“甲”、“乙”、“丙”三种身体出血外显的信息表征的特征信息的权重表如下所示。根据各个特征权重,可以计算出患病概率。举例:选择设有“甲”、“乙”、“丙”三种身体出血类别,每种类别分别有五、六、七个症状标签,标签中有共同症状两个,如下:甲:共同标签1,共同标签2,甲标签1,甲标签2,甲标签3;乙:共同标签1,共同标签2,乙标签1,乙标签2,乙标签3,乙标签4;丙:共同标签1,共同标签2,丙标签1,丙标签2,丙标签3,丙标签4,丙标签5。假设:用户选择了“共同标签1”,“甲标签1”,“丙标签5”,计算患病概率的步骤如下所示:第一步,计算各个疾病权重。疾病甲权重=1+5=6;疾病乙权重=1;疾病丙权重=1+50=51;总权重:6+1+50=58;第二步:根据各个疾病权重,计算患病概率。疾病甲概率:6/58=10.3%;疾病乙概率:1/58=1.7%;疾病丙概率:51/58=87.9%。
然后获取身体出血外显的信息表征的目标特征信息和疾病的目标症状特征信息,利用所述计算模型,对疾病的目标症状特征信息和身体出血外显的信息表征的目标特征信息进行语义相似度计算。计算方法按照前文所述模型计算方法执行,此处不再赘述。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种出血性疾病的智能预测模型构建方法,包括以下步骤:
建立身体出血外显的信息表征的特征信息与出血性疾病症状特征信息映射关系的数据库;从所述数据库中获取具有匹配关系的身体出血外显的信息表征与出血性疾病对,并从获取到的身体出血外显的信息表征和出血性疾病对中分别抽取各自特征信息的表示;
根据获取到的身体出血外显的信息表征与出血性疾病症状特征信息表示的匹配关系,建立身体出血外显的信息表征与出血性疾病对之间特征信息的语义相似度的计算模型。
2.根据权利要求1所述的出血性疾病的智能预测模型构建方法,其特征在于,所述数据库的构建的步骤包括:从各类文本中提取相应的分词和短语,然后对提取到的分词和短语的特征信息进行标定,得到身体出血外显的信息表征的特征信息与出血性疾病症状特征信息对的特征信息。
3.根据权利要求2所述的出血性疾病的智能预测模型构建方法,其特征在于,所述数据库的构建步骤还包括,根据身体出血外显的信息表征的语义特征对身体出血外显的信息表征进行聚类,得到身体出血外显的信息表征类;根据身体出血外显的信息表征类对相应的疾病进行划分和聚类,得到疾病类。
4.根据权利要求3所述的出血性疾病的智能预测模型构建方法,其特征在于,所述聚类过程中由身体出血外显的信息表征构成的特征集合中所包含的待选特征的数量范围可以预设。
5.根据权利要求4所述的出血性疾病的智能预测模型构建方法,其特征在于,所述聚类过程中针对每个特征集合使用m个训练样本在该特征集合包含的每个待选特征下的特征值和待选特征对应的分类标签,训练分类模型,获得该特征集合对应的分类准确率m个。
6.根据权利要求1所述的出血性疾病的智能预测模型构建方法,所述身体出血外显的信息表征和/或出血性疾病对的表示包括多个义原描述和关系符号描述。
8.根据权利要求6或7所述的出血性疾病的智能预测模型构建方法,其特征在于,所述计算模型还包括将影响身体出血的间接空间关系因子设定为可变或固定的权重,参与血认知模型里面进行匹配和加权计算。
9.一种出血性疾病的智能预测系统,其特征在于,包括数据库模块,模型模块、计算模块,所述数据库模块,用于构建一个具有匹配关系的、身体出血外显的信息表征的特征信息与出血性疾病症状特征信息映射关系的数据库;
所述模型模块,用于根据获取到的身体出血外显的信息表征与出血性疾病症状的特征信息的表示和匹配关系,利用机器学习和神经网络分类的方法,建立身体出血外显的信息表征的特征信息与出血性疾病症状间特征信息语义相似度的计算模型;
所述计算模块,用于获取身体出血外显的信息表征目标特征信息和出血性疾病目标症状特征信息以及身体出血各种空间关系因子,利用计算模型对它们进行语义相似度估计和计算。
10.根据权利要求9所述的出血性疾病的智能预测系统,其特征在于,所述计算模块还用于由各类相似度估计函数加权获得目标疾病与身体出血外显的信息表征的目标特征信息间的相似度估计函数。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202010480854.XA CN111653359B (zh) | 2020-05-30 | 2020-05-30 | 一种出血性疾病的智能预测模型构建方法和预测系统 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202010480854.XA CN111653359B (zh) | 2020-05-30 | 2020-05-30 | 一种出血性疾病的智能预测模型构建方法和预测系统 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN111653359A true CN111653359A (zh) | 2020-09-11 |
| CN111653359B CN111653359B (zh) | 2023-09-08 |
Family
ID=72348119
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202010480854.XA Active CN111653359B (zh) | 2020-05-30 | 2020-05-30 | 一种出血性疾病的智能预测模型构建方法和预测系统 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN111653359B (zh) |
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112086200A (zh) * | 2020-09-17 | 2020-12-15 | 吾征智能技术(北京)有限公司 | 一种基于口苦预测疾病的系统、设备、存储介质 |
| CN112133391A (zh) * | 2020-09-17 | 2020-12-25 | 吾征智能技术(北京)有限公司 | 一种基于人体异常眉毛的疾病认知系统 |
| CN112185571A (zh) * | 2020-09-17 | 2021-01-05 | 吾征智能技术(北京)有限公司 | 一种基于口酸的疾病辅助诊断系统、设备、存储介质 |
| CN112233750A (zh) * | 2020-10-20 | 2021-01-15 | 吾征智能技术(北京)有限公司 | 一种基于咯血性状及疾病的信息匹配系统 |
| CN112233793A (zh) * | 2020-10-20 | 2021-01-15 | 吾征智能技术(北京)有限公司 | 一种基于血精及疾病的自学习信息匹配系统 |
| CN112233792A (zh) * | 2020-10-20 | 2021-01-15 | 吾征智能技术(北京)有限公司 | 一种基于便血的疾病推导系统 |
| CN112259219A (zh) * | 2020-09-30 | 2021-01-22 | 吾征智能技术(北京)有限公司 | 一种基于上消化道出血预测疾病的系统、设备、存储介质 |
| CN112331352A (zh) * | 2020-11-04 | 2021-02-05 | 吾征智能技术(北京)有限公司 | 一种基于登革热的信息智能匹配系统 |
| CN112349423A (zh) * | 2020-11-04 | 2021-02-09 | 吾征智能技术(北京)有限公司 | 一种基于BiMPM方法的口干信息匹配系统 |
| CN115081749A (zh) * | 2022-07-28 | 2022-09-20 | 华中科技大学 | 基于贝叶斯优化lstm的盾构掘进载荷超前预测方法及系统 |
Citations (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20040193022A1 (en) * | 2003-03-24 | 2004-09-30 | Fujitsu Limited | Diagnostic support system and diagnostic support program |
| CA2683169A1 (en) * | 2009-10-16 | 2011-04-16 | Majed Khraishi | A method for diagnosing psoriatic arthritis in patients with skin psoriasis |
| CA2885834A1 (en) * | 2012-09-27 | 2014-04-03 | The Children's Mercy Hospital | System for genome analysis and genetic disease diagnosis |
| CN103955703A (zh) * | 2014-04-25 | 2014-07-30 | 杭州电子科技大学 | 一种基于朴素贝叶斯的医疗影像疾病分类方法 |
| CN105095665A (zh) * | 2015-08-13 | 2015-11-25 | 易保互联医疗信息科技(北京)有限公司 | 一种中文疾病诊断信息的自然语言处理方法及系统 |
| CN107610779A (zh) * | 2017-10-25 | 2018-01-19 | 医渡云(北京)技术有限公司 | 疾病评价及患病风险评估方法及装置 |
| CN107862179A (zh) * | 2017-11-06 | 2018-03-30 | 中南大学 | 一种基于相似性和逻辑矩阵分解的miRNA‑疾病关联关系预测方法 |
| CN107887023A (zh) * | 2017-12-08 | 2018-04-06 | 中南大学 | 一种基于相似性和双随机游走的微生物‑疾病关系预测方法 |
| CN109471950A (zh) * | 2018-11-19 | 2019-03-15 | 北京交通大学 | 腹部超声文本数据的结构化知识网络的构建方法 |
| CN111063434A (zh) * | 2019-12-26 | 2020-04-24 | 北京中润普达信息技术有限公司 | 一种基于临床症状特征的性病诊断系统 |
-
2020
- 2020-05-30 CN CN202010480854.XA patent/CN111653359B/zh active Active
Patent Citations (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20040193022A1 (en) * | 2003-03-24 | 2004-09-30 | Fujitsu Limited | Diagnostic support system and diagnostic support program |
| CA2683169A1 (en) * | 2009-10-16 | 2011-04-16 | Majed Khraishi | A method for diagnosing psoriatic arthritis in patients with skin psoriasis |
| CA2885834A1 (en) * | 2012-09-27 | 2014-04-03 | The Children's Mercy Hospital | System for genome analysis and genetic disease diagnosis |
| CN103955703A (zh) * | 2014-04-25 | 2014-07-30 | 杭州电子科技大学 | 一种基于朴素贝叶斯的医疗影像疾病分类方法 |
| CN105095665A (zh) * | 2015-08-13 | 2015-11-25 | 易保互联医疗信息科技(北京)有限公司 | 一种中文疾病诊断信息的自然语言处理方法及系统 |
| CN107610779A (zh) * | 2017-10-25 | 2018-01-19 | 医渡云(北京)技术有限公司 | 疾病评价及患病风险评估方法及装置 |
| CN107862179A (zh) * | 2017-11-06 | 2018-03-30 | 中南大学 | 一种基于相似性和逻辑矩阵分解的miRNA‑疾病关联关系预测方法 |
| CN107887023A (zh) * | 2017-12-08 | 2018-04-06 | 中南大学 | 一种基于相似性和双随机游走的微生物‑疾病关系预测方法 |
| CN109471950A (zh) * | 2018-11-19 | 2019-03-15 | 北京交通大学 | 腹部超声文本数据的结构化知识网络的构建方法 |
| CN111063434A (zh) * | 2019-12-26 | 2020-04-24 | 北京中润普达信息技术有限公司 | 一种基于临床症状特征的性病诊断系统 |
Non-Patent Citations (3)
| Title |
|---|
| 宁温馨;于明;: "基于语义相似度计算的临床诊断自动编码算法研究", no. 02, pages 186 - 233 * |
| 李小整;王华珍;熊英杰;曾宇晨;何霆;吴谨准;陈坚;: "卷积神经网络模型在儿科疾病预测中的应用", no. 10 * |
| 李文庆;谢红薇;: "基于医疗本体的语义相似度评估方法", no. 04 * |
Cited By (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112086200B (zh) * | 2020-09-17 | 2024-01-12 | 吾征智能技术(北京)有限公司 | 一种基于口苦预测疾病的系统、设备、存储介质 |
| CN112133391A (zh) * | 2020-09-17 | 2020-12-25 | 吾征智能技术(北京)有限公司 | 一种基于人体异常眉毛的疾病认知系统 |
| CN112185571A (zh) * | 2020-09-17 | 2021-01-05 | 吾征智能技术(北京)有限公司 | 一种基于口酸的疾病辅助诊断系统、设备、存储介质 |
| CN112086200A (zh) * | 2020-09-17 | 2020-12-15 | 吾征智能技术(北京)有限公司 | 一种基于口苦预测疾病的系统、设备、存储介质 |
| CN112133391B (zh) * | 2020-09-17 | 2024-01-26 | 吾征智能技术(北京)有限公司 | 一种基于人体异常眉毛的疾病认知系统 |
| CN112185571B (zh) * | 2020-09-17 | 2024-01-16 | 吾征智能技术(北京)有限公司 | 一种基于口酸的疾病辅助诊断系统、设备、存储介质 |
| CN112259219B (zh) * | 2020-09-30 | 2024-02-02 | 吾征智能技术(北京)有限公司 | 一种基于上消化道出血预测疾病的系统、设备、存储介质 |
| CN112259219A (zh) * | 2020-09-30 | 2021-01-22 | 吾征智能技术(北京)有限公司 | 一种基于上消化道出血预测疾病的系统、设备、存储介质 |
| CN112233793A (zh) * | 2020-10-20 | 2021-01-15 | 吾征智能技术(北京)有限公司 | 一种基于血精及疾病的自学习信息匹配系统 |
| CN112233792A (zh) * | 2020-10-20 | 2021-01-15 | 吾征智能技术(北京)有限公司 | 一种基于便血的疾病推导系统 |
| CN112233750B (zh) * | 2020-10-20 | 2024-02-02 | 吾征智能技术(北京)有限公司 | 一种基于咯血性状及疾病的信息匹配系统 |
| CN112233750A (zh) * | 2020-10-20 | 2021-01-15 | 吾征智能技术(北京)有限公司 | 一种基于咯血性状及疾病的信息匹配系统 |
| CN112349423A (zh) * | 2020-11-04 | 2021-02-09 | 吾征智能技术(北京)有限公司 | 一种基于BiMPM方法的口干信息匹配系统 |
| CN112331352A (zh) * | 2020-11-04 | 2021-02-05 | 吾征智能技术(北京)有限公司 | 一种基于登革热的信息智能匹配系统 |
| CN112349423B (zh) * | 2020-11-04 | 2024-05-24 | 吾征智能技术(北京)有限公司 | 一种基于BiMPM方法的口干信息匹配系统 |
| CN115081749A (zh) * | 2022-07-28 | 2022-09-20 | 华中科技大学 | 基于贝叶斯优化lstm的盾构掘进载荷超前预测方法及系统 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN111653359B (zh) | 2023-09-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111653359A (zh) | 一种出血性疾病的智能预测模型构建方法和预测系统 | |
| Mandava | MDensNet201-IDRSRNet: Efficient cardiovascular disease prediction system using hybrid deep learning | |
| CN114549469A (zh) | 一种基于置信度校准的深层神经网络医疗图像诊断方法 | |
| Chiu et al. | EHR-based phenotyping: bulk learning and evaluation | |
| Mishra et al. | An enhanced approach for analyzing the performance of heart stroke prediction with machine learning techniques | |
| CN113539460A (zh) | 用于远程医疗平台的智能导诊方法和装置 | |
| Ahmed et al. | Intelligent decision-making framework for evaluating and benchmarking hybridized multi-deep transfer learning models: managing COVID-19 and beyond | |
| CN115114445B (zh) | 细胞知识图谱构建方法、装置、计算设备及存储介质 | |
| Estiri et al. | Kluster: an efficient scalable procedure for approximating the number of clusters in unsupervised learning | |
| CN111091907A (zh) | 基于相似病例库的健康医疗知识检索方法和系统 | |
| Rathi et al. | Early prediction of diabetes using machine learning techniques | |
| Shrestha et al. | Supervised machine learning for early predicting the sepsis patient: modified mean imputation and modified chi-square feature selection | |
| CN110890130A (zh) | 基于多类型关系的生物网络模块标志物识别方法 | |
| CN107491656A (zh) | 一种基于相对危险度决策树模型的妊娠结局影响因子评估方法 | |
| Toma et al. | Discovery and integration of univariate patterns from daily individual organ-failure scores for intensive care mortality prediction | |
| To et al. | Receiver operating characteristic estimation and threshold selection criteria in three-class classification problems for clustered data | |
| CN117831635A (zh) | 一种生物标志物挖掘方法及系统 | |
| AU2021102593A4 (en) | A Method for Detection of a Disease | |
| CN114708965B (zh) | 诊断推荐方法及装置、电子设备和存储介质 | |
| CN117150030A (zh) | 基于改进的TransH的知识推理方法、装置和设备 | |
| CN116564540A (zh) | 基于集成学习算法的角膜塑形镜参数预测方法及系统 | |
| Rajaprakash et al. | Using convolutional network in graphical model detection of autism disorders with fuzzy inference systems | |
| CN115331811A (zh) | 一种疾病类型的预测方法、装置、电子设备及存储介质 | |
| CN116052889B (zh) | 一种基于血液常规指标检测的sFLC预测系统 | |
| CN120727290B (zh) | 一种基于平衡邻居感知与度量学习的疾病风险预测方法及系统 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |