CN117194630A - 基于大型语言模型的用药方案生成方法及相关设备 - Google Patents
基于大型语言模型的用药方案生成方法及相关设备 Download PDFInfo
- Publication number
- CN117194630A CN117194630A CN202311160223.XA CN202311160223A CN117194630A CN 117194630 A CN117194630 A CN 117194630A CN 202311160223 A CN202311160223 A CN 202311160223A CN 117194630 A CN117194630 A CN 117194630A
- Authority
- CN
- China
- Prior art keywords
- text
- medicine
- medication
- entity
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003814 drug Substances 0.000 title claims abstract description 1014
- 229940079593 drug Drugs 0.000 title claims abstract description 513
- 238000000034 method Methods 0.000 title claims abstract description 127
- 238000012545 processing Methods 0.000 claims abstract description 70
- 238000004590 computer program Methods 0.000 claims abstract description 28
- 230000002452 interceptive effect Effects 0.000 claims description 112
- 238000012549 training Methods 0.000 claims description 32
- 238000005516 engineering process Methods 0.000 claims description 19
- 238000002372 labelling Methods 0.000 claims description 12
- 230000003993 interaction Effects 0.000 claims description 8
- 238000012795 verification Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 description 43
- 238000010586 diagram Methods 0.000 description 39
- 238000013473 artificial intelligence Methods 0.000 description 22
- 229960002073 sertraline Drugs 0.000 description 19
- VGKDLMBJGBXTGI-SJCJKPOMSA-N sertraline Chemical compound C1([C@@H]2CC[C@@H](C3=CC=CC=C32)NC)=CC=C(Cl)C(Cl)=C1 VGKDLMBJGBXTGI-SJCJKPOMSA-N 0.000 description 19
- HEFNNWSXXWATRW-UHFFFAOYSA-N Ibuprofen Chemical compound CC(C)CC1=CC=C(C(C)C(O)=O)C=C1 HEFNNWSXXWATRW-UHFFFAOYSA-N 0.000 description 11
- 229960001680 ibuprofen Drugs 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 238000012937 correction Methods 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 9
- 238000012550 audit Methods 0.000 description 8
- 206010067484 Adverse reaction Diseases 0.000 description 7
- 230000006838 adverse reaction Effects 0.000 description 7
- 238000003058 natural language processing Methods 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 6
- 206010012601 diabetes mellitus Diseases 0.000 description 6
- 230000015654 memory Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 208000024891 symptom Diseases 0.000 description 6
- 241000282414 Homo sapiens Species 0.000 description 5
- UREBDLICKHMUKA-CXSFZGCWSA-N dexamethasone Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(F)[C@@H]1[C@@H]1C[C@@H](C)[C@@](C(=O)CO)(O)[C@@]1(C)C[C@@H]2O UREBDLICKHMUKA-CXSFZGCWSA-N 0.000 description 5
- 229960003957 dexamethasone Drugs 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- GLQPTZAAUROJMO-UHFFFAOYSA-N 4-(3,4-dimethoxyphenyl)benzaldehyde Chemical compound C1=C(OC)C(OC)=CC=C1C1=CC=C(C=O)C=C1 GLQPTZAAUROJMO-UHFFFAOYSA-N 0.000 description 4
- 230000019771 cognition Effects 0.000 description 4
- 238000013479 data entry Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 229960003660 sertraline hydrochloride Drugs 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 239000002552 dosage form Substances 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000003472 antidiabetic agent Substances 0.000 description 2
- 239000002775 capsule Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 229940126904 hypoglycaemic agent Drugs 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000001430 anti-depressive effect Effects 0.000 description 1
- 239000000935 antidepressant agent Substances 0.000 description 1
- 229940005513 antidepressants Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 125000000118 dimethyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 238000001647 drug administration Methods 0.000 description 1
- 229940088679 drug related substance Drugs 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- WHXMKTBCFHIYNQ-SECBINFHSA-N levosimendan Chemical compound C[C@@H]1CC(=O)NN=C1C1=CC=C(NN=C(C#N)C#N)C=C1 WHXMKTBCFHIYNQ-SECBINFHSA-N 0.000 description 1
- 229960000692 levosimendan Drugs 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- XZWYZXLIPXDOLR-UHFFFAOYSA-N metformin Chemical compound CN(C)C(=N)NC(N)=N XZWYZXLIPXDOLR-UHFFFAOYSA-N 0.000 description 1
- 229960003105 metformin Drugs 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 229960005489 paracetamol Drugs 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请的实施例公开了基于大型语言模型的用药方案生成方法、装置、电子设备、计算机可读介质及计算机程序产品,该方法包括:对输入的药品问题文本进行文本识别处理,得到药品实体,以及与药品问题文本匹配的问题意图;从药品描述文本库中获取与药品实体匹配的目标描述文本;从目标描述文本中获取与问题意图匹配的药品知识提示文本;调用大型语言模型,基于药品知识提示文本对药品问题文本进行回复处理,得到药品问题文本的用药方案。本申请实施例的技术方案可以针对药品问题生成准确的用药方案。
Description
技术领域
本申请涉及计算机及通信技术领域,具体而言,涉及基于大型语言模型的用药方案生成方法、基于大型语言模型的用药方案生成装置、电子设备、计算机可读介质及计算机程序产品。
背景技术
自然语言处理技术作为人工智能技术的重要分支,在智能医疗知识问答领域起着重要的作用。其中,用药问答是智能医疗知识问答的一个子领域;用药问答指的是针对提问对象输入的药品相关的问题,利用人工智能技术回复相应答案。在相关技术中,用药问答主要是基于药品知识领域的从业人员标注的药品问答对构建用药问答知识库,以从用药问答知识库中检索出与输入问题匹配的答案。上述方式中,知识覆盖面会因用药问答知识库而受限,且针对药品问题仅有固定答案,导致问题答案不够准确。因此,如何针对药品问题生成准确的用药方案,是目前亟需解决的问题。
发明内容
本申请的实施例提供了基于大型语言模型的用药方案生成方法、基于大型语言模型的用药方案生成装置、电子设备、计算机可读介质及计算机程序产品,可以针对药品问题生成准确的用药方案。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
第一方面,本申请实施例提供了一种基于大型语言模型的用药方案生成方法,包括:
显示用药交互界面,所述用药交互界面包含数据输入区域;
响应对所述数据输入区域的数据输入操作,获取输入的药品问题文本,并对所述药品问题文本进行文本识别处理,得到所述药品问题文本中的药品实体,以及与所述药品问题文本匹配的问题意图;其中,任一意图是基于多个药品的药品描述文本设定的,任一药品描述文本用于记载相应药品在药品知识领域中通过知识审核的药品描述信息;
从药品描述文本库中获取与所述药品实体匹配的目标描述文本;
从所述目标描述文本中获取与所述问题意图匹配的药品知识提示文本;
调用大型语言模型,基于所述药品知识提示文本对所述药品问题文本进行回复处理,得到所述药品问题文本的用药方案;
在所述用药交互界面输出所述用药方案。
第二方面,本申请实施例提供了一种基于大型语言模型的用药方案生成装置,所述装置包括显示单元、文本识别单元、获取单元和方案生成单元,其中:
所述显示单元,用于显示用药交互界面,所述用药交互界面包含数据输入区域;
所述文本识别单元,用于响应对所述数据输入区域的数据输入操作,获取输入的药品问题文本,并对所述药品问题文本进行文本识别处理,得到所述药品问题文本中的药品实体,以及与所述药品问题文本匹配的问题意图;其中,任一意图是基于多个药品的药品描述文本设定的,任一药品描述文本用于记载相应药品在药品知识领域中通过知识审核的药品描述信息;
所述获取单元,用于从药品描述文本库中获取与所述药品实体匹配的目标描述文本;
所述获取单元,还用于从所述目标描述文本中获取与所述问题意图匹配的药品知识提示文本;
所述方案生成单元,用于调用大型语言模型,基于所述药品知识提示文本对所述药品问题文本进行回复处理,得到所述药品问题文本的用药方案;
所述方案生成单元,还用于在所述用药交互界面输出所述用药方案。
第三方面,本申请实施例提供了一种电子设备,包括一个或多个处理器;存储装置,用于存储一个或多个计算机程序,当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述电子设备实现如上所述的基于大型语言模型的用药方案生成方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被电子设备的处理器执行时,使电子设备执行如上所述的基于大型语言模型的用药方案生成方法。
第五方面,本申请实施例提供了一种计算机程序产品,包括计算机程序,所述计算机程序存储在计算机可读存储介质中,电子设备的处理器从所述计算机可读存储介质读取并执行所述计算机程序,使得所述电子设备执行如上所述的基于大型语言模型的用药方案生成方法。
在本申请的实施例所提供的技术方案中,通过识别药品问题文本中药品实体的方式,可以方便后续查找到描述该药品实体的目标描述文本;同时,通过从目标描述文本中获取与问题意图匹配的药品知识提示文本的方式,可以精准获取目标描述文本中与药品问题文本相关的内容以作为药品知识提示文本。而药品描述文本所包含的都是通过知识审核的药品描述信息,具有权威性和准确性,故而药品知识提示文本中的知识内容是权威且准确的。因此,本申请实施例中的大型语言模型在药品知识提示文本所提示的准确且权威的知识内容下对药品问题文本进行作答,能够有效避免大型语言模型对问题内容的认知出现偏差的情况,有利于大型语言模型输出更准确的用药方案,从而提高针对药品问题所生成的用药方案的准确性,进而提高用药问答的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。在附图中:
图1是本申请实施例提供的一种错误答案的问答界面图
图2是本申请实施例提供的一种基于大型语言模型的用药方案生成系统的结构示意图;
图3是本申请实施例提供的一种基于大型语言模型的用药方案生成方法的流程示意图;
图4是本申请实施例提供的一种用药交互界面的界面示意图;
图5是本申请实施例提供的一种包含问题输入提示信息的用药交互界面示意图;
图6是本申请实施例提供的一种包含方案反馈信息的用药交互界面示意图;
图7是本申请实施例提供的另一种基于大型语言模型的用药方案生成方法的流程示意图;
图8是本申请实施例提供的一种药品匹配的过程示意图;
图9是本申请实施例提供的又一种基于大型语言模型的用药方案生成方法的流程示意图;
图10是本申请实施例提供的一种零样本提示的训练过程示意图;
图11是本申请实施例提供的一种少样本提示的训练过程示意图;
图12是本申请实施例提供的一种用药方案的生成过程示意图;
图13是本申请实施例提供的一种问题答案的生成过程示意图;
图14是本申请实施例提供的一种基于大型语言模型的用药方案生成过程示意图;
图15是本申请实施例提供的又一种基于大型语言模型的用药方案生成方法的流程示意图;
图16是本申请实施例提供的一种包含患者特征提示信息的用药交互界面图;
图17是本申请实施例提供的一种包含混用提示信息的用药交互界面图;
图18是本申请实施例提供的另一种用药交互界面示意图;
图19是本申请实施例提供的又一种用药交互界面示意图;
图20是本申请实施例提供的又一种用药交互界面示意图;
图21是本申请实施例提供的一种基于大型语言模型的用药方案生成装置的结构框图
图22示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/,也不是必须按所描述的顺序执行。例如,有的操作/还可以分解,而有的操作/可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
还需要说明的是:在本申请中提及的“多个”是指两个或者两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
随着互联网技术的不断发展,人工智能(Artificial Intelligence,AI)技术也随之得到更好的发展。所谓的人工智能技术是指利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术;其主要通过了解智能的实质,生产出一种新的能以人类智能相似的方式做出反应的智能机器,使得智能机器具有感知、推理与决策等多种功能。相应的,AI技术是一门综合学科,其主要包括计算机视觉技术(Computer Vision,CV)、语音技术、自然语言处理技术以及机器学习(MachineLearning,ML)/深度学习等几大方向。
其中,机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是AI的核心,是使计算机设备具有智能的根本途径;所谓的机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科;其专门研究计算机设备怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。而深度学习则是一种利用深层神经网络系统,进行机器学习的技术;机器学习/深度学习通常可包括人工神经网络、强化学习(Reinforcement Learning,RL)、有监督学习、无监督学习等多种技术;所谓的有监督学习是指采用类别已知(具有标注类别)的训练样本进行模型训练的处理方式,无监督学习是指采用类别未知(没有被标记)的训练样本进行模型训练的处理方式。
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、智能知识问答、知识图谱等技术。
其中,智能知识问答指的是针对提问对象输入的问题,利用人工智能技术回复相应答案。智能知识问答包含智能医疗知识问答,而用药问答是智能医疗知识问答的一个子领域。用药问答指的是针对提问对象输入的药品相关的问题,利用人工智能技术回复相应答案。
在相关技术中,主要通过基于问答对检索的方式来实现用药问答。具体来说,基于知识对检索的方式包括:药品知识领域的从业人员针对多个药品问题编写相应答案,得到多个药品问答对,从而建立药品问答知识库;然后,在接收到输入的药品查询问题之后,可以通过对药品问答知识库进行信息检索的方式,查找到与查询问题最相关的药品问答对;最后输出查找到的问答对的答案。
但是,药品问答知识库都是人工编写的,故而人工成本高,且相关从业人员的知识水平参差不齐,有时候编写的答案还带有个人偏好,故而答案的准确性和权威性不能保证;同时,上述方式中的知识覆盖面受到药品问答知识库中存储的药品问答对的数量限制,无法对超过范围的问题进行回答;另外,由于药品问答知识库中的答案是事先编写好的固定的答案,因此最终输出的答案与药品查询问题并不能完全匹配,不够精确。
基于此,本申请实施例提供了一种基于大型语言模型的用药方案生成方案,该方案在通过用药交互界面获取到输入的药品问题文本之后,会先识别出药品问题文本含有的药品实体,以及与该药品问题文本所匹配的问题意图;然后,再从药品描述文本库中查找出与药品实体匹配的目标描述文本,以及从目标描述文本中获取与问题意图匹配的部分作为药品知识提示文本。最后,可以调用大型语言模型,基于药品知识提示文本对药品问题文本进行回复处理,从而得到药品问题文本的用药方案。
其中,药品实体具体可以是药品名称。示例性地,药品问题文本为“孕妇可以吃布洛芬吗?”,那么该药品问题文本含有的药品实体为“布洛芬”。
此外,任一意图是基于多个药品的药品描述文本设定的;而任一药品描述文本用于记载相应药品在药品知识领域中通过知识审核的药品描述信息。
具体来说,知识审核可以是通过药品知识领域中的权威机构的审核,也可以是通过药品知识领域的从业人员组成的专业团队的审核,还可以是通过相关管理规范、法律规定的审核,在此不作限定。因此,任一药品描述文本对相应药品的描述是具有权威性和准确性的。
另外,药品描述文本中与问题意图匹配的部分具体可以是药品描述文本中语义与问题意图相同或相似的文本。
最后,基于药品知识提示文本对药品问题文本进行回复的大型语言模型指的是拥有大量参数(十亿级以上)的神经网络模型,其通过无监督的方式在海量文本进行大规模的预训练,从而自主学习到自然语言的语法和语义规则,进而可以在下游任务中使用。
具体来说,大型语言模型的预训练模型可以包括自然语言理解类模型、自然语言生成类模型,等等。举例来说,大型语言模型可以是自然语言生成类模型,如GenerativePre-Trained Transformer(GPT,生成式预训练Transformer模型)、PaLM(PathwaysLanguage Model,自然语言预训练大模型)、LLaMA(Large Language Model Meta AI,是由Meta AI研究人员发布的一个预训练语言模型)、ChatGLM(研发的支持中英双语的对话机器人)、Moss(Multilingual Open-Source Semantic Search,一个对话式大型语言模型),等等。
由于大型语言模型通过在海量文本上的预训练,获得了通用领域的相关知识,并通过指令微调使得大型语言模型获得了理解自然语言指令的能力。因此,也有人直接将查询问题输入到大型语言模型,以获取大型语言模型输出的答案。
直接通过大型语言模型对查询问题进行回复,虽然在一定程度上保证了知识的覆盖度,以及问题答案的流畅度。但是,一旦涉及专业性强的知识领域,如药品知识领域,大型语言模型就常常会出现“一本正经地胡说八道”的现象。示例性地,请参见附图1,示出了一种错误答案的问答界面图。如问答界面101所示,小明向大语言模型输入了“老年糖尿病患者能吃舍曲林吗?”这一问题之后,大型语言模型对舍曲林(一种抗抑郁药品)的认识出现偏差,生成了如答案框102所示的答案,提及“舍曲林是一种降糖药物……”;该答案看似流畅正确,实则完全错误。
由此可见,本方案通过识别药品问题文本中药品实体的方式,可以方便后续查找到与该药品实体关联的目标描述文本;而目标描述文本可以为大型语言模型提供回答药品问题文本所需的相关知识,使得大型语言模型是在知识提示下对药品问题文本进行作答,能够有效避免大型语言模型对问题内容的认知出现偏差的情况,有利于大型语言模型输出更准确的用药方案,从而提高针对药品问题所生成的用药方案的准确性,进而提高用药问答的准确性。
此外,由于药品描述文本涉及相应药品在多个方面的知识,篇幅往往较长,而大型语言模型通常支持输入的文本序列长度在2000至4000以下。因此,本方案通过识别与药品问题文本匹配的问题意图,并从目标描述文本中获取与问题意图匹配的药品知识提示文本的方式,可以精准定位针对药品问题文本所需的知识。一方面使得输入文本的序列长度可以与大型语言模型适配;另一方面,随着输入文本序列长度的减小,大型语言模型的阅读理解难度也会随着减小;而大型语言模型对药品知识提示文本的理解越准确,其输出的用药方案也就越精准,从而有利于进一步提高针对药品问题所生成的用药方案的准确性,进而进一步提高用药问答的准确性。
另外,药品描述文本所包含的都是通过知识审核的药品描述信息,具有权威性和准确性,故而药品知识提示文本中的知识内容是准确无误的;因此,大型语言模型在对药品知识提示文本的理解下所输出的用药方案具备准确性。
基于上述基于大型语言模型的用药方案生成方案,本申请实施例提供了一种基于大型语言模型的用药方案生成系统,可参见图2,图2所示的基于大型语言模型的用药方案生成系统可以包括多个终端设备201和多个服务器202。其中,任一终端设备和任一服务器之间均建立有通信连接。举例来说,终端设备201可以包括智能手机、平板电脑、笔记本电脑、台式计算机、智能车载以及智能可穿戴设备中的任意一种或多种。终端设备201内可以运行用药问答客户端、多媒体播放客户端、游戏客户端、搜索客户端、购物客户端、浏览器客户端、信息流客户端等。服务器202可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的服务器。任一终端设备201以及任一服务器202之间可以通过有线或无线通信方式进行直接或间接地通信连接,本申请在此不做限制。
在一些实施例中,上述人工智能知识问答方法可以仅由图2所示人工智能知识问答系统中的终端设备201执行,具体执行过程为:终端设备201可以显示用药交互界面,其中用药交互界面包含数据输入区域;之后,终端设备201可以响应对数据输入区域的数据输入操作,获取输入的药品问题文本,并对药品问题文本进行文本识别处理,得到药品问题文本中的药品实体,以及与药品问题文本匹配的问题意图。然后,终端设备201可以从药品描述文本库中查找出与药品实体匹配的目标描述文本。之后,终端设备201可以从目标描述文本中获取与问题意图匹配的部分作为药品知识提示文本。最后,终端设备201可以调用大型语言模型,基于药品知识提示文本对药品问题文本进行回复处理,从而得到药品问题文本的用药方案。
进一步的,终端设备201还可以在用药交互界面输出用药方案。可选的,上述基于大型语言模型的用药方案生成方法也可以仅由图2所示的基于大型语言模型的用药方案生成系统中的服务器202执行,其具体执行过程可参见终端设备201的具体执行过程,在此不再赘述。
在另一些实施例中,上述基于大型语言模型的用药方案生成方法可以运行在基于大型语言模型的用药方案生成系统中,基于大型语言模型的用药方案生成系统可以包括终端设备和服务器。具体来说,上述基于大型语言模型的用药方案生成方法可由图2所示的基于大型语言模型的用药方案生成系统中所包含的终端设备201和服务器202来共同完成,服务器202中存储有药品描述文本库。具体执行过程为:终端设备201显示用药交互界面,其中用药交互界面包含数据输入区域;然后终端设备201可以响应对数据输入区域的数据输入操作,获取输入的药品问题文本,并将药品问题文本发送至服务器202。
服务器202先识别出接收到的药品问题文本含有的药品实体,以及与该药品问题文本所匹配的问题意图。然后,服务器202可以从药品描述文本库中查找出与药品实体匹配的目标描述文本,并将目标描述文本中与问题意图匹配的部分作为药品知识提示文本。之后,服务器202可以调用大型语言模型,基于药品知识提示文本对药品问题文本进行回复处理,从而得到药品问题文本的用药方案。最后,服务器202可以将用药方案发送至终端设备201,由终端设备201在用药交互界面输出用药方案。
需要说明的是,本申请实施例可应用于各种场景,包括但不限于云技术、AI(Artificial Intelligence,人工智能)、智慧医疗、智慧家居、智能驾驶等各种场景,也可以用于医疗应用、社交应用、购物应用等在使用中可能产生问题的应用,对此不作限定。
具体地,可以将本申请实施例的技术方案应用在智慧医疗场景中,如为了辅助不想去门诊的患者用药,可以开发一个用药问答应用。具体来说,终端设备中可以运行有用药问答客户端,服务器可以是为用药问答客户端提供数据处理服务的问答服务器。患者可以在用药问答客户端显示的用药交互界面中输入药品问题文本,然后用药问答客户端可以输入的药品问题文本发送至问答服务器。
问答服务器可以先识别出接收到的药品问题文本中的药品实体,以及与该药品问题文本匹配的问题意图。之后,问答服务器可以从药品描述文本库中查找出与药品实体匹配的目标描述文本;其中,药品描述文本库具体可以是药品说明书库。然后,问答服务器可以从目标描述文本中获取与接收到的问题意图所匹配的药品知识提示文本,并调用大型语言模型,基于获取到的药品知识提示文本对药品问题文本进行回复处理,从而得到用药方案。最后,问答服务器可以将用药方案发送至用药问答客户端,由用药问答客户端在用药交互界面输出该用药方案。
又例如将本申请实施例的技术方案应用于购物应用中,购物应用内开发有用药问答程序,用于辅助消费者在购买药品过程中买到适用的药品。其中,终端设备可以是运行有购物应用的终端设备,服务器可以是为购物应用提供用药问答服务的应用服务器。
举例来说,消费者可以通过终端设备在购物应用内浏览药品的过程中,可以打开购物应用的用药交互界面,输入药品问题文本。然后,购物应用可以将输入的药品问题文本发送至应用服务器。应用服务器可以先识别出接收到的药品问题文本中的药品实体,以及与该药品问题文本匹配的问题意图。之后,应用服务器可以从药品描述文本库中查找出与该药品实体匹配的目标描述文本。然后,应用服务器可以从目标描述文本中获取与接收到的问题意图所匹配的药品知识提示文本,并调用大型语言模型,基于获取到的药品知识提示文本对药品问题文本进行回复处理,从而得到用药方案。最后,应用服务器可以将用药方案发送至购物应用,由购物应用在用药交互界面输出该问题答案。
需要说明的是,在本申请的具体实施方式中,若药品问题文本等相关数据或信息涉及到对象相关,当本申请实施例运用到具体产品或技术中时,需要获得对象许可或者同意,且相关数据或信息的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
以下对本申请实施例的技术方案的各种实现细节进行详细阐述:
如图3所示,图3是本申请的一个实施例示出的基于大型语言模型的用药方案生成方法的流程示意图,该方法可以应用于图2所示的基于大型语言模型的用药方案生成系统,该方法可以由终端设备或服务器执行,也可以由终端设备和服务器共同执行,在本申请实施例中,以该方法由终端设备执行为例进行说明,其中,基于大型语言模型的用药方案生成方法可以包括S301至S306,详细介绍如下:
S301、显示用药交互界面。
在本申请实施例中,用药交互界面可以包括数据输入区域。数据输入区域输入的数据类型可以包括文本、图片、声音、视频等一种或多种。
可选的,数据输入区域可以包括问题输入区域;其中,问题输入区域可以用于交互对象输入药品问题文本。
S302、响应对数据输入区域的数据输入操作,获取输入的药品问题文本,并对药品问题文本进行文本识别处理,得到药品问题文本中的药品实体,以及与药品问题文本匹配的问题意图。
在本申请实施例中,由于步骤S301中提及输入的数据类型有多种,而当交互对象输入数据的数据类型不是文本时,可以针对不同数据类型的数据,分别通过语音识别、图像识别等方式获取到药品问题文本。
可选的,由于步骤S301中提及数据输入区域可以包括问题输入区域,因此,可以响应对问题输入区域的数据输入操作,获取输入的药品问题文本。
其中,药品问题文本指的是存在需要解答或者解释的药品内容的文本。与药品问题文本匹配的问题意图是从多个预设的意图中选取出来的,任一意图是基于多个药品描述文本设定的。
具体来说,不同药品需要描述的角度大致相同或相似,因此药品描述文本会分为相同或相似多个部分对药品进行描述。那么,可以根据药品描述文本中的不同部分去提取出不同的问题意图。
举例来说,药品描述文本通常会描述药品适用于哪些症状、有哪些症状的人群不能使用该药品、吃药的频率和药量,等等。因此,基于多个药品描述文本,可以总结并设定适应症、禁忌症、用法用量、药代动力学、相互作用、孕妇、老人、儿童、不良反应、注意事项等多个意图。
此外,任一药品描述文本用于记载相应药品在药品知识领域中通过知识审核的药品描述信息。具体来说,知识审核可以是通过药品知识领域中的权威机构的审核,也可以是通过药品知识领域的从业人员组成的专业团队的审核,还可以是通过相关管理规范、法律规定的审核,在此不作限定。因此,任一药品描述文本对相应药品的描述是具有权威性和准确性的。
另外,文本识别处理的具体过程可以包括:对输入的药品问题文本进行实体识别处理,得到药品问题文本含有的药品实体;对药品问题文本进行意图理解处理,得到与药品问题文本匹配的问题意图。
在一个实施例中,由于上述提及针对药品知识领域可以设定多个问题意图,且文本的特征可以用于表征文本的语义。因此,意图理解处理的具体方式可以是:对药品问题文本进行特征提取处理,得到文本特征;对各个问题意图进行特征提取处理,得到各个意图特征;获取文本特征与各个意图特征之间的特征相似度;基于多个特征相似度,确定与药品问题文本匹配的问题意图,其中,与药品问题文本匹配的问题意图对应的特征相似度大于其他特征相似度。
其中,具体可以通过卷积神经网络、注意力机制下的神经网络等机器学习模型进行特征提取处理,由于特征提取处理的过程为本领域技术人员所公知,故而不作赘述。此外,具体可以通过计算特征距离、余弦相似度、相关系数等一种或多种方式获取特征之间的相似度。
另外,基于多个特征相似度,确定与药品问题文本匹配的问题意图的具体方式可以是:将多个特征相似度最大的特征相似度对应的问题意图确定为与问题文本匹配的问题意图。可选的,基于多个特征相似度,确定与药品问题文本匹配的问题意图的具体方式还可以是:若任一特征相似度大于或等于预设特征阈值,则将任一特征相似度对应的问题意图确定为与药品问题文本匹配的问题意图。可选的,还可以是将多个特征相似度中较大的几个特征相似度对应的问题意图确定与药品问题文本匹配的问题意图。
在一个实施例中,实体识别处理的具体方式可以是:调用训练后的命名实体识别模型,对药品问题文本进行实体识别处理,得到药品实体。
其中,上述训练后的命名实体识别模型可以是通过对隐马尔可夫模型(HiddenMarkov Model,HMM)、BiLSTM-CRF(Bi-directional Long Short-Term Memory andConditional Random Field)、Lattice LSTM(一种针对中文的命名实体识别模型)等模型进行训练后所得到,在此不限定。另外,对命名实体识别模型进行训练的过程为本领域技术人员所惯用的技术手段,在此不赘述。
S303、从药品描述文本库中获取与药品实体匹配的目标描述文本。
在本申请实施例中,药品描述文本库存储有多个药品的药品描述文本。具体来说,药品描述文本库可以为药品说明书库。药品说明书库中各种药品的标准名称和药品说明书对应存储;可选的,药品说明书库中还可以将高质量的药品问答知识库中各种药品的问答知识,作为相应药品的描述信息,与相应药品的标准名称对应存储。
在一个实施例中,目标描述文本的获取过程具体可以包括:获取药品描述文本库中各个药品描述文本所描述的药品的标准名称;获取药品实体中各个字符与任一标准名称中各个字符之间的字符相似度;基于多个字符相似度,得到药品实体与任一标准名称之间的目标相似度;根据多个目标相似度,确定与药品实体匹配的目标描述文本。
其中,目标描述文本对应的目标相似度大于其他药品描述文本对应的目标相似度;根据多个目标相似度确定目标描述文本的具体方式可以参见步骤S302中基于多个特征相似度确定与问题文本匹配的问题意图的具体实施方式,在此不作赘述。
此外,药品的标准名称是指药品在药品知识领域所公认的通用名称。另外,获取字符之间相似度的具体方式为本领域技术人员所惯用的技术手段,故而在此不赘述。
S304、从目标描述文本中获取与问题意图匹配的药品知识提示文本。
在本申请实施例中,与问题意图匹配的药品知识提示文本指的是目标描述文本中语义与问题意图的语义相似或相同的文本。
具体来说,获取药品知识提示文本的具体过程可以包括:将目标描述文本切分为多个短文本,其中不同短文本对应目标描述文本中的不同段落和/或句子;对各个短文本进行特征提取处理,得到各个短文本特征;对问题意图进行特征提取处理,得到意图特征;获取各个短文本特征与意图特征之间的相似度,并根据获取到的多个相似度,确定与问题意图匹配的短文本;将确定的短文本合并为药品知识提示文本。
其中,与问题意图匹配的短文本对应的相似度大于其他相似度。短文本特征与意图特征之间的相似度的获取方式,以及根据获取到的多个相似度确定与问题意图匹配的短文本的具体实施方式可以参见步骤S301中获取特征之间相似度、根据多个相似度确定与问题文本匹配的问题意图的具体实施方式,在此不作赘述。
在一个实施例中,由于步骤S301中提及药品描述文本会分为多个部分以从多个角度描述相应药品;因此,药品描述文本可以针对不同的部分有相应的子标题。
那么,获取药品知识提示文本的具体过程可以包括:获取目标描述文本中的多个子标题;对各个子标题进行特征提取处理,得到各个标题的标题特征;对问题意图进行特征提取处理,得到意图特征;获取各个标题特征与意图特征之间的相似度,并根据获取到的多个相似度,确定与问题意图匹配的子标题;将目标描述文本中确定的子标题所对应的文本合并为药品知识提示文本。
其中,与问题意图匹配的子标题对应的相似度大于其他相似度。标题特征与意图特征之间的相似度的获取方式,以及根据获取到的多个相似度确定与问题意图匹配的子标题的具体实施方式可以参见步骤S301中获取特征之间相似度、根据多个相似度确定与问题文本匹配的问题意图的具体实施方式,在此不作赘述。
S305、调用大型语言模型,基于药品知识提示文本对药品问题文本进行回复处理,得到药品问题文本的用药方案。
在本申请实施例中,大型语言模型指的是拥有大量参数(十亿级以上)的神经网络模型。具体来说,大型语言模型的预训练模型可以包括自然语言理解类模型、自然语言生成类模型,等等。举例来说,大型语言模型可以是自然语言生成类模型,如GPT、PaLM、LLaMA、ChatGLM、Moss,等等。此外,药品问题文本的用药方案包括对药品问题文本的问题解决方案。具体来说,药品问题文本的用药方案可以包括药品问题文本的问题答案。
在一个实施例中,可以将药品知识提示文本与药品问题文本进行拼接,得到初始文本;调用大型语言模型,对初始文本进行文本理解处理,得到用药方案。具体来说,可以将初始文本输入大型语言模型,就可以得到大型语言模型输出的用药方案。其中,大型语言模型进行文本理解处理的具体过程为本领域技术人员所公知,故而在此不作赘述。
S306、在用药交互界面输出用药方案。
在本申请实施例中,在用药交互界面输出用药方案的具体方式可以是:在用药交互界面显示用药方案。
在一个实施例中,由于大型语言模型输出的用药方案可能内容比较多,而对于药品不够了解的交互对象来说,内容太多的方案有可能会让交互对象难以理解或者没有耐心看下去。因此,在得到用药方案之后,终端设备还可以响应用药方案,生成对用药方案的结论提示文本;然后,再将结论提示文本输入大型语言模型,得到大型语言模型输出的用药方案的概括文本。
其中,结论提示文本包含对用药方案进行概括的提示内容。举例来说,结论提示文本的内容可以包括“所以上述问题答案的结论是?”、“请对用药方案进行总结”、“上述文本可以概括为?”,等等。
可选的,在用药交互界面输出用药方案的具体方式可以包括:在用药交互界面输出用药方案的概括文本。
可选的,终端设备可以仅输出概括文本,也可以仅输出用药方案,还可以同时输出概括文本和用药方案。
在一个实施例中,为了进一步提高用药方案的准确性,回复处理的具体过程可以包括:调用大型语言模型,基于药品知识提示文本对药品问题文本进行多次回复处理,得到药品问题文本的多个初始方案;针对任一初始方案,确定多个初始方案中与任一初始方案相匹配的初始方案的方案数量;将对应方案数量最大的初始方案确定为用药方案。其中,与任一初始方案相匹配的初始方案指的是与任一初始方案相同或相似的方案。
具体实现中,请参见附图4,示出了一种用药交互界面的界面示意图。如图4所示,用药交互界面401包括问题输入区域402。终端设备响应交互对象对问题输入区域402的数据输入操作,可以获取到输入的药品问题文本403。之后,终端设备可以对药品问题文本403进行文本识别处理,得到药品实体“地塞米松”以及问题意图“注意事项”。然后,终端设备可以从药品描述文本库中获取与“地塞米松”匹配的目标描述文本,并从目标描述文本中截取与“注意事项”匹配的药品知识提示文本。
在得到药品知识提示文本之后,终端设备可以将药品知识提示文本和药品问题文本403进行拼接,得到拼接文本。然后,终端设备可以将拼接文本输入大型语言模型,从而得到药品问题文本403的用药方案404“经过查询,使用地塞米松时需注意:……”。最后,如图4所示,终端设备可以在用药交互界面401输出用药方案404。
在一个实施例中,可能存在部分交互对象输入的文本中仅含有药品名称却没有相关问题、仅有问句但没有药品名称等情况;因此,为了让交互对象能够输入有效的文本,提升交互效率;终端设备可以在检测到响应对数据输入区域的数据输入操作之前,在用药交互界面输出问题输入提示信息,其中问题输入提示信息用于提示输入药品知识领域的问题。
举例来说,请参见附图5,示出了一种包含问题输入提示信息的用药交互界面示意图。如图5所示,用药交互界面501包括问题输入区域502。交互对象点击进入用药交互界面501之后,可以在用药交互界面501输出问题输入提示信息503。问题输入提示信息503给出了3个药品相关的问题示例,使得交互对象明白应该输入什么内容的文本。
然后,终端设备可以响应交互对象对问题输入区域502的数据输入操作,可以获取到输入的药品问题文本504。之后,终端设备在对药品问题文本504进行处理之后,可以得到药品问题文本504的用药方案505。最后,如图5所示,终端设备可以在用药交互界面501输出用药方案505。
在一个实施例中,为了提升交互对象的交互体验,以及帮助研发人员确定用药方案的生成方法的改进方向,还可以在输出用药方案之后,在用药交互界面输出方案反馈信息,其中,方案反馈信息用于提示输入对用药方案的评价信息。示例性地,请参见附图6,示出了一种包含方案反馈信息的用药交互界面示意图。如图6所示,在用药交互界面601输出用药方案602之后,还可以在交互对象退出用药交互界面601之前,输出方案反馈信息603。
在本申请实施例中,通过识别药品问题文本中药品实体的方式,可以方便后续查找到描述该药品实体的目标描述文本;同时,通过从目标描述文本中获取与问题意图匹配的药品知识提示文本的方式,可以精准获取目标描述文本中与药品问题文本相关的内容以作为药品知识提示文本。而药品描述文本所包含的都是通过知识审核的药品描述信息,具有权威性和准确性,故而药品知识提示文本中的知识内容是权威且准确的。因此,本申请实施例中的大型语言模型在药品知识提示文本所提示的准确且权威的知识内容下对药品问题文本进行作答,能够有效避免大型语言模型对问题内容的认知出现偏差的情况,有利于大型语言模型输出更准确的用药方案,从而提高针对药品问题所生成的用药方案的准确性,进而提高用药问答的准确性。
另外,药品知识提示文本会比目标描述文本的文本序列长度更小,一方面使得输入文本的序列长度可以与大型语言模型适配;另一方面,随着输入文本序列长度的减小,大型语言模型的阅读理解难度也会随着减小;而大型语言模型对药品知识提示文本的理解越准确,其输出的用药方案也就越精准,从而有利于进一步提高针对药品问题所生成的用药方案的准确性,进而有利于进一步提高用药问答的准确性。
在本申请的一个实施例中,提供了另一种基于大型语言模型的用药方案生成方法,该基于大型语言模型的用药方案生成方法可以应用于图2所示的基于大型语言模型的用药方案生成系统,该方法可以由终端设备或服务器执行,也可以由终端设备和服务器共同执行,在本申请实施例中,以该方法由服务器执行为例进行说明,如图4所示,示出了另一种基于大型语言模型的用药方案生成方法的流程示意图,该基于大型语言模型的用药方案生成方法在图3中所示的方法的基础上进行了扩展。
其中,S701至S708详细介绍如下:
S701、显示用药交互界面。
在本申请实施例中,步骤S701的具体实施方式可以参见上述实施例中步骤S301的具体实施方式,在此不赘述。
S702、响应对数据输入区域的数据输入操作,获取输入的药品问题文本,并对药品问题文本进行文本识别处理,得到药品问题文本中的药品实体,以及与药品问题文本匹配的问题意图。
在本申请实施例中,步骤S702的具体实施方式可以参见上述实施例中步骤S302的具体实施方式,在此不赘述。
S703、获取药品描述文本库中的各个标准名称与药品实体之间的名称相似度。
在本申请实施例中,药品描述文本库除了包括多个药品的药品描述文本外,还包括各个药品描述文本所描述的药品在药品知识领域中的标准名称。
其中,药品的标准名称是指药品在药品知识领域所公认的通用名称。举例来说,“布洛芬”是标准名称,但市面上关于布洛芬的药品名称通常在标准的通用名上还会加上剂型等类别名,如布洛芬缓释胶囊、布洛芬颗粒、布洛芬混悬液,等等。
在一些实施例中,获取任一标准名称与药品实体之间的名称相似度的具体过程可以包括:对任一标准名称进行特征提取处理,得到名称特征;对药品实体进行特征提取处理,得到实体特征;基于名称特征和实体特征,得到任一标准名称与药品实体之间的名称相似度。
其中,具体可以通过计算名称特征和实体特征之间的特征距离、余弦相似度、相关系数等一种或多种计算特征相似度的方式得到名称相似度。
在另一些实施例中,获取任一标准名称与药品实体之间的名称相似度的具体过程可以包括:
1)对药品实体进行类型拆分处理,得到拆分字段;
其中,拆分字段的数量包括一个或多个;不同拆分字段对应不同的命名类型。具体来说,可以调用命名实体识别模型完成类型拆分处理。那么,针对该命名实体识别模型的实体标签是基于命名类型来设定的。
举例来说,可以设定命名类型包括商品名、通用名和类别名,那么相应的实体标签可以包括B-commodity、I-commodity、B-current、I-current、B-category、I-category和O。其中,commodity指的是商品名,current指的是通用名,category指的是类别名;B、I、O为标签位置,B指的是开始,I指的是内部,如实体标签为B-commodity的字符指的是该字符为某个对象名称的首字符,实体标签为I-commodity的字符指的是该字符为某个对象的内部字符(即除首字符之外的字符);O指的是非实体信息,也就是不属于设定的实体标签中的任意一种。
可选的,类型拆分处理的具体方式还可以包括:对药品实体进行词语拆分处理,得到多个初始字段;将与预设命名类型匹配的初始字段作为拆分字段。
其中,预设命名类型可以包括商品名、通用名和类别名等一种或多种类型。判断初始字段是否与预设命名类型匹配的具体方式可以包括:分别提取任一初始字段和预设命名类型的特征;基于提取到的两个特征,确定任一初始字段和预设命名类型之间的相似度;将对应相似度最大的初始字段确定为与预设命名类型匹配的拆分字段。
2)获取各个标准名称对应的参考字段,其中,参考字段是对各个标准名称进行类型拆分处理得到的;
具体来说,参考字段的数量包括一个或多个。可以是先对各个标准名称进行类型拆分处理,从而得到各个标准名称的参考字段,然后将药品描述文本、标准名称和参考字段对应存储至药品描述文本库;那么,就可以直接从药品描述文本库中获取各个标准名称对应的参考字段。可选的,还可以遍历药品描述文本库中多个标准名称,对当前遍历到的标准名称进行类型拆分处理,从而得到各个标准名称对应的参考字段。
3)将对应的命名类型与拆分字段相同的参考字段确定为目标字段;
具体来说,经过类型拆分处理之后的字段都会对应有一个命名类型。针对任一标准名称对应的参考字段,将对应的命名类型与拆分字段相同的参考字段,确定为任一标准名称对应的目标字段。
4)基于拆分字段与目标字段之间的字段相似度,得到相应标准名称与药品实体之间的名称相似度。
具体来说,获取拆分字段与目标字段之间的字段相似度的具体方式可以包括:调用预设相似度算法,对拆分字段与目标字段进行处理,得到拆分字段与目标字段之间的字段相似度。其中,预设相似度算法可以包括特征距离算法、拼音相似度算法、语义相似度算法等算法中的一种或多种。
当预设相似度算法的数量包括一个时,可以得到该算法计算出的一个字段相似度,那么可以直接将该字段相似度作为相应标准名称与药品实体之间的名称相似度。
当预设相似度算法的数量包括多个时,可以得到多个算法计算出的多个字段相似度,那么可以对多个字段相似度进行加权相加,从而得到相应标准名称与药品实体之间的名称相似度。其中,不同预设相似度算法得到的字段相似度的权重可以相同也可以不同,在此不作限定。
S704、根据多个名称相似度,确定与药品实体匹配的目标标准名称。
在本申请实施例中,目标标准名称对应的名称相似度大于其他标准名称对应的名称相似度。
那么,确定目标标准名称的具体方式可以包括:将对应的名称相似度最大的标准名称确定为目标标准名称。
可选的,确定目标标准名称的具体方式还可以包括:将对应的名称相似度大于预设相似度阈值的标准名称确定为目标标准名称。若对应的名称相似度大于预设相似度阈值的标准名称的数量包括多个时,可以将对应的名称相似度大于预设相似度阈值的多个标准名称中最大的标准名称确定为目标标准名称。
可选的,还可以通过排序等其他方式确定与药品实体匹配的目标标准名称,在此不作限定。
S705、将目标标准名称对应的药品描述文本作为目标描述文本。
在本申请实施例中,服务器可以从药品描述文本库中查找目标标准名称对应的药品描述文本;然后,服务器将查找到的药品描述文本作为目标描述文本。
在一种可能的实现方式中,药品知识领域都会有常用的药品以及不常用的药品;而常用的药品的数量通常只占药品知识领域所含药品的较少部分。因此,可以先从常用的药品的标准名称中查找与药品实体匹配的标准名称,这样服务器或终端设备需要处理的数据量得到了大幅减少,有利于提高目标标准名称的查找效率和准确性,从而有利于提高目标描述文本的查找效率和准确性。
那么,服务器还可以预先基于药品知识领域中各个药品的使用频率,生成药品白名单;其中,药品白名单中标准名称所对应的药品的使用频率大于其他药品的使用频率。
若药品白名单中存在与药品实体相匹配的指定标准名称,则服务器可以将药品描述文本库中指定标准名称对应的药品描述文本确定为目标描述文本;若药品白名单中未存在与药品实体相匹配的指定标准名称,则服务器可以触发执行上述步骤S703至S705。
其中,与药品实体相匹配的指定标准名称指的是与药品实体相同或相似的标准名称。具体来说,判断药品白名单中是否存在与药品实体相匹配的指定标准名称的具体实施方式可以参见步骤S702至S705的具体实施方式,在此不作赘述。
在一种可能的实现方式中,如果药品问题文本中的药品实体出现了错别字、同音字等情况,会降低后续查找出的目标标准名称的准确性,从而导致目标描述文本不够准确,进而影响用药方案的准确性。
因此,为了进一步提高查找出的目标标准名称的准确性,还可以对药品实体进行文本纠错处理,得到处理后的药品实体;那么,后续就可以从药品描述文本库中获取与处理后的药品实体匹配的目标描述文本。具体来说,步骤S704中类型拆分处理的具体过程也就变成了对处理后的药品实体进行类型拆分处理,从而得到拆分字段。
需要说明的是,具体可以通过文本纠错模型对药品实体进行文本纠错处理。其中,文本纠错模型的预训练模型可以包括soft-masked Bert(一种基于Bert的文本纠错模型)、PLOME(Pre-trained masked Language model with Misspelled knowledge,一种对输入文本中的拼写错误进行检测和纠正的模型)、FastCorrect(一种可以实现错别字纠错、漏字纠错、语法错误纠错等功能的机器学习模型)等用于纠错的机器学习模型中的一种或多种。
请参见附图8,示出了一种药品匹配的过程示意图。如图8所示,识别出输入的药品问题文本中的药品实体之后,可以对药品实体进行处理,得到处理后的药品实体。然后,如图8所示,可以查找药品白名单中是否存在与处理后的药品实体相匹配的药品标准名称。其中,药品白名单具体可以包括22个常见药类下药品的标准名称。
如图8所示,若存在匹配的标准名称,则可以将匹配的标准名称(即指定标准名称)作为输出的标准名称,以将输出药品标准名称对应的药品描述文本作为目标描述文本。若未存在匹配的药品标准名称,则可以对处理后的药品实体进行类型拆分,拆解“胶囊、片”等剂型通用词,得到处理后的药品实体在商品名、药品通用名、类别名等命名类型下的拆分字段。
同时,可以获取对药品说明书库中的各个标准名称对应的参考字段。再从任一标准名称对应的参考字段中,找到与各个拆分字段命名类型相同的各个目标字段。
然后,如图8所示,可以通过拼音、语义、特征距离等多种相似度算法计算出各个拆分字段与其对应的目标字段之间的多个字段相似度。然后,可以综合各个拆分字段与其对应的目标字段之间的多个字段相似度,得到任一标准名称与处理后的药品实体之间的名称相似度。
最后,如图8所示,可以根据多个名称相似度,确定输出的标准名称(即目标标准名称)。具体来说,可以按照从大到小的顺序,对多个名称相似度进行排序处理,从而得到名称相似度序列;将名称相似度序列中第一个名称相似度对应的标准名称作为输出的标准名称。
可选的,也可以在得到多个名称相似度之后,将多个名称相似度输入大型语言模型,由大型语言模型来对多个名称相似度进行精排,从而输出与处理后的药品实体匹配度最高的标准名称。
在实际应用中,上述药品匹配方案总体的识别准确率可以达到98%以上。无论输入的药品问题文本中所包含的是药品通用名(如氨酚黄那敏颗粒),还是商品名,该方案都能将药品问题文本中的药品实体映射到相应的标准名称。
S706、从目标描述文本中获取与问题意图匹配的药品知识提示文本。
在本申请实施例中,步骤S706的具体实施方式可以参见上述实施例中步骤S304的具体实施方式,在此不赘述。
S707、调用大型语言模型,基于药品知识提示文本对药品问题文本进行回复处理,得到药品问题文本的用药方案。
在本申请实施例中,步骤S707的具体实施方式可以参见上述实施例中步骤S305的具体实施方式,在此不赘述。
S708、在用药交互界面输出用药方案。
在本申请实施例中,步骤S708的具体实施方式可以参见上述实施例中步骤S306的具体实施方式,在此不赘述。
由于标准名称、药品实体都是短文本,而目前针对短文本的相似度算法的准确度都比较高;因此,本申请实施例通过比较各个标准名称与药品实体之间的名称相似度去确定目标描述文本的方式,可以准确地从多个标准名称筛选出与药品实体匹配的目标标准名称,从而使得最终得到目标描述文本是与药品问题文本紧密关联的,进而有利于提高后续问题答案的准确性。
此外,针对同一药品有多个名称的情况,本申请实施例还通过对标准名称以及药品实体在同一命名类型下的字段计算相似度的方式,实现了标准名称和药品实体在字段级的匹配。上述方式可以避免药品实体中与标准名称命名类型不匹配的字段,在计算相似度时对整体的名称相似度产生干扰,有利于进一步提高筛选的目标标准名称的准确性,从而使得最终得到目标描述文本是准确的,进而有利于提高后续得到的用药方案的准确性。
在本申请的一个实施例中,提供了又一种基于大型语言模型的用药方案生成方法,该基于大型语言模型的用药方案生成方法可以应用于图1所示的基于大型语言模型的用药方案生成系统,该方法可以由终端设备或服务器执行,也可以由终端设备和服务器共同执行,在本申请实施例中,以该方法由服务器执行为例进行说明,如图9所示,示出了又一种基于大型语言模型的用药方案生成方法的流程示意图,该基于大型语言模型的用药方案生成方法在图3和图7中所示的方法的基础上进行了扩展。
其中,S901至S909详细介绍如下:
S901、获取识别校准文本和意图校准文本。
在本申请实施例中,识别校准文本包括实体识别技术提示字段、含有药品参考实体的问题文本、以及实体输出要求。
具体来说,实体识别技术提示字段可以包括“命名实体识别技术”、“命名实体识别算法”、“命名实体识别”、“Named Entity Recognition(命名实体识别的英文名称)”、“NER(命名实体识别的英文缩写)”,等一个或多个用于指示实体识别技术的名称或短语。
此外,含有药品参考实体的问题文本中会写明提问的药品名称。举例来说,识别校准文本内的问题文本可以为“孕妇可以吃布洛芬吗?”。该问题文本含有的药品参考实体为“布洛芬”。
另外,实体输出要求可以包含指明提取药品名称的字段。举例来说,实体输出要求可以包括“抽取药品实体”。
可选的,实体输出要求还可以包括实体输出格式和/或实体输出范围。举例来说,识别校准文本可以为“请用NER技术确定下面句子中的药品实体:“老人可以吃左洛复吗”。输出要求:①格式为:A、B...,其中A、B为具体的实体;②不要输出食物实体”。其中,输出要求中的“左洛复”为药品实体,①为实体输出格式,②为实体输出范围。
此外,意图校准文本可以包括多个意图、问题样本、意图输出要求和意图理解样本。其中,意图理解样本包括问题示例,以及多个意图中与问题示例相匹配的标注意图。问题示例及其标注意图可以对大型语言模型的意图理解处理起到一个参考作用。
意图校准文本所包括的多个意图是基于多个药品的药品描述文本设定的;而这多个意图可以囊括药品知识领域的药品描述文本所描述的全部方面。而问题样本指的是用于模型训练的样本问题。意图输出要求可以包括输出与问题样本匹配的问题意图的数量、输出格式、输出范围中的一种或多种。
S902、通过识别校准文本和意图校准文本,对待校准的大型语言模型进行校准训练,得到大型语言模型。
在本申请实施例中,由于大型语言模型在这基础的自然语言任务上有强大的零样本提示(zero-shot prompt)与少样本提示(few-shot prompt)能力,故而不需要大量人工标注数据也可以完成实体识别和意图理解任务。
其中,零样本提示是在特定自然语言处理任务中,不需要对大型语言模型进行参数微调,也不需要给出标注样本示例,直接以自然语言提示的形式就可以使大型语言模型完成相关的任务,是大型语言模型经过指令微调后获得的一种理解自然语言指示的能力。少样本提示是指在特定任务中,给大型语言模型提供一组少量人工标注好的样本示例,大型语言模型不需进行模型参数微调,就能够对新的样本按照示例样式进行准确地预测,这是大型语言模型参数越来越大的时候涌现出的一种能力。
那么,校准训练的过程可以包括:调用待校准的大型语言模型,对识别校准文本进行实体识别处理,直至识别出的实体与识别校准文本中的参考实体相匹配,得到初始校准的大型语言模型;调用初始校准的大型语言模型,对意图校准文本进行意图理解处理,直至得到的问题意图与标注意图相匹配,得到大型语言模型。需要说明的是,本申请实施例中的相匹配指的是相同或相似,后续不再赘述。
其中,经过校准训练后的大型语言模型具备了准确的实体识别和意图理解的能力。由于识别校准文本中没有类似意图理解样本这样的样本示例去为大型语言模型作参考,因此通过识别校准文本对大型语言模型的校准训练过程相当于零样本提示;同时,通过含有意图理解样本的意图校准文本对大型语言模型的校准训练过程则相当于少样本提示。
示例性地,请参见附图10,示出了一种零样本提示的训练过程示意图。对于药品实体识别,只需要对大型语言模型给出详细的自然语言提示与输出要求即可。可选的,由于部分有调理效果的食物与药品界限比较模糊,因此可以在用于提示的识别校准文本中明确输出结果不能包括食物实体。
示例性地,识别校准文本的内容可以包括“请利用命名实体识别技术识别下面句子中的药品实体:{问题}。输出要求:1)格式为:A、B…,其中A、B为具体的实体;2)不输出食物实体”。
如图10中的训练界面1001所示,服务器可以将识别校准文本1002输入大型语言模型,然后大型语言模型会输出相应的识别结果1003,即“舍曲林”。可选的,如果识别结果1003与预期的识别结果不符,工作人员还可以点击“重新生成”按键,直至大型语言模型输出的识别结果与预期的识别结果不符。关于识别校准文本1004和识别结果1005的描述同上,在此不作赘述。
此外,由于识别校准文本1006中的实体输出要求部分限定了不要输出食物实体,因此,识别校准文本1006输入大型语言模型之后,大型语言模型会输出内容为“无药物实体,只有食物实体“苹果””的识别结果1007。
示例性地,请参见附图11,示出了一种少样本提示的训练过程示意图。对于药品用药的意图理解,可以根据多个药品说明书限定多个意图包括10个子部分,即适应症、禁忌症、用法用量、药代动力学、相互作用、孕妇、老人、儿童、不良反应、注意事项。
由于问题意图是针对药品知识领域所设定的,因此为了提升大型语言模型对意图分类的准确性,可以采用少样本提示的方案对大型语言模型进行训练。
如图11所示,训练界面1101中的意图校准文本1102包括针对药品知识领域的多个意图,意图输出要求(即要求不超过两个部分),问题样本(即短句“老年糖尿病能吃舍曲林吗”)以及意图理解样本(即前三个有标准意图的示例短句)。其中,意图输出要求限定输出的问题意图不要超过两个,可以保证涵盖部分多意图问题场景的同时,又避免意图太多使得抽取的说明书内容太长,从而导致大型语言模型在后续回复处理时产生性能下降的情况。
如训练界面1101所示,服务器可以将意图校准文本1102输入大型语言模型,然后大型语言模型会输出相应的意图结果1103,即“老人、禁忌症”。可选的,如果意图结果1103与预期的意图结果不符,工作人员还可以点击“重新生成”按键,直至大型语言模型输出的意图结果与预期的意图结果相符。关于意图校准文本1104和意图结果1105的描述同上,在此不作赘述。
此外,若问题意图不在针对药品知识领域的10个问题意图内,如询问药品的价格、产地等,大型语言模型会输出如“无法找到相关部分”的内容,此类意图将不采用后续的知识问答方案。
如意图校准文本1106所示,由于意图校准文本1106中的问题样本“二甲双(格华止)的价格”不在针对药品知识领域的10个问题意图内,因此大型语言模型会如内容为“药品说明书中通常不包含药品价格信息,因此无法找到对应部分”的文本1107。
可选的,为了进一步提高大语言模型在实体识别方面的准确度,还可以采用少样本提示的方式对大语言模型进行实体识别的校准训练。那么,识别校准文本中还可以包括识别样本,识别样本包含问题示例及其标注实体,其中标注实体属于药品知识领域,具体可以为某种药品的药品名称。
举例来说,识别校准文本中识别样本可以包括“老年糖尿病可以吃舍曲林吗。对应药品实体:舍曲林”。其中,“老年糖尿病可以吃舍曲林吗”为识别样本中的问题示例,“舍曲林”为识别样本中的标注实体。
进一步的,可以通过上述含有识别样本的识别校准文本,以及意图校准文本,对待校准的大型语言模型进行校准训练,从而得到大型语言模型。
S903、显示用药交互界面。
在本申请实施例中,步骤S903的具体实施方式可以参见上述实施例中步骤S301的具体实施方式,在此不赘述。
S904、响应对数据输入区域的数据输入操作,获取输入的药品问题文本。
在本申请实施例中,步骤S904的具体实施方式可以参见上述实施例中步骤S302的具体实施方式,在此不赘述。
S905、调用大型语言模型,对药品问题文本进行文本识别处理,得到药品问题文本中的药品实体,以及与药品问题文本匹配的问题意图。
在本申请实施例中,由于大型语言模型经过步骤S901至S902的校准训练之后,已经具备实体识别和意图理解的能力;因此,可以直接将问题文本输入大型语言模型,得到大型语言模型输出的对象实体,以及与问题文本匹配的问题意图。
在一个实施例中,为了进一步意图理解的准确性,还可以获取与药品问题文本匹配的目标问题示例及其标注意图;然后,调用大型语言模型,基于目标问题示例及其标注意图,对药品问题文本进行意图理解处理,得到与药品问题文本匹配的问题意图。由于药品问题文本及与其相似的目标问题示例的问题意图也应该是相似的,因此,可以通过目标问题示例的标注意图,辅助大型语言模型理解药品问题文本的问题意图,从而提高意图理解的准确性。
S906、从药品描述文本库中获取与药品实体匹配的目标描述文本。
在本申请实施例中,步骤S906的具体实施方式可以参见上述实施例中步骤S302和步骤S703至S705的具体实施方式,在此不赘述。
S907、从目标描述文本中获取与问题意图匹配的药品知识提示文本。
在本申请实施例中,步骤S907的具体实施方式可以参见上述实施例中步骤S303的具体实施方式,在此不赘述。
S908、调用大型语言模型,基于药品知识提示文本对药品问题文本进行回复处理,得到药品问题文本的用药方案。
在本申请实施例中,为了让大型语言模型能够明白需要将药品知识提示文本作为药品问题文本的知识背景去进行回复,还可以将背景提示文本与药品知识提示文本以及药品问题文本拼接在一起;然后再调用大型语言模型,对拼接文本进行文本理解处理,得到问题答案。
其中,背景提示文本用于提示药品问题文本的知识背景包括药品知识提示文本。举例来说,背景提示文本的内容可以包括“请结合上述药品知识提示文本,对药品问题文本进行回答”、“请对上述药品知识提示文本进行理解之后,再对药品问题文本进行回答”,等等。
举例来说,请参见附图12,示出了一种用药方案的生成过程示意图。服务器在对药品问题文本“老年糖尿病患者能吃舍曲林吗”进行文本识别处理之后,识别到药品实体“舍曲林”,以及与该药品问题文本匹配的问题意图“禁忌症”和“老人”。之后,服务器可以查找到与“舍曲林”匹配的药品标准名称“盐酸舍曲林片”,并从药品说明书库中查找出“盐酸舍曲林片”对应的药品说明书。然后,服务器再从药品说明书中截取关于“禁忌症”和“老人”的部分,从而得到药品知识提示文本。
服务器在得到药品知识提示文本之后,可以将药品知识提示文本、药品问题文本以及背景提示文本进行拼接,从而得到如答案生成界面1201中的拼接文本1202。其中,药品知识提示文本的内容包括拼接文本1202中的第二段;背景提示文本的内容包括“已知舍曲林的药品说明书如下”和“请结合上述药品说明书回答”。
服务器将拼接文本1202输入大型语言模型,然后大型语言模型对拼接文本1202进行文本理解之后,会输出相应的用药方案1203。
服务器在接收到用药方案1203时,可以响应用药方案1203生成内容为“所以结论是?”的结论提示文本1204;然后服务器可以将结论提示文本1204输入大型语言模型,得到大型语言模型输出的用药方案1203的概括文本1205。
可选的,服务器可以在用药交互界面输出概括文本1205或者将概括文本1205发送至终端设备以使终端设备用药交互界面输出概括文本1205。那么,交互对象最终接收到的是一个简单易懂且准确的答案。
请参见附图13,示出了另一种问题答案的生成过程示意图。服务器在对药品问题文本“男性吃完舍曲林会导致那方面不行吗”进行文本识别处理之后,识别到药品实体“舍曲林”,以及与该药品问题文本匹配的问题意图“不良反应”。之后,服务器可以查找到与“舍曲林”匹配的药品标准名称“盐酸舍曲林片”,并从药品说明书库中查找出“盐酸舍曲林片”对应的药品说明书。然后,服务器再从药品说明书中截取关于“不良反应”的部分,从而得到药品知识提示文本。
服务器在得到药品知识提示文本之后,可以将药品知识提示文本、药品问题文本以及背景提示文本进行拼接,从而得到如答案生成界面1301中的拼接文本1302。其中,药品知识提示文本的内容包括拼接文本1302中的第二段;背景提示文本的内容包括“已知舍曲林的不良反应如下”和“请结合上述药品说明书回答”。
服务器将拼接文本1302输入大型语言模型,然后大型语言模型对拼接文本907进行文本理解之后,会输出相应的用药方案1303。
服务器在接收到用药方案1303时,可以响应用药方案1303生成内容为“对上述内容进行结论性概括”的结论提示文本1304;然后服务器可以将结论提示文本1304输入大型语言模型,得到大型语言模型输出的用药方案1303的概括文本1305。可选的,服务器可以输出概括文本1305或者将概括文本1305发送至终端设备以使终端设备输出概括文本1305。那么,提问对象最终接收到的是一个简单易懂且准确的答案。
相较于图1所示的直接使用大型语言模型进行知识问答,将“舍曲林”错误理解成一种降糖药的示例;图12中的示例通过匹配药品的标准名称,获取药品知识提示文本的方式,使得大型语言模型能够在药品说明书的知识提示下,理解老年人相关临床试验数据,针对问题文本给出有循证依据的答案,并可以进一步通过结论提示文本给出简单易懂的结论。
此外,图13所示的示例中,对于药品问题文本“男性吃完舍曲林会导致那方面不行吗”,大型语言模型能够理解问题意图为“不良反应”,从而引入“不良反应”知识提示。也就是说,大型语言模型可以像人类医生一样理解相对隐诲的问法,以便从长段药品说明书中定位到相关知识,给出精准且流畅的回答,体现出了答案的智能。
具体实现中,请参见附图14,示出了一种基于大型语言模型的用药方案生成过程示意图。如图14所示,在获取到药品问题文本之后,服务器可以调用大型语言模型对药品问题文本进行问题理解,问题理解的过程具体包括实体识别和意图理解两个部分。之后,大型语言模型可以输出药品问题文本含有的药品实体以及与药品问题文本匹配的问题意图。
然后,如图10所示,服务器可以通过标准名称匹配模块,查找到与上述药品实体相匹配的标准名称,并从药品描述文本库中获取该标准名称对应的目标描述文本。
在得到目标描述文本之后,服务器可以从目标描述文本中截取与上述输出的问题意图相匹配的部分,并生成药品知识提示文本。最后,如图10所示,服务器可以将药品知识提示文本与药品问题文本拼接,并调用大型语言模型根据拼接文本完成在知识提示下的知识问答,从而得到最终的用药方案。
S909、在用药交互界面输出用药方案。
在本申请实施例中,步骤S909的具体实施方式可以参见上述实施例中步骤S306的具体实施方式,在此不赘述。
在本申请实施例中,根据大型语言模型的特点,借助零样本提示和少样本提示的方式,可以在不需要大量标注数据的情况下,就得到一个能够进行准确的实体识别和意图理解的模型;通过上述方式,省去了从零开始训练实体识别模型和意图识别模型的中间技术环节,也大大减小了人工标注数据的工作量,有利于降低成本以及提升用药问答过程的可维护性和可拓展性。
在本申请的一个实施例中,提供了又一种基于大型语言模型的用药方案生成方法,该基于大型语言模型的用药方案生成方法可以应用于图1所示的基于大型语言模型的用药方案生成系统,该方法可以由终端设备或服务器执行,也可以由终端设备和服务器共同执行,在本申请实施例中,以该方法由服务器执行为例进行说明,如图15所示,示出了又一种基于大型语言模型的用药方案生成方法的流程示意图,该基于大型语言模型的用药方案生成方法在图3、图7和图9中所示的方法的基础上,将预设知识领域确定为药品知识领域。
其中,S1501至S1509详细介绍如下:
S1501、显示用药交互界面。
在本申请实施例中,步骤S1503的具体实施方式可以参见上述实施例中步骤S301的具体实施方式,在此不赘述。
S1502、响应对数据输入区域的数据输入操作,获取输入的药品问题文本,并对药品问题文本进行文本识别处理,得到药品问题文本中的药品实体,以及与药品问题文本匹配的问题意图。
在本申请实施例中,步骤S1502的具体实施方式可以参见上述实施例中步骤S302的具体实施方式,在此不赘述。
S1503、从药品描述文本库中获取与药品实体匹配的目标描述文本。
在本申请实施例中,步骤S1503的具体实施方式可以参见上述实施例中步骤S302,以及步骤S703至S705的具体实施方式,在此不赘述。
S1504、在用药交互界面输出患者特征提示信息。
在本申请实施例中,患者特征提示信息用于提示输入患者在预设属性下的患者特征信息,其中预设属性是基于多个意图设定的。具体来说,由于同一药品可能对不同性别、不同年龄或者患有不同疾病的患者所产生的效果不同,而根据多个药品描述文本所设定的多个意图中也包括“孕妇”、“老人”、“禁忌症”等。因此根据多个意图所设定的预设属性可以包括性别、年龄、症状等。
举例来说,患者特征提示信息可以包括“请问患者的性别和年龄是?”、“请问患者是否有其他疾病”、“是否还有其他症状?”,等等。
在一个实施例中,如果与药品问题文本匹配的问题意图的数量过少或者没有,那么会影响获取到的药品知识提示文本的准确性,从而影响生成的用药方案的准确性。因此,若与药品问题文本匹配的问题意图的数量小于预设数量,则输出可以患者特征提示信息。
其中,预设数量可以是人为设定的,也可以上述基于大型语言模型的用药方案生成系统中的终端设备或服务器设定的,在此不作限定。具体来说,预设数量最好不要太大。举例来说,预设数量可以为2或3。
在一个实施例中,有些药品的药品描述文本中会明确说明属于某类人群、患有某种疾病等情况下不能使用该药品;因此,为了避免由于获取到的患者信息不够而导致的用药方案偏差的情况,可以在获取到的目标描述文本中包含使用禁忌事项时,输出患者特征提示信息。其中,使用禁忌事项可以包括含有不能使用、禁止使用等字眼的文本。
S1505、响应对数据输入区域的数据输入操作,获取输入的患者特征信息。
在本申请实施例中,数据输入区域与获取输入药品问题文本的区域可以是相同的区域。
可选的,输入患者特征信息的区域与获取输入药品问题文本的区域也可以不相同。那么,数据输入区域可以包括问题输入区域和特征输入区域,即特征输入区域用于输入患者特征信息,问题输入区域用于输入药品问题文本。
S1506、对患者特征信息进行意图理解处理,得到新增意图。
在本申请实施例中,由于患者特征信息是交互对象根据相应预设属性所输入的,而预设属性是基于多个意图设定的;因此,对患者特征信息进行意图理解处理是可以得到相应意图的。
举例来说,患者特征信息可以包括“男,67岁”,通常65岁以上都算作老人,那么对患者特征信息进行意图理解处理之后所得到的新增意图可以包括“老人”。又如,患者特征信息还包括“糖尿病”,而糖尿病属于疾病,那么对患者特征信息进行意图理解处理之后所得到的新增意图可以包括“禁忌症”。
举例来说,请参见附图16,示出了一种包含患者特征提示信息的用药交互界面图。可以设定预设数量为2。如图16所示,用药交互界面1601包含数据输入区域1602。交互对象先通过数据输入区域1602输入药品问题文本1603。服务器对药品问题文本1603进行文本识别处理后发现与药品问题文本1603匹配的问题意图仅为“注意事项”,其数量小于2,那么,可以在用药交互界面1601输出患者特征提示信息1604,以提示交互对象输入自己的性别、年龄和存在的症状。
交互对象先通过数据输入区域1602输入患者特征信息1605之后,服务器可以对患者特征信息1605进行意图理解处理,得到新增意图“孕妇”。然后,服务器再基于之前获取到的问题意图,以及新增意图得到用药方案1606。最后,可以在用药交互界面1601输出用药方案1606。
S1507、从目标描述文本中获取与问题意图和新增意图匹配的药品知识提示文本。
在本申请实施例中,步骤S1104的具体实施方式可以参见上述实施例中步骤S304,以及步骤S606的具体实施方式,在此不赘述。
S1508、调用大型语言模型,基于药品知识提示文本对药品问题文本进行回复处理,得到药品问题文本的用药方案。
在本申请实施例中,步骤S1104的具体实施方式可以参见上述实施例中步骤S304,以及步骤S606的具体实施方式,在此不赘述。
S1509、在用药交互界面输出用药方案。
在本申请实施例中,步骤S1103的具体实施方式可以参见上述实施例中步骤S303的具体实施方式,在此不赘述。
在一种可能实现的方式中,交互对象在输入药品问题时,忘记或者没有意识需要输入自己已经服用、正在服用或者将要服用其他药品,而其他药品可能与输入的药品问题中的药品产生相互作用、不良反应等。
因此,还可以在用药交互界面输出混用提示信息;响应对数据输入区域的数据输入操作,获取输入的药品名称,并对输入的药品名称进行实体识别处理得到混用实体;生成含有药品实体以及混用实体的混用问题文本;获取混用问题文本的药品混用方案,并在用药交互界面输出药品混用方案。
其中,混用提示信息用于提示输入与药品实体混用的药品名称。由于交互对象输入的药品名称往往比较随意,可能含有其他不属于药品名称的字符,因此需要对输入的药品名称进行实体识别处理得到混用实体。
以及,生成含有药品实体以及混用实体的混用问题文本的具体方式可以包括:基于混用提示信息确定混用实体的用药意图;根据用药意图、药品实体以及混用实体,生成混用问题文本。其中,混用问题文本的问题意图与用药意图匹配。
此外,此处输入药品名称的区域与输入药品问题文本,以及输入患者特征信息的区域可以是相同的区域。可选的,输入药品名称的区域与输入药品问题文本,以及输入患者特征信息的区域也可以不相同。那么,数据输入区域可以包括问题输入区域、特征输入区域以及名称输入区域,其中名称输入区域用于输入药品名称。
另外,获取混用问题文本的药品混用方案的具体方式可以包括:对混用问题文本进行文本识别处理,得到混用问题文本中的药品实体,以及与混用问题文本匹配的问题意图;从药品描述文本库中获取与混用问题文本中的药品实体匹配的指定描述文本;从指定描述文本中获取与混用问题文本匹配的问题意图所匹配的药品知识提示文本;调用大型语言模型,基于获取到的药品知识提示文本对混用问题文本进行回复处理,得到混用问题文本的药品混用方案。
示例性地,请参见附图17,示出了一种包含混用提示信息的用药交互界面图。用药交互界面1701包含问题输入区域1702。如用药交互界面1701所示,在得到用药方案1703之后,可以输出混用提示信息1704。若存在混用的药品,则交互对象可以通过药品输入区域1705输入混用的药品名称。
实际应用中,可以开发用药问答应用,或者将用药问答程序嵌入到其他应用的智能问答中,从而便于解决人们对用药方面的疑惑。用药问答应用或相关程序可以通过调用用药问答引擎的方式,得到药品相关问题的答案。其中,用药问答引擎包含针对药品知识领域进行校准训练后的大型语言模型、药品说明书库。用药问答引擎的执行过程可以参见图3、图7以及图9中的实施例,在此不作赘述。
可选的,由于存在某些药品明确不能用于某类人群、某些年龄段的人员或者某种性别的人群等;因此,用药问答应用或相关程序可以基于这类药品的基础用药方案,在前端设计几个简单的追问问题,以便在获取到更多信息之后,可以直接通过基础用药方案得到问题答案。对于简单的问题用简单的逻辑判断,对于复杂的问题则调用用药问答引擎,这样在保证答案准确性的同时也有利于提高知识问答的效率。
请参见附图18,示出了另一种用药交互界面示意图。如用药交互界面1801所示,患者输入“地塞米松使用时有什么需要注意的?”这一问题文本之后,用药问答客户端可以输出“请问患者的性别和年龄是?”以及“是否还有其他症状?”等追问问题。
用药问答客户端在确定无法直接根据逻辑判断得出答案之后,可以调用用药问答引擎对输入的药品问题文本进行文本识别处理,得到药品实体“地塞米松”以及问题意图“相互作用”;然后可以根据得到的药品实体和问题意图,去查找目标说明书、生成药品知识提示文本;最后再通过大型语言模型,在药品知识提示文本的知识提示下对药品问题文本进行回复处理,从而得到该药品问题文本的用药方案1802。最后,用药问答客户端可以输出用药方案1802。
可选的,在输出用药方案之后,用药交互界面还可以输出药品问题文本中提及的药品实体的药品信息。请参见附图19,示出了又一种用药交互界面示意图。如用药交互界面1901所示,在输出用药方案之后,用药交互界面1901还可以输出药品问题文本中提及的布洛芬的药品信息。
以及,请参见附图20,示出了又一种用药交互界面示意图。如用药交互界面2001所示,在输出用药方案之后,用药交互界面2001还输出了药品问题文本中提及的二甲双胍相关的各种剂型药品的药品信息。同时,点击“查看更多”的按键,还可以获取布洛芬相关的药品信息。
可选的,用药交互界面还可以包括辅助配件,以便在患者对问题答案不够满意的情况下,跳转到其他界面,为患者提供人工、药品推荐、医院推荐等其他服务,从而帮助患者从多方面更加完善地解决问题。如用药交互界面1901包含辅助配件1902,以及用药交互界面2001包含辅助配件2002。
由于药品能不能使用是与患者自身情况相关的。因此,在本申请实施例中,通过提示交互对象输入患者特征信息的方式,可以掌握患者更多的信息,从而可以定位更多的新增意图。同时,本申请实施例通过从目标描述文本中获取与问题意图和新增意图匹配的药品知识提示文本的方式,可以使得药品知识提示文本能够提供与患者自身情况更为切合的知识背景,有利于生成患者级别的准确用药方案。在此介绍本申请的装置实施例,可以用于执行本申请上述实施例中的人工智能知识问答方法。对于本申请装置实施例中未披露的细节,请参照本申请上述的人工智能知识问答方法的实施例。
本申请实施例提供了一种基于大型语言模型的用药方案生成装置,如图21所示,装置包括显示单元2101、文本识别单元2102、获取单元2103和方案生成单元2104,其中:
显示单元2101,用于显示用药交互界面,用药交互界面包含数据输入区域;
文本识别单元2102,用于响应对数据输入区域的数据输入操作,获取输入的药品问题文本,并对药品问题文本进行文本识别处理,得到药品问题文本中的药品实体,以及与药品问题文本匹配的问题意图;其中,任一意图是基于多个药品的药品描述文本设定的,任一药品描述文本用于记载相应药品在药品知识领域中通过知识审核的药品描述信息;
获取单元2103,用于从药品描述文本库中获取与药品实体匹配的目标描述文本;
获取单元2103,还用于从目标描述文本中获取与问题意图匹配的药品知识提示文本;
方案生成单元2104,用于调用大型语言模型,基于药品知识提示文本对药品问题文本进行回复处理,得到药品问题文本的用药方案;
方案生成单元2104,还用于在用药交互界面输出用药方案。
在本申请的一个实施例中,药品描述文本库还包括各个药品描述文本所描述的药品的标准名称;基于前述方案,获取单元2103在从药品描述文本库中获取与药品实体匹配的目标描述文本时,具体可以用于:获取药品描述文本库中的各个标准名称与药品实体之间的名称相似度;根据多个名称相似度,确定与药品实体匹配的目标标准名称;其中,目标标准名称对应的名称相似度大于其他标准名称对应的名称相似度;将目标标准名称对应的药品描述文本作为目标描述文本。
在本申请的一个实施例中,基于前述方案,获取单元2103在获取药品描述文本库中的各个标准名称与药品实体之间的名称相似度时,具体可以用于:对药品实体进行类型拆分处理,得到拆分字段;获取各个标准名称对应的参考字段;其中,参考字段是对各个标准名称进行类型拆分处理得到的;将对应的命名类型与拆分字段相同的参考字段确定为目标字段;基于拆分字段与目标字段之间的字段相似度,得到相应标准名称与药品实体之间的名称相似度。
在本申请的一个实施例中,基于前述方案,获取单元2103进一步还可以用于:基于药品知识领域中各个药品的使用频率,生成药品白名单;其中,药品白名单中标准名称所对应的药品的使用频率大于其他药品的使用频率;若药品白名单中存在与药品实体相匹配的指定标准名称,则将药品描述文本库中指定标准名称对应的药品描述文本确定为目标描述文本;若药品白名单中未存在与药品实体相匹配的指定标准名称,则触发执行对药品实体进行类型拆分处理,得到拆分字段的步骤。
在本申请的一个实施例中,基于前述方案,获取单元2103进一步还可以用于:对对象实体进行文本纠错处理,得到处理后的对象实体;对对象实体进行类型拆分处理,得到拆分字段,包括:对处理后的对象实体进行类型拆分处理,得到拆分字段。
在本申请的一个实施例中,基于前述方案,文本识别单元2102进一步还可以用于:获取识别校准文本;其中,识别校准文本包括实体识别技术提示字段、含有药品参考实体的问题文本、以及实体输出要求;获取意图校准文本;其中,意图校准文本包括多个意图、问题样本、意图输出要求和意图理解样本,意图理解样本包括问题示例,以及多个意图中与问题示例相匹配的标注意图;通过识别校准文本和意图校准文本,对待校准的大型语言模型进行校准训练,得到大型语言模型,以通过大型语言模型进行文本识别处理。
在本申请的一个实施例中,基于前述方案,方案生成单元2104在调用大型语言模型,基于药品知识提示文本对药品问题文本进行回复处理,得到药品问题文本的用药方案时,具体可以用于:对药品知识提示文本、背景提示文本以及药品问题文本进行拼接处理,得到拼接文本;其中,背景提示文本用于提示药品问题文本的知识背景包括药品知识提示文本;调用大型语言模型,对拼接文本进行文本理解处理,得到用药方案。
在本申请的一个实施例中,基于前述方案,方案生成单元2104进一步还可以用于:响应用药方案,生成对用药方案的结论提示文本,结论提示文本包含对用药方案进行概括的提示内容;将结论提示文本输入大型语言模型,得到大型语言模型输出的用药方案的概括文本;那么,方案生成单元2104在用药交互界面输出用药方案时,具体可以用于:在用药交互界面输出概括文本。
在本申请的一个实施例中,基于前述方案,方案生成单元2104还可以用于:在用药交互界面输出混用提示信息;混用提示信息用于提示输入与药品实体混用的药品名称;响应对数据输入区域的数据输入操作,获取输入的药品名称,并对输入的药品名称进行实体识别处理得到混用实体;生成含有药品实体以及混用实体的混用问题文本;获取混用问题文本的药品混用方案,并在用药交互界面输出药品混用方案。
在本申请的一个实施例中,基于前述方案,方案生成单元2104在生成含有药品实体以及混用实体的混用问题文本时,具体可以用于:基于混用提示信息确定混用实体的用药意图;根据用药意图、药品实体以及混用实体,生成混用问题文本;混用问题文本的问题意图与用药意图匹配。
在本申请的一个实施例中,基于前述方案,方案生成单元2104还可以用于:在用药交互界面输出患者特征提示信息;患者特征提示信息用于提示输入患者在预设属性下的患者特征信息,预设属性是基于多个意图设定的;响应对数据输入区域的数据输入操作,获取输入的患者特征信息;对患者特征信息进行意图理解处理,得到新增意图,以基于问题意图以及新增意图得到用药方案。
在本申请的一个实施例中,基于前述方案,方案生成单元2104还可以用于:若与药品问题文本匹配的问题意图的数量小于预设数量,则输出患者特征提示信息;或者,若目标描述文本中包含使用禁忌事项,则输出患者特征提示信息。
需要说明的是,上述实施例所提供的装置与上述实施例所提供的方法属于同一构思,其中各个模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
上述实施例所提供的装置可以设于终端设备内,也可以设于服务器内,通过本申请实施例提供的装置通过识别药品问题文本中药品实体的方式,可以方便后续查找到描述该药品实体的目标描述文本;同时,通过从目标描述文本中获取与问题意图匹配的药品知识提示文本的方式,可以精准获取目标描述文本中与药品问题文本相关的内容以作为药品知识提示文本。而药品描述文本所包含的都是通过知识审核的药品描述信息,具有权威性和准确性,故而药品知识提示文本中的知识内容是权威且准确的。因此,本申请实施例中的大型语言模型在药品知识提示文本所提示的准确且权威的知识内容下对药品问题文本进行作答,能够有效避免大型语言模型对问题内容的认知出现偏差的情况,有利于大型语言模型输出更准确的用药方案,从而提高针对药品问题所生成的用药方案的准确性,进而提高用药问答的准确性。
本申请的实施例还提供了一种电子设备,包括一个或多个处理器,以及存储装置,其中,存储装置,用于存储一个或多个计算机程序,当一个或多个计算机程序被一个或多个处理器执行时,使得电子设备实现如上的人工智能知识问答方法。
图22示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图22示出的电子设备的计算机系统2200仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图22所示,计算机系统2200包括处理器(Central Processing Unit,CPU)2201,其可以根据存储在只读存储器(Read-Only Memory,ROM)2202中的程序或者从存储部分2208加载到随机访问存储器(Random Access Memory,RAM)2203中的程序而执行各种适当的动作和处理,例如执行上述实施例中的方法。在RAM 2203中,还存储有系统操作所需的各种程序和数据。CPU 2201、ROM 2202以及RAM 2203通过总线2204彼此相连。输入/输出(Input/Output,I/O)接口2205也连接至总线2204。
在一些实施例中,以下部件连接至I/O接口2205:包括键盘、鼠标等的输入部分2206;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid CrystalDisplay,LCD)等以及扬声器等的输出部分2207;包括硬盘等的存储部分2208;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分2209。通信部分2209经由诸如因特网的网络执行通信处理。驱动器2210也根据需要连接至I/O接口2205。可拆卸介质2211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器2210上,以便于从其上读出的计算机程序根据需要被安装入存储部分2208。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分2209从网络上被下载和安装,和/或从可拆卸介质2211被安装。在该计算机程序被处理器(CPU)2201执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机程序的组合来实现。
描述于本申请实施例中所涉及到的单元或者模块可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元或者模块也可以设置在处理器中。其中,这些单元或者模块的名称在某种情况下并不构成对该单元或者模块本身的限定。
本申请的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前的人工智能知识问答方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中。
本申请的另一方面还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该电子设备执行上述各个实施例中提供如前所述的人工智能知识问答方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
本领域技术者在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
上述内容,仅为本申请的较佳示例性实施例,并非用于限制本申请的实施方案,本领域普通技术者根据本申请的主要构思和精神,可以十分方便地进行相应的变通或修改,故本申请的保护范围应以权利要求书所要求的保护范围为准。
Claims (14)
1.一种基于大型语言模型的用药方案生成方法,其特征在于,包括:
显示用药交互界面,所述用药交互界面包含数据输入区域;
响应对所述数据输入区域的数据输入操作,获取输入的药品问题文本,并对所述药品问题文本进行文本识别处理,得到所述药品问题文本中的药品实体,以及与所述药品问题文本匹配的问题意图;其中,任一意图是基于多个药品的药品描述文本设定的,任一药品描述文本用于记载相应药品在药品知识领域中通过知识审核的药品描述信息;
从药品描述文本库中获取与所述药品实体匹配的目标描述文本;
从所述目标描述文本中获取与所述问题意图匹配的药品知识提示文本;
调用大型语言模型,基于所述药品知识提示文本对所述药品问题文本进行回复处理,得到所述药品问题文本的用药方案;
在所述用药交互界面输出所述用药方案。
2.根据权利要求1所述的方法,其特征在于,所述药品描述文本库还包括各个药品描述文本所描述的药品的标准名称;所述从药品描述文本库中获取与所述药品实体匹配的目标描述文本,包括:
获取所述药品描述文本库中的各个标准名称与所述药品实体之间的名称相似度;
根据多个名称相似度,确定与所述药品实体匹配的目标标准名称;其中,所述目标标准名称对应的名称相似度大于其他标准名称对应的名称相似度;
将所述目标标准名称对应的药品描述文本作为所述目标描述文本。
3.根据权利要求2所述的方法,其特征在于,所述获取所述药品描述文本库中的各个标准名称与所述药品实体之间的名称相似度,包括:
对所述药品实体进行类型拆分处理,得到拆分字段;
获取所述各个标准名称对应的参考字段;其中,所述参考字段是对所述各个标准名称进行类型拆分处理得到的;
将对应的命名类型与所述拆分字段相同的参考字段确定为目标字段;
基于所述拆分字段与目标字段之间的字段相似度,得到相应标准名称与所述药品实体之间的名称相似度。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
基于所述药品知识领域中各个药品的使用频率,生成药品白名单;其中,药品白名单中标准名称所对应的药品的使用频率大于其他药品的使用频率;
若所述药品白名单中存在与所述药品实体相匹配的指定标准名称,则将所述药品描述文本库中所述指定标准名称对应的药品描述文本确定为所述目标描述文本;
若所述药品白名单中未存在与所述药品实体相匹配的指定标准名称,则触发执行所述对所述药品实体进行类型拆分处理,得到拆分字段的步骤。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取识别校准文本;其中,所述识别校准文本包括实体识别技术提示字段、含有药品参考实体的问题文本、以及实体输出要求;
获取意图校准文本;其中,所述意图校准文本包括多个意图、问题样本、意图输出要求和意图理解样本,所述意图理解样本包括问题示例,以及所述多个意图中与所述问题示例相匹配的标注意图;
通过所述识别校准文本和所述意图校准文本,对待校准的大型语言模型进行校准训练,得到所述大型语言模型,以通过所述大型语言模型进行文本识别处理。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述调用大型语言模型,基于所述药品知识提示文本对所述药品问题文本进行回复处理,得到所述药品问题文本的用药方案,包括:
对所述药品知识提示文本、背景提示文本以及所述药品问题文本进行拼接处理,得到拼接文本;其中,所述背景提示文本用于提示所述药品问题文本的知识背景包括所述药品知识提示文本;
调用所述大型语言模型,对所述拼接文本进行文本理解处理,得到所述用药方案。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
响应所述用药方案,生成对所述用药方案的结论提示文本,所述结论提示文本包含对所述用药方案进行概括的提示内容;
将所述结论提示文本输入所述大型语言模型,得到所述大型语言模型输出的所述用药方案的概括文本;
所述在所述用药交互界面输出所述用药方案,包括:
在所述用药交互界面输出所述概括文本。
8.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
在所述用药交互界面输出混用提示信息;所述混用提示信息用于提示输入与所述药品实体混用的药品名称;
响应对所述数据输入区域的数据输入操作,获取输入的药品名称,并对所述输入的药品名称进行实体识别处理得到混用实体;
生成含有所述药品实体以及所述混用实体的混用问题文本;
获取所述混用问题文本的药品混用方案,并在所述用药交互界面输出所述药品混用方案。
9.根据权利要求8所述的方法,其特征在于,所述生成含有所述药品实体以及所述混用实体的混用问题文本,包括:
基于所述混用提示信息确定所述混用实体的用药意图;
根据所述用药意图、所述药品实体以及所述混用实体,生成所述混用问题文本;所述混用问题文本的问题意图与所述用药意图匹配。
10.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
在所述用药交互界面输出患者特征提示信息;所述患者特征提示信息用于提示输入患者在预设属性下的患者特征信息,所述预设属性是基于多个意图设定的;
响应对所述数据输入区域的数据输入操作,获取输入的患者特征信息;
对所述患者特征信息进行意图理解处理,得到新增意图,以基于所述问题意图以及所述新增意图得到所述用药方案。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
若与所述药品问题文本匹配的问题意图的数量小于预设数量,则输出所述患者特征提示信息;
或者,若所述目标描述文本中包含使用禁忌事项,则输出所述患者特征提示信息。
12.一种基于大型语言模型的用药方案生成装置,其特征在于,包括显示单元、文本识别单元、获取单元和方案生成单元,其中:
所述显示单元,用于显示用药交互界面,所述用药交互界面包含数据输入区域;
所述文本识别单元,用于响应对所述数据输入区域的数据输入操作,获取输入的药品问题文本,并对所述药品问题文本进行文本识别处理,得到所述药品问题文本中的药品实体,以及与所述药品问题文本匹配的问题意图;其中,任一意图是基于多个药品的药品描述文本设定的,任一药品描述文本用于记载相应药品在药品知识领域中通过知识审核的药品描述信息;
所述获取单元,用于从药品描述文本库中获取与所述药品实体匹配的目标描述文本;
所述获取单元,还用于从所述目标描述文本中获取与所述问题意图匹配的药品知识提示文本;
所述方案生成单元,用于调用大型语言模型,基于所述药品知识提示文本对所述药品问题文本进行回复处理,得到所述药品问题文本的用药方案;
所述方案生成单元,还用于在所述用药交互界面输出所述用药方案。
13.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至11中任一项所述的基于大型语言模型的用药方案生成方法。
14.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至11中任一项所述的基于大型语言模型的用药方案生成方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202311160223.XA CN117194630A (zh) | 2023-09-08 | 2023-09-08 | 基于大型语言模型的用药方案生成方法及相关设备 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202311160223.XA CN117194630A (zh) | 2023-09-08 | 2023-09-08 | 基于大型语言模型的用药方案生成方法及相关设备 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN117194630A true CN117194630A (zh) | 2023-12-08 |
Family
ID=88999272
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202311160223.XA Pending CN117194630A (zh) | 2023-09-08 | 2023-09-08 | 基于大型语言模型的用药方案生成方法及相关设备 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN117194630A (zh) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN118841131A (zh) * | 2024-06-27 | 2024-10-25 | 讯飞医疗科技股份有限公司 | 一种用药建议方法和装置、电子设备和存储介质 |
| CN120413053A (zh) * | 2025-07-03 | 2025-08-01 | 安徽中医药大学 | 医疗方案的生成方法、系统、设备和介质 |
-
2023
- 2023-09-08 CN CN202311160223.XA patent/CN117194630A/zh active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN118841131A (zh) * | 2024-06-27 | 2024-10-25 | 讯飞医疗科技股份有限公司 | 一种用药建议方法和装置、电子设备和存储介质 |
| CN120413053A (zh) * | 2025-07-03 | 2025-08-01 | 安徽中医药大学 | 医疗方案的生成方法、系统、设备和介质 |
| CN120413053B (zh) * | 2025-07-03 | 2025-09-16 | 安徽中医药大学 | 医疗方案的生成方法、系统、设备和介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20220138432A1 (en) | Relying on discourse analysis to answer complex questions by neural machine reading comprehension | |
| US11861319B2 (en) | Chatbot conducting a virtual social dialogue | |
| CN112106056A (zh) | 构造虚构的话语树来提高回答聚敛性问题的能力 | |
| US20080091634A1 (en) | Content enhancement system and method and applications thereof | |
| CN111670435A (zh) | 使用交流话语树来检测对解释的请求 | |
| US11532387B2 (en) | Identifying information in plain text narratives EMRs | |
| US20220075954A1 (en) | Formulating Questions Using Differences Between Sets of Syntactic Trees and Differences Between Sets of Semantic Trees | |
| CN114360711A (zh) | 通过句法-语义对准和话语分析进行的基于多案例的推理 | |
| CN114902230A (zh) | 改进的话语解析 | |
| US11914961B2 (en) | Relying on discourse trees to build ontologies | |
| US11615145B2 (en) | Converting a document into a chatbot-accessible form via the use of communicative discourse trees | |
| Polat et al. | Testing prompt engineering methods for knowledge extraction from text | |
| CN117194630A (zh) | 基于大型语言模型的用药方案生成方法及相关设备 | |
| CN115392217A (zh) | 用于保持修辞流的技术 | |
| CN119988602A (zh) | 基于大模型的检索增强方法、设备及存储介质 | |
| CN117473057A (zh) | 问答处理方法、系统、设备和存储介质 | |
| Guasch et al. | Effects of the degree of meaning similarity on cross-language semantic priming in highly proficient bilinguals | |
| CN117015772A (zh) | 依赖于话语树以构建本体 | |
| Green | A Bayesian network coding scheme for annotating biomedical information presented to genetic counseling clients | |
| Xiong et al. | Automating smart recommendation from natural language API descriptions via representation learning | |
| US12153889B2 (en) | Relying on discourse trees to build ontologies | |
| JPWO2019167281A1 (ja) | 応答処理プログラム、応答処理方法、応答処理装置および応答処理システム | |
| Demner-Fushman | Complex question answering based on a semantic domain model of clinical medicine | |
| EP1912164A2 (en) | Content enhancement system and method and applications thereof | |
| Sales et al. | An explainable semantic parser for end-user development |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication |