CN116860969A - 一种客户评论分析方法、系统、设备及介质 - Google Patents
一种客户评论分析方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN116860969A CN116860969A CN202310812427.0A CN202310812427A CN116860969A CN 116860969 A CN116860969 A CN 116860969A CN 202310812427 A CN202310812427 A CN 202310812427A CN 116860969 A CN116860969 A CN 116860969A
- Authority
- CN
- China
- Prior art keywords
- intermediate data
- target
- keywords
- emotion
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种客户评论分析方法、系统、设备及介质,其中方法包括:获取目标评论数据,对目标评论数据进行预处理,以得到中间数据及中间数据对应的词向量;对中间数据进行关键词提取,以得到中间数据对应的关键词;基于关键词对应的词向量,对关键词进行聚类,以得到关键词提取聚类;基于预设情感词典,对中间数据进行情感特征分析,以得到中间数据中与各关键词相关的情感特征值;基于情感特征值,以及关键词提取聚类,确定目标产品对应的产品属性权重评分。研发者可快速、全面的了解客户对产品的总体评价,可总结出客户对产品提出的建议与意见,可根据分析出的情感特征来总结客户对产品需求的趋向,来研发新的更符合大众需求的产品。
Description
技术领域
本申请涉及自然语言处理领域,具体涉及一种客户评论分析方法、系统、设备及介质。
背景技术
近年来,随着各种软件应用的多样化发展,用户对软件的内容和功能要求越来越高,而研发人员获取用户对产品的意见与建议最主要途径就是用户的评论反馈。随着社交媒体在网络上的爆炸性增长(例如,评论,论坛讨论,博客,微博,Twiter,评论和社交网站上的帖子),个人和组织越来越多地使用这些媒体中的内容进行决策。如今,如果想购买一种消费产品,不再局限于向朋友和家人征求意见,因为在Web上的公共论坛上有很多关于该产品的用户评论和讨论,对于组织而言,可能不再需要进行问卷,民意调查和焦点小组采收集公众意见,因为有大量此类信息可以公开获得。然而,由于各种网站的激增,在网上寻找和监测意见网站并从中提取信息仍然是一项艰巨的任务。每个网站通常都包含大的观点文太,而在冗长的博客和论坛帖子中,这些文本并不总是容易被解读。一般的人举违者很难识别相关的网站,并提取和总结其中的观点。因此需要自动化的情绪分析系统。
但是通过研发人员或客户经理逐条阅读分析评论反馈,以此获取用户的意见及建议,过于依赖于个人偏好及研发经验,且效率较低。
发明内容
为了解决上述问题,本申请提出了一种方法、设备及介质,其中方法包括:
获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
在一个示例中,所述对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量,具体包括:基于预设停用词表,对所述目标评论数据进行去停用词操作,以得到第一中间数据;通过正则表达式删除所述第一中间数据中的符号数据,以得到第二中间数据;所述符号数据包括错误符号以及网络表情中的至少一种;通过基于变压器的双向编码器表达,提取所述第二中间数据的主干信息,并将索引长度标准化;使用Bert嵌入层抽取所述主干信息中的词序列,并将所述词序列转化为所述词向量。
在一个示例中,所述关键词提取并聚类,具体包括:基于文档主题生成模型,提取所述中间数据对应的关键词;基于所述关键词分别对应的词向量,确定所述关键词之间的相似度;基于所述关键词之间的相似度,对所述关键词进行聚类操作,以得到第一数量个关键词提取聚类。
在一个示例中,所述情感特征分析,具体包括:确定预设的情感词典、预设否定词表以及预设程度副词表;基于所述中间数据中的情感词,确定所述中间数据对应的情感分数;基于所述中间数据中所述情感词前的否定词以及程度副词,确定所述情感分数对应的情感极性;基于所述情感极性以及所述情感分数,确定所述中间数据对应的情感特征值分析。
在一个示例中,所述基于预设情感词典,对所述中间数据进行情感特征分析之前,所述方法还包括:将Opinion Lexicon情感词典作为初始情感词典;使用情感倾向点互信息算法对所述初始情感词典进行扩充,以得到所述预设情感词典。
在一个示例中,,所述基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分,具体包括:确定目标产品属性对应的目标关键词提取聚类;确定所述目标关键词提取聚类中所包含的目标关键词,以及包含所述目标关键词的目标中间数据;获取所述目标中间数据对应的情感特征值,并通过如下公式,确定所述目标关键词提取聚类对应的聚类权重评分:
其中,R为聚类权重评分,n为目标关键词提取聚类中包含的目标关键词个数,ui为目标关键词提取聚类中第i个目标关键词对应的情感特征值,ti为ui对应的时间修正系数,与目标中间数据对应的评论发布时间相关;将所述目标产品属性中各目标关键词提取聚类分别对应的聚类权重评分加权,以得到所述产品属性权重评分。
在一个示例中,所述确定目标产品对应的产品属性权重评分之后,所述方法还包括:获取所述目标产品对应的全部目标产品属性;并基于所述全部目标产品属性分别对应的产品属性权重评分,确定所述目标产品对应的产品调研报告;将所述产品调研报告通过报表格式,呈现给工作人员。
本申请还提供了一种客户评论分析系统,包括:预处理模块,获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;关键词提取模块,对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;聚类模块,基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;情感分析模块,基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;权重评分模块,基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
本申请还提供了一种客户评论分析设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行:获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
本申请还提供了一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
通过本申请提出的方法能够带来如下有益效果:研发者可快速、全面的了解客户对产品的总体评价,可总结出客户对产品提出的建议与意见,可根据分析出的情感特征来总结客户对产品需求的趋向,来研发新的更符合大众需求的产品。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中一种客户评论分析方法的流程示意图;
图2为本申请实施例中一种客户评论分析系统的模块示意图;
图3为本申请实施例中一种客户评论分析设备的机构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本说明书一个或多个实施例提供的一种客户评论分析方法的流程示意图。该方法可以应用于不同类型的产品,比如,互联网金融产品、电商产品、即时通讯产品、游戏产品、公务产品等。该流程可以由相应领域的计算设备(比如,支付业务对应的风控服务器或者智能移动终端等)执行,流程中的某些输入参数或者中间结果允许人工干预调节,以帮助提高准确性。
本申请实施例涉及的分析方法的实现可以为终端设备,也可以为服务器,本申请对此不作特殊限制。为了方便理解和描述,以下实施例均以服务器为例进行详细描述。
需要说明的是,该服务器可以是单独的一台设备,可以是由多台设备组成的系统,即,分布式服务器,本申请对此不做具体限定。
如图1所示,本申请实施例提供一种客户评论分析方法,包括:
S101:获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量。
首先获取与目标产品相关的目标评论数据,并对目标评论数据进行预处理,从而得到中间数据以及与中间数据对应的词向量。这里的中间数据指的是经过清洗、去停用词等操作后剩余的评论数据。
在一个实施例中,上述目标评论数据可以预先存储在计算机设备的存储装置中,当需要对目标产品的评论数据进行分析时,计算机设备可以从存储装置中选取目标评论数据。当然,计算机设备还可以从其它外部设备中获取该目标评论数据。比如,将目标评论数据存储在云端,当需要目标产品的评论数据进行分析时,计算机设备可以从云端获取目标评论数据,本实施例对目标评论数据的获取方式不做限定。
在一个实施例中,在进行预处理时,首先需要基于预设停用词表,对目标评论数据进行去停用词操作,以得到第一中间数据,然后可通过正则表达式删除第一中间数据中的符号数据,以得到第二中间数据,这里的符号数据包括错误符号以及网络表情等符号数据。然后通过基于变压器的双向编码器表达,提取第二中间数据的主干信息,以得到中间数据,将索引长度标准化后,使用Bert嵌入层抽取主干信息中的词序列,并将词序列转化为词向量。
S102:对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词。
S103:基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类。
在一个实施例中,在进行关键词提取并进行聚类时,可以基于文档主题生成模型,提取中间数据对应的关键词,然后基于关键词分别对应的词向量,确定关键词之间的相似度,最后基于关键词之间的相似度,对关键词进行聚类操作,以得到第一数量个关键词提取聚类。
S104:基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值。
在一个实施例中,在进行情感特征值分析时,首先确定预设的情感词典、预设否定词表以及预设程度副词表,然后基于中间数据中的情感词,确定中间数据对应的情感分数,然后基于中间数据中情感词前的否定词以及程度副词,确定情感分数对应的情感极性,最后基于情感极性以及情感分数,确定中间数据对应的情感特征值分析。最后得到的情感特征值有正负之分,分数越高月趋近于正面,分数越低越趋近于负面。
在一个实施例中,将Opinion Lexicon情感词典作为初始情感词典,并使用情感倾向点互信息算法对初始情感词典进行扩充,以得到预设情感词典。
S105:基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
在一个实施例中,在确定产品属性对应的权重评分时,首先要确定需要进行评估的产品属性,如食物产品的产品属性可以是包装属性、味道属性、外观属性等。然后确定目标产品属性对应的目标关键词提取聚类,如味道属性下可以对应有口感、酸甜等关键词提取聚类,然后确定目标关键词提取聚类中所包含的目标关键词,以及包含目标关键词的目标中间数据。需要说明的是,这里跌目标关键词提取聚类指的是目标产品属性所对应的全部关键词提取聚类,目标关键词指的是某一目标关键提取聚类中的全部关键词,目标中间数据指的是某一目标关键词所对应的全部中间数据。然后获取目标中间数据对应的情感特征值,并通过如下公式,确定目标关键词提取聚类对应的聚类权重评分:
其中,R为聚类权重评分,n为目标关键词提取聚类中包含的目标关键词个数,ui为目标关键词提取聚类中第i个目标关键词对应的情感特征值,ti为ui对应的时间修正系数,与目标中间数据对应的评论发布时间相关。可以理解地,越是邻近当前时间节点的评论数据,对目标产品的分析影响比重越大,因此此处引入时间修正系数。最后,将目标产品属性中各目标关键词提取聚类分别对应的聚类权重评分加权,即可得到产品属性权重评分。
在一个实施例中,在得到了目标产品各产品属性的权重评分之后,为了更加方便工作人员对目标产品的产品属性进行分析,可以生成目标产品的调研报告,具体地,首先需要获取目标产品对应的全部目标产品属性,并基于全部目标产品属性分别对应的产品属性权重评分,确定目标产品对应的产品调研报告,最后将产品调研报告通过报表格式,呈现给工作人员。
如图2所示,本申请实施例还提供了一种客户评论分析系统,包括:
预处理模块201,获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量。
关键词提取模块202,对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词。
聚类模块203,基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类。
情感分析模块204,基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值。
权重评分模块205,基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
如图3所示,本申请实施例还提供了一种客户评论分析设备,包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
本申请实施例还提供了一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备和介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例提供的设备和介质与方法是一一对应的,因此,设备和介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述设备和介质的有益技术效果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(trans itory med i a),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种客户评论分析方法,其特征在于,包括:
获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;
对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;
基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;
基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;
基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量,具体包括:
基于预设停用词表,对所述目标评论数据进行去停用词操作,以得到第一中间数据;
通过正则表达式删除所述第一中间数据中的符号数据,以得到第二中间数据;所述符号数据包括错误符号以及网络表情中的至少一种;
通过基于变压器的双向编码器表达,提取所述第二中间数据的主干信息,并将索引长度标准化;
使用Bert嵌入层抽取所述主干信息中的词序列,并将所述词序列转化为所述词向量。
3.根据权利要求1所述的方法,其特征在于,所述关键词提取并聚类,具体包括:
基于文档主题生成模型,提取所述中间数据对应的关键词;
基于所述关键词分别对应的词向量,确定所述关键词之间的相似度;
基于所述关键词之间的相似度,对所述关键词进行聚类操作,以得到第一数量个关键词提取聚类。
4.根据权利要求1所述的方法,其特征在于,所述情感特征分析,具体包括:
确定预设的情感词典、预设否定词表以及预设程度副词表;
基于所述中间数据中的情感词,确定所述中间数据对应的情感分数;
基于所述中间数据中所述情感词前的否定词以及程度副词,确定所述情感分数对应的情感极性;
基于所述情感极性以及所述情感分数,确定所述中间数据对应的情感特征值分析。
5.根据权利要求1所述的方法,其特征在于,所述基于预设情感词典,对所述中间数据进行情感特征分析之前,所述方法还包括:
将Opinion Lexicon情感词典作为初始情感词典;
使用情感倾向点互信息算法对所述初始情感词典进行扩充,以得到所述预设情感词典。
6.根据权利要求1所述的方法,其特征在于,所述基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分,具体包括:
确定目标产品属性对应的目标关键词提取聚类;
确定所述目标关键词提取聚类中所包含的目标关键词,以及包含所述目标关键词的目标中间数据;
获取所述目标中间数据对应的情感特征值,并通过如下公式,确定所述目标关键词提取聚类对应的聚类权重评分:
其中,R为聚类权重评分,n为目标关键词提取聚类中包含的目标关键词个数,ui为目标关键词提取聚类中第i个目标关键词对应的情感特征值,ti为ui对应的时间修正系数,与目标中间数据对应的评论发布时间相关;
将所述目标产品属性中各目标关键词提取聚类分别对应的聚类权重评分加权,以得到所述产品属性权重评分。
7.根据权利要求6所述的方法,其特征在于,所述确定目标产品对应的产品属性权重评分之后,所述方法还包括:
获取所述目标产品对应的全部目标产品属性;
并基于所述全部目标产品属性分别对应的产品属性权重评分,确定所述目标产品对应的产品调研报告;
将所述产品调研报告通过报表格式,呈现给工作人员。
8.一种客户评论分析系统,其特征在于,包括:
预处理模块,获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;
关键词提取模块,对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;
聚类模块,基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;
情感分析模块,基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;
权重评分模块,基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
9.一种客户评论分析设备,其特征在于,包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行:
获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;
对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;
基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;
基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;
基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
10.一种非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:
获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;
对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;
基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;
基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;
基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202310812427.0A CN116860969A (zh) | 2023-07-03 | 2023-07-03 | 一种客户评论分析方法、系统、设备及介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202310812427.0A CN116860969A (zh) | 2023-07-03 | 2023-07-03 | 一种客户评论分析方法、系统、设备及介质 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN116860969A true CN116860969A (zh) | 2023-10-10 |
Family
ID=88235253
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202310812427.0A Pending CN116860969A (zh) | 2023-07-03 | 2023-07-03 | 一种客户评论分析方法、系统、设备及介质 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN116860969A (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119599700A (zh) * | 2024-11-17 | 2025-03-11 | 合肥工业大学 | 面向复杂产品研发的用户体验属性提取分析方法和系统 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20180260860A1 (en) * | 2015-09-23 | 2018-09-13 | Giridhari Devanathan | A computer-implemented method and system for analyzing and evaluating user reviews |
| CN110457472A (zh) * | 2019-07-16 | 2019-11-15 | 天津大学 | 基于som聚类算法的针对电商产品评论的情感关联分析方法 |
| CN110706028A (zh) * | 2019-09-26 | 2020-01-17 | 四川长虹电器股份有限公司 | 基于属性特征的商品评价情感分析系统 |
| CN111242679A (zh) * | 2020-01-08 | 2020-06-05 | 北京工业大学 | 一种基于产品评论观点挖掘的销量预测方法 |
| CN112131863A (zh) * | 2020-08-04 | 2020-12-25 | 中科天玑数据科技股份有限公司 | 一种评论观点主题抽取方法、电子设备及存储介质 |
-
2023
- 2023-07-03 CN CN202310812427.0A patent/CN116860969A/zh active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20180260860A1 (en) * | 2015-09-23 | 2018-09-13 | Giridhari Devanathan | A computer-implemented method and system for analyzing and evaluating user reviews |
| CN110457472A (zh) * | 2019-07-16 | 2019-11-15 | 天津大学 | 基于som聚类算法的针对电商产品评论的情感关联分析方法 |
| CN110706028A (zh) * | 2019-09-26 | 2020-01-17 | 四川长虹电器股份有限公司 | 基于属性特征的商品评价情感分析系统 |
| CN111242679A (zh) * | 2020-01-08 | 2020-06-05 | 北京工业大学 | 一种基于产品评论观点挖掘的销量预测方法 |
| CN112131863A (zh) * | 2020-08-04 | 2020-12-25 | 中科天玑数据科技股份有限公司 | 一种评论观点主题抽取方法、电子设备及存储介质 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119599700A (zh) * | 2024-11-17 | 2025-03-11 | 合肥工业大学 | 面向复杂产品研发的用户体验属性提取分析方法和系统 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11907274B2 (en) | Hyper-graph learner for natural language comprehension | |
| CN112307351B (zh) | 用户行为的模型训练、推荐方法、装置和设备 | |
| CN108304526B (zh) | 一种数据处理方法、装置及服务器 | |
| US20180336193A1 (en) | Artificial Intelligence Based Method and Apparatus for Generating Article | |
| CN110516033B (zh) | 一种计算用户偏好的方法和装置 | |
| CN106354856B (zh) | 基于人工智能的深度神经网络强化搜索方法和装置 | |
| CN110362662A (zh) | 数据处理方法、装置以及计算机可读存储介质 | |
| CN113688310A (zh) | 一种内容推荐方法、装置、设备及存储介质 | |
| CN112805715A (zh) | 识别实体属性关系 | |
| CN111639162A (zh) | 信息交互方法和装置、电子设备和存储介质 | |
| CN106407316A (zh) | 基于主题模型的软件问答推荐方法和装置 | |
| CN113886539A (zh) | 话术推荐方法、装置、客服设备及存储介质 | |
| CN116109373A (zh) | 金融产品的推荐方法、装置、电子设备和介质 | |
| CN115018576A (zh) | 金融数据处理方法、装置、设备及存储介质 | |
| CN119046432A (zh) | 基于人工智能的数据生成方法、装置、计算机设备及介质 | |
| CN119379403B (zh) | 一种目标用户筛选方法、系统及介质 | |
| JP6664580B2 (ja) | 算出装置、算出方法および算出プログラム | |
| CN116860969A (zh) | 一种客户评论分析方法、系统、设备及介质 | |
| CN111783445A (zh) | 数据生成方法、装置、介质及电子设备 | |
| CN113722487A (zh) | 用户情感分析方法、装置、设备及存储介质 | |
| Ali et al. | Identifying and profiling user interest over time using social data | |
| CN113761118B (zh) | 音频数据处理方法、装置、音频数据处理设备及存储介质 | |
| CN111191095A (zh) | 网页数据获取方法、装置、设备及介质 | |
| CN113807920A (zh) | 基于人工智能的产品推荐方法、装置、设备及存储介质 | |
| CN114911936A (zh) | 一种模型训练、评论识别方法、装置、电子设备及介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |