CN111652658A - 画像融合方法、装置、电子设备及计算机可读存储介质 - Google Patents
画像融合方法、装置、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111652658A CN111652658A CN202010532360.1A CN202010532360A CN111652658A CN 111652658 A CN111652658 A CN 111652658A CN 202010532360 A CN202010532360 A CN 202010532360A CN 111652658 A CN111652658 A CN 111652658A
- Authority
- CN
- China
- Prior art keywords
- portrait
- list
- user
- fusion
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2471—Distributed queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明提供了一种画像融合方法、装置、电子设备及计算机可读存储介质,包括:获取多个领域的初始数据;将获取到的初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个领域对应的系统画像;响应将至少两个目标系统画像进行融合的融合指令,将目标系统画像进行融合,将融合结果作为用户画像。本发明能够生成多领域融合的用户画像,提高业务灵活度。
Description
技术领域
本发明涉及人工智能技术领域,尤其是涉及一种画像融合方法、装置、电子设备及计算机可读存储介质。
背景技术
随着互联网的发展,各行业的线上业务也不断增加,线上精准营销、人群分析逐渐成为现在线上业务达到收益的最优路线。而精准营销的基础则是进行用户分群以及人群分析,从而建立用户画像,达到发现用户习惯和需求的目的。目前各类用户画像都处于垂直领域,如电商持有的是消费画像、健康领域为健康画像,各自领域的画像只能在各自领域内使用,无法跨领域使用,而且当业务领域较多时,各自领域的画像无法进行融合,从而无法提供用户的全领域的用户画像,业务灵活度较差。
发明内容
有鉴于此,本发明的目的在于提供一种画像融合方法、装置、电子设备及计算机可读存储介质,能够生成多领域融合的用户画像,提高业务灵活度。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种画像融合方法,包括:获取多个领域的初始数据;将获取到的初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个领域对应的系统画像;响应将至少两个目标系统画像进行融合的融合指令,将目标系统画像进行融合,将融合结果作为用户画像。
在一种实施方式中,将获取到的初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个领域对应的系统画像的步骤,包括:利用MVEL表达式引擎将获取到的初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个领域对应的系统画像;其中,系统画像通过Elasticsearch分布式搜索与分析引擎进行存储。
在一种实施方式中,利用MVEL表达式引擎将获取到的初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个领域对应的系统画像的步骤之前,还包括:利用Elasticsearch分布式搜索与分析引擎的scroll游标将初始数据进行切分。
在一种实施方式中,响应将至少两个目标系统画像进行融合的融合指令,将目标系统画像进行融合,将融合结果作为用户画像的步骤,包括:响应将至少两个目标系统画像进行融合的融合指令,并确定目标系统画像对应的英文名称列表;根据英文名称列表确定Elasticsearch分布式搜索与分析引擎中对应的Index列表;根据Index列表确定去重后的accountId列表;根据accountId列表查找每个accountId对应的系统画像列表;将系统画像列表中的系统画像进行融合,并将融合结果作为用户画像。
在一种实施方式中,根据Index列表确定去重后的accountId列表的步骤,包括:根据Index列表通过Elasticsearch分布式搜索与分析引擎的多索引融合查询以及scroll游标进行分页查询,根据查询结果确定去重后的accountId列表。
在一种实施方式中,上述方法还包括:数据标签通过MySQL进行关系存储,初始数据通过Elasticsearch分布式搜索与分析引擎进行存储。
在一种实施方式中,上述方法还包括:当初始数据更新时,向实时消息监控RocketMQ发送更新信息;根据更新信息确定需要修改的用户画像的范围,并根据用户画像的范围生成用户画像列表;遍历用户画像列表,对每一个用户画像进行修改。
第二方面,本发明实施例提供了一种画像融合装置,包括:数据获取模块,用于获取多个领域的初始数据;画像生成模块,用于将获取到的初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个领域对应的系统画像;画像融合模块,用于响应将至少两个目标系统画像进行融合的融合指令,将目标系统画像进行融合,将融合结果作为用户画像。
第三方面,本发明实施例提供了一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现上述第一方面提供的任一项的方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述第一方面提供的任一项的方法的步骤。
本发明实施例提供了一种画像融合方法、装置、电子设备及计算机可读存储介质,能够获取多个领域的初始数据;然后将获取到的初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个领域对应的系统画像;最后响应将至少两个目标系统画像进行融合的融合指令,将目标系统画像进行融合,将融合结果作为用户画像。上述方法不仅能够根据各个领域的初始数据建立每个领域对应的系统画像,还可以根据业务需要将不同领域的目标系统画像进行融合,得到多领域融合的用户画像,从而能够提供全领域的用户画像,使不同领域的画像跨领域使用,提高业务灵活度。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种画像融合方法的流程示意图;
图2为本发明实施例提供的一种系统画像的存储结构示意图;
图3为本发明实施例提供的另一种画像融合方法的流程示意图;
图4为本发明实施例提供的一种画像更新方法的流程示意图;
图5为本发明实施例提供的一种画像融合平台的结构示意图;
图6为本发明实施例提供的一种画像融合装置的结构示意图;
图7为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前各类用户画像都处于垂直领域,垂直领域的用户画像形态固定、标签无法自由选择使用,只能对特定的垂直领域起作用的,但是对于本身业务领域较多的平台而言,各自垂直领域的画像无法进行融合,也就无法提供用户的全领域的用户画像以及根据业务需求自定义配置画像;而且垂直领域的用户画像只能在各自领域内使用,无法跨领域使用,如保险领域使用健康画像的某部分标签。基于此,本发明实施例提供的一种画像融合方法、装置、电子设备及计算机可读存储介质,能够生成多领域融合的用户画像,提高业务灵活度。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种画像融合方法进行详细介绍,参见图1所示的一种画像融合方法的流程示意图,该方法可以由电子设备执行,诸如智能手机、电脑、iPad等,主要包括以下步骤S102至步骤S106:
步骤S102:获取多个领域的初始数据。
在一种实施方式中,对于平台化发展的企业而言包括较多的业务领域,初始数据可以是从网络上获取的用户上网日志,也可以是用户上传的各业务领域的专业知识和数据。
步骤S104:将获取到的初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个领域对应的系统画像。
其中,系统画像也即垂直领域画像,包括同一业务领域的多个用户的画像,每个用户的画像中又包括至少一个数据标签。在一种实施方式中,不同领域的数据对应有不同类型的数据标签,在获取各个领域的初始数据时可以预先创建初始数据对应的数据标签,并将其进行存储,基于此,本实施例可以针对每个领域通过将获取到的初始数据与预先创建的多个数据标签进行匹配,从而得到该领域中每个用户对应的标签,生成每个用户对应的画像,进而将每个领域中所有用户的画像作为该领域对应的系统画像。
步骤S106:响应将至少两个目标系统画像进行融合的融合指令,将目标系统画像进行融合,将融合结果作为用户画像。
在一种实施方式中,可以根据不用的业务需求需要将不同领域的系统画像进行融合,以使各个领域的画像可以跨领域使用。具体的,本实施例中用户可以根据实际的业务需求选择需要融合的系统画像,即确定目标系统画像并发送融合指令,需要融合的系统画像可以是全部领域的系统画像,也可以只是部分领域(至少两个)。当接收到用户发送的融合指令后,可以将用户配置的目标系统画像进行融合,将融合结果作为用户画像,也即针对每个用户将每个用户不同领域中的标签进行融合,得到每个用户的对应的包含多个领域标签的画像(即用户画像)。
本发明实施例提供的画像融合方法不仅能够根据各个领域的初始数据建立每个领域对应的系统画像,还可以根据业务需要将不同领域的目标系统画像进行融合,得到多领域融合的用户画像,从而能够提供全领域的用户画像,使不同领域的画像跨领域使用,提高业务灵活度。
考虑到用于生成用户画像的数据数据量很大,为了提高数据处理的速度,实现大数据量的数据分批同步处理,本实施例提供了一种将获取到的初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个领域对应的系统画像的具体实施方式,也即上述步骤S104可以参照如下步骤(1)至步骤(2)执行:
步骤(1):利用Elasticsearch分布式搜索与分析引擎的scroll游标将初始数据进行切分。
本实施例中,数据标签可以通过MySQL进行关系存储,初始数据可以通过Elasticsearch分布式搜索与分析引擎进行存储。Elasticsearch是一个分布式、高扩展、高实时的搜索与数据分析引擎,能够使大量数据具有搜索、分析和探索的能力;游标是系统为用户开设的一个数据缓冲区,存放SQL语句的执行结果。每个游标区都有一个名字,用户可以用SQL语句逐一从游标中获取记录,并赋给主变量,交由主语言进一步处理。就本质而言,游标实际上是一种能从包括多条数据记录的结果集中每次提取一条记录的机制。在一种实施方式中,可以利用画像系统生成系统画像,一个业务领域对应一个画像系统,即不同业务领域对应不同的画像系统,用于生成对应垂直领域的画像。画像系统可以使用Elasticsearch分布式搜索与分析引擎的scroll游标将大批量数据进行切分。
步骤(2):利用MVEL表达式引擎将获取到的初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个领域对应的系统画像。
其中,系统画像可以通过Elasticsearch分布式搜索与分析引擎进行存储,具体可以参见图2所示的一种系统画像的存储结构示意图,可以通过英文名称(eng_name)将不同领域的画像进行关联,并将英文名称的值作为用户画像的表名。
通过Elasticsearch分布式搜索与分析引擎的scroll游标将大批量数据进行切分后,可以得到多个数据缓冲区,因此当进行数据查询时,可以基于数据缓冲区快速进行查询,从而不会影响主线程的处理速度。在具体实施方式中,可以根据上述步骤的数据切分结果进行数据查询,采用MVEL表达式引擎将获取到的初始数据与预先创建的多个数据标签按照预设规则进行匹配,并根据匹配结果生成每个领域对应的系统画像(也即生成对应的垂直领域画像)。对于预设规则用户可以根据实际需求进行设定,以血压为例,可以根据经验将设定当血压值大于第一阈值时对应的标签为高血压,小于第二阈值时对应的标签为低血压,处于第二阈值与第一阈值之间时对应的标签为正常,那么则可以根据获取的用户的血压数据进行匹配确定用户的血压值对应的标签,并将确定的标签赋予该用户。此外,为了提升数据处理速度本实施例可以使用线程池技术进行数据处理。
为了便于理解,本实施例提供了一种响应将至少两个目标系统画像进行融合的融合指令,将目标系统画像进行融合,将融合结果作为用户画像的具体实施方式,参见图3所示的另一种画像融合方法的流程示意图,也即上述步骤S106可以参照如下步骤S302至步骤S310执行:
步骤S302:响应将至少两个目标系统画像进行融合的融合指令,并确定目标系统画像对应的英文名称列表。
在一种实施方式中,用户可以选择需要融合的画像,并根据传入的所选画像的ID列表查询到对应系统画像的英文名称列表。
步骤S304:根据英文名称列表确定Elasticsearch分布式搜索与分析引擎中对应的Index列表。
步骤S306:根据Index列表确定去重后的accountId列表。
在一种实施方式中,不同的系统画像中可能会存在同一个用户的相同的标签,为了避免用户画像中存在大量重复信息,可以现根据Index列表进行查询,将重复的信息去除。具体的,可以根据Index列表通过Elasticsearch分布式搜索与分析引擎的多索引融合查询以及scroll游标进行分页查询,根据查询结果确定去重后的accountId列表。
步骤S308:根据accountId列表查找每个accountId对应的系统画像列表。
具体的,可以根据去重后的accountId列表进行遍历,查询出每个accountId对应的系统画像列表。
步骤S310:将系统画像列表中的系统画像进行融合,并将融合结果作为用户画像。
考虑到现有技术中画像更新不及时,为了能够实时更新融合完成后的画像,本发明实施例还提供一种画像更新的方法,参见图4所示的一种画像更新方法的流程示意图,主要包括以下步骤S402至步骤S406:
步骤S402:当初始数据更新时,向实时消息监控RocketMQ发送更新信息。
步骤S404:根据更新信息确定需要修改的用户画像的范围,并根据用户画像的范围生成用户画像列表。
步骤S406:遍历用户画像列表,对每一个用户画像进行修改。
在一种实施方式中,可以通过实时消息监控RocketMQ监控数据的更新。具体的,当初始数据更新后,可以向实时消息监控RocketMQ发送更新信息,并将更新信息进行同步;然后可以通过RocketMQ中的消息(即更新信息)确定需要修改的用户画像范围,并根据用户画像的范围生成出用户画像列表;最后遍历用户画像列表,对每一个用户画像进行修改。
本发明实施例提供的上述画像融合方法,不仅能够输出垂直领域画像(系统画像),也可根据业务需要将多个不用领域的画像融合成系统画像进行输出,提高业务灵活度;其次,本发明实施例能够基于RocketMQ对数据更新进行实时监控,从而可以仅在第一次生成用户画像时耗费较长时间,融合完成后实现实时更新,使得更新几乎不存在时间差,解决了现有技术中画像更新不实时的问题;此外,本实施例引入了Elasticsearch分布式搜索与分析引擎的scroll游标以及线程池技术,提升了数据处理速度,实现大数据量的数据分批同步处理。
对于前述实施例提供的画像融合方法,本发明实施例还提供了一种画像融合平台,参见图5所示的一种画像融合平台的结构示意图,示意出该平台包括:创建标签、数据整合、画像系统、系统画像、画像中台管理系统以及实时监控。
其中,创建标签、数据整合为生产画像的基础层,标签使用mysql进行关系存储,数据使用Elasticsearch分布式搜索与分析引擎技术进行存储。
画像系统以及系统画像为画像生产层,一个业务领域为一个画像系统即不同业务领域对应不同的画像系统,用于生产对应垂直领域的画像。画像系统使用Elasticsearch分布式搜索与分析引擎的scroll游标将大批量数据进行切分,使用MVEL表达式引擎对标签以及数据进行规则匹配,生成对应的垂直领域画像,垂直领域的画像通过Elasticsearch分布式搜索与分析引擎进行存储,同时使用线程池技术进行数据处理,以提升数据处理速度。
画像中台管理系统以及实时监控为画像融合层,画像融合分为离线和实时两部分,离线使用Elasticsearch分布式搜索与分析引擎的多索引融合查询以及scroll游标对大批量数据进行规则处理,融合成用户画像;实时使用RocketMQ的消息发布与订阅完成,在系统画像更新后发布一条消息到RocketMQ中,画像中台管理系统进行消息订阅,消费消息,确定用户画像的修改范围,并对用户画像进行实时更新。
本发明实施例提供的上述画像融合平台打破了画像垂直的规律,通过各业务领域的专业知识和数据生成对应的垂直领域的系统画像,客户可以通过自己业务的需求选择使用或者融合一个或者多个画像的全部标签或者部分标签,系统自动根据需求进行融合,达到各业务领域的画像融合输出,支撑平台级业务需求。此外上述画像融合平台采用整体分层的方法,即不同画像系统对应不同的垂直领域,不同的画像系统间互不干涉分工明确;同时画像系统与画像中台管理系统之间也相互独立、互不干涉。
本发明实施例所提供的画像融合平台,其采用的画像融合方法的实现原理及产生的技术效果和前述方法实施例相同,为简要描述,本实施例部分未提及之处,可参考前述方法实施例中相应内容。
对于前述实施例提供的画像融合方法,本发明实施例还提供了一种画像融合装置,参见图6所示的一种画像融合装置的结构示意图,该装置可以包括以下部分:
数据获取模块601,用于获取多个领域的初始数据。
画像生成模块602,用于将获取到的初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个领域对应的系统画像。
画像融合模块603,用于响应将至少两个目标系统画像进行融合的融合指令,将目标系统画像进行融合,将融合结果作为用户画像。
本发明实施例提供的画像融合装置不仅能够根据各个领域的初始数据建立每个领域对应的系统画像,还可以根据业务需要将不同领域的目标系统画像进行融合,得到多领域融合的用户画像,从而能够提供全领域的用户画像,使不同领域的画像跨领域使用,提高业务灵活度。
在一种实施方式中,上述画像生成模块602还用于利用MVEL表达式引擎将获取到的初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个领域对应的系统画像;其中,系统画像通过Elasticsearch分布式搜索与分析引擎进行存储。
在一种实施方式中,上述画像生成模块602还用于利用Elasticsearch分布式搜索与分析引擎的scroll游标将初始数据进行切分。
在一种实施方式中,上述画像融合模块603还用于响应将至少两个目标系统画像进行融合的融合指令,并确定目标系统画像对应的英文名称列表;根据英文名称列表确定Elasticsearch分布式搜索与分析引擎中对应的Index列表;根据Index列表确定去重后的accountId列表;根据accountId列表查找每个accountId对应的系统画像列表;将系统画像列表中的系统画像进行融合,并将融合结果作为用户画像。
在一种实施方式中,上述画像融合模块603还用于根据Index列表通过Elasticsearch分布式搜索与分析引擎的多索引融合查询以及scroll游标进行分页查询,根据查询结果确定去重后的accountId列表。
在一种实施方式中,上述装置还包括存储模块用于通过MySQL方式存储数据标签,通过Elasticsearch分布式搜索与分析引擎存储初始数据。
在一种实施方式中,上述装置还包括更新模块,用于当初始数据更新时,向实时消息监控RocketMQ发送更新信息;根据更新信息确定需要修改的用户画像的范围,并根据用户画像的范围生成用户画像列表;遍历用户画像列表,对每一个用户画像进行修改。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
本发明实施例还提供了一种电子设备,具体的,该电子设备包括处理器和存储装置;存储装置上存储有计算机程序,计算机程序在被处理器运行时执行如上实施方式的任一项所述的方法。
图7为本发明实施例提供的一种电子设备的结构示意图,该电子设备100包括:处理器70,存储器71,总线72和通信接口73,所述处理器70、通信接口73和存储器71通过总线72连接;处理器70用于执行存储器71中存储的可执行模块,例如计算机程序。
其中,存储器71可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口73(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线72可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器71用于存储程序,所述处理器70在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流程定义的装置所执行的方法可以应用于处理器70中,或者由处理器70实现。
处理器70可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器70中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器70可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器71,处理器70读取存储器71中的信息,结合其硬件完成上述方法的步骤。
本发明实施例所提供的可读存储介质的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见前述方法实施例,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种画像融合方法,其特征在于,包括:
获取多个领域的初始数据;
将获取到的所述初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个所述领域对应的系统画像;
响应将至少两个目标系统画像进行融合的融合指令,将所述目标系统画像进行融合,将融合结果作为用户画像。
2.根据权利要求1所述的方法,其特征在于,所述将获取到的所述初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个所述领域对应的系统画像的步骤,包括:
利用MVEL表达式引擎将获取到的所述初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个所述领域对应的系统画像;其中,所述系统画像通过Elasticsearch分布式搜索与分析引擎进行存储。
3.根据权利要求2所述的方法,其特征在于,所述利用MVEL表达式引擎将获取到的所述初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个所述领域对应的系统画像的步骤之前,还包括:
利用所述Elasticsearch分布式搜索与分析引擎的scroll游标将所述初始数据进行切分。
4.根据权利要求1所述的方法,其特征在于,所述响应将至少两个目标系统画像进行融合的融合指令,将所述目标系统画像进行融合,将融合结果作为用户画像的步骤,包括:
响应将至少两个目标系统画像进行融合的融合指令,并确定所述目标系统画像对应的英文名称列表;
根据所述英文名称列表确定Elasticsearch分布式搜索与分析引擎中对应的Index列表;
根据所述Index列表确定去重后的accountId列表;
根据所述accountId列表查找每个accountId对应的系统画像列表;
将所述系统画像列表中的所述系统画像进行融合,并将融合结果作为用户画像。
5.根据权利要求4所述的方法,其特征在于,所述根据所述Index列表确定去重后的accountId列表的步骤,包括:
根据所述Index列表通过所述Elasticsearch分布式搜索与分析引擎的多索引融合查询以及scroll游标进行分页查询,根据查询结果确定去重后的accountId列表。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述数据标签通过MySQL进行关系存储,所述初始数据通过Elasticsearch分布式搜索与分析引擎进行存储。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述初始数据更新时,向实时消息监控RocketMQ发送更新信息;
根据所述更新信息确定需要修改的所述用户画像的范围,并根据所述用户画像的范围生成用户画像列表;
遍历所述用户画像列表,对每一个所述用户画像进行修改。
8.一种画像融合装置,其特征在于,包括:
数据获取模块,用于获取多个领域的初始数据;
画像生成模块,用于将获取到的所述初始数据与预先创建的多个数据标签进行匹配,根据匹配结果生成每个所述领域对应的系统画像;
画像融合模块,用于响应将至少两个目标系统画像进行融合的融合指令,将所述目标系统画像进行融合,将融合结果作为用户画像。
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求1至7任一项所述的方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1至7任一项所述的方法的步骤。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202010532360.1A CN111652658A (zh) | 2020-06-11 | 2020-06-11 | 画像融合方法、装置、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202010532360.1A CN111652658A (zh) | 2020-06-11 | 2020-06-11 | 画像融合方法、装置、电子设备及计算机可读存储介质 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN111652658A true CN111652658A (zh) | 2020-09-11 |
Family
ID=72348926
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202010532360.1A Pending CN111652658A (zh) | 2020-06-11 | 2020-06-11 | 画像融合方法、装置、电子设备及计算机可读存储介质 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN111652658A (zh) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112732700A (zh) * | 2021-01-25 | 2021-04-30 | 中冶赛迪重庆信息技术有限公司 | 一种轧钢生产数据切片方法、系统、介质及电子终端 |
| CN112861013A (zh) * | 2021-03-18 | 2021-05-28 | 京东数字科技控股股份有限公司 | 用户画像更新方法、装置、电子设备及存储介质 |
| CN113407843A (zh) * | 2021-07-09 | 2021-09-17 | 深圳壹账通智能科技有限公司 | 用户画像生成方法、装置、电子设备及计算机存储介质 |
| CN115242466A (zh) * | 2022-07-04 | 2022-10-25 | 北京华圣龙源科技有限公司 | 一种基于高仿真虚拟环境的入侵主动诱捕系统和方法 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110069702A (zh) * | 2019-03-15 | 2019-07-30 | 深圳壹账通智能科技有限公司 | 用户行为数据分析方法、装置、计算机设备及存储介质 |
| CN110245719A (zh) * | 2019-03-27 | 2019-09-17 | 中国海洋大学 | 一种面向实体和用户画像的特征融合方法 |
| CN110908883A (zh) * | 2019-11-15 | 2020-03-24 | 江苏满运软件科技有限公司 | 用户画像数据监控方法、系统、设备及存储介质 |
| CN110968584A (zh) * | 2019-12-03 | 2020-04-07 | 北京明略软件系统有限公司 | 一种画像生成系统、方法、电子设备及可读存储介质 |
-
2020
- 2020-06-11 CN CN202010532360.1A patent/CN111652658A/zh active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110069702A (zh) * | 2019-03-15 | 2019-07-30 | 深圳壹账通智能科技有限公司 | 用户行为数据分析方法、装置、计算机设备及存储介质 |
| CN110245719A (zh) * | 2019-03-27 | 2019-09-17 | 中国海洋大学 | 一种面向实体和用户画像的特征融合方法 |
| CN110908883A (zh) * | 2019-11-15 | 2020-03-24 | 江苏满运软件科技有限公司 | 用户画像数据监控方法、系统、设备及存储介质 |
| CN110968584A (zh) * | 2019-12-03 | 2020-04-07 | 北京明略软件系统有限公司 | 一种画像生成系统、方法、电子设备及可读存储介质 |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112732700A (zh) * | 2021-01-25 | 2021-04-30 | 中冶赛迪重庆信息技术有限公司 | 一种轧钢生产数据切片方法、系统、介质及电子终端 |
| CN112861013A (zh) * | 2021-03-18 | 2021-05-28 | 京东数字科技控股股份有限公司 | 用户画像更新方法、装置、电子设备及存储介质 |
| CN113407843A (zh) * | 2021-07-09 | 2021-09-17 | 深圳壹账通智能科技有限公司 | 用户画像生成方法、装置、电子设备及计算机存储介质 |
| CN115242466A (zh) * | 2022-07-04 | 2022-10-25 | 北京华圣龙源科技有限公司 | 一种基于高仿真虚拟环境的入侵主动诱捕系统和方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111652658A (zh) | 画像融合方法、装置、电子设备及计算机可读存储介质 | |
| CN111191125A (zh) | 一种基于标签化的数据分析方法 | |
| CN110968695A (zh) | 基于弱监督技术主动学习的智能标注方法、装置及平台 | |
| CN111400361B (zh) | 数据实时存储方法、装置、计算机设备和存储介质 | |
| CN118981527A (zh) | 基于大模型的问答方法、装置、电子设备、存储介质、智能体和程序产品 | |
| CN113032580A (zh) | 关联档案推荐方法、系统及电子设备 | |
| CN111754268A (zh) | 基于ott大数据的用户标签生成方法、管理系统及存储介质 | |
| CN110781375B (zh) | 一种用户状态标识确定方法及装置 | |
| CN111782946A (zh) | 书友推荐方法、计算设备及计算机存储介质 | |
| CN112231292B (zh) | 文件处理方法、装置、存储介质及计算机设备 | |
| CN111597336A (zh) | 训练文本的处理方法、装置、电子设备及可读存储介质 | |
| CN111444368B (zh) | 构建用户画像的方法、装置、计算机设备及存储介质 | |
| CN114880308A (zh) | 一种基于大数据的元数据处理方法、装置、介质 | |
| CN114817344B (zh) | 一种数据获取方法和装置 | |
| US20250021602A1 (en) | Artificial intelligence system for efficient attribute extraction | |
| CN110895587A (zh) | 用于确定目标用户的方法和装置 | |
| CN117171185B (zh) | 基于工业标识的物流数据变更方法及相关设备 | |
| CN109857838B (zh) | 用于生成信息的方法和装置 | |
| CN113220992B (zh) | 一种信息流内容推荐方法、系统及介质 | |
| CN118349220A (zh) | 代码编辑的方法、装置、设备和存储介质 | |
| CN113704272B (zh) | 一种人机物融合环境下的数字对象状态表达方法及装置 | |
| CN116304236A (zh) | 一种用户画像生成方法、装置、电子设备和存储介质 | |
| US9471569B1 (en) | Integrating information sources to create context-specific documents | |
| CN120297399B (zh) | 知识库的构建方法、装置、设备及介质 | |
| CN117097617B (zh) | 通信系统的模板管理方法、装置、计算机设备和存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200911 |
|
| RJ01 | Rejection of invention patent application after publication |