[go: up one dir, main page]

CN112862008A - 偏好预测模型的训练方法及用户偏好的预测方法 - Google Patents

偏好预测模型的训练方法及用户偏好的预测方法 Download PDF

Info

Publication number
CN112862008A
CN112862008A CN202110333952.5A CN202110333952A CN112862008A CN 112862008 A CN112862008 A CN 112862008A CN 202110333952 A CN202110333952 A CN 202110333952A CN 112862008 A CN112862008 A CN 112862008A
Authority
CN
China
Prior art keywords
evaluation data
user
historical evaluation
prediction model
preference prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110333952.5A
Other languages
English (en)
Other versions
CN112862008B (zh
Inventor
周勖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Citic Bank Corp Ltd
Original Assignee
China Citic Bank Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Citic Bank Corp Ltd filed Critical China Citic Bank Corp Ltd
Priority to CN202110333952.5A priority Critical patent/CN112862008B/zh
Publication of CN112862008A publication Critical patent/CN112862008A/zh
Application granted granted Critical
Publication of CN112862008B publication Critical patent/CN112862008B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种偏好预测模型的训练方法及用户偏好的预测方法。该方法包括:获取用户对对象的历史评价数据;确定历史评价数据的数据量是否满足预设条件;基于历史评价数据的数据量是否满足预设条件,构建训练集;基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。基于本方案训练得到的偏好预测模型,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。

Description

偏好预测模型的训练方法及用户偏好的预测方法
技术领域
本申请涉及数据处理技术领域,具体而言,本申请涉及一种偏好预测模型的训练方法及用户偏好的预测方法。
背景技术
目前,各种产品层出不穷,活跃用户量是评价产品的重要指标,如何保持活跃用户量的快速增长已经成为众多公司需要思考解决的问题,对用户的偏好进行预测并且投其所好是一个很好的解决办法。
对用户的偏好进行预测的一种办法是基于观测特征(Feature-based)的方法。这种方法的思路是直接以用户的观测特征为输入,通过建立线性回归、贝叶斯网络、支持向量机以及决策树等模型,对用户的偏好进行预测。
基于观测特征进行偏好预测的方式存在一定的瓶颈,就是预测粒度有限,以预测用户对不同视频的喜好为例,预测不可能精确到(用户,视频)对。例如,如果两个用户的可观测特征一样,则对于同一视频,预测的结果是一样的,但这种预测结果可能是不太合理的,用户的偏好实际上可能是不同的。因此,亟需提供一种能够提升用户偏好预测的准确率的方式。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一。本申请所采用的技术方案如下:
第一方面,本申请实施例提供了一种偏好预测模型的训练方法,该方法包括:
获取用户对对象的历史评价数据;
确定历史评价数据的数据量是否满足预设条件;
基于历史评价数据的数据量是否满足预设条件,构建训练集;
基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。
可选地,基于历史评价数据的数据量是否满足预设条件,构建训练集,包括:
若历史评价数据的数据量不满足预设条件,则基于历史评价数据以及可观测特征,构建训练集;
若历史评价数据的数据量满足预设条件,则基于历史评价数据构建训练集。
可选地,基于训练集训练偏好预测模型,包括:
基于训练集,并根据协同过滤算法训练偏好预测模型。
可选地,可观测特征包括用户特征,用户特征包括以下至少一项:
用户年龄;
用户性别;
用户职业。
可选地,可观测特征还包括对象特征,若对象为视频,对象特征包括以下至少一项:
从视频的视频名称中提取的关键字;
从视频的发行年份中获取的时间信息。
可选地,若历史评价数据的数据量不满足预设条件,在训练出偏好预测模型之后,方法还包括:
按照预设的重试规则,重复获取用户对对象的历史评价数据,直至获取到的历史评价数据的数据量满足预设条件,基于历史评价数据更新训练集,并基于更新后的训练集训练偏好预测模型。
第二方面,本申请实施例提供了一种用户偏好的预测方法,该方法包括:
获取用户对对象的历史评价数据;
将历史评价数据输入预训练的偏好预测模型,得到用户的偏好预测结果,其中,偏好预测模型为根据上述的偏好预测模型的训练方法训练得到的。
第三方面,本申请实施例提供了一种偏好预测模型的训练装置,该装置包括:
数据获取模块,用于获取用户对对象的历史评价数据;
数据量比对模块,用于确定历史评价数据的数据量是否满足预设条件;
训练集构建模块,用于基于历史评价数据的数据量是否满足预设条件,构建训练集;
模型训练模块,用于基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。
可选地,训练集构建模块具体用于:
若历史评价数据的数据量不满足预设条件,则基于历史评价数据以及可观测特征,构建训练集;
若历史评价数据的数据量满足预设条件,则基于历史评价数据构建训练集。
可选地,模型训练模块具体用于:
基于训练集,并根据协同过滤算法训练偏好预测模型。
可选地,可观测特征包括用户特征,用户特征包括以下至少一项:
用户年龄;
用户性别;
用户职业。
可选地,可观测特征还包括对象特征,若对象为视频,对象特征包括以下至少一项:
从视频的视频名称中提取的关键字;
从视频的发行年份中获取的时间信息。
可选地,若历史评价数据的数据量不满足预设条件,上述模型训练模块还用于:
在训练出偏好预测模型之后,按照预设的重试规则,重复获取用户对对象的历史评价数据,直至获取到的历史评价数据的数据量满足预设条件,基于历史评价数据更新训练集,并基于更新后的训练集训练偏好预测模型。
第四方面,本申请实施例提供了一种用户偏好的预测装置,该装置包括:
评价数据获取模块,用于获取用户对对象的历史评价数据;
偏好预测模块,用于将历史评价数据输入预训练的偏好预测模型,得到用户的偏好预测结果,其中,偏好预测模型为根据上述的偏好预测模型的训练方法训练得到的。
第五方面,本申请实施例提供了一种电子设备,该电子设备包括:处理器和存储器;
存储器,用于存储操作指令;
处理器,用于通过调用操作指令,执行如本申请的第一方面的任一实施方式中或者第二方面的任一实施方式中所示的方法。
第六方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请的第一方面的任一实施方式中或者第二方面的任一实施方式中所示的方法。
本申请实施例提供的技术方案带来的有益效果是:
本申请实施例提供的方案,通过获取用户对对象的历史评价数据,确定历史评价数据的数据量是否满足预设条件,基于历史评价数据的数据量是否满足预设条件,构建训练集,基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。基于本方案训练得到的偏好预测模型,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种偏好预测模型的训练方法的流程示意图;
图2为本申请实施例提供的一种用户偏好的预测方法的流程示意图;
图3为本申请实施例提供的一种偏好预测模型的训练装置的结构示意图;
图4为本申请实施例提供的一种用户偏好的预测装置的结构示意图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1示出了本申请实施例提供的一种偏好预测模型的训练方法的流程示意图,如图1所示,该方法主要可以包括:
步骤S110:获取用户对对象的历史评价数据;
步骤S120:确定历史评价数据的数据量是否满足预设条件;
步骤S130:基于历史评价数据的数据量是否满足预设条件,构建训练集;
步骤S140:基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。
本申请实施例中,对象可以为产品,如视频等,历史评价数据可以为用户对对象的评分。
在对用户偏好进行预测时,隐藏特征起到了非常重要的作用。例如,表象上看是两个用户对视频的打分相似,而本质上是两个用户的某些隐藏特征相似,比如两者都喜欢喜剧片不喜欢恐怖片。因此,在解决用户偏好预测的问题中,根据已经观测到的用户偏好对用户抽取其隐藏特征是非常关键的一部分内容。
本申请实施例中,预设条件可以为预设的数据量,若历史评价数据较少,则可能会造成训练出的预测模型预测效果不佳,因此可以在根据历史评价数据训练预测模型之前,可以确定历史评价数据的数据量是否满足预设条件,根据历史评价数据的数据量是否满足预设条件来构建训练集,以保证训练出的预测模型的预测效果。
受限波兹曼机(Restricted Boltzmann Machine,RBM)可以通过叠加对特征进行深层次地抽象,并且可以灵活地处理概率生成模型。因此,为了能够更好地提取用户隐藏特征的模型来进行用户偏好预测,本申请实施例中通过建立受限波兹曼机模型来进行用户偏好预测。
本申请实施例提供的方法,通过获取用户对对象的历史评价数据,确定历史评价数据的数据量是否满足预设条件,基于历史评价数据的数据量是否满足预设条件,构建训练集,基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。基于本方案训练得到的偏好预测模型,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。
本申请实施例的一种可选方式中,基于历史评价数据的数据量是否满足预设条件,构建训练集,包括:
若历史评价数据的数据量不满足预设条件,则基于历史评价数据以及可观测特征,构建训练集;
若历史评价数据的数据量满足预设条件,则基于历史评价数据构建训练集。
本申请实施例中,可以在根据历史评价数据训练预测模型之前,可以确定历史评价数据的数据量是否满足预设条件,如果历史评价数据的数据量满足预设条件,这时可以认为用于进行模型训练的历史评价数据的数据量能够满足模型训练的需要,可以根据历史评价数据构建训练集。
如果历史评价数据的数据量不满足预设条件,这时可以认为用于进行模型训练的历史评价数据的数据量不能够满足模型训练的需要,为保证训练出的预测模型的预测效果,可以增加可观测特征用于模型训练,通过可观测特征以及历史评价数据共同构建训练集。
由于引入了可观测特征,这时即使历史评价数据的数据量较少,也可以对隐藏特征进行较好的预测。
本申请实施例的一种可选方式中,基于训练集训练偏好预测模型,包括:
基于训练集,并根据协同过滤算法训练偏好预测模型。
由于历史评价数据中,如果所有的用户给这所有的产品都进行了打分,那么可以得出此RBM有M个可见节点。但是实际情况时评分矩阵中大部分评分都是缺失的,为了应对评分缺失的情况,本申请实施例中根据协同过滤算法训练RBM。具体而言,可以对每一个用户都训练一个RBM,这些所有的RBM都有相同的隐藏节点数,但是每个RBM的可见节点数是一个用户评分中的产品数。这样虽然所有的RBM都只有一个训练样例,但是对应所有RBM,相同的隐藏节点和视频的偏差以及权重是绑在一起的。例如,两个用户对同一个视频进行里的打分,则对于两者的RBM,此视频与隐藏节点间的权重值是相同的。
本申请实施例中,可以对历史评价数据进行二值化处理,即RBM中的所有节点都只有0和1两种状态。构建二值化的RBM可以简化训练和预测过程。
本申请实施例的一种可选方式中,可观测特征包括用户特征,用户特征包括以下至少一项:
用户年龄;
用户性别;
用户职业。
本申请实施例中,可以将用户相关信息作为可观测特征,如将用户年龄、用户性别以及用户职业作为用户特征。
本申请实施例的一种可选方式中,可观测特征还包括对象特征,若对象为视频,对象特征包括以下至少一项:
从视频的视频名称中提取的关键字;
从视频的发行年份中获取的时间信息。
本申请实施例中,可观测特征还可以包括对象特征,若对象为视频,这时可以从视频的相关信息中提取对象特征,如从视频名称中提取出一些能够表现视频特征的关键字,或从发行年份中获取时间信息。
本申请实施例的一种可选方式中,若历史评价数据的数据量不满足预设条件,在训练出偏好预测模型之后,方法还包括:
按照预设的重试规则,重复获取用户对对象的历史评价数据,直至获取到的历史评价数据的数据量满足预设条件,基于历史评价数据更新训练集,并基于更新后的训练集训练偏好预测模型。
本申请实施例中,在训练出偏好预测模型之后,可以重复尝试获取历史评价数据,并且检测获取到的历史评价数据的数据量,当确定获取到的历史评价数据的数据量满足预设条件时,可以基于当前获取到的历史评价数据重新构建训练集,并根据重新构建出的训练集重新训练偏好预测模型。
作为一个示例,可以对可观测特征进行预处理,将用户特征及视频特征数值化。为了方便模型中的计算,本例中将用户特征及视频特征均映射为二值化的向量,具体关系如下:
年龄:本例中将年龄分为五个区间[-17][18-24][25-34][35-44][44-],用一个长度为5的二值向量来表示用户年龄所在区间;
性别:用长度为2的二值向量来表示性别(1,0)为男性,(0,1)为女性;
职业:用长度为21的二值向量来表示,若用户的职业是第i个,则向量中的第i个元素为1,其他元素为0;
电影类型:用长度为19的二值向量来表示,若视频的电影类型为第j个,则向量中的第j个元素为1,其他元素为0;
经过数据预处理,对于每个用户可以得到长度为28的向量作为可观测特征;对于每个视频可以得到长度为19的向量作为可观测特征。
图2示出了本申请实施例提供的一种用户偏好预测方法的流程示意图,如图2所示,该方法主要可以包括:
步骤S210:获取用户对对象的历史评价数据;
步骤S220:将历史评价数据输入预训练的偏好预测模型,得到用户的偏好预测结果,其中,偏好预测模型为根据上述的偏好预测模型的训练方法训练得到的。
本申请实施例中,对象可以为产品,如视频等,历史评价数据可以为用户对对象的评分。
在对用户的进行偏好预测时,可以将用户的历史评价数据输入预训练的偏好预测模型,由于该预测模型是基于受限波兹曼机模型建立的,可以通过叠加对特征进行深层次地抽象,更好地提取用户隐藏特征的模型来进行用户偏好预测,使得预测出的用户偏好更为准确。
本申请实施例提供的方法,获取用户对对象的历史评价数据,将历史评价数据输入预训练的偏好预测模型,得到用户的偏好预测结果。基于本方案,由于是基于受限波兹曼机模型建立的偏好预测模型进行用户偏好预测,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。
基于与图1中所示的方法相同的原理,图3示出了本申请实施例提供的一种偏好预测模型的训练装置的结构示意图,如图3所示,该偏好预测模型的训练装置30可以包括:
数据获取模块310,用于获取用户对对象的历史评价数据;
数据量比对模块320,用于确定历史评价数据的数据量是否满足预设条件;
训练集构建模块330,用于基于历史评价数据的数据量是否满足预设条件,构建训练集;
模型训练模块340,用于基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。
本申请实施例提供的装置,通过获取用户对对象的历史评价数据,确定历史评价数据的数据量是否满足预设条件,基于历史评价数据的数据量是否满足预设条件,构建训练集,基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。基于本方案训练得到的偏好预测模型,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。
可选地,训练集构建模块具体用于:
若历史评价数据的数据量不满足预设条件,则基于历史评价数据以及可观测特征,构建训练集;
若历史评价数据的数据量满足预设条件,则基于历史评价数据构建训练集。
可选地,模型训练模块具体用于:
基于训练集,并根据协同过滤算法训练偏好预测模型。
可选地,可观测特征包括用户特征,用户特征包括以下至少一项:
用户年龄;
用户性别;
用户职业。
可选地,可观测特征还包括对象特征,若对象为视频,对象特征包括以下至少一项:
从视频的视频名称中提取的关键字;
从视频的发行年份中获取的时间信息。
可选地,若历史评价数据的数据量不满足预设条件,上述模型训练模块还用于:
在训练出偏好预测模型之后,按照预设的重试规则,重复获取用户对对象的历史评价数据,直至获取到的历史评价数据的数据量满足预设条件,基于历史评价数据更新训练集,并基于更新后的训练集训练偏好预测模型。
可以理解的是,本实施例中的偏好预测模型的训练装置的上述各模块具有实现图1中所示的实施例中的偏好预测模型的训练方法相应步骤的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。上述模块可以是软件和/或硬件,上述各模块可以单独实现,也可以多个模块集成实现。对于上述偏好预测模型的训练装置的各模块的功能描述具体可以参见图1中所示实施例中的偏好预测模型的训练方法的对应描述,在此不再赘述。
基于与图2中所示的方法相同的原理,图4示出了本申请实施例提供的一种用户偏好的预测装置的结构示意图,如图4所示,该用户偏好的预测装置40可以包括:
评价数据获取模块410,用于获取用户对对象的历史评价数据;
偏好预测模块420,用于将历史评价数据输入预训练的偏好预测模型,得到用户的偏好预测结果,其中,偏好预测模型为根据上述的偏好预测模型的训练方法训练得到的。
本申请实施例提供的装置,获取用户对对象的历史评价数据,将历史评价数据输入预训练的偏好预测模型,得到用户的偏好预测结果。基于本方案,由于是基于受限波兹曼机模型建立的偏好预测模型进行用户偏好预测,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。
可以理解的是,本实施例中的用户偏好的预测装置的上述各模块具有实现图2中所示的实施例中的用户偏好的预测方法相应步骤的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。上述模块可以是软件和/或硬件,上述各模块可以单独实现,也可以多个模块集成实现。对于上述用户偏好的预测装置的各模块的功能描述具体可以参见图2中所示实施例中的用户偏好的预测方法的对应描述,在此不再赘述。
本申请实施例提供了一种电子设备,包括处理器和存储器;
存储器,用于存储操作指令;
处理器,用于通过调用操作指令,执行本申请任一实施方式中所提供的方法。
作为一个示例,图5示出了本申请实施例所适用的一种电子设备的结构示意图,如图5所示,该电子设备2000包括:处理器2001和存储器2003。其中,处理器2001和存储器2003相连,如通过总线2002相连。可选的,电子设备2000还可以包括收发器2004。需要说明的是,实际应用中收发器2004不限于一个,该电子设备2000的结构并不构成对本申请实施例的限定。
其中,处理器2001应用于本申请实施例中,用于实现上述方法实施例所示的方法。收发器2004可以包括接收机和发射机,收发器2004应用于本申请实施例中,用于执行时实现本申请实施例的电子设备与其他设备通信的功能。
处理器2001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器2001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线2002可包括一通路,在上述组件之间传送信息。总线2002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线2002可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器2003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
可选的,存储器2003用于存储执行本申请方案的应用程序代码,并由处理器2001来控制执行。处理器2001用于执行存储器2003中存储的应用程序代码,以实现本申请任一实施方式中所提供的方法。
本申请实施例提供的电子设备,适用于上述方法任一实施例,在此不再赘述。
本申请实施例提供了一种电子设备,与现有技术相比,通过获取用户对对象的历史评价数据,确定历史评价数据的数据量是否满足预设条件,基于历史评价数据的数据量是否满足预设条件,构建训练集,基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。基于本方案训练得到的偏好预测模型,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述方法实施例所示的方法。
本申请实施例提供的计算机可读存储介质,适用于上述方法任一实施例,在此不再赘述。
本申请实施例提供了一种计算机可读存储介质,与现有技术相比,通过获取用户对对象的历史评价数据,确定历史评价数据的数据量是否满足预设条件,基于历史评价数据的数据量是否满足预设条件,构建训练集,基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。基于本方案训练得到的偏好预测模型,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (11)

1.一种偏好预测模型的训练方法,其特征在于,包括:
获取用户对对象的历史评价数据;
确定所述历史评价数据的数据量是否满足预设条件;
基于所述历史评价数据的数据量是否满足预设条件,构建训练集;
基于所述训练集训练偏好预测模型,所述偏好预测模型基于受限波兹曼机模型建立。
2.根据权利要求1所述的方法,其特征在于,所述基于所述历史评价数据的数据量是否满足预设条件,构建训练集,包括:
若所述历史评价数据的数据量不满足预设条件,则基于所述历史评价数据以及可观测特征,构建训练集;
若所述历史评价数据的数据量满足预设条件,则基于所述历史评价数据构建训练集。
3.根据权利要求1所述的方法,其特征在于,所述基于所述训练集训练偏好预测模型,包括:
基于所述训练集,并根据协同过滤算法训练偏好预测模型。
4.根据权利要求1所述的方法,其特征在于,所述可观测特征包括用户特征,所述用户特征包括以下至少一项:
用户年龄;
用户性别;
用户职业。
5.根据权利要求4所述的方法,其特征在于,所述可观测特征还包括对象特征,若所述对象为视频,所述对象特征包括以下至少一项:
从所述视频的视频名称中提取的关键字;
从所述视频的发行年份中获取的时间信息。
6.根据权利要求2所述的方法,其特征在于,若所述历史评价数据的数据量不满足预设条件,在训练出所述偏好预测模型之后,所述方法还包括:
按照预设的重试规则,重复获取用户对对象的历史评价数据,直至获取到的历史评价数据的数据量满足预设条件,基于所述历史评价数据更新所述训练集,并基于更新后的所述训练集训练偏好预测模型。
7.一种用户偏好的预测方法,其特征在于,包括:
获取用户对对象的历史评价数据;
将所述历史评价数据输入预训练的偏好预测模型,得到所述用户的偏好预测结果,其中,所述偏好预测模型为根据权利要求1至6中任一项所述的偏好预测模型的训练方法训练得到的。
8.一种偏好预测模型的训练装置,其特征在于,包括:
数据获取模块,用于获取用户对对象的历史评价数据;
数据量比对模块,用于确定所述历史评价数据的数据量是否满足预设条件;
训练集构建模块,用于基于所述历史评价数据的数据量是否满足预设条件,构建训练集;
模型训练模块,用于基于所述训练集训练偏好预测模型,所述偏好预测模型基于受限波兹曼机模型建立。
9.一种用户偏好的预测装置,其特征在于,包括:
评价数据获取模块,用于获取用户对对象的历史评价数据;
偏好预测模块,用于将所述历史评价数据输入预训练的偏好预测模型,得到所述用户的偏好预测结果,其中,所述偏好预测模型为根据权利要求1至6中任一项所述的偏好预测模型的训练方法训练得到的。
10.一种电子设备,其特征在于,包括处理器和存储器;
所述存储器,用于存储操作指令;
所述处理器,用于通过调用所述操作指令,执行权利要求1-7中任一项所述的方法。
11.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法。
CN202110333952.5A 2021-03-29 2021-03-29 偏好预测模型的训练方法及用户偏好的预测方法 Active CN112862008B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110333952.5A CN112862008B (zh) 2021-03-29 2021-03-29 偏好预测模型的训练方法及用户偏好的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110333952.5A CN112862008B (zh) 2021-03-29 2021-03-29 偏好预测模型的训练方法及用户偏好的预测方法

Publications (2)

Publication Number Publication Date
CN112862008A true CN112862008A (zh) 2021-05-28
CN112862008B CN112862008B (zh) 2025-02-28

Family

ID=75993115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110333952.5A Active CN112862008B (zh) 2021-03-29 2021-03-29 偏好预测模型的训练方法及用户偏好的预测方法

Country Status (1)

Country Link
CN (1) CN112862008B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114090535A (zh) * 2021-11-29 2022-02-25 北京奇艺世纪科技有限公司 一种模型训练方法、数据存储方法、装置及电子设备
CN114418629A (zh) * 2021-12-30 2022-04-29 中国电信股份有限公司 一种用户流失预测方法、装置、电子设备及可读存储介质
CN114926227A (zh) * 2022-06-15 2022-08-19 中国联合网络通信集团有限公司 评分预测模型训练方法、装置、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105183748A (zh) * 2015-07-13 2015-12-23 电子科技大学 一种基于内容和评分的组合预测方法
CN109376766A (zh) * 2018-09-18 2019-02-22 平安科技(深圳)有限公司 一种画像预测分类方法、装置及设备
WO2019153518A1 (zh) * 2018-02-08 2019-08-15 平安科技(深圳)有限公司 信息推送方法、装置、计算机设备及存储介质
CN111311324A (zh) * 2020-02-18 2020-06-19 电子科技大学 基于稳定神经协同过滤的用户-商品偏好预测系统和方法
CN111650453A (zh) * 2020-05-25 2020-09-11 武汉大学 基于加窗特征希尔伯特图像化的电力设备诊断方法及系统
CN112417289A (zh) * 2020-11-29 2021-02-26 中国科学院电子学研究所苏州研究院 一种基于深度聚类的资讯信息智能推荐方法
KR20210023641A (ko) * 2019-08-23 2021-03-04 삼성전자주식회사 기계 학습 모델 및 규칙 기반 모델을 포함하는 혼성 모델을 위한 방법 및 시스템

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105183748A (zh) * 2015-07-13 2015-12-23 电子科技大学 一种基于内容和评分的组合预测方法
WO2019153518A1 (zh) * 2018-02-08 2019-08-15 平安科技(深圳)有限公司 信息推送方法、装置、计算机设备及存储介质
CN109376766A (zh) * 2018-09-18 2019-02-22 平安科技(深圳)有限公司 一种画像预测分类方法、装置及设备
KR20210023641A (ko) * 2019-08-23 2021-03-04 삼성전자주식회사 기계 학습 모델 및 규칙 기반 모델을 포함하는 혼성 모델을 위한 방법 및 시스템
CN111311324A (zh) * 2020-02-18 2020-06-19 电子科技大学 基于稳定神经协同过滤的用户-商品偏好预测系统和方法
CN111650453A (zh) * 2020-05-25 2020-09-11 武汉大学 基于加窗特征希尔伯特图像化的电力设备诊断方法及系统
CN112417289A (zh) * 2020-11-29 2021-02-26 中国科学院电子学研究所苏州研究院 一种基于深度聚类的资讯信息智能推荐方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114090535A (zh) * 2021-11-29 2022-02-25 北京奇艺世纪科技有限公司 一种模型训练方法、数据存储方法、装置及电子设备
CN114418629A (zh) * 2021-12-30 2022-04-29 中国电信股份有限公司 一种用户流失预测方法、装置、电子设备及可读存储介质
CN114926227A (zh) * 2022-06-15 2022-08-19 中国联合网络通信集团有限公司 评分预测模型训练方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN112862008B (zh) 2025-02-28

Similar Documents

Publication Publication Date Title
CN107944629B (zh) 一种基于异质信息网络表示的推荐方法及装置
CN112862008A (zh) 偏好预测模型的训练方法及用户偏好的预测方法
CN113761388A (zh) 一种推荐方法、装置、电子设备及存储介质
CN112836125A (zh) 一种基于知识图谱和图卷积网络的推荐方法及其系统
CN112749737A (zh) 图像分类方法及装置、电子设备、存储介质
CN112785391B (zh) 推荐处理方法、装置及智能设备、存储介质
CN112949724A (zh) 图像分类网络模型的训练方法、图像分类方法及相关设备
CN115345293A (zh) 基于差分隐私的文本处理模型的训练方法及装置
CN113918810A (zh) 基于机器学习模型的信息推送方法、装置、设备及介质
CN114428910A (zh) 资源推荐方法、装置、电子设备、产品及介质
CN115114483A (zh) 处理图数据的方法
CN112989182A (zh) 信息处理方法、装置、信息处理设备及存储介质
CN116361643A (zh) 实现对象推荐的模型训练方法及对象推荐方法及相关装置
JP7063274B2 (ja) 情報処理装置、ニューラルネットワークの設計方法及びプログラム
CN115758271A (zh) 数据处理方法、装置、计算机设备和存储介质
CN113515704A (zh) 推荐效果评价方法、装置、系统及计算机程序产品
CN116467466B (zh) 基于知识图谱的编码推荐方法、装置、设备及介质
CN111507471A (zh) 一种模型训练方法、装置、设备及存储介质
CN113836407B (zh) 推荐方法及相关装置
CN108596412A (zh) 基于用户相似度的跨领域评分方法以及评分设备
CN116662678A (zh) 一种采用异构图神经网络的社交兴趣嵌入方法
CN113255933B (zh) 特征工程和图网络生成方法和装置、分布式系统
CN111966813A (zh) 一种信息挖掘方法及装置和信息推荐方法及装置
CN109740743A (zh) 一种分层神经网络查询推荐方法及装置
CN116932890A (zh) 数据分析系统、方法、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant