CN116701861A - 基于显式和隐式反馈特征的后融合个性化推荐模型和方法 - Google Patents
基于显式和隐式反馈特征的后融合个性化推荐模型和方法 Download PDFInfo
- Publication number
- CN116701861A CN116701861A CN202310619062.XA CN202310619062A CN116701861A CN 116701861 A CN116701861 A CN 116701861A CN 202310619062 A CN202310619062 A CN 202310619062A CN 116701861 A CN116701861 A CN 116701861A
- Authority
- CN
- China
- Prior art keywords
- user
- model
- item
- ibpr
- explicit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明具体涉及一种基于显式和隐式反馈特征的后融合个性化推荐模型和方法,该模型包括显式特征提取模块、隐式特征提取模块和整体特征提取模块,显式特征提取模块和隐式特征提取模块分别与整体特征提取模块连接;该方法融合了IBPR模型和BiasSVD模型,将BiasSVD模型得到的预测的评分矩阵和IBPR模型得到的预测的排序评分矩阵进行加权求和,得到最终的预测的排序评分矩阵,将用户预测得到的所有排序评分从高到低进行排序,并将排序比较靠前的前个项目推荐给用户。本发明利用BiasSVD模型提取显式反馈特征、IBPR模型提取隐式反馈特征,并充分利用数据集中的历史评分数据和隐式反馈数据,缓解了推荐系统的冷启动问题,提高了推荐系统的性能。
Description
技术领域
本发明属于推荐系统、信息检索、数据挖掘技术领域,涉及一种基于显式和隐式反馈特征的后融合个性化推荐模型和方法。
背景技术
随着数据的爆发式增长,推荐系统被用来解决信息过载问题。在推荐系统中,推荐算法是其最为核心和关键的部分,在很大程度上决定了推荐系统性能的优劣。目前,已有很多不同的推荐算法,其中应用最为广泛的推荐算法为协同过滤推荐算法。
根据输入数据的不同,协同过滤推荐算法可被划分为两类:基于历史评分的协同过滤推荐算法和基于排序评分的协同过滤算法。前者的输入数据为显式反馈数据,如用户的历史评分数据,后者的输入数据为隐式反馈数据,如用户的点击、购买、观看等行为。由于在一些情况下很难获取用户的显式反馈数据,因此,协同过滤推荐算法面临严重的数据稀疏问题和冷启动问题。不同于显式反馈数据,隐式反馈数据来源广泛,且资源丰富。虽然隐式反馈数据的优点十分鲜明,但该类数据中缺少负反馈数据。基于此,研究学者提出了一种典型的贝叶斯个性化排序算法来解决该问题。
现阶段,由于虚拟浏览系统中注册用户感兴趣的项目、评分习惯、浏览时长等具有不确定性,系统数据库中的用户-项目评分矩阵变动较为频繁,随着系统中的老用户增加,部分用户评分数据集的稀疏度也会随之降低。目前,已有研究学者对贝叶斯个性化排序算法进行了扩展研究,并提出了多种推荐方法。然而,上述扩展方法仅仅关注用户的未评分项目,而未曾考虑到用户的历史评分项目中包含的负反馈数据,及历史评分数据中的显式特征信息,显然,现有方法造成了正反馈数据和负反馈数据的失衡和数据资源的浪费。
发明内容
为了解决现有推荐方法中存在因正反馈数据和负反馈数据的失衡、数据资源浪费导致的推荐系统性能较差的问题,本发明提供了一种基于显式和隐式反馈特征的后融合个性化推荐模型和方法。
本发明所采用的技术方案是:
基于显式和隐式反馈特征的后融合个性化推荐模型,包括显式特征提取模块、隐式特征提取模块和整体特征提取模块,所述显式特征提取模块和隐式特征提取模块分别与整体特征提取模块连接;
所述显式特征提取模块用于接收用户特征矩阵和项目特征矩阵的数据,提取用户和项目的显式反馈特征,重构预测的评分矩阵;
所述隐式特征提取模块用于接收用户的显式评分数据和隐式反馈数据,提取用户和项目的隐式反馈特征,重构预测的排序评分矩阵;
所述整体特征提取模块用于将所述预测的评分矩阵和所述预测的排序评分矩阵进行加权求和,得到最终的预测的排序评分矩阵。
进一步地,所述隐式特征提取模块采用BPR模型;
所述BPR模型用于从偏序集合Ds中提取用户和项目的特征;
所述偏序集合Ds的定义如下:
其中,项目i表示用户u标记过的任意一个项目,项目j表示用户u未标记过的任意一个项目,Ⅳ(u)表示用户u曾经标记过的项目集合,表示用户u未曾标记过的项目集合,三元组(u,i,j)表示相对于项目j,用户u更加偏好项目i。
进一步地,所述隐式特征提取模块采用IBPR模型;
所述IBPR模型用于对所述BPR模型输入的对级数据集合进行了扩展,增加了用户在历史评分项目对上的定义,扩展部分的偏序集合DR定义如下:
DR={(u,i,j)li∈Ⅳ(u)and j∈Ⅳ(u)and rui>ruj}
其中,项目i和项目j表示用户u标记过的其中两个项目,N(u)表示用户u曾经标记过的项目集合,rui和ruj分别表示用户u在项目i和项目j上的历史评分值,三元组(u,i,j)表示相对于项目j,用户u更加偏好项目i,因此,输入的偏序集合D表示为:
D=DS∪DR
所述偏序集合D中增加了部分用户历史评分项目对。
进一步地,所述IBPR模型的目标函数为:
其中,σ(x)为Sigmoid函数,λ为正则化参数,Θ为IBPR模型的参数集合,Θ={bu,bi,pu,qi,qj},用来获取用户u和两个项目i和j之间的关系,的定义如下:
其中,和分别表示IBPR模型预测得到的用户u对项目i和项目j的排序优先度,bi表示项目i的偏置项,rmax和rmin分别表示数据集中用户评分的最大值和最小值,pu表示用户u的特征向量,qi表示项目i的特征向量,表示qi的转置。
进一步地,所述显式特征提取模块采用BiasSVD模型;
所述BiasSVD模型的任意用户u在项目i上的评分预测公式采用其中,μ为训练集历史评分数据的评分值,bi和bu分别表示项目i的偏置项和用户u的偏置项,pu表示用户u的特征向量,qi表示项目i的特征向量,表示qi的转置。
进一步地,所述整体特征提取模块采用IBPR SVD模型;
所述IBPR_SVD模型融合了BiasSVD模型和IBPR模型;
对于用户u,预测得到的任意一个未标记的项目i的排序分值用下式来计算:
其中,表示由BiasSVD模型预测得到的用户u在项目i上的评分值,表示IBPR模型预测得到的用户u在项目i上的排序分值,α为折中参数,α的取值范围为[0,1]。
进一步地,所述折中参数α的最优取值为0.9。
一种基于显式和隐式反馈特征的后融合个性化推荐方法,包括如下步骤:
步骤一:从用户反馈数据库中获取用户的显式评分数据和隐式反馈数据;
步骤二:采用BiasSVD模型提取用户和项目的显式反馈特征,根据用户的历史评分数据来学习用户特征矩阵和项目特征矩阵,通过学习到的特征矩阵来重构预测的评分矩阵;
步骤三:采用IBPR模型提取用户和项目的隐式反馈特征,通过用户的显式评分数据和隐式反馈数据,构造IBPR模型的对级项目偏好集合,通过在扩展的对级项目集合上训练IBPR模型,得到另一组用户特征矩阵和项目特征矩阵,根据排序评分预测公式对数据集中的所有未标注项目的排序评分进行预测,进而重构出对应的用户-项目预测的排序评分矩阵;
步骤四:将BiasSVD模型得到的预测的评分矩阵和IBPR模型得到的预测的排序评分矩阵进行加权求和,得到最终的预测的排序评分矩阵,排序评分越高,获得推荐的概率越大;
步骤五:将用户预测得到的所有排序评分从高到低进行排序,得推荐列表,并将排序靠前的前Ⅳ个项目推荐给用户。
本发明的有益效果:
1.本发明基于用户更偏好评分值更高的项目这一假设,在贝叶斯个性化排序模型的基础上,引入了用户评分项目对,并在集合上定义了新的目标函数,提出了一种改进的贝叶斯个性化排序模型IBPR,IBPR模型缓解了隐式反馈数据中缺少负反馈的问题,提高了模型的抗噪性能;
2.本发明提出了基于显式和隐式反馈特征的后融合个性化推荐模型和方法,结合了IBPR模型和BiasSVD模型,利用BiasSVD模型来提取用户和项目的显式反馈特征,并利用IBPR模型提取用户和项目的隐式反馈特征,根据提取到的隐式反馈特征重构用户-项目排序评分矩阵,显式反馈特征重构用户-项目评分矩阵,并将重构的矩阵进行融合,融合后的矩阵即为最终的排序评分矩阵,本发明充分利用数据集中的历史评分数据和隐式反馈数据,缓解了推荐系统的冷启动问题。
附图说明
图1为本发明实施例1提供的基于显式和隐式反馈特征的后融合个性化推荐模型的框架图;
图2为BPR模型与提出的IBPR模型生成对级偏序集合图解对比;
图3为IBPR_SVD模型在公开数据集Movielens 100K上MAP/MRR指标随着折中参数α取值变化的曲线;
图4为IBPR_SVD模型在公开数据集FilmTrust上MAP/MRR指标随着折中参数α取值变化的曲线;
图5为注意力机制模块示意图;
图6为IBPR_SVD模型的MAP指标随着评分个数的变化曲线;
图7为IBPR_SVD模型的MRR指标随着评分个数的变化曲线;
图8为本发明实施例2提供的基于显式和隐式反馈特征的后融合个性化推荐方法的流程图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
实施例1:
本实施例提出了一种基于显式和隐式反馈特征的后融合个性化推荐模型,该基于显式和隐式反馈特征的后融合个性化推荐模型包括显式特征提取模块、隐式特征提取模块和整体特征提取模块,其中,显式特征提取模块和隐式特征提取模块分别与整体特征提取模块连接。显式特征提取模块用于接收用户特征矩阵和项目特征矩阵的数据,提取用户和项目的显式反馈特征,重构预测的评分矩阵;隐式特征提取模块用于接收用户的显式评分数据和隐式反馈数据,提取用户和项目的隐式反馈特征,重构预测的排序评分矩阵;整体特征提取模块用于将预测的评分矩阵和预测的排序评分矩阵进行加权求和,得到最终的预测的排序评分矩阵。
参照附图1所示,附图1中,标识BiasSVD算法的部分为显式特征提取模块,标识IBPR算法的部分为隐式特征提取模块,附图1的右侧部分为整体特征提取模块。附图1中,U为BiasSVD算法中用户特征矩阵,V为BiasSVD算法中项目特征矩阵,预测的评分矩阵为 U1为IBPR算法中用户特征矩阵,V1为IBPR算法中项目特征矩阵,预测的排序评分矩阵为
本实施例中,显式特征提取模块采用BiasSVD模型(Bias SingularValueDecomposition),隐式特征提取模块采用BPR模型,还可以采用IBPR模型,整体特征提取模块采用IBPR_SVD模型。
本实施例基于浏览用户更偏爱评分值高的项目这一假设,在贝叶斯个性化排序模型的基础上增加了模型在显式评分数据上的定义,提出了一种改进的贝叶斯个性化排序IBPR(Improved Bayesian Personalized Ranking,IBPR)模型来提取浏览用户和项目的隐式反馈特征。该模型充分利用了现有的浏览用户反馈数据并引入了负反馈数据的定义,缓解了隐式反馈数据中缺少负反馈的问题,提高了模型的抗噪性能。
为了缓解冷启动问题,本实施例采用BiasSVD模型来提取用户和项目的显式反馈特征,根据提取到的隐式反馈特征重构用户-项目排序评分矩阵,显式反馈特征重构用户*项目评分矩阵,并将重构的矩阵进行融合,提出了一种基于显式和隐式反馈特征的后融合个性化推荐模型。由于该模型结合了IBPR模型和BiasSVD模型,故将该模型简称为IBPR_SVD(Improved Bayesian PersonalizedRanking Singular Value Decomposition,IBPR_SVD)。
从BPR(Bayesian Personalized Ranking,BPR)模型的定义可知,该模型仅从偏序集合DS中提取用户和项目的特征,而忽略了用户均标记过的项目对。DS的定义如下:
其中,项目i表示用户u标记过的任意一个项目,项目j表示用户u未标记过的任意一个项目。Ⅳ(u)表示用户u曾经标记过的项目集合,表示用户u未曾标记过的项目集合。三元组(u,i,j)表示相对于项目j,用户u更加偏好项目i。
由于在浏览系统中,通常会出现一个用户同时对几个甚至更多个浏览项目进行评价的情况,从评分的数值可以直观地看出:用户更偏爱评分值较高的项目。基于此,本实施例基于用户更偏爱评分值高的项目这一假设,提出了IBPR模型。不同于BPR模型的是,本实施例提出的IBPR模型对BPR模型输入的对级数据集合进行了扩展,增加了用户在历史评分项目对上的定义,扩展部分的偏序集合DR定义如下:
DR={(u,i,j)|i∈Ⅳ(u)and j∈Ⅳ(u)and rui>ruj} (2)
其中,项目i和项目j表示用户u标记过的其中两个项目,N(u)表示用户u曾经标记过的项目集合,rui和ruj分别表示用户u在项目i和项目j上的历史评分值。三元组(u,i,j)表示相对于项目j,用户u更加偏好项目i。因此,IBPR模型输入的偏序集合D可以表示为:
D=DS∪DR (3)
偏序集合D中增加了部分用户历史评分项目对。
本实施例的BPR模型对级数据集合和IBPR模型对级数据集合参照附图2。
附图2展示了BPR模型和IBPR模型将用户反馈数据分别转换为对级偏序集合DS和D时的不同。附图2中最左边的用户-项目评分矩阵是一组用户在项目上的评分记录,分值反映了用户的喜爱程度,分值越高,表示用户越喜欢该项目。问号表示用户从未对该项目评过分。BPR模型和IBPR模型根据用户的标记情况在两个不同的项目之间生成了偏好项目对u:i>uj,偏序集合中的加号表示相对于项目j用户u更偏爱项目i,减号则恰恰相反,它表示相对于项目i用户更偏爱项目j,问号表示不能判断用户对两个项目的相对偏好情况。
从附图2中可以看出,相对于BPR模型,IBPR模型的偏序集合中增加了部分用户历史评分项目对,以三元组<u1,i2,i3>为例,在BPR模型中,不能判断用户u1对项目i2和项目i3的偏好关系。由于用户u1在项目i2和项目i3上的打分记录分别为5和3,IBPR模型则认为相对于项目i3,用户u1更偏爱i2。如果用户在两个项目上的评分值相同,IBPR模型不能判断两项目之间的偏好关系。
基于上述分析,IBPR模型的目标函数为:
其中,σ(x)为Sigmoid函数,λ为正则化参数,Θ为模型的参数集合,Θ=<bu,bi,pu,qi,qj}。用来获取用户u和两个项目i和j之间的关系,的定义如下:
其中,和分别表示模型预测得到的用户u对项目i和项目j的排序优先度,bi表示项目i的偏置项,rmax和rmin分别表示数据集中用户评分的最大值和最小值,pu表示用户u的特征向量,qi表示项目i的特征向量,表示qi的转置。IBPR模型通过随机梯度下降法进行优化求解。
本实施例中,显式特征提取模块采用BiasSVD模型,即采用BiasSVD模型来提取用户和项目的显式反馈特征,BiasSVD模型的任意用户u在项目i上的评分预测公式采用其中,μ为训练集历史评分数据的评分值,bi和bu分别表示项目i的偏置项和用户u的偏置项,pu表示用户u的特征向量,qi表示项目i的特征向量,表示qi的转置。
本实施例整体特征提取模块采用IBPR_SVD模型,IBPR_SVD模型融合了BiasSVD模型和IBPR模型。
对于用户u来说,预测得到的任意一个未标记的项目i的排序分值可以用下式来计算:
其中,表示由BiasSVD模型预测得到的用户u在项目i上的评分值,表示IBPR模型预测得到的用户u在项目i上的排序分值。α为折中参数,α的取值范围为[0,1]。
由于折中参数α取值的好坏直接影响了本实施例提出算法的推荐精度,因此,在验证IBPR_SVD算法的性能之前,首先需要确定折中参数α的最佳取值。折中参数α越大,IBPR模型对IBPR_SVD算法的影响越大,BiasSVD模型的影响也越小;折中参数α越小,IBPR模型对IBPR_SVD算法的贡献也随之越小,BiasSVD模型的贡献则会随之增大。当α=0时,IBPR_SVD算法退化为BiasSVD模型,当α=1时,IBPR_SVD算法退化为IBPR模型。折中参数α的具体取值通过实验来确定。
本实施例通过实验来确定折中参数α的最合适取值,实验在两个公开数据集Movielens 100K和FilmTrust上进行,折中参数α为变量,取值为[0,1],步长0.1,MAP和MRR作为实验的评价指标,迭代次数设定为1000,IBPR模型和BiasSVD模型的特征向量维数均设置为10。IBPR_SVD算法在两个数据集Movielens 100K和FilmTrust上随折中参数α变化的性能曲线显示在附图3和附图4中。从附图3和附图4中可以看出,折中参数的最优取值为0.9。
不同于现有方法将历史评分项目全部作为正反馈数据,本实施例在历史评分项目中定义了负反馈数据;采用一个折中参数将基于历史评分数据的协同过滤算法BiasSVD和基于排序评分的协同过滤算法IBPR连接起来,联合提取用户和项目的显式特征和隐式特征。充分利用数据集中的历史评分数据和隐式反馈数据,缓解了推荐系统的冷启动问题。
实施例2:
本实施例提供了一种基于显式和隐式反馈特征的后融合个性化推荐方法,参照附图8。该基于显式和隐式反馈特征的后融合个性化推荐方法融合了BiasSVD模型和IBPR模型,包括如下步骤:
步骤一:从用户反馈数据库中获取用户的显式评分数据和隐式反馈数据;
步骤二:采用BiasSVD模型提取用户和项目的显式反馈特征,根据用户的历史评分数据来学习用户特征矩阵和项目特征矩阵,通过学习到的特征矩阵来重构预测的评分矩阵;
步骤三:采用IBPR模型提取用户和项目的隐式反馈特征,通过用户的显式评分数据和隐式反馈数据,构造IBPR模型的对级项目偏好集合,通过在扩展的对级项目集合上训练IBPR模型,得到另一组用户特征矩阵和项目特征矩阵,根据排序评分预测公式对数据集中的所有未标注项目的排序评分进行预测,进而重构出对应的用户-项目预测的排序评分矩阵;
步骤四:将BiasSVD模型得到的预测的评分矩阵和IBPR模型得到的预测的排序评分矩阵进行加权求和,得到最终的预测的排序评分矩阵,排序评分越高,获得推荐的概率越大;
步骤五:将用户预测得到的所有排序评分从高到低进行排序,得推荐列表,并将排序靠前的前Ⅳ个项目推荐给用户。
本实施例的基于显式反馈和隐式反馈特征的后融合个性化推荐方法,结合了IBPR模型和BiasSVD模型。本实施例利用BiasSVD模型作为显式特征提取模块提取用户和项目的显式反馈特征,重构预测的评分矩阵,利用IBPR模型作为隐式特征提取模块提取用户和项目的隐式反馈特征,重构预测的排序评分矩阵,利用IBPR SVD模型作为整体特征提取模块将预测的评分矩阵和预测的排序评分矩阵进行融合,得到最终的预测的排序评分矩阵。具体方法可参照实施例1的基于显式反馈和隐式反馈特征的后融合个性化推荐模型的处理过程。本实施例基于显式反馈和隐式反馈特征的后融合个性化推荐方法充分利用了数据集中的历史评分数据和隐式反馈数据,缓解了推荐系统的冷启动问题。
本实施例的工作流程,输入:数据集T,IBPR_SVD模型特征向量维度f,学习速率γ,正则化参数λ,迭代次数interations,对级偏序集合D,数据集中的用户个数m,项目个数n;输出预测的排序评分矩阵初始化BiasSVD模型和BPR模型中preRmse,参数集合;开始运行直至迭代停止。
为了探索最有效的融合BiasSVD和IBPR的方式,本实施例设计了13种不同的融合方法来对比。为了更加清晰地介绍上述方法,本实施例假设BiasSVD模型的用户和项目特征向量分别为U和V,IBPR模型的用户和项目特征向量分别为P和Q。13种融合方式定义如下:
1)IBPR_SVD_AM。本实施例设计了一个注意力机制模块来BiasSVD和IBPR分配权重,如附图5所示。在IBPR_SVD_AM方法中,对于不同用户而言,对应的注意力权重可能不同。附图5中输入端a(u)和b(u)分别表示BiasSVD和IBPR对用户u的影响度,输出端的向量表示由于BiasSVD的影响而产生的用户注意力权重向量,分别表示由于IBPR的影响而产生的用户注意力权重向量。本实施例设计了一个损失函数来计算向量和
其中,表示训练集,rui表示历史评分数据,λ为正则化参数,本实施例采用梯度下降方法来优化上述损失函数。
2)IBPR_SVD_MAX。本方法取BiasSVD和IBPR预测结果中的最大值作为最终的预测结果。
3)IBPR_SVD_MIN。本方法取BiasSVD和IBPR预测结果中的最小值作为最终的预测结果。
4)IBPR_SVD_MUL。本方法取BiasSVD和IBPR预测结果的乘积作为最终的预测结果。
5)IBPR_SVD_(U+P)(V+Q)。为了尝试更多的可能性,本方法将BiasSVD和IBPR模型特征集进行重新组合。本方法首先计算两个模型用户偏好特征总和及项目属性特征总和,然后对未评分项目进行评分预测。
6)IBPR_SVD(UQ+VP)。本方法重组两个模型的特征,将BiasSVD和IBPR模型项目特征进行了交换,并计算相应的点积和。
7)IBPR_SVD_UQ。本方法提取BiasSVD的用户特征和IBPR模型的项目特征来进行推荐。
8)IBPR_SVD_VP。本方法提取BiasSVD的项目特征和IBPR模型的用户特征进行推荐。
9)IBPR_SVD(U+P)V。本方法采用两个模型的用户特征和,及BiasSVD模型的项目特征进行推荐。
10)IBPR_SVD(U+P)Q。本方法采用两个模型的用户特征和,及IBPR模型的项目特征进行推荐。
11)IBPR_SVD_U(V+Q)。本方法采用BiasSVD模型的用户特征,及两个模型的项目特征进行推荐。
12)IBPR_SVD_P(V+Q)。本方法采用IBPR模型的用户特征,及两个模型的项目特征进行推荐。
13)IBPR_SVD。本方法即为本实施例提出的方法,采用折中参数α来融合BiasSVD和IBPR模型,折中参数设置为0.9。
根据上述描述,本实施例的在两个公开数据集Movielens 100K和FilmTrust上测试13种融合方法的性能,评价指标选择Precision@3,Recall@3,Precision@5,Recall@5,MAP和MRR,实验结果如表1所示。从实验结果可以看出,本实施例提出的融合方法显著优于其他融合方法。
表1
为了说明本实施例提出方法IBPR_SVD的有效性,本实施例在5个公开数据集上进行了大量的实验,数据集分别为Movielens 100K、Movielens 1M、FilmTrust、Ciao和Hetrec-movielens-2k。与较为新颖的4种方法进行了对比,进而验证了IBPR_SVD方法的有效性。实验中采用的指标分别为Precision@3,Recall@3,Precision@5,Recall@5,MAP和MRR,实验结果表2所示。实验结果表明,提出的IBPR_SVD性能显著优于其他方法,再次证明了本实施例提出的方法是有效的。
表2
本实施例所对比的模型均已发表于信息推荐领域的顶刊上,包括Knowledge-Based Systems(KBS)和Information Sciences(Inf.Sci)。对比的模型:RBPR(RatingBayesian personalized ranking)、SPR(Similarity pairwise ranking)、BPRN(Bayesianpersonalized ranking algorithm based on multiple-layer neighborhoods)和MSBPR(multi-pairwise preference and similarity based BPR)。
本实施例探索IBPR_SVD方法在用户冷启动情况下的性能,本实施例所用的新用户冷启动数据集由FilmTrust数据集人工生成。具体做法为:冷启动数据集通过改变用户的评分个数来生成,数据集的用户评分个数取值范围为[3,19],步长为2。数据集不同,用户的评分个数亦不相同。本实施例的对比方法选择SPR方法,评价指标选择MAP和MRR。实验结果如附图6和附图7所示,从附图6和附图7中可以看出,本实施例提出的IBPR_SVD方法能在一定程度上缓解冷启动问题。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在未脱离本发明技术方案的内容,均应包含在本发明的保护范围之内。
Claims (8)
1.基于显式和隐式反馈特征的后融合个性化推荐模型,其特征在于,包括显式特征提取模块、隐式特征提取模块和整体特征提取模块,所述显式特征提取模块和隐式特征提取模块分别与整体特征提取模块连接;
所述显式特征提取模块用于接收用户特征矩阵和项目特征矩阵的数据,提取用户和项目的显式反馈特征,重构预测的评分矩阵;
所述隐式特征提取模块用于接收用户的显式评分数据和隐式反馈数据,提取用户和项目的隐式反馈特征,重构预测的排序评分矩阵;
所述整体特征提取模块用于将所述预测的评分矩阵和所述预测的排序评分矩阵进行加权求和,得到最终的预测的排序评分矩阵。
2.根据权利要求1所述的基于显式和隐式反馈特征的后融合个性化推荐模型,其特征在于,所述隐式特征提取模块采用BPR模型;
所述BPR模型用于从偏序集合Ds中提取用户和项目的特征;
所述偏序集合Ds的定义如下:
其中,项目i表示用户u标记过的任意一个项目,项目j表示用户u未标记过的任意一个项目,N(u)表示用户u曾经标记过的项目集合,表示用户u未曾标记过的项目集合,三元组(u,i,j)表示相对于项目j,用户u更加偏好项目i。
3.根据权利要求2所述的基于显式和隐式反馈特征的后融合个性化推荐模型,其特征在于,所述隐式特征提取模块采用IBPR模型;
所述IBPR模型用于对所述BPR模型输入的对级数据集合进行了扩展,增加了用户在历史评分项目对上的定义,扩展部分的偏序集合DR定义如下:
DR={(u,i,j)|i∈N(u)and j∈N(u)and rui>ruj}
其中,项目i和项目j表示用户u标记过的其中两个项目,N(u)表示用户u曾经标记过的项目集合,rui和ruj分别表示用户u在项目i和项目j上的历史评分值,三元组(u,i,j)表示相对于项目j,用户u更加偏好项目i,因此,输入的偏序集合D表示为:
D=DS∪DR
所述偏序集合D中增加了部分用户历史评分项目对。
4.根据权利要求3所述的基于显式和隐式反馈特征的后融合个性化推荐模型,其特征在于,所述IBPR模型的目标函数为:
其中,σ(x)为Sigmoid函数,λ为正则化参数,Θ为IBPR模型的参数集合,Θ={bu,bi,pu,qi,qj},用来获取用户u和两个项目i和j之间的关系,的定义如下:
其中,和分别表示IBPR模型预测得到的用户u对项目i和项目j的排序优先度,bi表示项目i的偏置项,rmax和rmin分别表示数据集中用户评分的最大值和最小值,pu表示用户u的特征向量,qi表示项目i的特征向量,表示qi的转置。
5.根据权利要求4所述的基于显式和隐式反馈特征的后融合个性化推荐模型,其特征在于,所述显式特征提取模块采用BiasSVD模型;
所述BiasSVD模型的任意用户u在项目i上的评分预测公式采用其中,μ为训练集历史评分数据的评分值,bi和bu分别表示项目i的偏置项和用户u的偏置项,pu表示用户u的特征向量,qi表示项目i的特征向量,表示qi的转置。
6.根据权利要求5所述的基于显式和隐式反馈特征的后融合个性化推荐模型,其特征在于,所述整体特征提取模块采用IBPR_SVD模型;
所述IBPR_SVD模型融合了BiasSVD模型和IBPR模型;
对于用户u,预测得到的任意一个未标记的项目i的排序分值用下式来计算:
其中,表示由BiasSVD模型预测得到的用户u在项目i上的评分值,表示IBPR模型预测得到的用户u在项目i上的排序分值,α为折中参数,α的取值范围为[0,1]。
7.根据权利要求6所述的基于显式和隐式反馈特征的后融合个性化推荐模型,其特征在于,所述折中参数α的最优取值为0.9。
8.一种基于显式和隐式反馈特征的后融合个性化推荐方法,其特征在于,包括如下步骤:
步骤一:从用户反馈数据库中获取用户的显式评分数据和隐式反馈数据;
步骤二:采用BiasSVD模型提取用户和项目的显式反馈特征,根据用户的历史评分数据来学习用户特征矩阵和项目特征矩阵,通过学习到的特征矩阵来重构预测的评分矩阵;
步骤三:采用IBPR模型提取用户和项目的隐式反馈特征,通过用户的显式评分数据和隐式反馈数据,构造IBPR模型的对级项目偏好集合,通过在扩展的对级项目集合上训练IBPR模型,得到另一组用户特征矩阵和项目特征矩阵,根据排序评分预测公式对数据集中的所有未标注项目的排序评分进行预测,进而重构出对应的用户-项目预测的排序评分矩阵;
步骤四:将BiasSVD模型得到的预测的评分矩阵和IBPR模型得到的预测的排序评分矩阵进行加权求和,得到最终的预测的排序评分矩阵,排序评分越高,获得推荐的概率越大;
步骤五:将用户预测得到的所有排序评分从高到低进行排序,得推荐列表,并将排序靠前的前N个项目推荐给用户。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202310619062.XA CN116701861A (zh) | 2023-05-29 | 2023-05-29 | 基于显式和隐式反馈特征的后融合个性化推荐模型和方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202310619062.XA CN116701861A (zh) | 2023-05-29 | 2023-05-29 | 基于显式和隐式反馈特征的后融合个性化推荐模型和方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN116701861A true CN116701861A (zh) | 2023-09-05 |
Family
ID=87823118
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202310619062.XA Pending CN116701861A (zh) | 2023-05-29 | 2023-05-29 | 基于显式和隐式反馈特征的后融合个性化推荐模型和方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN116701861A (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117974330A (zh) * | 2024-03-28 | 2024-05-03 | 华侨大学 | 基于混合模型的互联网保险评分预测方法及装置 |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20100030764A1 (en) * | 2008-07-30 | 2010-02-04 | At&T Corp. | Recommender System Utilizing Collaborative Filtering Combining Explicit and Implicit Feedback with both Neighborhood and Latent Factor Models |
| US20160217374A1 (en) * | 2015-01-27 | 2016-07-28 | Milq Inc. | Method and system utilizing collaborative filtering |
| CN106951528A (zh) * | 2017-03-21 | 2017-07-14 | 北京邮电大学 | 一种推荐信息确定方法及装置 |
| CN108460619A (zh) * | 2018-01-16 | 2018-08-28 | 杭州电子科技大学 | 一种融合显隐式反馈的协同推荐模型 |
| CN110020207A (zh) * | 2019-04-16 | 2019-07-16 | 中森云链(成都)科技有限责任公司 | 一种融合方面隐式反馈的试题可解释Top-K推荐方法 |
| WO2021135192A1 (zh) * | 2019-12-31 | 2021-07-08 | 华南理工大学 | 一种基于用户好奇心的贝叶斯个性化排序推荐方法 |
| US20220253688A1 (en) * | 2021-02-08 | 2022-08-11 | Haolun Wu | Recommendation system with adaptive weighted baysian personalized ranking loss |
-
2023
- 2023-05-29 CN CN202310619062.XA patent/CN116701861A/zh active Pending
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20100030764A1 (en) * | 2008-07-30 | 2010-02-04 | At&T Corp. | Recommender System Utilizing Collaborative Filtering Combining Explicit and Implicit Feedback with both Neighborhood and Latent Factor Models |
| US20160217374A1 (en) * | 2015-01-27 | 2016-07-28 | Milq Inc. | Method and system utilizing collaborative filtering |
| CN106951528A (zh) * | 2017-03-21 | 2017-07-14 | 北京邮电大学 | 一种推荐信息确定方法及装置 |
| CN108460619A (zh) * | 2018-01-16 | 2018-08-28 | 杭州电子科技大学 | 一种融合显隐式反馈的协同推荐模型 |
| CN110020207A (zh) * | 2019-04-16 | 2019-07-16 | 中森云链(成都)科技有限责任公司 | 一种融合方面隐式反馈的试题可解释Top-K推荐方法 |
| WO2021135192A1 (zh) * | 2019-12-31 | 2021-07-08 | 华南理工大学 | 一种基于用户好奇心的贝叶斯个性化排序推荐方法 |
| US20220253688A1 (en) * | 2021-02-08 | 2022-08-11 | Haolun Wu | Recommendation system with adaptive weighted baysian personalized ranking loss |
Non-Patent Citations (2)
| Title |
|---|
| 何灵敏;杜民双;: "融合AOBPR和SVD++的排序推荐算法", 中国计量大学学报, no. 01, 15 March 2018 (2018-03-15) * |
| 张宇;王文剑;赵胜男;: "基于正负反馈的SVM协同过滤Top-N推荐算法", 小型微型计算机系统, no. 05, 15 May 2017 (2017-05-15) * |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117974330A (zh) * | 2024-03-28 | 2024-05-03 | 华侨大学 | 基于混合模型的互联网保险评分预测方法及装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Feng et al. | RBPR: A hybrid model for the new user cold start problem in recommender systems | |
| Doulamis et al. | Evaluation of relevance feedback schemes in content-based in retrieval systems | |
| CN111897999B (zh) | 一种用于视频推荐且基于lda的深度学习模型构建方法 | |
| CN114782791A (zh) | 基于transformer模型和类别关联的场景图生成方法 | |
| CN115730139B (zh) | 基于异质多兴趣建模的短视频推荐方法及装置 | |
| CN107025311A (zh) | 一种基于k近邻的贝叶斯个性化推荐方法及装置 | |
| CN111814016B (zh) | 一种混合粒度多视图新闻数据聚类方法 | |
| CN119474551B (zh) | 一种基于路径增强的图神经网络电影推荐方法 | |
| CN113343077A (zh) | 一种融合用户兴趣时序波动的个性化推荐方法及系统 | |
| CN114022233A (zh) | 一种新型的商品推荐方法 | |
| CN113742464B (zh) | 一种基于异构信息网络的新闻事件发现算法及装置 | |
| CN111259264B (zh) | 一种基于生成对抗网络的时序评分预测方法 | |
| CN116701861A (zh) | 基于显式和隐式反馈特征的后融合个性化推荐模型和方法 | |
| CN107622071A (zh) | 通过间接相关反馈在无查源下的衣服图像检索系统及方法 | |
| CN112817442A (zh) | 基于ffm的多任务情况下态势信息分类推荐系统及方法 | |
| Zhu et al. | Multimodal sparse linear integration for content-based item recommendation | |
| JP2002342360A (ja) | 情報提供装置、その方法、そのコンピュータ・プログラムおよびそのプログラムを記録した記録媒体 | |
| CN120470143A (zh) | 一种图文跨模态检索方法及系统 | |
| CN111860870A (zh) | 交互行为确定模型的训练方法、装置、设备及介质 | |
| You et al. | A hotel ranking model through online reviews with aspect-based sentiment analysis | |
| Wang et al. | BERT-based aggregative group representation for group recommendation | |
| CN116910371A (zh) | 一种基于深层关系的推荐方法及系统 | |
| CN120655448B (zh) | 一种面向稀疏社交网络的图混合学习好友推荐方法 | |
| Vats et al. | Dimensionality reduction techniques: comparative analysis | |
| Kavitha et al. | Machine learning paradigm towards content-based image retrieval on high-resolution satellite images |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |