基于KNN-SVM的混合协同过滤推荐算法.pdf
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 KNN SVM 混合 协同 过滤 推荐 算法
- 资源描述:
-
第29恙第5期
算杌应用研究
Vol 29 No 5
2012年5月
Application Research of Computers
May 2012
基于KN-SM的混合协同过滤推荐算法
吕成成,王维国,丁永健
(1.东北财经大学a.管理科学与工程学院;b.数学与数量经济学院,辽宁大连16025;2.大连理工大学管理
与经济学部,辽宁大连116024)
摘要:数据稀巯性问题对协同过滤推荐系统的推荐精度有很大影响,为此,融合缺失数据平衡方法,提出了
个基于 KNN-SVM的混合协同过滤推荐算法。利用K-最近邻法对训练集中的缺失数据进行填补,然后通过支持
向量机交叉验证进行分类,综合两者优点,从而克服数据质量对推荐算法的影响。在标杆数据集上进行了仿真
实验,数值结果证明了方法的有效性
关键词:数据稀荒性;支持向量机;K-最近邻;协同过滤
中图分类号:TP311文献标志码:A文章编号:1001-3695(2012)05-1707-03
doi:10.3969
Hybrid collaborative filtering algorithm based on KNN-SVM
LV Cheng-shu", WANG W
DING Yong
(1. a. School of an emet Sce Egg h o m t E s s ofin&Eo
nomis, Dalian Ining 116025, China 2. Fcy f Manag men&co omics, Dal n University of nology, Dalian Liaoning 11602
Abstract: The problem of data sparseness has great influence on collaborative filtering recommendation system s accurary
balance for this missing data fusion method, his paper proposed a h rid collab ative filtering algorithms based on KNN-SVM
K-neaest neor method used e training set o fill the missing data, and then cross-validate by VM classification. Cor
prehend advantages oth KNN and S M in order to overcome impact of data quality on the recommended algorithm. The pro-
Key words: da applied to benchmark problens, and the simulation results show it is valid
Key words: data sparsity; support vector machine(SVM); K-nearest neighbor; collaborative filtering
基于模型的协同过滤算法是目前个性化推荐系统的研究降低用户一项目矩阵的稀疏性;然后在得到的稠密矩阵上建立
热点,其核心思想是利用数据挖掘与人工智能技术来改进传统模型,以SVM算法进行推荐。
的协同过滤算法】。分类算法是基于模型的协同过滤算法
常采用的一种建模方法。其中, Vapnik5?根据统计学习理
理论基础
论提出的支持向量机方法具有诸多的优良特性,近年来引起
广泛的关注,已在文本分类、图像分类、人脸识别等领域取得了
1K-最近部法
良好的应用效果。推荐系统和文本分类具有很多共同特
K最近邻法?是最近邻的一个排广。其工作原理是利用
征?,支持向量机在文本分类领域取得的成功促使其被运用评分相似度来杓造用户或者项目的K个最近邻,再使用K最近
到推荐系统中。 Zhang等人将标准的SVM分类器直接应用邻集合进行推荐。K最近邻法具备较高的灵活性,易与其他模
到推荐系统中,但由于推荐系统中数据的极端稀疏性,SWM分型整合,推荐结果直观,容易解释。因此,在实际应用中可以
类器的分类精度受到很大影响,不能取得令人满意的的分类效将区最近邻法与其他推荐技术相结合以取得更好的实际效果。
果。Gcax等人?将KN与SyM在协同过潓框架下的性能进1.2支持向量机
行了对比,实验结果表明,SVM处理高维度、高稀疏数据集的
支持向量机基于结构风险最小化原理,通过核映射解
性能优于传统的协同过滤算法,但其推荐精度与数据质暈高度决高维空间的学习问题,并具有更好的推广能力能够克服局
相关。
部极小、维数灾难和过学习等问题。支持向量机算法的原始形
针对存在的问题,本文结合KNN和SVM算法的功能特式为
点,提出了一个基于 KNN-SVM的协同过滤推荐算法。算法首
先采用K-最近邻法找出具有缺失值样本点的K个最近邻,用
K个最近邻的相关属性值来对用户一项目矩阵中的缺失数据
8.し.yY(W+b)≥1ーよ:i=1,2,…
进行预测和填补,使用户之间拥有更多的共同评分项目,从而其中:WXx+b=0是所要求解的超平面,W是超平面的法向
收稿日期:2011-10-07;修回日期:2011-1-14基金项目:辽宁省社会科学规划基全资助项目( LIOBJL035);中央高校专项科研基金资
動项目( DUTIORW302)
作者简介:吕成成(1979-),女,硕士,主要研究方向为机器学习、电子商务(1vcs@163.com);王维国(1963-),男,教授,博导,主要研究方向为
据挖据;丁永健(1977-),男,副教授,持士研究生,主要研究方向为个性化推荐系统
万方数据
展开阅读全文
文档分享网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。



链接地址:https://www.wdfxw.net/doc56542284.htm