神经网络的推荐算法中数据集利用策略研究(源码)

为了探究基于神经网络的推荐算法中,如何最大化利用数据集以提高推荐结果准确性的问题,本文对算法实现过程中的数据利用方式进行了深入研究并对个性化模型构建进行了一定的尝试。通过构建3层神经网络对Movielens-1M数据集进行评分预测,在数据预处理的过程中,尝试使用Embedding层表示各项数据,在模型的训练过程中,将除id信息以外的各项信息单独加入推荐模型中,比较其对模型预测准确性的影响,最后,尝试按用户划分数据集,为不同用户训练了个性化的推荐模型。实验结果显示,使用用户和电影id信息进行评分预测时,数据预处理阶段使用embedding层表示id信息能够使MSE从1.243降低到0.827,效果显著,增加除id信息以外的信息作为模型的输入依据使MSE获得了不同幅度的下降,多数为子用户集训练的个性化模型推荐效果不如为所有用户构建的模型。根据实验结果,最终得到3个结论:(1)使用embedding层能够有效的表示用户和物品的特征,有助于提高推荐效果。(2)增加用户物品的信息作为推荐的依据能够改善模型推荐的效果。(3)在数据不够全面的情况下,简单为不同类别用户构建推荐模型难以有效提升推荐效果。
目录
摘要 1
关键词 1
ABSTRACT 1
KEY WORDS 1
1绪论 2
1.1研究背景与意义 2
1.2推荐算法综述 2
1.2.1基于协同过滤的推荐 2
1.2.2基于内容的推荐 4
1.2.3组合推荐 5
1.2.4基于深度学习的推荐 5
1.2.5推荐算法评价方法与评价指标 6
1.3存在的主要问题 6
1.4研究内容 7
1.5技术路线 7
1.6论文组织结构 7
2基于神经网络的推荐算法 8
2.1实验环境与数据集介绍 8
2.2基于神经网络的推荐算法原理与实现 9
2.2.1神经网络 9
2.2.2基于神经网络的推荐算法实现 10
2.3算法评测与分析 12
2.3.1输入维度比对 12
2.3.2网络结构比对 13 *好棒文|www.hbsrm.com +Q: ¥351916072$ 

2.4本章小结 13
3数据集量化与利用研究 14
3.1数据表现形式 14
3.1.1数据归一化 14
3.1.2数据的Embedding层表示 15
3.2数据相关性 16
3.3数据有效性 18
3.4与传统算法比对分析 21
3.5本章小结 21
4个性化模型构建尝试与分析 22
4.1数据集按用户分析 22
4.1.1用户性别分析 22
4.1.2用户年龄分析 23
4.1.3用户职业分析 24
4.2数据集划分与个性化模型训练 24
4.3个性化模型预测准确性分析 25
4.4本章小结 26
5总结与展望 27
5.1本文工作总结 27
5.2未来展望 27
致谢 27
参考文献: 28
基于神经网络的推荐算法中数据集利用策略研究
引言
1绪论
1.1研究背景与意义
互联网的出现和普及给人类带来了海量的信息,满足了人类在信息时代对信息的需求,但随着信息的爆炸式增长,面对着过于庞大的信息时,用户往往难以从中获得对自己真正有用的信息,这就是所谓的信息超载[1](information overload)问题。
为了解决信息超载的问题,推荐系统(Recommender System)横空出世。Resnick等[2]于1997年第一次正式提出了推荐系统的概念,“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。它旨在将用户感兴趣的或是需要的信息和商品呈现在用户面前,节约用户的时间,改善用户体验,同时也使得商家能够将尽可能多的产品销售给潜在客户,得到更多的利润。普通人对推荐系统的概念可能了解的并不多,但事实上,推荐系统已在众多与生活密切相关的领域得到应用,无论是Amazon的商品推荐,还是Youtube的视频推荐,或是今日头条的新闻推荐,都离不开推荐系统,它们影响着几乎所有人的生活。
一个完整的推荐系统,除了系统界面,还有用户和物品建模以及推荐算法这几部分。推荐系统通过推荐算法对用户的兴趣特征和物品的特征进行提取与匹配计算,推测出用户有大概率感兴趣的物品并向用户推荐。虽然推荐算法只是推荐系统的一部分,但它对系统的性能和推荐的结果有重要的影响,直接决定着推荐效果好坏,因此,好的推荐算法尤为重要。
1.2推荐算法综述
所谓推荐算法,是指根据已有信息,包括物品信息、用户信息、用户偏好信息这三方面的信息,通过某些计算方式,推测出用户有较大概率喜欢的物品的一种算法。
除了协同过滤算法、基于内容的推荐算法和组合推荐算法这三类传统推荐算法外,随着深度学习的快速发展,深度学习领域的知识逐步开始被用于改进推荐算法,由于很难界定这些方法属于哪一类传统的推荐算法,因而,将基于深度学习的推荐算法作为单独的一类推荐算法进行概述。
1.2.1基于协同过滤的推荐
推荐算法的研究始于20世纪90年代,一般认为,协同过滤算法是第一个得到广泛应用的推荐算法[3]。1992年,Xerox公司为了使他们的邮件系统了解用户喜好,能够向用户发送更为个性化邮件,让用户选择若干种喜好的主题的邮件,依照不同的主题对邮件进行过滤并发送给用户,使得系统达到了个性化的目的。1994年,明尼苏达大学推出了GroupLens系统[4],该系统主要用于帮助用户过滤其感兴趣的新闻,以实现新闻的推荐。而后,应用了协同过滤算法的Amazon网站电子商务推荐系统[5]的出现推动了以协同过滤算法为代表的推荐算法的研究热潮。
一个简单的协同过滤推荐的例子如图1所示。

图 1协同过滤推荐简例
协同过滤算法有基于用户和基于物品两种类型。基于用户的协同过滤算法原理是

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/jsjkxyjs/1652.html

好棒文