基于关联规则和情感分析的图书推荐算法研究
本文关键词:基于关联规则和情感分析的图书推荐算法研究,由笔耕文化传播整理发布。
【摘要】:在当今数字化时代,互联网的迅速发展使得中国网民人数达到6.68亿人次,其中有一半左右的人喜欢在网上发表评论,而且大多数人会把自己喜欢的文章、书籍、网站等进行收藏,不难看出每位用户的收藏信息很具有代表性。那么如何从这些数据中挖掘出对人们购买图书有帮助的相关信息就成为了当前研究的热点之一。本文利用数据挖掘技术来分析用户的收藏习惯和评论信息,力图为用户提供更人性化的图书推荐服务。关联规则算法是数据领域中较为常用的研究方法,常常用来发现不同项集之间的关系,在推荐系统方向有着很重要的地位。本文基于Apriori算法提出了一种改进的关联规则方法,用于分析用户收藏图书习惯。通过分析“豆瓣”网站上每一位读者的“收藏”记录,对数据库中每位顾客收藏的图书信息进行分析从而得到所有的图书频繁项集以及关联规则。仅仅使用关联规则算法推荐并不能达到最好的效果,本文基于上下文对图书评论内容进行情感分析,从而挖掘出图书评论的情感倾向性,对读者真正的想法进行分析。对于图书评论分析部分的研究方法是,首先利用爬虫方法得到豆瓣用户的图书评论语料,然后利用基于上下文的图书评论分析算法对所得到的原始语料进行分析,得到图书评论的情感倾向性。本文的主要内容如下:(1)简述关联规则算法、文本挖掘技术及国内外发展现状。(2)基于经典关联规则算法Apriori算法提出了一种改进算法。(3)提出了一种基于上下文的文本情感分析算法。(4)结合实验结果进行分析。结合关联规则中的图书书目,对其用户评论进行情感分析,可以推荐给用户更为精确的图书推荐。本文所提供的算法将会给用户推荐更受其他用户好评的图书,达到更为有效的推荐效果。本文的主要创新点如下:(1)以Apriori算法为基础,提出了一种改进的关联规则算法,减少了计算次数,在时间复杂度上有所减少,从而达到提升计算速度的目的,在计算图书关联规则集的部分起到了重要的作用。(2)在推荐特征方向上增加了图书评论的情感分析,提出了一种基于上下文的情感分析算法,使得分析结果的正确性有了提升,整个图书推荐系统的准确性也有了相应提升,提高了用户体验。
【关键词】:数据挖掘 图书推荐 关联规则 图书评论 情感分析
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;TP391.3
【目录】:
- 摘要4-6
- Abstract6-11
- 第1章 绪论11-17
- 1.1 研究背景及意义11-12
- 1.1.1 研究背景11-12
- 1.1.2 研究意义12
- 1.2 国内外相关研究现状12-14
- 1.2.1 关联规则研究现状12-13
- 1.2.2 文本情感研究现状13-14
- 1.3 主要研究内容14-15
- 1.4 论文的组织结构15-17
- 第2章 相关理论和技术17-24
- 2.1 理论基础17-20
- 2.1.1 关联规则理论基础17-18
- 2.1.2 文本分类的理论基础18-20
- 2.2 相关技术20-22
- 2.2.1 爬虫技术20-21
- 2.2.2 数据预处理技术21-22
- 2.2.3 中文文本情感倾向性分析技术22
- 2.3 本章小结22-24
- 第3章 关联规则在图书推荐系统中的应用24-34
- 3.1 关联规则的问题描述24
- 3.2 关联规则算法分析24-26
- 3.2.1 关联规则的重要指标24-25
- 3.2.2 关联规则的基本过程25-26
- 3.3 关联规则在图书推荐系统中的必要性26-27
- 3.4 关联规则的改进算法27-30
- 3.5 改进的关联规则算在图书推荐系统中的应用30-33
- 3.6 本章小结33-34
- 第4章 基于上下文的图书评论情感分析34-52
- 4.1 数据处理34-40
- 4.1.1 获取数据34-37
- 4.1.2 数据预处理37
- 4.1.3 分词37-40
- 4.2 词典构建40-47
- 4.2.1 情感词典构建40-45
- 4.2.2 程度词典构建45-46
- 4.2.3 感叹号46-47
- 4.2.4 否定词47
- 4.3 情感分析算法描述及设计47-51
- 4.3.1 断句47-48
- 4.3.2 算法设计48-51
- 4.4 本章小结51-52
- 第5章 实验结果及分析52-60
- 5.1 测评指标52
- 5.2 改进关联规则算法测评结果及分析52-55
- 5.3 基于上下文的图书评论分析测评结果及分析55-57
- 5.4 图书推荐的测评结果57-59
- 5.5 本章小结59-60
- 第6章 总结与展望60-62
- 参考文献62-65
- 作者简介65-66
- 致谢66
【相似文献】
中国期刊全文数据库 前10条
1 宫雨,武森,尹阿东,高学东;加权关联规则的改进算法[J];计算机工程与应用;2004年22期
2 王华秋,曹长修,王越;一种快速并行关联规则算法研究及仿真[J];计算机应用研究;2005年07期
3 陈涛;张玮;;一个改进的并行关联规则算法研究[J];计算机技术与发展;2007年01期
4 张志锋;邓璐娟;刘秀梅;;关联规则算法在邮政商函客户关系中的应用[J];计算机技术与发展;2008年12期
5 付宝君;;基于关联规则算法的研究[J];科技信息(科学教研);2008年15期
6 王琳莎;林国龙;杨斌;;新的关联规则算法在物流行业中的应用[J];物流工程与管理;2009年03期
7 傅国强;郭向勇;;动态加权关联规则算法的分析与实现[J];计算机工程;2010年23期
8 张瑞雪;;改进的关联规则算法在课堂教学评价中的应用[J];产业与科技论坛;2011年06期
9 李琦,宋国新;在线挖掘关联规则算法的改进[J];华东理工大学学报;2000年05期
10 辛志,刘少辉,史忠植;关联规则算法的实现与改进[J];计算机工程与应用;2002年24期
中国重要会议论文全文数据库 前4条
1 谷斌;靳艳峰;王磊;;关联规则算法在邮政报刊征订中的应用研究[A];第十届中国科协年会信息化与社会发展学术讨论会分会场论文集[C];2008年
2 王爽;魏振钢;;空间关联规则算法在环境污染事故应急处理系统中的应用研究[A];第四届中国智能计算大会论文集[C];2010年
3 谭军;卜英勇;;一种具有反单调性的加权支持度-信任度框架[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
4 高杰;李绍军;钱锋;;数据挖掘中关联规则算法的研究及应用[A];第十七届全国过路控制会议论文集[C];2006年
中国硕士学位论文全文数据库 前10条
1 李远博;基于关联规则算法的旅游推荐研究[D];陕西师范大学;2015年
2 毕岩;基于Hadoop的并行关联算法的研究[D];南京邮电大学;2015年
3 于娜;基于关联规则算法的嫌疑程度关系发现方法研究[D];大连工业大学;2015年
4 李自胜;基于动态KMV模型和时序关联规则的商业银行信用风险研究[D];浙江财经大学;2016年
5 武霞;Hadoop平台下基于聚类和关联规则算法的工程车辆故障预测研究[D];太原科技大学;2015年
6 张依欢;关联规则算法在教学评价中的应用研究[D];吉林大学;2016年
7 李欣弘;基于关联规则和情感分析的图书推荐算法研究[D];吉林大学;2016年
8 陶双红;决策树关联规则算法在高校贫困生评定管理中的应用[D];湖南大学;2013年
9 王凯;关联规则算法及其在智能药房系统中的应用研究[D];南京理工大学;2012年
10 王磊;关联规则算法的研究及在海岸线分类中的应用[D];青岛大学;2012年
本文关键词:基于关联规则和情感分析的图书推荐算法研究,,由笔耕文化传播整理发布。
本文编号:364637
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/364637.html