当前位置:主页 > 科技论文 > 软件论文 >

面向社交媒体网络的用户情感分析方法的研究

发布时间:2018-04-30 00:42

  本文选题:情感分析 + 云计算 ; 参考:《河南科技大学》2017年硕士论文


【摘要】:近年来,互联网的快速发展,人们之间交流日益方便快捷,随着新的多媒体社交平台的不断涌出,围绕社交平台开展的交流日益增多,每天有成千上万的用户通过社交平台发表他们的言论和看法。这些文本信息中包含有大量的情感倾向(评论某个事物的“好”与“坏”)的词语,这些带有情感倾向的词语能反映出用户当时的情感状态。一方面,多媒体社交平台逐渐发展成意见挖掘和意见情感分析的评论文本资料库;另一方面,多媒体社交平台的发展也为意见的挖掘和情感分析提出了更高的需求。电影的评论文本是多媒体社交平台上比较常见评论信息,针对电影评论的研究已经很多很完善了,在传统的评论领域的情感分析不好在突破了,因此本文在基于传统的评论信息的基础上结合了一些其它因素来对评论文本进行情感分析,通过情感分析可以发现用户关注的电影特征,并根据电影的特征信息,推断出用户的偏好,本文提出了将电影的评论文本信息中的隐含语义内容和评分相结合构建一个新的电影推荐模型。因此本文是基于多媒体社交平台(电影的影评论坛)的评论文本信息来开展对电影推荐和评分预测的方法进行研究。并开展以下两个方面的研究工作:1.对电影评论的文本信息中的词语进行统计和分析,基于知网词典构建了一个电影领域的情感词典,用来对电影评论信息进行情感分类,根据情感分类中主题发散这个特点,提出一种基于情感句提取的电影评论的分类方法。并使用机器学习的方法对文本进行分类,从而得到它的情感倾向。在一级情感分类的基础上提出了结合统计学BSI的二级情感分类模型,通过实验对比证明了二级情感分类模型的准确度相比较一级情感分类提高了5%,且对未标示过的评论文本有更佳突出的情感分类能力。2.用户在浏览网页或者搜索内容的时候都有浏览记录的存在,这些日志数据随着用户的操作不断的增多,日志的数据能反映出用户的一些习惯或偏好,对这些日志数据进行统计分析,从而可以获取用户的搜索行为特征,可以把用户的行为特征进行关联,从而能得到用户搜索行为的历史轨迹,这些用户搜索行为的历史轨迹为用户评分预测精度的提高起到了一定的影响力。由于日志的数据比较大,本文是采用Hadoop框架来开展研究的。提出了一种新的推荐方法将评论中的隐含内容与用户的打分,用户的日志信息统计后的数据相结合,设计了一种新的电影的推荐模型,首先利用主题挖掘将文本中隐含的主题分布找出来,然后利用主题分布来刻画出用户的偏好和电影的画像,结合用户的历史足迹的统计和BSI情感预测来构建一个评分预测模型,然后基于逻辑斯蒂回归模型上训练主题与用户的打分之间的内在联系,该算法丰富了推荐数据的信息,可以有效的缓解当用户冷启动时,推荐系统中打分稀疏的问题。然后利用真实的数据来进行实验对比,从实验的数据来验证这个模型。
[Abstract]:In recent years , the rapid development of Internet has become more and more convenient and faster . With the emergence of new multimedia social platform , the exchange of the new multimedia social platform is increasing day by day .

【学位授予单位】:河南科技大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1

【参考文献】

相关期刊论文 前10条

1 朱扬勇;孙婧;;推荐系统研究进展[J];计算机科学与探索;2015年05期

2 陈诚;战荫伟;李鹰;;基于网页链接分类的PageRank并行算法[J];计算机应用;2015年01期

3 曹姗姗;王冲;;基于网页链接与用户反馈的PageRank算法改进研究[J];计算机科学;2014年12期

4 刘健;刘奕群;马少平;张敏;茹立云;张阔;;搜索引擎用户行为与用户满意度的关联研究[J];中文信息学报;2014年01期

5 韩忠明;张玉沙;张慧;万月亮;黄今慧;;有效的中文微博短文本倾向性分类算法[J];计算机应用与软件;2012年10期

6 代大明;王中卿;李寿山;李培峰;朱巧明;;基于情绪词的非监督中文情感分类方法研究[J];中文信息学报;2012年04期

7 张剑峰;夏云庆;姚建民;;微博文本处理研究综述[J];中文信息学报;2012年04期

8 庞磊;李寿山;周国栋;;基于情绪知识的中文微博情感分类方法[J];计算机工程;2012年13期

9 王中卿;李寿山;朱巧明;李培峰;周国栋;;基于不平衡数据的中文情感分类[J];中文信息学报;2012年03期

10 徐群岭;;一种新型的中文文本情感计算模型[J];计算机应用与软件;2011年06期

相关硕士学位论文 前2条

1 郭伟;网络电影评论的情感挖掘分析[D];吉林大学;2010年

2 崔宝今;基于半监督和主动学习的蛋白质关系抽取研究[D];大连理工大学;2008年



本文编号:1822312

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1822312.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3a9e6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com