当前位置:主页 > 科技论文 > 软件论文 >

基于文本分析的在线图书评论质量研究

发布时间:2022-02-12 13:45
  随着大数据时代的到来,越来越多的人通过互联网分享自己的观点和想法,用户在线评论数量呈指数型爆发,评论的控制和利用成为当前网络平台面临的重要考验。一个有效的网络评论管理系统应当具备以下两方面的功能:帮助用户快速的从海量数据中得到有用信息和帮助平台合理有效的管理和利用用户评论。评论质量评估作为自然语言处理的一个分支,成为网络评论管理系统的重要组成部分。评论质量评估即寻找可衡量评论质量的指标,根据相应指标对评论质量进行量化,进而可以根据质量高低将评论进行过滤、排序等更多处理,识别出质量较高的评论,使得阅读评论的人能够在海量评论中快速获取有价值的信息。对非商业化图书交流平台进行评论质量评估,一方面,有助于识别出高质量评论,使读者更加快速高效地发现有价值的评论,协助其选择适合自己的、更优质的书籍。另一方面,能够改进图书门户网站的现有评论展示功能,改善网站的服务质量,提高用户体验度。本文面向非商业化图书平台的用户评论进行了质量评估研究。首先分析了非商业化图书平台的特点,结合中文表达方式的特殊性,构建了一套适用于该类型平台的WDC在线评论质量评价指标体系,然后以该指标为基础分析了使用支持向量机方法、... 

【文章来源】:山东大学山东省211工程院校985工程院校教育部直属院校

【文章页数】:52 页

【学位级别】:硕士

【部分图文】:

基于文本分析的在线图书评论质量研究


图1.2用户在线评论研宄现状示意图??1.情感分析??

整体框架,论文


需要在文本型评论中提取的指标有:评论长度、平均句长、相关性、??饰词数量、情感词数量和可读性指标。??2.构建在线评论质量评价指标体系。根据现有研宄中的数据质量描述体豆瓣读书的评论特点,提出本文的WDC评论质量评价指标体系。??3.建立模型。根据获得的WDC评价指标体系,将评论数据按一定比例划训练集和测试集,分别用SVM、逻辑回归方法建立在线评论质量评价模型。??4.模型分析。首先从查准率、召回率、F值、准确率四个方面分别对SVM、??辑回归方法的分类效果进行了评价。然后利用随机森林的特征排序能力,对的指标进行了重要度排序,分析其影响力。最后对模型整体效果进行了总.2论文整体结构??本文的整体结构包括研究背景及意义、相关研究理论、在线评论质量评价体系及模型构建、实证分析、模型性能评估、总结与展望六部分,如图1.2。本文共分为六章,各章节的主要内容和结构框架如下:??

概率分布,主题,过程,文档


山东大学硕士学位论文??率),W表示每篇文档中的词语数,D表示文档的个数,0?—z,cp?—w都服从??多项式(Multinomial)分布。LDA的概率图可以描述如下:??1.?根据狄利克雷分布Dir(c〇得到每篇文档的主题概率分布0,根据狄利??克雷分布Dir〇?:)得到每个主题下词语的概率分布cp。??2.?对于某篇文档中的第i个词,先从该文档中包含的每个主题的多项式??分布0中抽取一个主题6,再在这个主题对应的词的多项式分布<p中抽??取一个词u^。??3.?重复步骤2,直到D篇文章全部生成完成。??

【参考文献】:
期刊论文
[1]基于个人–群体–商户关系模型的虚假评论识别研究[J]. 余传明,冯博琳,左宇恒,陈百云,安璐.  北京大学学报(自然科学版). 2017(02)
[2]基于Markov逻辑网的虚假评论识别方法[J]. 行娟娟.  中文信息学报. 2016(05)
[3]基于逻辑回归的中文在线评论有效性检测模型[J]. 吴含前,朱云杰,谢珏.  东南大学学报(自然科学版). 2015(03)
[4]基于内容分析的用户评论质量的评价与预测[J]. 聂卉.  图书情报工作. 2014(13)
[5]基于层次结构的多策略中文微博情感分析和特征抽取[J]. 谢丽星,周明,孙茂松.  中文信息学报. 2012(01)
[6]基于中文分词和词频统计的图书在线评论文本分析[J]. 张丽,张蕾,张阳,戢妍.  信息系统工程. 2011(07)
[7]图书领域消费者在线评论的有用性影响因素研究[J]. 孙文俊,薛博召.  江苏商论. 2011(05)
[8]汉语语句主题语义倾向分析方法的研究[J]. 姚天昉,娄德成.  中文信息学报. 2007(05)

硕士论文
[1]基于意图特征的评论质量分析与建模方法研究[D]. 陆军.苏州大学 2013



本文编号:3621829

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3621829.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户00ca6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com