用户负面评论对App软件迭代影响研究
发布时间:2021-01-27 18:06
信息技术与人工智能正在潜移默化地改变着人们的生活,智能手机已在学习工作中不可或缺,App软件日益盛行。用户通过下载安装软件后,在应用商店发表评论反馈自己的意见,App软件开发人员会不定期对软件进行迭代,并发布迭代日志。用户的负面评论中蕴含着大量用户需求和对App软件的意见和建议,研究软件开发人员如何利用用户负面评论信息来对App软件进行迭代意义重大。本文通过爬取App软件负面评论和迭代日志信息,提取这些信息中的特征,并根据评论特征强度和日志特征强度定义迭代模式和迭代节,通过计算所有迭代节的迭代有效性和及时性,聚类出五种迭代模式,并对迭代模式进行了系列分析。本文具体研究包括以下内容:(1)分析当前App软件在各大应用商店的现状,编写网络爬虫程序,爬取苹果应用商店免费排名榜前100的App软件的负面评论信息和迭代日志信息,并对原始数据予以统计方面的分析,主要针对不同星级评论数量和迭代数量进行了可视化描述。(2)对原始数据进行了文本预处理,包括垃圾评论过滤、文本分词和文本停用词过滤,并对预处理过后的数据利用主题模型提取特征。定义了迭代模式和迭代节,并描述评论特征和迭代特征强度,给出迭代的有效...
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
图1-1研宄路线图??Fig.?1-1?Research?roadmap??各章节内容如下:??
在文本挖掘领域到学者研。这里“”,话、一段描述、一篇文章讲述的主旨。例如一篇文档主要讲述和“教育”相关的,其主题为“教育”,则在这篇文档中,“学校”、“教师”、“学生”、“学习”等词会频繁出现,而“手机”、“电脑”等词语出现的频率相对较小。??传统判断两个文档是否相似一般看其词语的共现量,当其共现量超过一定时,则认为其相似。但有些文档共同出现的词语并不多,但它们所表达的意思相关的。因此在实际判断文档相关性的时候,考虑内容所要表达的含义同样至要。主题模型就是语义挖掘比较行之有效的方法,经典且较为基础的是LDA模型,LDA模型在实际生活中应用广泛,个性化推荐、社交网站、内容推广域都使用了该模型。??LDA主题模型是根据词袋模型的思想演化发展而来的,它不考虑句法或词序,单纯地把一篇文档当做是由若干个词语随机组合而成,词语两两之间没有关系和先后之分。LDA主题模型认为,文档是某些主题对应的概率分布,主某些词语对应的概率分布,因此就形成了文档-主题-词的三层结构。LDA主题的贝叶斯网络结构图如图2-1所示。??
收集迭代信息时,App软件迭代信息页面主要包括版本号、迭代时间、更新日??志、应用描述等,本文研究应用软件迭代日志信息主要包括前三项。App软件迭代??信息如图3-3所不。??版本:10.1.32?〇?支付宝?让生活更简单??2018?年?09?月?03?日??|?|?赌日志??支H宝最臟舞丨最新麵:??1?.APP新孖级.启劫邏度更铁,???
【参考文献】:
期刊论文
[1]基于改进FOA的SVM参数优化研究[J]. 张前图,曾真真,毛凯,冯明峰,宋振宇. 价值工程. 2016(08)
[2]协同过滤推荐算法研究:考虑在线评论情感倾向[J]. 王伟,王洪伟,孟园. 系统工程理论与实践. 2014(12)
[3]在线评论对应用软件及平台定价策略的影响[J]. 刘洋,廖貅武,刘莹. 系统工程学报. 2014(04)
[4]基于用户行为综合分析的微博用户影响力评价方法[J]. 齐超,陈鸿昶,于洪涛. 计算机应用研究. 2014(07)
[5]基于位置的社交网络用户签到及相关行为研究[J]. 李敏,王晓聪,张军,刘正捷. 计算机科学. 2013(10)
[6]微博信息采集及群体行为分析[J]. 高凯,王九硕,马红霞,周二亮,Radha Ganesan. 小型微型计算机系统. 2013(10)
[7]一种新的中文文本分类算法——One Class SVM-KNN算法[J]. 刘文,吴陈. 计算机技术与发展. 2012(05)
[8]基于LDA特征选择的文本聚类[J]. 张梦笑,王素格,王智强. 电脑开发与应用. 2012(01)
[9]国内中文自动分词技术研究综述[J]. 奉国和,郑伟. 图书情报工作. 2011(02)
[10]高性能网络爬虫:研究综述[J]. 周德懋,李舟军. 计算机科学. 2009(08)
硕士论文
[1]基于统计与词典相结合的中文分词的研究与实现[D]. 周祺.哈尔滨工业大学 2015
[2]文本分类停用词处理和特征选择技术研究[D]. 马治涛.西安电子科技大学 2014
[3]基于用户行为的动态推荐系统算法研究及实现[D]. 赵钕森.电子科技大学 2013
[4]基于情感词典的中文微博情感倾向分析研究[D]. 陈晓东.华中科技大学 2012
[5]基于理解的汉语分词系统的设计与实现[D]. 苏勇.电子科技大学 2011
本文编号:3003499
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
图1-1研宄路线图??Fig.?1-1?Research?roadmap??各章节内容如下:??
在文本挖掘领域到学者研。这里“”,话、一段描述、一篇文章讲述的主旨。例如一篇文档主要讲述和“教育”相关的,其主题为“教育”,则在这篇文档中,“学校”、“教师”、“学生”、“学习”等词会频繁出现,而“手机”、“电脑”等词语出现的频率相对较小。??传统判断两个文档是否相似一般看其词语的共现量,当其共现量超过一定时,则认为其相似。但有些文档共同出现的词语并不多,但它们所表达的意思相关的。因此在实际判断文档相关性的时候,考虑内容所要表达的含义同样至要。主题模型就是语义挖掘比较行之有效的方法,经典且较为基础的是LDA模型,LDA模型在实际生活中应用广泛,个性化推荐、社交网站、内容推广域都使用了该模型。??LDA主题模型是根据词袋模型的思想演化发展而来的,它不考虑句法或词序,单纯地把一篇文档当做是由若干个词语随机组合而成,词语两两之间没有关系和先后之分。LDA主题模型认为,文档是某些主题对应的概率分布,主某些词语对应的概率分布,因此就形成了文档-主题-词的三层结构。LDA主题的贝叶斯网络结构图如图2-1所示。??
收集迭代信息时,App软件迭代信息页面主要包括版本号、迭代时间、更新日??志、应用描述等,本文研究应用软件迭代日志信息主要包括前三项。App软件迭代??信息如图3-3所不。??版本:10.1.32?〇?支付宝?让生活更简单??2018?年?09?月?03?日??|?|?赌日志??支H宝最臟舞丨最新麵:??1?.APP新孖级.启劫邏度更铁,???
【参考文献】:
期刊论文
[1]基于改进FOA的SVM参数优化研究[J]. 张前图,曾真真,毛凯,冯明峰,宋振宇. 价值工程. 2016(08)
[2]协同过滤推荐算法研究:考虑在线评论情感倾向[J]. 王伟,王洪伟,孟园. 系统工程理论与实践. 2014(12)
[3]在线评论对应用软件及平台定价策略的影响[J]. 刘洋,廖貅武,刘莹. 系统工程学报. 2014(04)
[4]基于用户行为综合分析的微博用户影响力评价方法[J]. 齐超,陈鸿昶,于洪涛. 计算机应用研究. 2014(07)
[5]基于位置的社交网络用户签到及相关行为研究[J]. 李敏,王晓聪,张军,刘正捷. 计算机科学. 2013(10)
[6]微博信息采集及群体行为分析[J]. 高凯,王九硕,马红霞,周二亮,Radha Ganesan. 小型微型计算机系统. 2013(10)
[7]一种新的中文文本分类算法——One Class SVM-KNN算法[J]. 刘文,吴陈. 计算机技术与发展. 2012(05)
[8]基于LDA特征选择的文本聚类[J]. 张梦笑,王素格,王智强. 电脑开发与应用. 2012(01)
[9]国内中文自动分词技术研究综述[J]. 奉国和,郑伟. 图书情报工作. 2011(02)
[10]高性能网络爬虫:研究综述[J]. 周德懋,李舟军. 计算机科学. 2009(08)
硕士论文
[1]基于统计与词典相结合的中文分词的研究与实现[D]. 周祺.哈尔滨工业大学 2015
[2]文本分类停用词处理和特征选择技术研究[D]. 马治涛.西安电子科技大学 2014
[3]基于用户行为的动态推荐系统算法研究及实现[D]. 赵钕森.电子科技大学 2013
[4]基于情感词典的中文微博情感倾向分析研究[D]. 陈晓东.华中科技大学 2012
[5]基于理解的汉语分词系统的设计与实现[D]. 苏勇.电子科技大学 2011
本文编号:3003499
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3003499.html