当前位置:主页 > 科技论文 > 软件论文 >

基于描述和用户评论的App应用市场信息挖掘

发布时间:2022-01-22 06:54
  随着移动互联网的不断发展,各类应用市场上出现了种类繁多的各种App,并包含了海量的用户评论信息。提供一个合理的App的分类方案将会方便用户按需选择,从App的评论中发掘用户的需求和反馈,将会帮助App开发者更好地改进服务。本文基于App的描述信息构建了一个新的App功能分类体系,并且从用户的评论中抽取用户观点汇聚出App的评论观点标签并且挖掘出用户的心理需求。以App开发者对App的描述作为语料信息,基于主题模型构建了一个新的App功能分类体系。针对华为应用市场上2万款App,提取出了 12个App功能类别标签,并且得到了每款App在这12个功能标签下的分布。这样的分类体系,可以更全面地展示出App的功能,方便用户按需选用。用户评论中观点的自动提取和聚合是对海量用户评论进行自动分析的关键技术。本文设计了一种基于初始观点词性规则自动迭代发现新的用户观点词性规则的方法,来抽取用户评论观点,比传统的抽取方案能更加全面准确地抽取出用户观点。并设计了一种新的评论观点的聚类方法,对观点按照极性进行汇聚,最终生成每款App正面和负面的用户评论观点标签。按照心理学的观点,用户对App的选择体现了用户的... 

【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校

【文章页数】:71 页

【学位级别】:硕士

【部分图文】:

基于描述和用户评论的App应用市场信息挖掘


图2.?1?Af)p评论条数分布图??6??

示意图,文档,总数,单词


?布场?货疖?道路?高铁??图3.2主题模型示意图??以图3.2为例,该文章包括了三个主题,这三个主题的分布是{教育:0.2,经??济:0.5,交通:0.3},每一个主题下面包含三个单词,以交通为例,在该主题下??的词分布为{飞机:0.1,道路:0.2,高铁:0.7},则这篇文章生成单词高铁的概率就是:??p(高铁|doc)?=?p(交通|doc)?*?p(高铁丨交通)=0.21?(3.1)??主题模型找到了文档的一个层次化的表示方式,将上述过程进行抽象,就可??以得到pLSA[33]模型。pLSA模型的算法模型示意图如图3.3所示。pLSA模型中??一篇文章中的某个词的生成方式:??(1)以先验概率p(di)选择一篇文章di;??10??

示意图,文档,算法模型,总数


?布场?货疖?道路?高铁??图3.2主题模型示意图??以图3.2为例,该文章包括了三个主题,这三个主题的分布是{教育:0.2,经??济:0.5,交通:0.3},每一个主题下面包含三个单词,以交通为例,在该主题下??的词分布为{飞机:0.1,道路:0.2,高铁:0.7},则这篇文章生成单词高铁的概率就是:??p(高铁|doc)?=?p(交通|doc)?*?p(高铁丨交通)=0.21?(3.1)??主题模型找到了文档的一个层次化的表示方式,将上述过程进行抽象,就可??以得到pLSA[33]模型。pLSA模型的算法模型示意图如图3.3所示。pLSA模型中??一篇文章中的某个词的生成方式:??(1)以先验概率p(di)选择一篇文章di;??10??

【参考文献】:
期刊论文
[1]基于句法分析的评价搭配抽取及其倾向性分析[J]. 张铎,朱征宇.  世界科技研究与发展. 2013 (04)
[2]基于词频统计的中文分词的研究[J]. 费洪晓,康松林,朱小娟,谢文彪.  计算机工程与应用. 2005(07)

硕士论文
[1]基于情感词典的中文微博情感倾向分析研究[D]. 陈晓东.华中科技大学 2012



本文编号:3601742

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3601742.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0d3a3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com