基于内容分析的评论组织方法研究
本文关键词:基于内容分析的评论组织方法研究
更多相关文章: 评论组织 评论质量评估 评论选择 评论摘要生成
【摘要】:随着电子商务的快速发展及其对信息交互的支持,用户评论数据与日俱增。商品评论通常包括一个数字评分和一段非结构化的文字描述。其中,数字评分反映了评论商品的总体评价,而评论文本则提供更为详细的商品属性描述信息。评论内容是从用户角度出发对商品的评价,如用户使用商品或体验服务后的感受,所以评论内容所传达的信息是决定用户消费行为的关键因素之一。商家试图通过评论为商品打口碑、找问题;消费者则阅读评论来全面了解商品。因此,对评论数据的收集、整理和分析逐渐成为电子商务网站的一项重要工作。然而,由于移动终端和无线网络的普及,评论数据的生成已不受时间和空间约束,导致评论数量呈爆炸式增长;同时,移动设备的出现对评论处理任务提出更高的要求,即处理结果要精简。面对海量的评论数据,为了提高评论信息的利用率,如何分析和组织评论内容是亟待解决的问题。有效组织评论内容不仅可以解决信息过载的问题,还能提高用户体验从而增强电子商务网站的可用性。当前的评论组织方法通常根据评论质量选择top-K条评论作为结果集呈现给用户。可以从商品属性覆盖度和观点分布一致性这两方面来评估评论质量。但现有方法并未区分top-K评论集中属性的重要性,也没考虑其中观点的多样性。因此本文提出基于属性重要程度的代表性评论集生成方案,令生成的结果集质量高且观点丰富。此外,已有工作通常把每条评论与单件商品关联起来,即默认一条评论只针对一件商品。对类似餐馆的应用场景而言,现有代表性评论集生成方案存在粒度较粗的缺点。单条餐馆评论可能涉及多道菜,用户更希望看到基于菜的评论组织结果。为从评论集中生成每件单品的评论摘要,本文首次提出针对评论包含多件商品的解决方案。以单品为中心为评论集中每件单品生成评论摘要,包括总体评分和K条最能代表这件商品的评论短语。本文主要针对以下两大问题展开研究:·评论质量评估和top-K评论集生成技术1.首先,提出一种衡量商品属性重要性的方法,计算属性对应权重。通过加入属性重要性这一因素,提高评估评论质量的准确度。2.然后,介绍一种基于聚类的评论多样性评估方法,该方法根据属性观点上的分布对评论进行聚类。3.接着,设计一种多样化算法从不同类中按比例地选择评论,使最终选择的top-K条评论能覆盖更多属性的观点,反映商品评论集中的观点分布。4.最后,从网络购物网站爬取商品评论数据进行实验,验证本文top-K评论评估与选择方案的有效性。·以单品为中心的评论摘要生成技术1.首先,提出一种判断评论短语是否包含用户观点的方法。该方法基于非监督学习,根据评论短语中N元词串的信息熵对评论短语进行分类。2.然后,设计三种挖掘评论短语观点的方法,通过评论的整体评分来预测其中每条有观点短语的对应评分,并以此作为评论短语的观点。根据商品相关评论短语的评分,可以进一步得到一个商品评分。3.接着,介绍两种多样化算法分别从按观点以及按属性观点聚合的类中选择评论短语作为评论摘要,使最终选择的K条评论短语能达到商品属性和用户观点的多样化。4.最后,从在线评论网站爬取餐馆评论数据进行实验,验证本文以单品为中心的评论摘要生成方案的有效性。
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:F724.6;TP393.092
【相似文献】
中国期刊全文数据库 前10条
1 孙瑞英;网络数据内容分析研究[J];图书馆学研究;2005年05期
2 任立肖,沙勇忠;网络内容分析研究[J];情报理论与实践;2005年05期
3 陆冰鑫;;《中国图书商报》广告内容分析[J];新闻世界;2011年09期
4 启之,,区永峻;电视:内容分析[J];现代传播-北京广播学院学报;1995年05期
5 庞旭;;报纸官方微博发展研究[J];新闻世界;2014年02期
6 邱均平;柴雯;;我国社会标签研究进展内容分析[J];图书馆论坛;2014年07期
7 邬友倩;;内容分析的概念框架新探[J];现代情报;2007年12期
8 周培勤;薛飞;;“绿色”广告的“灰色”地带——广告的环保诉求内容分析[J];新闻与传播研究;2010年01期
9 朱向霞;;内容分析方法[J];新闻研究资料;1992年01期
10 余红;新闻内容分析的信度和效度[J];华中科技大学学报(社会科学版);2004年04期
中国重要会议论文全文数据库 前10条
1 彭璐珞;彭泗清;;看不见的市场——有关“小广告”的报道和评论的内容分析[A];中国市场学会2006年年会暨第四次全国会员代表大会论文集[C];2006年
2 钟娟;陈会昌;刘力;;博客的自我表露初探[A];第十一届全国心理学学术会议论文摘要集[C];2007年
3 毕雪梅;;“人文奥运”报道的网络媒体内容分析[A];第七届全国体育科学大会论文摘要汇编(一)[C];2004年
4 夏琼;陈敏利;;艾滋病媒体报道内容分析——基于湖北省2008年艾滋病媒体报道环境监测[A];第四届中国健康传播大会优秀论文集[C];2009年
5 王芳;;媒介棱镜下的“80后”形象——对2003-2011年国内报纸上“80后”报道的内容分析[A];科学发展·惠及民生——天津市社会科学界第八届学术年会优秀论文集(上)[C];2012年
6 吴贻刚;谢丹霞;吕和武;;改革开放30年中国教练员研究状况的调查与分析[A];第九届全国体育科学大会论文摘要汇编(3)[C];2011年
7 徐煜;;自杀行为何以被媒介建构?一项针对国内新闻网站自杀报道的内容分析研究[A];第八届中国健康传播大会优秀论文集[C];2013年
8 张琳琳;李朝旭;;大学生爱的原型初探[A];第十一届全国心理学学术会议论文摘要集[C];2007年
9 黄雨晴;王乃考;;官网新闻对高校品牌形象塑造的实证研究——厦门大学嘉庚学院十年官网新闻的内容分析[A];2013福建省传播学年会论文集[C];2013年
10 刘美婷;宋广文;李朝旭;;大学生“仁”概念的原型初探[A];中国社会心理学会2008年全国学术大会论文摘要集[C];2008年
中国硕士学位论文全文数据库 前10条
1 邬友倩;内容分析的方法论视角新探[D];华东师范大学;2007年
2 李宁;金融服务业报纸广告内容分析[D];厦门大学;2006年
3 徐沛;文革后报纸照片中女性地位的内容分析[D];四川大学;2002年
4 杨刚;台湾媒体对核四议题的审议式报道研究[D];西北大学;2013年
5 刘金梅;我国老年报对老年人形象的再现研究[D];新疆大学;2010年
6 邵方超;我国主流报刊对“住房议题”报道的内容分析[D];山东大学;2011年
7 金颖;中国科技类报纸转基因报道内容分析[D];湖南师范大学;2011年
8 张萍;一念之差现象的心理学研究[D];曲阜师范大学;2013年
9 余文U
本文编号:1227993
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1227993.html