当前位置:主页 > 管理论文 > 客户关系论文 >

基于意见挖掘的网络评论动态分析方法

发布时间:2017-04-03 02:01

  本文关键词:基于意见挖掘的网络评论动态分析方法,由笔耕文化传播整理发布。


【摘要】:近年来,各种基于互联网及移动终端的技术发展使得商业数据不断信息化并向互联网终端汇集。通过数据挖掘,能够将网络商品交易数据充分利用,提供商业决策的关键信息。近来,数据挖掘技术在电商推荐系统、客户关系管理系统等应用中有着相当广泛的应用,也是越来越多管理者采取的新型而高效的业务处理方式。数据挖掘和商务智能结合数据统计分析处理、数据集成、有效信息转化等方法对商品交易数据、用户反馈数据进行搜集,利用相应的机器学习、统计分析和关联规则等技术对数据进行处理,并根据分析结果了解产品的销售信息,确定用户的反馈意见以及用户的观点和情感变化,从而提高市场占有率,提升对市场的响应速度。 当代电商业务发展与数据挖掘的研究着重于将网络商业数据转换成为对业务有用的知识。同时,不断改进数据挖掘的算法,设计出针对具体应用的信息处理系统,得出准确的挖掘结果来表征商业数据中的隐藏知识,也是近年来数据挖掘的热点。 与此同时,互联网也成为人们发布与分享意见、观点的一个重要媒介,意见挖掘技术也广泛地被研究和应用到这些信息资源上。而随着互联网及移动互联的飞速发展,网络交易、评论数据呈爆炸式增长之势。面对如此海量、繁杂及不断更新、动态变化的网络信息资源,传统的文本挖掘技术显然已经不能满足互联网动态内容的高维度、大数据、动态更新处理的要求。 对此,本文以商业领域需求为背景,提出了一种基于意见挖掘的网络评论动态分析方法。这种方法不仅能够对大量的网络评论数据行进动态更新处理,同时能够对用户评论文本进行分解归类,识别用户在不同时间段内对产品相关属性的关注程度,并且自动归纳出用户对于相关属性的情感倾向,得到产品待宣传和改进的属性。同时,能够动态更新挖掘结果,最终将挖掘结果清晰地展示给管理者,使他们了解人们对某个事物的关注热点及看法态度,便于更好地制定商业决策。 本文以时间窗口模型和文本特征提取技术为理论指导。归纳提取产品属性,并对相应属性的情感倾向进行分类总结。实验结果表明本文的方法在动态分析上非常有效。该算法不仅能给出较为准确的分类结果,同时能够动态地反映用户观点的变化,自动识别出值得关注的产品特征信息。
【关键词】:意见挖掘 网络评论 文本特征 情感倾向
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.1
【目录】:
  • 摘要5-6
  • ABSTRACT6-11
  • 第一章 绪论11-19
  • 1.1 研究背景及意义11-13
  • 1.1.1 研究背景11-12
  • 1.1.2 研究意义12-13
  • 1.2 研究现状13-16
  • 1.2.1 国内研究现状13-14
  • 1.2.2 国外研究现状14-16
  • 1.3 论文主要工作和结构安排16-19
  • 1.3.1 论文主要工作16-17
  • 1.3.2 论文结构安排17-19
  • 第二章 文本挖掘技术简介19-29
  • 2.1 文本挖掘概述19-21
  • 2.1.1 文本挖掘基本概念19
  • 2.1.2 文本挖掘流程19-20
  • 2.1.3 文本挖掘技术分类20-21
  • 2.2 文本预处理21-24
  • 2.2.1 特征选择21-23
  • 2.2.2 文本表示23-24
  • 2.3 文本分类算法24-27
  • 2.3.1 简单向量距离分类算法24
  • 2.3.2 K近邻算法24-25
  • 2.3.3 朴素贝叶斯算法25-26
  • 2.3.4 支持向量机(Support Vector Machine)26-27
  • 2.4 文本聚类算法27-28
  • 2.4.1 文本聚类概述27
  • 2.4.2 k-means算法27-28
  • 2.4.3 层次聚类方法28
  • 2.5 本章小结28-29
  • 第三章 意见挖掘与动态网络环境29-35
  • 3.1 意见挖掘的概念与任务29-30
  • 3.2 意见挖掘步骤与意义30-32
  • 3.2.1 意见挖掘具体步骤30-31
  • 3.2.2 意见挖掘的意义31-32
  • 3.3 动态网络环境下的意见挖掘32-34
  • 3.3.1 网络评论的特殊性32-33
  • 3.3.2 意见挖掘技术在动态网络环境下的特征33-34
  • 3.4 本章小结34-35
  • 第四章 网络评论动态分析方法35-49
  • 4.1 方法概述35-37
  • 4.1.1 总体框架36
  • 4.1.2 模块介绍36-37
  • 4.2 评论文本的采集37
  • 4.3 评论文本的预处理37-39
  • 4.3.1 文本的合并及分割38
  • 4.3.2 文本分词及词性标注38-39
  • 4.4 评论文本的特征提取及情感倾向分类39-41
  • 4.4.1 频繁词汇的识别39-40
  • 4.4.2 紧凑型检验和冗余检验40
  • 4.4.3 产品特征-情感倾向组合提取40-41
  • 4.5 评论文本的动态分析41-47
  • 4.5.1 参数和定义41-44
  • 4.5.2 动态意见分析算法及步骤44-47
  • 4.6 本章小结47-49
  • 第五章 实验与分析49-57
  • 5.1 数据来源49
  • 5.2 特征提取分析49-50
  • 5.3 意见演变分析50-55
  • 5.4 本章小结55-57
  • 第六章 总结与展望57-59
  • 6.1 总结57
  • 6.2 展望57-59
  • 参考文献59-63
  • 致谢63-65
  • 在读期间发表的学术论文与取得的其他研究成果65

【参考文献】

中国期刊全文数据库 前8条

1 娄德成;姚天f ;;汉语句子语义极性分析和观点抽取方法的研究[J];计算机应用;2006年11期

2 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期

3 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[J];中文信息学报;2007年01期

4 姚天f ;娄德成;;汉语语句主题语义倾向分析方法的研究[J];中文信息学报;2007年05期

5 徐琳宏;林鸿飞;赵晶;;情感语料库的构建和分析[J];中文信息学报;2008年01期

6 姚天f ;程希文;徐飞玉;汉思·乌思克尔特;王睿;;文本意见挖掘综述[J];中文信息学报;2008年03期

7 刘全升;姚天f ;黄高辉;刘军;宋鸿彦;;汉语意见型主观性文本类型体系的研究[J];中文信息学报;2008年06期

8 刘永丹,曾海泉,李荣陆,胡运发;基于语义分析的倾向性文本过滤[J];通信学报;2004年07期


  本文关键词:基于意见挖掘的网络评论动态分析方法,由笔耕文化传播整理发布。



本文编号:283499

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/kehuguanxiguanli/283499.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9d262***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com