面向社交媒体的文本情感分析关键技术研究
本文关键词:面向社交媒体的文本情感分析关键技术研究 出处:《大连理工大学》2016年博士论文 论文类型:学位论文
更多相关文章: 情感分析 观点挖掘 属性抽取 话题发现 话题摘要
【摘要】:近年来社交媒体蓬勃且迅速的发展,使其成为了全世界最大规模的公共数据源。文本作为社交媒体中一种重要的信息载体,有着指数级增长趋势且蕴含着极其丰富的研究与商业价值。文本情感分析作为分析文本的主要技术之一,可作为分析社交媒体文本的必要手段及技术支持,因此面向社交媒体文本的情感分析技术应运而生。面向社交媒体文本的情感分析主要包含情感信息检索、情感信息抽取、情感分类、情感归纳四大任务,实现对用户在各种网络平台中所表达观点、倾向等主观性文本进行分析与挖掘,进而获取用户所生成文本的倾向性和话题等重要信息,以辅助不同用户、研究者、商业组织及政府机构的决策需要。本文结合社交媒体文本情感分析的任务,分别从如下几个方面进行了创新性研究,具体完成的工作主要包括:1、针对社交媒体文本中的关键信息抽取问题,本文研究了如何从产品评论语料中准确且高效地抽取产品属性的信息,提出了将同一句子内部的局部信息与不同句子间的全局信息进行融合的方法,实现了对产品评论语料中的产品属性抽取;然后在依据其重要性对产品属性加以归并及排序,从而发现产品中的重要属性。实验结果表明本文提出的融合全局信息与局部信息的产品属性抽取方法适用于产品属性抽取任务,并能在一定程度上提高产品属性抽取的精度。2、针对社交媒体中文本情感复杂多样的特点,本文研究了如何将认知思维模式引入社交媒体文本情感分析中,并用于指导情感分类任务。对于不同民族和区域所存在的思维模式差异现象,及其所引发的语言与情感表达的多样化问题,本文提出了度量思维模式差异的具体模型,并利用思维模式差异模型来指导社交媒体文本情感分类,分别以中英文语料作为实验对象,实验结果表明在中英文语料中考虑各自思维模式特点有助于提高社交媒体文本情感分类的精度。3、针对社交媒体平台中层出不断的热点事件,本文研究了如何从海量微博信息中发现热点事件,并以新浪微博作为研究对象。依据当微博平台中热点事件出现时,用户的情感发生波动,所发微博中情感词数量增多的现象,提出了情感分布语言模型。通过分析相邻时段间情感分布语言模型的差异,实现了对微博平台中热点事件的发现。实验结果表明本文提出的方法可以有效地从微博平台中发现热点事件,并且有助于对微博平台中热点事件的管理和监控。4、针对社交媒体平台中的海量信息缺乏归纳的问题,本文以新浪微博作为研究对象,提出了一种基于权重量化的微博热点事件摘要生成方法。该方法融合微博信息熵、话题的重要性及微博在话题中的重要性等因素,并以话题中转发度最高的微博为中心,结合停用词比例及与中心微博的编辑距离等统计特征对候选微博进行排序,从而完成热点事件摘要生成的任务。在新浪微博数据集上的实验结果表明本文提出的方法可有效地对微博平台中的热点事件进行摘要生成,可以用于对新浪微博平台中的热点事件摘要生成与监管。
[Abstract]:In recent years the development of social media vigorously and rapidly, which has become the world's largest public data source. The text of social media as an important carrier of information, has a research and commercial value of exponential growth trend and contains an extremely rich text sentiment analysis. As one of the main technical analysis of the text, can as a necessary means to analyze the social media text and technical support, so the social media text sentiment analysis technology came into being. For social media text sentiment analysis mainly includes emotion information retrieval, emotional information extraction, sentiment classification, emotion induction four tasks, implementation of the views of users expressed in a variety of network platform, tendency subjective text analysis and mining, and then obtain a user generated text orientation and topic and other important information, for different users, the researchers, Commercial organizations and government agencies. This paper analyzes the decision-making needs of social media text emotional tasks respectively from the following aspects of innovative research, the specific work includes: 1, aiming at the key problem of information extraction of social media in the text, this paper studies how to from the product review corpus accurately and efficiently extract the product attribute information, put forward a fusion method of global information of local information within the same sentence and between sentences, the realization of product attribute extraction of product reviews in the corpus; then on the basis of the importance of product attributes to merge and sort, and found an important attribute in the product. The experimental results show that the product attribute extraction based on fusion of global information and local information is proposed in this paper is applicable to the task of product attribute extraction, and can increase the yield to a certain extent The accuracy of the.2 product attribute extraction, according to the text of social media emotional complex characteristics, this paper studies how the cognitive thinking mode into the analysis of social media sentiment, and used to guide the sentiment classification task. For different modes of thinking in different ethnic and regional phenomenon, language and emotional expression of a variety of problems and causes, this paper puts forward a concrete model to measure the differences of thinking modes, and the modes of thinking model to guide the social media text sentiment classification, respectively in the English corpus as the experimental object, the experimental results show that in the English corpus consider their mode of thinking features helps to improve the accuracy of.3 social media text sentiment classification, according to the social media platform middle out hot events continuously, this paper studies how to find the hot events from the mass of information to Sina and micro-blog. Micro-blog as the research object. Based on the micro-blog platform when hot events occur, users emotional fluctuations, the number of emotional words in micro-blog increased phenomenon, proposed the emotional language distribution model. Through the analysis of differences between adjacent time emotional distribution language model, the hot events found in the micro-blog platform. The experimental results show that the proposed method can effectively detect hot events from the micro-blog platform, and contribute to the hot events in the micro-blog platform of monitoring and management of.4, according to the massive information social media platform under the lack of problems, this paper takes Sina and micro-blog as the research object, put forward a kind of micro-blog hot events abstractionbased the weight of quantization based on information entropy method. The fusion of micro-blog and micro-blog, the importance of topic in the topic of the importance of other factors, and the topic of transmitting the highest degree Micro-blog as the center, with the stop words and micro-blog ratio and the edit distance and other statistical characteristics to rank micro-blog, thus completing the task of generating hot events. In the Sina micro-blog data sets. The experimental results show that the proposed method can be effectively used in the hot events in the micro-blog platform can be used to produce a summary. The generation of hot events and supervision of sina micro-blog platform.
【学位授予单位】:大连理工大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 许璐蕾;;网络评论中情感词的获取及极性判断方法比较[J];电脑与电信;2011年01期
2 肖健;徐建;朱姝;万缨;许亮;;基于翻译和语义方法的情感词挖掘研究[J];计算机工程与应用;2011年32期
3 赵鹏;赵志伟;卓景文;;一种情感词语义加权的句子倾向性识别方法[J];计算机工程与应用;2011年35期
4 代大明;李寿山;李培峰;朱巧明;;基于情绪词与情感词协作学习的情感分类方法研究[J];计算机科学;2012年12期
5 李勇敢;周学广;孙艳;张焕国;;结合依存关联分析和规则统计分析的情感词库构建方法[J];武汉大学学报(理学版);2013年05期
6 彭庆喜;钱铁云;;基于量化情感的网店垃圾评论检测[J];山东大学学报(理学版);2013年11期
7 杜嘉忠;徐健;刘颖;;网络商品评论的特征 情感词本体构建与情感分析方法研究[J];现代图书情报技术;2014年05期
8 张清亮;徐健;;网络情感词自动识别方法研究[J];现代图书情报技术;2011年10期
9 黄俊;田生伟;禹龙;冯冠军;;基于维吾尔语情感词的句子情感分析[J];计算机工程;2012年09期
10 孙劲光;马志芳;孟祥福;;基于情感词属性和云模型的文本情感分类方法[J];计算机工程;2013年12期
相关会议论文 前5条
1 陈奇哲;刘全升;姚天f ;;汉语意见型语句主题与情感关系抽取的研究[A];第五届全国信息检索学术会议论文集[C];2009年
2 孙慧;关毅;董喜双;;中文情感词倾向消歧[A];第六届全国信息检索学术会议论文集[C];2010年
3 段秀婷;何婷婷;宋乐;;基于PMI-IR算法的Blog情感分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
4 李先斌;袁平波;俞能海;;基于局部最优的情感标签图像自动标注算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
5 王枞;涂序彦;刘嘉;;注意-情绪协调的个性化信息推荐模型[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
相关博士学位论文 前9条
1 刘全超;面向中文微博的观点挖掘与倾向性分析研究[D];北京理工大学;2015年
2 江腾蛟;基于句法和语义挖掘的Web金融评论情感分析[D];江西财经大学;2015年
3 董喜双;基于免疫多词主体自治学习的情感分析研究[D];哈尔滨工业大学;2013年
4 寇广增;基于意见挖掘通用框架的情感极性强度模糊性研究[D];武汉大学;2010年
5 杨玉珍;基于Web评论信息的倾向性分析关键技术研究[D];山东师范大学;2014年
6 黄胜;Web评论文本的细粒度意见挖掘技术研究[D];北京理工大学;2014年
7 施寒潇;细粒度情感分析研究[D];苏州大学;2013年
8 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
9 李芳;面向中文Web评论的观点挖掘关键技术研究[D];华中师范大学;2013年
相关硕士学位论文 前10条
1 孙博;关于情感词的意义用法[D];辽宁大学;2012年
2 王银;中文微博情感分析方法研究[D];广东技术师范学院;2015年
3 崔连超;互联网评论文本情感分析研究[D];山东大学;2015年
4 杜雪峰;藏文句子倾向性分析研究[D];中央民族大学;2015年
5 孙建超;微博舆情挖掘技术的研究与应用[D];电子科技大学;2015年
6 张圣声;基于微博平台的产品评论情感分类研究[D];广东外语外贸大学;2015年
7 何天翔;基于情感词网的短文本情感分类方法研究[D];西南科技大学;2015年
8 丁星;基于文本倾向性分析技术的微博监控系统[D];江苏科技大学;2015年
9 李茜;博客意见检索关键问题研究[D];北京理工大学;2015年
10 李瑞静;汉语情感词模糊语义的量化分析及应用研究[D];北京理工大学;2015年
,本文编号:1378420
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1378420.html