当前位置:主页 > 管理论文 > 移动网络论文 >

基于情绪词典扩展技术的中文微博情绪分析

发布时间:2020-07-06 21:28
【摘要】:随着微博等社交媒体在人们生活中的普及,微博对人们的生活和工作产生了很大的影响。因此,微博情绪分析也成为自然语言处理的一个研究热点。现阶段中文微博的情绪分析正处起步阶段,情绪词典是微博情绪分析的重要资源。但现有情绪词典地构建还不够健全,这是造成中文微博情绪分析准确率较低的重要原因之一。因此,本文提出了一种基于词典扩展技术的微博情绪分析,通过在特定语料中对现有情绪词典进行情绪词的扩展和情绪权重的标注,实现对现有情绪词典的扩展,并利用扩展后的情绪词典对该语料进行情绪分析。首先,本文提出了一种情绪词识别的方法,该方法主要是识别语料中未被情绪词典收录,却表达了情绪的词语。利用情绪词典中情绪色彩鲜明的情绪词作为种子情绪词,通过考察候选词与种子情绪词在语料中的相似性来识别候选词中的情绪词。利用识别出的情绪词扩展现有的情绪词典,并使用无监督的规则方法和有监督的支持向量机(SVM)方法进行微博情绪分析。将实验结果与原情绪词典的实验结果进行对比,结果表明,情绪词地扩展有效地改善了词典对微博的覆盖率,并显著地提高了微博情绪分析的准确率。其次,本文对语料中的情绪词进行了加权处理。通过考察情绪词在语料中与各情绪类的共现模式判断情绪词在语料中对情绪的激励程度,利用情绪词对情绪激励程度的差别对情绪词进行加权。实验结果表明,与词典中标注的情绪强度相比,该方法计算的情绪词权重更准确地表示了该词在语料中对情绪表达的作用,有效地提高了微博情绪分析的精度。并且该方法可以有效的综合多个情绪词典的优势,更进一步地提高微博情绪分析的准确率。最后,本文综合了前面两个工作的优势进行了情绪词典扩展。结合种子情绪词的情绪权重进行情绪词的识别,并根据种子情绪词的情绪权重对识别出的情绪词进行了加权处理。使用所生成的情绪词典,利用无监督的规则方法和有监督的支持向量机(SVM)方法进行微博情绪分析,并将实验结果与现有词典以及未加权的语料情绪词进行比较,结果表明,该方法扩展的情绪词典中情绪词具有更鲜明的情绪倾向,进一步提高了微博情绪分析的准确率。
【学位授予单位】:南京航空航天大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1;TP393.092

【相似文献】

相关期刊论文 前10条

1 郑炜冬;;试卷相似度自动评估技术的研究[J];智能计算机与应用;2011年06期

2 赵涛;肖建;;二型模糊相似度及其应用[J];计算机工程与应用;2013年08期

3 徐志明;李栋;刘挺;李生;王刚;袁树仑;;微博用户的相似性度量及其应用[J];计算机学报;2014年01期

4 李桂林,陈晓云;关于聚类分析中相似度的讨论[J];计算机工程与应用;2004年31期

5 秦玉平;杨兴凯;;基于案例推理的区间属性相似度研究[J];辽宁师范大学学报(自然科学版);2006年04期

6 蒋鹏;;基于本体的应急案例相似度算法研究[J];南昌高专学报;2009年03期

7 何亚;;词语相似度算法的分析与改进[J];硅谷;2011年24期

8 仇丽青;陈卓艳;;基于共同邻居相似度的社区发现算法[J];信息系统工程;2014年05期

9 焦鹏;唐见兵;查亚兵;;仿真可信度评估中相似度方法的改进及其应用[J];系统仿真学报;2007年12期

10 姜毅;乐庆玲;;一种基于兴趣相似度的学习社区算法[J];电脑知识与技术(学术交流);2007年16期

相关会议论文 前10条

1 刘海波;郑德权;赵铁军;;基于相似度线性加权方法的检索结果聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

2 陆劲挺;路强;刘晓平;;对比相似度计算方法及其在功能树扩展中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

3 董刊生;方金云;;基于向量距离的词序相似度算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

4 刘晓平;陆劲挺;;任意功能树的物元相似度求解方法[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年

5 王茜;张卫星;;基于分类树相似度加权的协同过滤算法[A];2008年计算机应用技术交流会论文集[C];2008年

6 洪文学;王金甲;常凤香;宋佳霖;刘文远;王立强;;基于图形特征增强的相似度分类器的研究[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(上册)[C];2007年

7 雷庆;吴扬扬;;一种基于语义信息计算XML文档相似度的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

8 叶正;林鸿飞;杨志豪;;基于问句相似度的中文FAQ问答系统研究[A];第三届学生计算语言学研讨会论文集[C];2006年

9 罗辛;欧阳元新;熊璋;袁满;;通过相似度支持度优化基于K近邻的协同过滤算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年

10 王健;刘衍珩;焦玉;;VANETs信任传播建模[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年

相关重要报纸文章 前1条

1 王伽 卫江;出入境证件照片应及时更换[N];中国国门时报;2008年

相关博士学位论文 前10条

1 操震洲;矢量数据动态多尺度网络传输研究[D];南京大学;2015年

2 程亮;基于本体的疾病数据整合与挖掘方法研究[D];哈尔滨工业大学;2014年

3 张明西;信息网络中的相似度搜索问题研究[D];复旦大学;2013年

4 武威;异质数据相似度学习及其在网络搜索中的应用[D];北京大学;2012年

5 朱娜斐;基于RTT相似度的网络延迟估测理论和方法[D];北京工业大学;2012年

6 钱鹏飞;基于模糊相似度的异构本体映射、合并及校验方法的研究[D];上海交通大学;2008年

7 马海平;基于概率生成模型的相似度建模技术研究及应用[D];中国科学技术大学;2013年

8 刘守群;海量网络视频快速检索关键技术研究[D];中国科学技术大学;2010年

9 夏云庆;IHSMTS系统中启发式类比翻译处理机制(HATM)的设计与实现[D];中国科学院研究生院(计算技术研究所);2001年

10 姜雅文;复杂网络社区发现若干问题研究[D];北京交通大学;2014年

相关硕士学位论文 前10条

1 杨巧;基于改进相似度的社会网络链接预测研究[D];华南理工大学;2015年

2 张宁;某于《知网》的词语相似度优化算法[D];昆明理工大学;2015年

3 沈迤淳;歌曲中相似片段的检测及其应用[D];复旦大学;2014年

4 梁霄;社交网络中的社区聚集研究[D];上海交通大学;2015年

5 王魁;在线社交中基于微博的好友推荐系统设计与实现[D];电子科技大学;2015年

6 洪耀停;基于共同作者图的合作者推荐系统[D];浙江大学;2015年

7 褚立超;基于相似度评分模型的人员识别方法研究[D];广西大学;2015年

8 蒲进兴;基于动态相似度的错误定位优先排序[D];北京化工大学;2015年

9 余超;基于Google Map的地理位置查询系统[D];电子科技大学;2014年

10 乌兰;基于动力学行为的复杂网络社区检测研究[D];内蒙古工业大学;2015年



本文编号:2744159

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2744159.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9f8ea***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com