一种主动学习和协同训练相结合的半监督微博情感分类方法
本文关键词:一种主动学习和协同训练相结合的半监督微博情感分类方法
【摘要】:【目的】针对微博情感分类时未标注样本多和已标注集少的问题,提出一种新的方法。【方法】在协同训练算法的基础上引入主动学习思想,从低置信度样本中选取最有价值的、信息含量大的,提交标注,标注完后添加到训练集中,重新训练分类器进行情感分类。【结果】使用不同的数据集进行实验,实验结果表明该方法所构建的分类器性能优于其他方法,分类准确率明显提高。特别是在已标注样本占40%的情况下,提升5%左右。【局限】在协同训练过程中使用随机特征子空间生成方法不能保证每次构建的两个分类器都是强分类器,因此未能充分地满足协同训练的假设条件。【结论】引入主动学习思想后,能够解决协同训练对低置信度样本处理的不足,进而增强分类器性能,提高分类准确率。
【作者单位】: 昆明理工大学艺术与传媒学院;云南财经大学信息学院;云南财经大学信息管理中心;
【关键词】: 协同训练 主动学习 情感分类
【基金】:云南省哲学社会科学规划基金项目“微博用户影响力模型研究”(项目编号:QN2014071)的研究成果之一
【分类号】:TP393.092;TP391.1
【正文快照】: 1引言随着互联网的快速发展,微博的出现不断地改变着人们的生活方式。由于其强大的影响力和渗透力,越来越多的人喜欢通过微博发表自己的观点和看法。随着微博用户的不断增加,网络上微博数量也越来越多。这些海量文本信息带有明显的情感色彩,具有很高的价值,对其进行情感分析研
【共引文献】
中国期刊全文数据库 前10条
1 程亮;何志浩;李留英;李龙;;中文BBS内容安全监控模型构想[J];情报杂志;2007年12期
2 文能;丁晟春;;商品主观评论信息的倾向性分析综述[J];情报杂志;2010年12期
3 赵妍妍;秦兵;刘挺;;文本情感分析[J];软件学报;2010年08期
4 郗亚辉;张明;袁方;王煜;;产品评论挖掘研究综述[J];山东大学学报(理学版);2011年05期
5 沈凤仙;朱巧明;;基于特征倾向性的网页特征提取方法研究[J];计算机工程与设计;2009年16期
6 王铁套;王国营;陈越;黄惠新;;基于语义模式与词汇情感倾向的舆情态势研究[J];计算机工程与设计;2012年01期
7 王翠波;;基于文本情感挖掘的企业技术竞争情报采集模型研究[J];图书情报工作;2010年14期
8 陈铭;李生红;陈秀真;;基于句式结构的评论倾向性识别方法[J];通信技术;2011年02期
9 朱俭;;文本情感研究综述[J];软件导刊;2012年09期
10 文涛;杨达;李娟;;中文软件评论挖掘系统的设计与实现[J];计算机工程与设计;2013年01期
中国重要会议论文全文数据库 前10条
1 边海容;万常选;李国林;杨莉;;Web金融信息情感倾向与上市公司财务危机的关系研究[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
2 朱宏博;张芊;赵海;宋纯贺;;基于贝叶斯网络英文电影对白的潜在语义分析[A];第八届沈阳科学学术年会论文集[C];2011年
3 ;Comparing Chinese reviews based on Fuzzy PROMETHEE: A new approach to sentiment analysis[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
4 王根;赵军;;中文褒贬义词语倾向性的分析[A];第三届学生计算语言学研讨会论文集[C];2006年
5 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[A];第三届学生计算语言学研讨会论文集[C];2006年
6 姚天f ;聂青阳;李建超;李林琳;娄德成;陈珂;付宇;;一个用于汉语汽车评论的意见挖掘系统[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 李斌;卢俊之;章成志;陈小荷;;基于聚类引擎的话题褒贬度计算[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 倪茂树;林鸿飞;;基于关联规则和极性分析的商品评论挖掘[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 申晓晔;封化民;毋非;;基于语义理解的Web新闻倾向性分析[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
【相似文献】
中国期刊全文数据库 前10条
1 刘敏;谢伙生;;一种基于旋转森林的集成协同训练算法[J];计算机工程与应用;2011年30期
2 胡菊花;姜远;周志华;;一种基于教学模型的协同训练方法[J];计算机研究与发展;2013年11期
3 尹哲峰;崔荣一;;协同训练在教师评估中的应用[J];延边大学学报(自然科学版);2009年02期
4 武永成;;一种基于分类置信度差异性的协同训练算法[J];湖北民族学院学报(自然科学版);2013年01期
5 徐飞裕;徐荣聪;;基于密度敏感距离的协同训练算法[J];计算机应用与软件;2011年09期
6 马蕾;汪西莉;;基于支持向量机协同训练的半监督回归[J];计算机工程与应用;2011年03期
7 詹永照;陈亚必;;具有噪声过滤功能的协同训练半监督主动学习算法[J];模式识别与人工智能;2009年05期
8 谢伙生;刘敏;;一种基于主动学习的集成协同训练算法[J];山东大学学报(工学版);2012年03期
9 李广水;宋丁全;郑滔;李杨;苏继申;;协同训练支持向量机对遥感影像的分类研究[J];计算机工程与应用;2009年29期
10 谢科;;融合协同训练和两层主动学习策略的SVM分类方法[J];湖南师范大学自然科学学报;2014年01期
中国重要报纸全文数据库 前10条
1 文雅 丁猛 王方靖;某部多法并举解决协同训练难题[N];战士报;2008年
2 张新兵 唐廷刚 赵荣;兵种专业“结亲”夯实协同训练基础[N];中国国防报;2009年
3 记者 李学勇 特约记者 代宗锋;赴远海开展协同训练[N];解放军报;2010年
4 杨先富、胡金宝、车益洪;打破建制 协同训练[N];战士报;2012年
5 陈振东 李东生;紧贴使命任务要求砥砺精兵[N];解放军报;2009年
6 王小兴、杨志;总装某测试站协同训练提升试验能力[N];解放军报;2006年
7 苏俊杰、特约通讯员 王宇;一批协同训练课目成重点[N];中国国防报;2006年
8 彭兵根 记者 刘建伟;训练资源重点投向关键节点[N];解放军报;2010年
9 杨申勇 特约记者 唐青松;指挥程序一个不简 “战斗”全程模拟实战[N];战士报;2007年
10 高志群 成立 钱英新;加强科技动员力量培训[N];中国国防报;2010年
中国硕士学位论文全文数据库 前1条
1 魏辉;飞机与船舶协同训练RTI仿真平台的设计与实现[D];沈阳航空航天大学;2013年
,本文编号:613087
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/613087.html