一种基于特征簇的微博短文本情感分类方法
本文关键词:一种基于特征簇的微博短文本情感分类方法
更多相关文章: 微博情感 数据稀疏 词向量 特征簇 机器学习
【摘要】:针对由微博短文本特征规模大、自身特征较少等特点导致的数据稀疏性,提出一种基于特征簇的微博情感分类方法.提出的分类方法以大规模语料库为基础,利用word2vec模型学习词语之间潜在的语义关联,将单个词语表示成多维向量的形式;结合情感词典,提取出微博文本的情感特征集,在基于词向量计算词语相似度方法的基础上,将情感特征合并为特征簇,以此构造低维的文本向量;最后利用机器学习算法,构建情感分类器,实现微博短文本的情感分类.实验结果表明,本文提出的方法对情感特征的降维是可行和有效的,并且取得很好的情感分类效果.
【作者单位】: 广东外语外贸大学思科信息学院;广东外语外贸大学语言工程与计算实验室;广东外语外贸大学财务处;
【关键词】: 微博情感 数据稀疏 词向量 特征簇 机器学习
【基金】:国家社会科学基金项目(12BYY045)资助 广东外语外贸大学研究生科研创新项目(14GWCXXM-36)资助;广东外语外贸大学创新创业训练计划项目(201511846021)资助
【分类号】:TP391.1
【正文快照】: 1引言互联网的蓬勃发展,方便了网民观点的表达与传播,在线文本呈现爆炸式增长.针对主观性文本中所包含的用户观点、情感和情绪等进行分析的研究,已成为自然语言处理技术的一个热点方向.微博往往以短文本形式存在,存在用词随意、文本格式较不规范和表意方式多样等特点,而且由于
【相似文献】
中国期刊全文数据库 前10条
1 张明玉,倪志伟;基于机器学习的智能决策支持系统[J];淮南师范学院学报;2005年03期
2 杨凌霄;武建平;;机器学习方法在人脸检测中的应用[J];计算机与数字工程;2008年03期
3 ;第十一届中国机器学习会议[J];智能系统学报;2008年02期
4 ;第14届中国机器学习会议[J];智能系统学报;2012年06期
5 费宗铭;吕建;王志坚;陈道蓄;徐家福;;机器学习[J];计算机科学;1991年01期
6 赵沁平;魏华;王军玲;;机器学习技术与机器学习系统[J];计算机科学;1993年05期
7 姚敏;机器学习及其发展方向[J];计算机时代;1994年04期
8 ;第31届机器学习国际会议(英文)[J];智能系统学报;2014年01期
9 黄海滨;机器学习及其主要策略[J];河池师范高等专科学校学报(自然科学版);2000年04期
10 佘玉梅;一种协调机器学习方法研究[J];云南民族学院学报(自然科学版);2000年03期
中国重要会议论文全文数据库 前10条
1 王珏;;归纳机器学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年
2 王昊;李银波;纪志梁;;利用机器学习方法预测严重药物不良反应-呼吸困难[A];中国化学会第28届学术年会第13分会场摘要集[C];2012年
3 吴沧浦;;智能系统与机器学习的新领域[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
4 周晴杰;徐立鸿;吴启迪;;机器学习串级结构的初步探讨[A];1998年中国控制会议论文集[C];1998年
5 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
6 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
7 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 黄金铁;李景银;周建常;;对高炉炉况评价模型参数的机器学习——一个三类线性模式分类器的实现[A];1995中国控制与决策学术年会论文集[C];1995年
9 程国建;蔡磊;潘华贤;;核向量机在大规模机器学习中的应用[A];第十一届中国青年信息与管理学者大会论文集[C];2009年
10 张钹;张铃;;统计学习理论及其应用[A];2001年中国智能自动化会议论文集(上册)[C];2001年
中国重要报纸全文数据库 前10条
1 黎骊/文 [美] Tom M.Mitchell 著;机器学习与智能化社会[N];中国邮政报;2003年
2 IBM大数据专家 James Kobielus 范范 编译;机器学习已成为大数据基石[N];网络世界;2014年
3 本报记者 房琳琳;合久必分:分布式“机器学习”应运而生[N];科技日报;2014年
4 雨辰;机器学习类图书为什么火爆[N];中华读书报;2014年
5 百度公司技术副总监 多媒体部负责人 余凯;深度学习与多媒体搜索技术演进[N];中国信息化周报;2013年
6 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年
7 本报记者 张晔邋通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
8 记者 彭德倩;机器学习精度提升近6个百分点[N];解放日报;2006年
9 本报记者 闵杰;大数据热 高端人才缺[N];中国电子报;2013年
10 沈建苗 编译;如何成为大数据科学家[N];计算机世界;2013年
中国博士学位论文全文数据库 前10条
1 董春茹;机器学习中的权重学习与差分演化[D];华南理工大学;2015年
2 姚明臣;机器学习和神经网络学习中的若干问题研究[D];大连理工大学;2016年
3 赵玉鹏;机器学习的哲学探索[D];大连理工大学;2010年
4 胡巍;面向格结构的机器学习[D];上海交通大学;2009年
5 张义荣;基于机器学习的入侵检测技术研究[D];国防科学技术大学;2005年
6 钱线;快速精确的结构化机器学习方法研究[D];复旦大学;2010年
7 梁锡军;稀疏优化在机器学习中的若干应用[D];大连理工大学;2013年
8 蒋刚;核机器学习方法若干问题研究[D];西南交通大学;2006年
9 陈慧灵;面向智能决策问题的机器学习方法研究[D];吉林大学;2012年
10 周伟达;核机器学习方法研究[D];西安电子科技大学;2003年
中国硕士学位论文全文数据库 前10条
1 毛海斌;基于半监督机器学习的情感分类领域适应问题研究[D];南京理工大学;2015年
2 安军辉;基于微博数据的微博用户性别判断研究[D];华中师范大学;2015年
3 陈召阳;基于机器学习的改性麦槽吸附重金属构效关系模型研究[D];江西理工大学;2014年
4 王成;基于半监督机器学习的文本情感分析技术[D];南京理工大学;2015年
5 孙科;基于Spark的机器学习应用框架研究与实现[D];上海交通大学;2015年
6 刘江龙;基于机器学习的射频指纹定位方法研究[D];电子科技大学;2015年
7 张蕾;基于机器学习的网络舆情采集技术研究与设计[D];电子科技大学;2014年
8 施宇;基于数据挖掘和机器学习的木马检测系统设计与实现[D];电子科技大学;2014年
9 施应敏;基于机器学习的Femtocell信道频谱与功率资源分配算法的研究[D];南京邮电大学;2015年
10 张柯;基于机器学习的错误定位方法研究[D];南京航空航天大学;2015年
,本文编号:565851
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/565851.html