基于混合高斯分布伪样本生成的情感分析方法
本文关键词:基于混合高斯分布伪样本生成的情感分析方法,由笔耕文化传播整理发布。
【摘要】:针对微博行文自由性大,情感倾向识别困难的问题,提出了一种基于混合高斯分布伪样本生成技术和条件随机场模型的新方法。该方法首先利用混合高斯分布模型来为训练集中的少数类生成伪样本从而构建一个情感倾向分布平衡的训练集,然后通过使用Word2vec来扩展微博句子以丰富它的情感信息,从而缓解情感词典不足够大对情感分类的负面影响;最后将条件随机场模型应用在上面已经平衡和扩展后的训练集上.实验结果表明该方法比现有方法在数据集情感倾向分布不平衡时能更有效地识别微博的情感倾向.
【作者单位】: 广东工业大学计算机学院;
【关键词】: 情感分析 混合高斯分布 条件随机场 情感倾向 不平衡性 Wordvec
【基金】:国家自然科学基金资助项目(61472089,61572143)
【分类号】:TP391.1
【正文快照】: 微博作为一个新的社交平台,承载了海量的信息,如何有效分析和挖掘用户微博中的情感是非常有意义的[1].与传统的情感分析工作一样,对微博的情感分析方法可以分为两类.一类是基于情感词典和规则的方法,这类方法通过计算句子中负面情感词和正面情感词的个数来识别情感倾向[2-6].
【相似文献】
中国期刊全文数据库 前10条
1 刘玉超;马于涛;张海粟;陈桂生;;高阶高斯分布迭代的云模型及其数学性质研究[J];电子学报;2012年10期
2 邵叶秦;任明武;杨静宇;;基于多高斯分布的背景生成算法[J];计算机工程;2008年13期
3 G.Eranna ,D.Kakali ,肖辉扬;硅中磷扩散的工艺模拟试验——一种新的模型[J];微电子学;1985年01期
4 周宏潮,朱炬波,王正明;混合泊松-高斯分布模型的参数估计[J];中国空间科学技术;2005年02期
5 袁少锋;王士同;;基于多元混合高斯分布的多分类人脸识别方法[J];计算机应用研究;2013年09期
6 曾华;;基于混合高斯分布的红外人脸分割研究[J];长江工程职业技术学院学报;2011年02期
7 ;数据处理、信息处理[J];电子科技文摘;1999年06期
8 ■晓平;;散粒噪声分布探讨[J];光通信研究;1986年02期
9 季铎;王智超;蔡东风;张桂平;;基于高斯分布的簇间距离计算方法[J];中文信息学报;2008年03期
10 李朝伟;王宏强;黎湘;庄钊文;;多个斯威林4型目标输出信号近似服从高斯分布研究[J];电子与信息学报;2006年02期
中国重要会议论文全文数据库 前3条
1 孙浩军;孔令俊;刘志辉;;利用高斯分布生成数据对聚类算法的比较[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
2 王华;程侃;;逆高斯分布在可靠性中的应用[A];2001年全国数学规划及运筹研讨会论文集[C];2001年
3 蒲克塞;郭承军;;基于混合高斯包络法的伪码-载波偏离度监测器门限设计[A];第四届中国卫星导航学术年会论文集-S5 卫星导航增强与完好性监测[C];2013年
中国博士学位论文全文数据库 前1条
1 林祥涛;上下文认知计算技术研究[D];北京邮电大学;2010年
中国硕士学位论文全文数据库 前9条
1 李思明;基于复合高斯模型的杂波统计分析与建模[D];哈尔滨工业大学;2015年
2 吴安勤;基于EM估计的正态逆高斯分布下中国股票收益率分布研究[D];南京大学;2014年
3 冯晓利;单峰高斯分布适应面上准物种演化的研究[D];郑州大学;2006年
4 王淑华;逆高斯分布输入下的Integrate-and-Fire模型[D];湖南师范大学;2008年
5 邓立凤;逆高斯分布参数的Bayes 估计研究[D];广西师范学院;2010年
6 周佩;基于高斯分布的率失真优化方法[D];西安电子科技大学;2012年
7 王刚;基于多变量亚高斯分布模型的图像检索的研究[D];扬州大学;2013年
8 张萌;对影响视频精确跟踪因素的研究及跟踪模式的优化[D];宁波大学;2012年
9 李淑娟;高斯分布声子腔对半导体纳米线中声子输运影响的研究[D];湖南大学;2010年
本文关键词:基于混合高斯分布伪样本生成的情感分析方法,由笔耕文化传播整理发布。
,本文编号:476192
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/476192.html