当前位置:主页 > 科技论文 > 软件论文 >

基于混合卡方统计量与逻辑回归的文本情感分析

发布时间:2018-04-15 09:40

  本文选题:卡方统计量 + 特征提取 ; 参考:《计算机工程》2017年12期


【摘要】:针对文本情感分析中基于卡方统计量的特征提取方法容易忽略单个文本词频,导致文本分类准确率较低的问题,提出一种基于混合卡方统计量的特征提取方法。通过增加特征频率、逆文档频率和负相关性指标,选出集中在某个特定类别中的特征词,从而减少特征负相关性的干扰。采用基于随机梯度下降的逻辑回归方法进行文本情感分类,并利用模拟退火原理自适应选择步长,解决随机梯度下降算法中步长难以确定的问题。实验结果表明,与基于卡方统计量的特征提取方法相比,该方法具有更高的文本情感分类质量。
[Abstract]:Aiming at the problem that the feature extraction method based on chi-square statistics in text emotion analysis is easy to ignore the frequency of a single text, which leads to the low accuracy of text classification, a feature extraction method based on mixed chi-square statistics is proposed.By increasing the feature frequency, the inverse document frequency and the negative correlation index, the feature words concentrated in a particular category are selected to reduce the interference of the feature negative correlation.The text emotion classification is carried out by using the logical regression method based on stochastic gradient descent, and the step size is adaptively selected by the simulated annealing principle to solve the problem that the step size is difficult to determine in the stochastic gradient descent algorithm.The experimental results show that compared with the chi-square statistics based feature extraction method, this method has higher text emotional classification quality.
【作者单位】: 江南大学物联网工程学院;
【基金】:国家自然科学基金(61572238) 江苏省杰出青年基金(BK20160001)
【分类号】:TP391.1

【相似文献】

相关期刊论文 前4条

1 魏立力;韩崇昭;;基于卡方统计量的属性约简新方法[J];计算机仿真;2007年05期

2 俞庆生;;基于云平台的逻辑回归模型构建算法的设计与实现[J];科技通报;2013年06期

3 邢秋菊,赵纯勇,高克昌,郭跃;基于GIS的滑坡危险性逻辑回归评价研究[J];地理与地理信息科学;2004年03期

4 王贤;张自力;;基于逻辑回归的案件关联[J];西南师范大学学报(自然科学版);2009年03期

相关会议论文 前1条

1 陈宗翰;孟捷;;卡方统计量在建立地理编码地址关键词库中的应用[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年

相关博士学位论文 前8条

1 易军;人脸识别中的特征提取与度量学习算法研究[D];北京邮电大学;2015年

2 陈超;复杂光照条件下的人脸识别方法研究[D];浙江大学;2016年

3 苗捷;时空特征提取方法研究[D];华南理工大学;2016年

4 谭文学;基于机器学习的作物病害图像处理及病变识别方法研究[D];北京工业大学;2016年

5 彭艺;面向可视化的特征提取、简化与追踪[D];清华大学;2015年

6 王胜;基于子空间的特征提取与融合算法研究[D];南京理工大学;2016年

7 杜建卫;希尔伯特黄变换方法及其在特征提取中的应用研究[D];北京科技大学;2017年

8 王振宇;面向人脸识别的特征提取技术应用研究[D];东南大学;2016年

相关硕士学位论文 前10条

1 姚海英;中文文本分类中卡方统计特征选择方法和TF-IDF权重计算方法的研究[D];吉林大学;2016年

2 伊瑶瑶;基于Hadoop的数据挖掘技术研究[D];南京邮电大学;2015年

3 刘鹏举;基于判别学习的单目标跟踪系统研究与实现[D];哈尔滨工业大学;2016年

4 董书超;基于逻辑回归模型的广告点击率预估系统的设计与实现[D];哈尔滨工业大学;2016年

5 张斌;智能推送平台的设计与实现[D];西安电子科技大学;2015年

6 王鹏;基于逻辑回归与GIS的青海省尖扎县区域滑坡危险性评价[D];中国地质大学(北京);2017年

7 祁全昌;基于内容广告平台的点击率预估系统的设计与实现[D];南京大学;2012年

8 刘力银;基于逻辑回归的推荐技术研究及应用[D];电子科技大学;2013年

9 周建成;存在“就是”句子的句间关系识别研究[D];杭州电子科技大学;2015年

10 汤鹏;基于LDA的特征提取及其在人脸识别中的应用[D];河北大学;2015年



本文编号:1753592

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1753592.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7249b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com