当前位置:主页 > 社科论文 > 新闻传播论文 >

基于SVM模型优化的互联网新闻自动分类研究

发布时间:2020-04-25 11:14
【摘要】:随着科学技术的快速发展,互联网已在各行各业得到广泛应用。大数据时代的到来使人们在获取信息资源的过程中,也会有大量干扰、不良的危害信息,网络信息的恣意传播很容易在获取信息时出现低效率、信息误导等情况。如何对互联网新闻数据进行准确的分类、提高信息的利用率成为了众多科研人员的研究目标。随着人工智能和智能化平台的发展,SVM研究又逐渐变热,重新成为热点。SVM在文本和图像分类等领域都有着较为显著的成果。本文在分析总结新闻自动分类过程中的分词,表示,降维,分类以及结果判定的基础上,着重对降维和分类进行了深入研究。本文主要研究内容如下:(1)针对互联网新闻文本数据量大,冗余数据资源较多不便于使用者查找有效信息等问题,做出以下改进:在数据预处理中,使用线性判别分析(LDA)可以让映射后的样本有最好的分类性能。在LDA进行特征降维之前,先使用单因素方差分析对每个属性与类别进行相关度的分析,将不相关或者相关性较低的特征剔除,再使用LDA在线性变换上将原始数据映射到能够较好区分特征与类别的低维度上,实现数据降维。(2)为提高鲸鱼优化算法的收敛速度和寻优精度,提出一种基于非线性收敛因子和局部扰动的鲸鱼优化算法。算法首先引入非线性收敛因子,提高鲸鱼种群的多样性,扩大鲸鱼搜索食物的范围。同时在鲸鱼包围捕食阶段,采用一种局部扰动策略,使算法在跳出局部极值时的能力增强,提高算法的寻优精度。实验结果表明,改进后算法和粒子群算法、蝙蝠算法、基本鲸鱼优化算法相比,寻优速度、收敛精度、算法稳定性上都要优于其他算法。(3)通过深入分析SVM的思想、原理和流程,针对基本SVM模型中存在的易发生分类准确率不高、参数优化费时等缺点,做出以下改进:在SVM参数选取中,使用鲸鱼优化算法,快速找到全局最优解,提高模型的分类准确率,改进后的鲸鱼优化算法在模型参数优化中效果更佳。并用互联网新闻自动分类系统与优化后的SVM模型结合,使互联网新闻信息更清晰直观的呈现给新闻用户,不仅可以提升用户获取有效信息的效率,也可以提高用户的使用兴趣,减少冗余数据对用户的干扰,实现本文的使用价值。
【图文】:

数据,图边,二维数据,类别


图 2-2 两类数据投影视图在上图提供的两种投影方式中,从直观上可以看出,右图比左图的投影效果要图的红色和蓝色数据较为集中,且类别之间的距离明显,而左图边缘处数据杂乱通过二维数据简要直观的体现了 LDA 的基本思想,但是在实际应用中,数据

视图,数据分类,分类方案


图 2-3 两类数据分类视图 1上图中的(a)是已有的数据,红色和蓝色分别代表两个不同的类别。数据显然是线性的,但是能把两类数据点分离的直线有多条。图 2-3 中的(b)图表示分类方案 A,(c示分类方案 B,,其中黑色实线被称之为分界线,专业术语也可叫做决策面。各个决
【学位授予单位】:河南大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:G210.7;TP181;TP391.1

【参考文献】

相关期刊论文 前10条

1 樊存佳;汪友生;边航;;一种改进的KNN文本分类算法[J];国外电子测量技术;2015年12期

2 魏峻;;基于蝙蝠算法的支持向量机参数优化[J];宝鸡文理学院学报(自然科学版);2015年03期

3 王琼瑶;何友全;彭小玲;;基于改进遗传算法的支持向量机参数优化方法[J];计算机与现代化;2015年03期

4 李锋刚;梁钰;GAO Xiao-zhi;ZENGER Kai;;基于LDA-wSVM模型的文本分类研究[J];计算机应用研究;2015年01期

5 薛春香;张玉芳;;面向新闻领域的中文文本分类研究综述[J];图书情报工作;2013年14期

6 崔建明;刘建明;廖周宇;;基于SVM算法的文本分类技术研究[J];计算机仿真;2013年02期

7 石丹丹;;网络新闻的特点[J];才智;2013年04期

8 张琳;陈燕;李桃迎;牟向伟;;决策树分类算法研究[J];计算机工程;2011年13期

9 林永民;朱卫东;;模糊kNN在文本分类中的应用研究[J];计算机应用与软件;2008年09期

10 邵浩然,张亮,马范援;基于损失最小化的SVM多类网页分类算法[J];计算机应用与软件;2005年07期

相关博士学位论文 前2条

1 曹杰;基于SVM的网络流量特征降维与分类方法研究[D];吉林大学;2017年

2 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年

相关硕士学位论文 前3条

1 刘春雨;改进的支持向量机的理论研究及应用[D];西北农林科技大学;2016年

2 周涛丽;基于支持向量机的多分类方法研究[D];电子科技大学;2015年

3 刘海旭;基于PCA和LDA的文本分类系统设计与实现[D];北京邮电大学;2013年



本文编号:2640186

资料下载
论文发表

本文链接:https://www.wllwen.com/xinwenchuanbolunwen/2640186.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c5ca1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com