当前位置:主页 > 管理论文 > 移动网络论文 >

基于在线排序逻辑回归的垃圾邮件过滤

发布时间:2018-09-14 15:08
【摘要】:垃圾邮件过滤是网络信息处理中的重要问题,基于机器学习方法的垃圾邮件过滤技术是目前的研究热点。现有研究一般将过滤问题视为二值分类问题进行解决,存在着模型优化目标和性能评价指标1-AUC不一致的问题,导致模型优化结果产生偏差,过滤性能受到很大影响。该文通过直接优化评价指标1-AUC来提升过滤器性能,将垃圾邮件过滤问题转化成排序问题进行建模,提出了在线排序逻辑回归学习算法,解决了在线学习中的邮件得分偏移问题;综合应用TONE算法和重采样技术,提出参数权重更新算法,解决模型学习中在线调整模型参数时的处理速度问题,满足垃圾邮件实时过滤的要求。在垃圾邮件过滤公开评测数据集上的实验结果表明,基于在线排序逻辑回归模型的过滤结果全面优于在线逻辑回归模型的过滤结果。
[Abstract]:Spam filtering is an important problem in network information processing. The current research generally regards the filtering problem as a binary classification problem, and there exists the problem that the model optimization goal is inconsistent with the performance evaluation index (1-AUC), which results in the deviation of the model optimization results and greatly affects the filtering performance. In this paper, the filter performance is improved by directly optimizing the evaluation index 1-AUC, and the spam filtering problem is transformed into a sort problem for modeling. An online sorting logical regression learning algorithm is proposed to solve the problem of mail score offset in online learning. By using TONE algorithm and resampling technology, a parameter weight updating algorithm is proposed to solve the problem of processing speed when model parameters are adjusted online in model learning, and meet the requirements of spam real-time filtering. The experimental results on the public evaluation data set of spam filtering show that the filtering result based on the online sorting logical regression model is better than that of the online logical regression model.
【作者单位】: 哈尔滨理工大学计算机科学与技术学院;黑龙江工程学院计算机科学与技术学院;
【基金】:国家自然科学基金资助项目(60903083) 黑龙江省新世纪人才项目(1155-ncet-008) 教育部博士点新教师基金资助项目(20092303120005)
【分类号】:TP393.098

【相似文献】

相关期刊论文 前10条

1 晓齐;启明星辰推出 天澄防垃圾邮件系统[J];信息网络安全;2004年08期

2 ;启明星辰公司天澄防垃圾邮件系统问世[J];电力信息化;2004年06期

3 ;垃圾邮件杀手[J];电脑知识与技术;2001年Z1期

4 王军;如何应对垃圾邮件[J];家庭电子;2001年01期

5 阿文;;恼人的垃圾邮件[J];大众科技;2001年05期

6 志杰;垃圾邮件大清除[J];计算机与农业;2002年03期

7 Michael J.Miller;铲除垃圾邮件[J];个人电脑;2003年10期

8 李瑞江;浅谈反垃圾邮件技术的应用[J];新疆师范大学学报(自然科学版);2003年02期

9 史兵;企业电子邮件系统的困境和对策[J];计算机安全;2004年05期

10 田青;个人用户如何对付垃圾邮件[J];电子世界;2004年07期

相关会议论文 前10条

1 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年

2 李军;何晓宁;黄成哲;齐浩亮;雷国华;;基于特征贡献度的垃圾邮件过滤方法[A];第六届全国信息检索学术会议论文集[C];2010年

3 李劲;岳昆;杭菲璐;;一种基于自适应Markov模型的中文垃圾邮件过滤方法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年

4 刘红翼;;一种垃圾邮件过滤器的设计与实现[A];广西计算机学会2005年学术年会论文集[C];2005年

5 米淑云;辛阳;罗群;;一种新型垃圾邮件过滤系统的设计和研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年

6 薛亚楠;廖闻剑;彭艳兵;;垃圾邮件行为识别研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年

7 赵利;廖闻剑;彭艳兵;;基于中文主题的垃圾邮件过滤方法研究[A];中国通信学会第六届学术年会论文集(上)[C];2009年

8 杨晓光;李宁;吴昊;;基于P2P信誉体系垃圾邮件过滤系统的设计与实现[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年

9 陈娟;葛辛;罗向阳;刘粉林;;基于反向查询技术和贝叶斯算法的反垃圾邮件方案[A];2006中国控制与决策学术年会论文集[C];2006年

10 周立兵;柳景超;;贝叶斯理论在垃圾邮件过滤中的应用分析[A];中国造船工程学会电子技术学术委员会2006学术年会论文集(上册)[C];2006年

相关重要报纸文章 前10条

1 陈翔;垃圾邮件7月忙换招[N];中国计算机报;2007年

2 ;把握特征阻断垃圾邮件[N];中国计算机报;2007年

3 敏;拒绝垃圾邮件5准则[N];中国电脑教育报;2002年

4 合 文;阻止垃圾邮件的蔓延[N];网络世界;2002年

5 侯海龙;McAfee 垃圾邮件的终结者[N];中国计算机报;2003年

6 ;砍断垃圾邮件黑手[N];计算机世界;2003年

7 ;怎样打击垃圾邮件[N];网络世界;2003年

8 姚晓晨;垃圾邮件“猛于虎” 谁该成为合格“驯兽师”[N];中国改革报;2008年

9 苗得雨;摧毁垃圾邮件[N];中国电脑教育报;2003年

10 高伟;垃圾邮件别烦我[N];中国电脑教育报;2004年

相关博士学位论文 前10条

1 陈彬;垃圾邮件的特征选择及检测方法研究[D];华南理工大学;2010年

2 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年

3 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年

4 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年

5 董建设;协作式垃圾邮件过滤关键技术研究[D];兰州理工大学;2009年

6 刘震;垃圾邮件过滤理论和关键技术研究[D];电子科技大学;2008年

7 王美珍;垃圾邮件行为模式识别与过滤方法研究[D];华中科技大学;2009年

8 邓蔚;垃圾邮件过滤中的敌手分类问题研究[D];电子科技大学;2011年

9 董大凡;基于度量空间的P2P网络相似搜索技术研究及应用[D];南开大学;2010年

10 王斌斌;僵尸网络检测方法研究[D];华中科技大学;2010年

相关硕士学位论文 前10条

1 杨慧娟;基于语义体与模糊聚类的中文垃圾邮件过滤方法研究[D];兰州理工大学;2011年

2 郭学敏;基于语义的广告图像垃圾邮件过滤技术研究[D];燕山大学;2010年

3 毛岩;基于行为识别的垃圾邮件过滤技术的研究[D];大庆石油学院;2010年

4 孙吉谭;基于内容的垃圾邮件意图分析方法研究[D];吉林大学;2011年

5 张青;中文垃圾邮件过滤技术研究[D];武汉理工大学;2011年

6 李扬继;垃圾邮件特征的判别模型研究[D];四川大学;2005年

7 杨兴华;基于多模态特征的垃圾邮件过滤技术研究[D];西安电子科技大学;2011年

8 赵海涛;基于模糊支持向量机的垃圾邮件过滤技术研究[D];重庆师范大学;2010年

9 刘菊新;垃圾图像过滤系统的实现[D];浙江大学;2010年

10 金彩琴;基于意图分析的垃圾邮件过滤研究[D];陕西师范大学;2011年



本文编号:2243066

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2243066.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ac0ee***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com