基于在线排序逻辑回归的垃圾邮件过滤
[Abstract]:Spam filtering is an important problem in network information processing. The current research generally regards the filtering problem as a binary classification problem, and there exists the problem that the model optimization goal is inconsistent with the performance evaluation index (1-AUC), which results in the deviation of the model optimization results and greatly affects the filtering performance. In this paper, the filter performance is improved by directly optimizing the evaluation index 1-AUC, and the spam filtering problem is transformed into a sort problem for modeling. An online sorting logical regression learning algorithm is proposed to solve the problem of mail score offset in online learning. By using TONE algorithm and resampling technology, a parameter weight updating algorithm is proposed to solve the problem of processing speed when model parameters are adjusted online in model learning, and meet the requirements of spam real-time filtering. The experimental results on the public evaluation data set of spam filtering show that the filtering result based on the online sorting logical regression model is better than that of the online logical regression model.
【作者单位】: 哈尔滨理工大学计算机科学与技术学院;黑龙江工程学院计算机科学与技术学院;
【基金】:国家自然科学基金资助项目(60903083) 黑龙江省新世纪人才项目(1155-ncet-008) 教育部博士点新教师基金资助项目(20092303120005)
【分类号】:TP393.098
【相似文献】
相关期刊论文 前10条
1 晓齐;启明星辰推出 天澄防垃圾邮件系统[J];信息网络安全;2004年08期
2 ;启明星辰公司天澄防垃圾邮件系统问世[J];电力信息化;2004年06期
3 ;垃圾邮件杀手[J];电脑知识与技术;2001年Z1期
4 王军;如何应对垃圾邮件[J];家庭电子;2001年01期
5 阿文;;恼人的垃圾邮件[J];大众科技;2001年05期
6 志杰;垃圾邮件大清除[J];计算机与农业;2002年03期
7 Michael J.Miller;铲除垃圾邮件[J];个人电脑;2003年10期
8 李瑞江;浅谈反垃圾邮件技术的应用[J];新疆师范大学学报(自然科学版);2003年02期
9 史兵;企业电子邮件系统的困境和对策[J];计算机安全;2004年05期
10 田青;个人用户如何对付垃圾邮件[J];电子世界;2004年07期
相关会议论文 前10条
1 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
2 李军;何晓宁;黄成哲;齐浩亮;雷国华;;基于特征贡献度的垃圾邮件过滤方法[A];第六届全国信息检索学术会议论文集[C];2010年
3 李劲;岳昆;杭菲璐;;一种基于自适应Markov模型的中文垃圾邮件过滤方法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
4 刘红翼;;一种垃圾邮件过滤器的设计与实现[A];广西计算机学会2005年学术年会论文集[C];2005年
5 米淑云;辛阳;罗群;;一种新型垃圾邮件过滤系统的设计和研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
6 薛亚楠;廖闻剑;彭艳兵;;垃圾邮件行为识别研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
7 赵利;廖闻剑;彭艳兵;;基于中文主题的垃圾邮件过滤方法研究[A];中国通信学会第六届学术年会论文集(上)[C];2009年
8 杨晓光;李宁;吴昊;;基于P2P信誉体系垃圾邮件过滤系统的设计与实现[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
9 陈娟;葛辛;罗向阳;刘粉林;;基于反向查询技术和贝叶斯算法的反垃圾邮件方案[A];2006中国控制与决策学术年会论文集[C];2006年
10 周立兵;柳景超;;贝叶斯理论在垃圾邮件过滤中的应用分析[A];中国造船工程学会电子技术学术委员会2006学术年会论文集(上册)[C];2006年
相关重要报纸文章 前10条
1 陈翔;垃圾邮件7月忙换招[N];中国计算机报;2007年
2 ;把握特征阻断垃圾邮件[N];中国计算机报;2007年
3 敏;拒绝垃圾邮件5准则[N];中国电脑教育报;2002年
4 合 文;阻止垃圾邮件的蔓延[N];网络世界;2002年
5 侯海龙;McAfee 垃圾邮件的终结者[N];中国计算机报;2003年
6 ;砍断垃圾邮件黑手[N];计算机世界;2003年
7 ;怎样打击垃圾邮件[N];网络世界;2003年
8 姚晓晨;垃圾邮件“猛于虎” 谁该成为合格“驯兽师”[N];中国改革报;2008年
9 苗得雨;摧毁垃圾邮件[N];中国电脑教育报;2003年
10 高伟;垃圾邮件别烦我[N];中国电脑教育报;2004年
相关博士学位论文 前10条
1 陈彬;垃圾邮件的特征选择及检测方法研究[D];华南理工大学;2010年
2 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
3 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
4 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
5 董建设;协作式垃圾邮件过滤关键技术研究[D];兰州理工大学;2009年
6 刘震;垃圾邮件过滤理论和关键技术研究[D];电子科技大学;2008年
7 王美珍;垃圾邮件行为模式识别与过滤方法研究[D];华中科技大学;2009年
8 邓蔚;垃圾邮件过滤中的敌手分类问题研究[D];电子科技大学;2011年
9 董大凡;基于度量空间的P2P网络相似搜索技术研究及应用[D];南开大学;2010年
10 王斌斌;僵尸网络检测方法研究[D];华中科技大学;2010年
相关硕士学位论文 前10条
1 杨慧娟;基于语义体与模糊聚类的中文垃圾邮件过滤方法研究[D];兰州理工大学;2011年
2 郭学敏;基于语义的广告图像垃圾邮件过滤技术研究[D];燕山大学;2010年
3 毛岩;基于行为识别的垃圾邮件过滤技术的研究[D];大庆石油学院;2010年
4 孙吉谭;基于内容的垃圾邮件意图分析方法研究[D];吉林大学;2011年
5 张青;中文垃圾邮件过滤技术研究[D];武汉理工大学;2011年
6 李扬继;垃圾邮件特征的判别模型研究[D];四川大学;2005年
7 杨兴华;基于多模态特征的垃圾邮件过滤技术研究[D];西安电子科技大学;2011年
8 赵海涛;基于模糊支持向量机的垃圾邮件过滤技术研究[D];重庆师范大学;2010年
9 刘菊新;垃圾图像过滤系统的实现[D];浙江大学;2010年
10 金彩琴;基于意图分析的垃圾邮件过滤研究[D];陕西师范大学;2011年
,本文编号:2243066
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2243066.html