代价敏感多主题学习的邮件过滤算法
本文关键词:代价敏感多主题学习的邮件过滤算法
更多相关文章: 潜在狄利克雷分布 支持向量机 垃圾邮件过滤 文本分类 多示例学习
【摘要】:针对传统邮件分类模型中较少对邮件主题进行描述和分析的问题,提出一种代价敏感多主题学习的邮件分类算法,用以实现垃圾邮件过滤.首先,基于LDA(潜在狄利克雷分布)对邮件的多个主题进行提取,对邮件语义进行描述;其次,利用CS-SVM(代价敏感支持向量机)对邮件进行代价敏感学习,实现对不同类别邮件的惩罚;最后,结合MI-SVM(多示例支持向量机)进行代价敏感的多主题学习,实现邮件分类.实验采用四组ling-spam处理数据集.实验结果证明:该分类算法较比传统邮件分类算法,可以取得更高的准确性、特异性与敏感性.
【作者单位】: 辽宁大学信息化中心;沈阳建筑大学信息网络中心;
【关键词】: 潜在狄利克雷分布 支持向量机 垃圾邮件过滤 文本分类 多示例学习
【基金】:国家自然科学基金资助项目(61502092)
【分类号】:TP393.098
【正文快照】: 不法组织未经许可强行向用户发送电子邮件,其中承载了大量的商业广告、诈骗或色情信息,这些垃圾邮件严重干扰人们的日常工作和生活,影响人的身心健康.邮件过滤技术通过对已有邮件样本的学习,实现对陌生邮件的自动标注,从而拦截垃圾邮件,避免损失.目前垃圾邮件过滤的主要方法有
【相似文献】
中国期刊全文数据库 前10条
1 杨葆红;防范垃圾邮件的几种措施[J];郑州铁路职业技术学院学报;2004年01期
2 Firefox;;在线狙击垃圾邮件[J];电脑迷;2005年16期
3 LX ,阮征 ,Joycat;垃圾邮件 你真的惹恼我了!(上)[J];电脑爱好者;2005年03期
4 许伟民;罗键;;厦门广电集团垃圾邮件的防范[J];中国传媒科技;2006年10期
5 冯秀彦;宋宏伟;杨凤勇;;防垃圾邮件方法探讨[J];石家庄职业技术学院学报;2006年06期
6 高良诚;;邮件过滤系统的设计与实现[J];铜陵职业技术学院学报;2007年01期
7 戴健;;飞马替你收邮件[J];电脑界.应用文萃;2000年08期
8 蔡健,黄国兴,谢孟军;基于数据挖掘方法的电子邮件过滤[J];微型电脑应用;2001年08期
9 呢仔男孩;垃圾邮件防守战[J];电脑爱好者;2001年09期
10 冯小民;彻底拒绝垃圾邮件[J];电脑爱好者;2001年16期
中国重要会议论文全文数据库 前10条
1 张晶;姚建民;董守斌;张凌;;基于自然语言同现词汇的邮件过滤[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 薛亚楠;廖闻剑;彭艳兵;;垃圾邮件行为识别研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
3 蒯莉;;网络垃圾邮件的防范与治理[A];第十六次全国计算机安全学术交流会论文集[C];2001年
4 沈卫超;;邮件过滤器系统的设计与实现[A];中国工程物理研究院科技年报(2001)[C];2001年
5 石艳荣;孙丹宁;贺永强;;一种基于内容的邮件过滤模型的研究与性能分析[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
6 张尼;姜誉;方滨兴;郭莉;;一个基于邮件路径地理属性分析的垃圾邮件过滤算法[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
7 朱巧明;周志军;李培峰;;中文邮件语料库建设及其分类研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
8 仇小锋;陈鸣;贾永兴;;垃圾邮件及其防范技术[A];第九届全国青年通信学术会议论文集[C];2004年
9 张相於;陈继东;李玉坤;孟小峰;;TEXEM:一种基于实体的邮件任务提取策略[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
10 李婧;张焕国;;应用于贝叶斯过滤器的噪音消除算法研究[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 曹;拒绝垃圾邮件[N];中国电脑教育报;2003年
2 ;狙击垃圾邮件[N];中国电脑教育报;2004年
3 ;砍断垃圾邮件黑手[N];计算机世界;2003年
4 本报记者 张琳;防垃圾邮件怎样“行为识别”[N];网络世界;2005年
5 新华社记者 王缅 毛磊 杨骏 何德功 潘治;垃圾邮件全球泛滥,,法律怎么办[N];新华每日电讯;2003年
6 阮光尘邋朱元春;多层构建邮件免疫机能[N];中国计算机报;2007年
7 ;垃圾邮件不再是安全难题[N];网络世界;2006年
8 ;垃圾邮件传播追随“热点”[N];网络世界;2007年
9 刘向晨;垃圾邮件防治任重道远[N];中国电脑教育报;2003年
10 小新;邮箱也能自动过滤垃圾邮件[N];中国电脑教育报;2003年
中国博士学位论文全文数据库 前6条
1 陈彬;垃圾邮件的特征选择及检测方法研究[D];华南理工大学;2010年
2 刘震;垃圾邮件过滤理论和关键技术研究[D];电子科技大学;2008年
3 王友卫;基于统计的垃圾邮件识别关键技术研究[D];吉林大学;2015年
4 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
5 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
6 王会珍;文本内容分类和主题追踪关键技术研究[D];东北大学;2008年
中国硕士学位论文全文数据库 前10条
1 朱凯健;基于向量空间模型的垃圾邮件过滤系统的设计与实现[D];内蒙古大学;2015年
2 卓小伍;基于改进度量尺度和阈值确定方法的马田系统及其在邮件过滤中的应用[D];南京理工大学;2015年
3 周文彬;基于链接挖掘的邮件网络中心性研究[D];北京化工大学;2015年
4 项学涛;基于赋权有向图的邮件网络亲缘关系研究与实现[D];国际关系学院;2015年
5 王旭;基于用户关系行为的垃圾邮件判别机制的研究与实现[D];东北大学;2014年
6 赵雪梅;校园网环境下行为模式识别垃圾邮件技术研究[D];安徽理工大学;2008年
7 王岩;基于内容的邮件过滤技术研究[D];北方工业大学;2010年
8 代伟;邮件过滤器的设计与实现[D];吉林大学;2010年
9 孙吉谭;基于内容的垃圾邮件意图分析方法研究[D];吉林大学;2011年
10 成宝国;基于统计方法的垃圾邮件处理技术研究[D];西北大学;2006年
本文编号:841033
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/841033.html