个性化垃圾邮件过滤的扩展研究
发布时间:2020-12-31 02:40
由于兴趣、爱好的不同,不同用户对垃圾邮件的定义可能存在巨大差异,这是一般化邮件过滤器面临的窘境,因此实现个性化垃圾邮件过滤成为目前邮件过滤领域研究的重要课题。同时,特定用户在不同时间段,兴趣点也会发生变化,会使其重新定义对垃圾邮件的过滤标准,所以检测用户兴趣点是否发生变化也是个性化过滤的关键任务。本文针对特定用户邮箱的错滤情况,对个性化过滤技术进行扩展研究,重点关注如何在动态环境下,结合用户的兴趣特征,降低邮件错滤率,并实现自动修正。主要工作和创新点如下:(1)为了缓解现实情况下网络用户邮箱的错滤程度,本文提出了一种基于客户端的个性化邮件再过滤方法。该方法基于多任务学习理论,使得收件箱和垃圾箱过滤器借鉴彼此的特征描述,“互相学习,分开过滤”,缓解类不平衡问题。本文提出邮件数据流中的“广义虚漂移”概念,同时设计多窗口框架,结合重要性加权的方法以达到动态环境自适应的效果。(2)通常情况下,相同集体(实验室、俱乐部或公司)环境中的用户收到的邮件存在一定的相关性,因此本文提出在集体环境下的个性化邮件再过滤方法。当完全个性化邮件过滤器学到的信息有限时,利用相关性数据,可有效增加其信息量,提高过滤...
【文章来源】:南京航空航天大学江苏省 211工程院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
垃圾邮件生命周期的三个阶段一些早期的研究表明,垃圾邮件已经占据所有邮件的80%[1]
图 1.2 2017 年恶意垃圾邮件数量占邮件总流量比例于垃圾邮件造成的大量的经济损失,导致一些国家通过法律限制垃圾邮件的扩散要求谨慎保管他们的电子邮件地址,不要回复任何垃圾邮件。但在现实中,垃圾各地发出,且发送者的真实信息难以追踪,这些困难都限定了法律的实用性。除的另一种方法是使用垃圾邮件过滤器,基于对消息内容和附加信息的分析,尝
图 2.1 3 种概念漂移类型时长和频率分为:突发式(abrupt)漂移、增量式(incrementa移和再现式(recurring)漂移四种[53]。概念漂移的四种变化模式
【参考文献】:
期刊论文
[1]Word2vec的工作原理及应用探究[J]. 周练. 科技情报开发与经济. 2015(02)
[2]基于用户反馈的个性化垃圾邮件过滤方法[J]. 黄国伟,刘云霞,陈志. 电子设计工程. 2014(15)
[3]基于用户兴趣度的垃圾邮件在线识别新方法[J]. 王友卫,刘元宁,凤丽洲,朱晓冬. 华南理工大学学报(自然科学版). 2014(07)
[4]高校误判垃圾邮件自动召回系统的研究与实现[J]. 林海卓,王继龙,吴建平,杨家海,徐聪. 通信学报. 2013(S2)
[5]集成学习和主动学习相结合的个性化垃圾邮件过滤[J]. 刘伍颖,王挺. 计算机工程与科学. 2011(09)
本文编号:2948790
【文章来源】:南京航空航天大学江苏省 211工程院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
垃圾邮件生命周期的三个阶段一些早期的研究表明,垃圾邮件已经占据所有邮件的80%[1]
图 1.2 2017 年恶意垃圾邮件数量占邮件总流量比例于垃圾邮件造成的大量的经济损失,导致一些国家通过法律限制垃圾邮件的扩散要求谨慎保管他们的电子邮件地址,不要回复任何垃圾邮件。但在现实中,垃圾各地发出,且发送者的真实信息难以追踪,这些困难都限定了法律的实用性。除的另一种方法是使用垃圾邮件过滤器,基于对消息内容和附加信息的分析,尝
图 2.1 3 种概念漂移类型时长和频率分为:突发式(abrupt)漂移、增量式(incrementa移和再现式(recurring)漂移四种[53]。概念漂移的四种变化模式
【参考文献】:
期刊论文
[1]Word2vec的工作原理及应用探究[J]. 周练. 科技情报开发与经济. 2015(02)
[2]基于用户反馈的个性化垃圾邮件过滤方法[J]. 黄国伟,刘云霞,陈志. 电子设计工程. 2014(15)
[3]基于用户兴趣度的垃圾邮件在线识别新方法[J]. 王友卫,刘元宁,凤丽洲,朱晓冬. 华南理工大学学报(自然科学版). 2014(07)
[4]高校误判垃圾邮件自动召回系统的研究与实现[J]. 林海卓,王继龙,吴建平,杨家海,徐聪. 通信学报. 2013(S2)
[5]集成学习和主动学习相结合的个性化垃圾邮件过滤[J]. 刘伍颖,王挺. 计算机工程与科学. 2011(09)
本文编号:2948790
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2948790.html