校园网络安全过滤模型及关键算法研究
发布时间:2021-12-10 21:40
在互联网技术快速发展的今天,随着人们对网络信息的使用日益普遍,网络上庞大的信息量中逐渐夹杂着越来越多的不良信息,如反动、色情、暴力等,对互联网的秩序以及互联网使用者的身心健康都有着严重的影响。因此目前很多学者致力于研究一种智能化、信息化不良信息检测过滤手段,期望从根本上阻止这些信息出现在互联网上。面对这种情况,校园网如何实现在海量的WEB网页中识别出含有不良信息的非法文本并将其屏蔽,逐渐成为信息过滤的一个新的研究领域。对此,本文首先探索了信息过滤的发展历史、研究现状和研究意义,并对目前网络安全知识及网络信息过滤技术进行深入了解。其次,本文设计了一种面向文本和图像概念空间的网页过滤算法。算法在对抓取到的网页进行预处理后,采用聚类算法提取网页中文本和图像有意义串集合,通过设置相同的聚类参数k,形成文本和图像统一描述的网页概念空间,之后在这些统一后的概念信息中进行查找,以达到网页过滤的目的。文章对校园网络安全过滤模型中的网页过滤模型以及邮件过滤模型进行设计。网页过滤模型主要包括训练模块以及分类模块,邮件过滤模型主要包括网络监听模块、URL提取模块、邮件过滤模块、客户端通信模块、服务端通信模块...
【文章来源】:安徽大学安徽省 211工程院校
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
目录
第一章 绪论
1.1 选题背景
1.2 课题研究的意义
1.3 研究现状
1.4 本文的主要工作和章节安排
第二章 网络安全综述
2.1 网络安全的定义
2.2 网络安全的内容
2.3 网络安全过滤技术介绍
2.4 本章小结
第三章 网页过滤算法设计
3.1 算法框架描述
3.2 网页预处理
3.2.1 文本内容候选串生成
3.2.2 图像内容候选串生成
3.3 特征提取
3.3.1 聚类方法描述
3.3.2 基于词聚类的文本提取
3.4 过滤设计
3.5 算法性能分析
3.6 算法的优势与不足
3.7 本章小结
第四章 校园网络安全过滤模型设计
4.1 系统功能划分
4.2 网页过滤模型设计
4.2.1 模型核心流程设计
4.2.2 训练模块的设计
4.2.3 分类模块的设计
4.3 邮件过滤模型设计
4.3.1 网络监听模块
4.3.2 URL提取模块
4.3.3 邮件过滤模块
4.3.4 客户端通信模块
4.3.5 服务端通信模块
4.3.6 URL匹配模块
4.4 本章小结
第五章 校园网络安全过滤模型的实现与测试
5.1 网页过滤模型实现与测试
5.1.1 网页过滤的实现与测试
5.1.2 结果分析
5.2 邮件过滤模型测试
5.2.1 邮件过滤的测试
5.2.2 实验结果及分析
5.3 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
【参考文献】:
期刊论文
[1]基于聚类的网页有意义串提取算法(英文)[J]. 陈洁,谭建龙,廖豪,周延泉. 中国通信. 2012(03)
[2]Web页面中文文本主题的自动提取研究[J]. 韩客松,王永成,滕伟. 情报学报. 2001(02)
[3]文本结构分析与基于示例的文本过滤[J]. 林鸿飞,战学刚,姚天顺. 小型微型计算机系统. 2000(04)
[4]基于概念扩充的中文文本过滤模型[J]. 林鸿飞,战学刚,姚天顺. 计算机科学. 2000(02)
[5]大规模真实文本处理的理论与方法——记第五届国际极大规模语料库研讨会(WVLC-5)[J]. 黄昌宁. 当代语言学. 1998(01)
硕士论文
[1]个性化信息获取与建模相关技术研究[D]. 冯丽娜.哈尔滨工业大学 2006
[2]基于Internet的中文文本过滤系统的研究与实践[D]. 孙岩国.兰州理工大学 2004
本文编号:3533439
【文章来源】:安徽大学安徽省 211工程院校
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
目录
第一章 绪论
1.1 选题背景
1.2 课题研究的意义
1.3 研究现状
1.4 本文的主要工作和章节安排
第二章 网络安全综述
2.1 网络安全的定义
2.2 网络安全的内容
2.3 网络安全过滤技术介绍
2.4 本章小结
第三章 网页过滤算法设计
3.1 算法框架描述
3.2 网页预处理
3.2.1 文本内容候选串生成
3.2.2 图像内容候选串生成
3.3 特征提取
3.3.1 聚类方法描述
3.3.2 基于词聚类的文本提取
3.4 过滤设计
3.5 算法性能分析
3.6 算法的优势与不足
3.7 本章小结
第四章 校园网络安全过滤模型设计
4.1 系统功能划分
4.2 网页过滤模型设计
4.2.1 模型核心流程设计
4.2.2 训练模块的设计
4.2.3 分类模块的设计
4.3 邮件过滤模型设计
4.3.1 网络监听模块
4.3.2 URL提取模块
4.3.3 邮件过滤模块
4.3.4 客户端通信模块
4.3.5 服务端通信模块
4.3.6 URL匹配模块
4.4 本章小结
第五章 校园网络安全过滤模型的实现与测试
5.1 网页过滤模型实现与测试
5.1.1 网页过滤的实现与测试
5.1.2 结果分析
5.2 邮件过滤模型测试
5.2.1 邮件过滤的测试
5.2.2 实验结果及分析
5.3 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
【参考文献】:
期刊论文
[1]基于聚类的网页有意义串提取算法(英文)[J]. 陈洁,谭建龙,廖豪,周延泉. 中国通信. 2012(03)
[2]Web页面中文文本主题的自动提取研究[J]. 韩客松,王永成,滕伟. 情报学报. 2001(02)
[3]文本结构分析与基于示例的文本过滤[J]. 林鸿飞,战学刚,姚天顺. 小型微型计算机系统. 2000(04)
[4]基于概念扩充的中文文本过滤模型[J]. 林鸿飞,战学刚,姚天顺. 计算机科学. 2000(02)
[5]大规模真实文本处理的理论与方法——记第五届国际极大规模语料库研讨会(WVLC-5)[J]. 黄昌宁. 当代语言学. 1998(01)
硕士论文
[1]个性化信息获取与建模相关技术研究[D]. 冯丽娜.哈尔滨工业大学 2006
[2]基于Internet的中文文本过滤系统的研究与实践[D]. 孙岩国.兰州理工大学 2004
本文编号:3533439
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3533439.html