基于隐私度的邮件分类方法研究
发布时间:2021-06-21 15:43
随着信息技术的普及,以及计算机和手机等智能设备的高速发展,电子邮件在生活和工作得到了越来越广泛的应用,它可以摆脱传统纸张书写的束缚,具有更加高效的传输效率,便于留存且不会轻易丢失。电子邮件带来便利的同时也产生了一些弊端,如目前整体的邮件安全形势就不容乐观,邮件数据泄露现象屡见不鲜,这些数据中包含大量隐私信息,对社会、企业,尤其是个人隐私安全会造成非常严重的影响,所以需要从复杂繁多的电子邮件中将含有隐私信息的邮件识别出来。目前关于隐私信息识别检测研究较少,常用的方法不能非常准确的识别出隐私信息。为此本文基于词向量和迁移学习,提出隐私邮件分类方法,具体研究工作及贡献包括:(1)针对隐私邮件文本特点,为防止生成的词向量稀疏和考虑上下文对单词的影响,选择分布式表示词向量的方式来得到词向量,针对词向量没有考虑文本的权重信息,加入TF-IDF权重,有效增强了邮件文本词向量的特征表示,使词向量更易于邮件分类;(2)从隐私邮件泄露对用户危害程度的角度出发,对隐私邮件进行分级。为解决没有大型隐私邮件数据集的问题,使用迁移学习进行隐私邮件分类,通过对卷积神经网络算法和门控制单元算法进行邮件分类的实验对比,...
【文章来源】:中北大学山西省
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
SVM超平面示意图
CNN网络结构
RNN结构
【参考文献】:
期刊论文
[1]个人信息安全的分级分类保护再探究[J]. 商晓阳. 现代信息科技. 2019(18)
[2]迁移学习研究和算法综述[J]. 刘鑫鹏,栾悉道,谢毓湘,黄明哲. 长沙大学学报. 2018(05)
[3]基于多因素的邮箱安全检测模型[J]. 李扬,方勇,黄诚,刘亮. 网络空间安全. 2018(06)
[4]命名实体识别研究综述[J]. 刘浏,王东波. 情报学报. 2018(03)
[5]基于词向量特征的文本分类模型研究[J]. 张敬谊,张亚红,李静. 信息技术与标准化. 2017(05)
[6]深度学习的发展与应用[J]. 邱晓康. 科技展望. 2016(33)
[7]朴素贝叶斯算法的改进与应用[J]. 赵文涛,孟令军,赵好好,王春春. 测控技术. 2016(02)
[8]基于类决策树分类的特征层融合识别算法[J]. 尚朝轩,王品,韩壮志,彭刚. 控制与决策. 2016(06)
[9]中文分词模型的领域适应性方法[J]. 韩冬煦,常宝宝. 计算机学报. 2015(02)
[10]中文分词与词性标注研究[J]. 梁喜涛,顾磊. 计算机技术与发展. 2015(02)
硕士论文
[1]基于循环神经网络模型的文本分类[D]. 龚千健.华中科技大学 2016
[2]大数据时代电子邮件中的隐私权保护[D]. 刘少阳.北京邮电大学 2016
[3]基于统计学习的中文分词方法的研究[D]. 王威.东北大学 2015
[4]基于卷积神经网络的句子分类算法[D]. 林荣华.浙江大学 2015
[5]统计与规则相结合的中文分词模型设计与实现[D]. 贺欢.西南交通大学 2013
[6]基于统计学习的中文分词改进及其在面向应用分词中的应用[D]. 巫黄旭.浙江大学 2012
[7]基于粗糙集和贝叶斯算法的邮件过滤系统的研究与应用[D]. 史晶.电子科技大学 2011
[8]基于逻辑回归模型的垃圾邮件过滤系统的研究[D]. 安波.哈尔滨工程大学 2009
本文编号:3240945
【文章来源】:中北大学山西省
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
SVM超平面示意图
CNN网络结构
RNN结构
【参考文献】:
期刊论文
[1]个人信息安全的分级分类保护再探究[J]. 商晓阳. 现代信息科技. 2019(18)
[2]迁移学习研究和算法综述[J]. 刘鑫鹏,栾悉道,谢毓湘,黄明哲. 长沙大学学报. 2018(05)
[3]基于多因素的邮箱安全检测模型[J]. 李扬,方勇,黄诚,刘亮. 网络空间安全. 2018(06)
[4]命名实体识别研究综述[J]. 刘浏,王东波. 情报学报. 2018(03)
[5]基于词向量特征的文本分类模型研究[J]. 张敬谊,张亚红,李静. 信息技术与标准化. 2017(05)
[6]深度学习的发展与应用[J]. 邱晓康. 科技展望. 2016(33)
[7]朴素贝叶斯算法的改进与应用[J]. 赵文涛,孟令军,赵好好,王春春. 测控技术. 2016(02)
[8]基于类决策树分类的特征层融合识别算法[J]. 尚朝轩,王品,韩壮志,彭刚. 控制与决策. 2016(06)
[9]中文分词模型的领域适应性方法[J]. 韩冬煦,常宝宝. 计算机学报. 2015(02)
[10]中文分词与词性标注研究[J]. 梁喜涛,顾磊. 计算机技术与发展. 2015(02)
硕士论文
[1]基于循环神经网络模型的文本分类[D]. 龚千健.华中科技大学 2016
[2]大数据时代电子邮件中的隐私权保护[D]. 刘少阳.北京邮电大学 2016
[3]基于统计学习的中文分词方法的研究[D]. 王威.东北大学 2015
[4]基于卷积神经网络的句子分类算法[D]. 林荣华.浙江大学 2015
[5]统计与规则相结合的中文分词模型设计与实现[D]. 贺欢.西南交通大学 2013
[6]基于统计学习的中文分词改进及其在面向应用分词中的应用[D]. 巫黄旭.浙江大学 2012
[7]基于粗糙集和贝叶斯算法的邮件过滤系统的研究与应用[D]. 史晶.电子科技大学 2011
[8]基于逻辑回归模型的垃圾邮件过滤系统的研究[D]. 安波.哈尔滨工程大学 2009
本文编号:3240945
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3240945.html