基于输入错误的中英文文本信息隐藏方法研究
发布时间:2022-02-24 16:46
在现代信息安全技术中,信息隐藏技术发挥着其不可替代的作用。目前,在图像、音视频、文件等载体上利用人类感官的限制等造成的冗余进行信息隐藏的研究百花齐放、层出不穷,但是对于文本载体,特别是纯文本载体,由于文本携带着高度抽象而又密集的语义信息,对修改敏感,可进行秘密信息嵌入的冗余较少,因此纯文本载体的信息隐藏方法种类较少,而目前网络上面对海量的文本,其版权保护、文本泄密、隐秘通信资源未被充分利用等问题仍有待解决。在以社交媒体为代表的网络环境下的文本中常常会出现输入错误,进而本文在其他类型的文本、其它语言的文本中也注意到了输入错误会以不同的频率出现由此,本文对输入错误、文本自动校对等进行了初步研究,认为输入错误是一个跨语言的、普遍存在的、自然存在的现象,可以与信息隐藏进行创新性的融合。本文主要做了以下研究:首先,本文基于社交网络等环境中的文本对中文文本与英文文本中的输入错误进行了研究、分类,并以文本信息隐藏为目的设计了简单的模拟生成部分输入错误的初级方法。基于以上研究与对文本信息隐藏的研习,本文利用前人设计的自然语言处理领域的语言模型BERT提出了基于输入错误的中英文文本信息隐藏方法。由于中文...
【文章来源】:国际关系学院北京市
【文章页数】:86 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 选题背景
1.2 研究现状
1.2.1 信息隐藏与文本信息隐藏研究现状
1.2.2 文本校对研究现状
1.3 选题的目的和意义
1.4 主要工作与创新之处
1.5 论文结构
第2章 相关理论与技术
2.1 信息隐藏
2.1.1 信息隐藏简介
2.1.2 文本信息隐藏
2.2 输入错误
2.2.1 输入错误
2.2.2 社交媒体与输入错误
2.2.3 英文输入错误
2.2.4 中文输入错误
2.3 输入错误与信息隐藏
2.4 文本校对
2.5 利用输入错误进行信息隐藏
2.6 BERT与 MASKED LM
2.6.1 BERT
2.6.2 MASKED LM
2.7 中文分词
2.8 本章小结
第3章 基于输入错误的英文文本隐写方法
3.1 英文输入错误研究应用
3.1.1 英文输入错误分类
3.1.2 结合与应用
3.2 算法描述
3.2.1 算法设计
3.2.2 算法步骤
3.3 不可嵌入词
3.4 实验仿真
3.4.1 数据
3.4.2 超参设置
3.4.3 其他设置
3.5 实验结果
3.5.1 实验结果
3.5.2 时间分析
3.5.3 隐藏容量
3.5.4 安全性与鲁棒性
3.6 本章小结
第4章 基于输入错误的中文文本隐写方法
4.1 中文输入错误研究应用
4.1.1 中文输入错误分类
4.1.2 结合应用
4.2 算法描述
4.2.1 算法设计
4.2.2 算法步骤
4.3 为什么不能直接使用单次的文本纠错?
4.4 不可嵌入词
4.5 实验仿真
4.5.1 数据
4.5.2 超参设置
4.6 结果分析
4.6.1 实验结果
4.6.2 时间分析
4.6.3 隐藏容量
4.6.4 不可见性
4.6.5 安全性与鲁棒性
4.7 本章小结
第5章 方法改进思路
5.1 易感知性
5.2 增加输入错误的形式
5.3 真词错误
5.3.1 英文真词错误替换
5.3.2 中文分词歧义
5.4 对BERT进行fine-tune
第6章 结论与展望
6.1 全文总结
6.2 未来展望
参考文献
附录 A名词表
A.1名词与方法
A.1.1 BERT系
A.1.2本文涉及
A.2公式符号说明
致谢
作者简历
发表的学术论文
【参考文献】:
期刊论文
[1]中文文本分类方法综述[J]. 于游,付钰,吴晓平. 网络与信息安全学报. 2019(05)
[2]中文文本信息隐藏研究进展[J]. 吴国华,龚礼春,袁理锋,姚晔. 通信学报. 2019(09)
[3]浅析粤语词汇中的古语来源——以“走”“食”“细”为例[J]. 白雪冬. 赤峰学院学报(汉文哲学社会科学版). 2019(04)
[4]基于门限卷积神经网络和词嵌入的中文分词法[J]. 张竞,刘暾东,陈美谦. 厦门大学学报(自然科学版). 2018(06)
[5]基于矩阵编码的同义词替换隐写算法[J]. 杨潇,李峰,向凌云. 小型微型计算机系统. 2015(06)
[6]网络传播中的错别字探究[J]. 贺洪花,陈铭. 艺术科技. 2014(02)
[7]五笔输入法和拼音输入法的认知效率比较[J]. 方燕红,张积家. 井冈山大学学报(社会科学版). 2013(05)
[8]社交媒体:概念、发展历程、特征与未来——兼谈当下对社交媒体认识的模糊之处[J]. 曹博林. 湖南广播电视大学学报. 2011(03)
[9]基于句法依存分析的文本水印算法[J]. 吴戈,文大化. 长春理工大学学报(自然科学版). 2011(03)
[10]基于字符阶梯边沿调整的文本水印算法[J]. 赵星阳,孙继银,李琳琳. 计算机应用. 2008(12)
博士论文
[1]数字图像盲取证技术研究[D]. 周琳娜.北京邮电大学 2007
硕士论文
[1]基于深度学习的中文分词方法研究[D]. 史宇.南京邮电大学 2019
[2]基于机器翻译模型的汉语近音错别字校对方法研究[D]. 薛鑫.黑龙江大学 2017
[3]面向社会媒体的中文文本校对方法研究与实现[D]. 张鑫.黑龙江大学 2015
[4]基于隐写编码的自然语言信息隐藏技术研究[D]. 杨潇.长沙理工大学 2015
[5]基于虚词变换的文本隐藏信息检测方法研究[D]. 曾莱蓓.湖南大学 2010
[6]拼音输入法视角的网络错别字研究[D]. 耿亮.上海师范大学 2010
本文编号:3643128
【文章来源】:国际关系学院北京市
【文章页数】:86 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 选题背景
1.2 研究现状
1.2.1 信息隐藏与文本信息隐藏研究现状
1.2.2 文本校对研究现状
1.3 选题的目的和意义
1.4 主要工作与创新之处
1.5 论文结构
第2章 相关理论与技术
2.1 信息隐藏
2.1.1 信息隐藏简介
2.1.2 文本信息隐藏
2.2 输入错误
2.2.1 输入错误
2.2.2 社交媒体与输入错误
2.2.3 英文输入错误
2.2.4 中文输入错误
2.3 输入错误与信息隐藏
2.4 文本校对
2.5 利用输入错误进行信息隐藏
2.6 BERT与 MASKED LM
2.6.1 BERT
2.6.2 MASKED LM
2.7 中文分词
2.8 本章小结
第3章 基于输入错误的英文文本隐写方法
3.1 英文输入错误研究应用
3.1.1 英文输入错误分类
3.1.2 结合与应用
3.2 算法描述
3.2.1 算法设计
3.2.2 算法步骤
3.3 不可嵌入词
3.4 实验仿真
3.4.1 数据
3.4.2 超参设置
3.4.3 其他设置
3.5 实验结果
3.5.1 实验结果
3.5.2 时间分析
3.5.3 隐藏容量
3.5.4 安全性与鲁棒性
3.6 本章小结
第4章 基于输入错误的中文文本隐写方法
4.1 中文输入错误研究应用
4.1.1 中文输入错误分类
4.1.2 结合应用
4.2 算法描述
4.2.1 算法设计
4.2.2 算法步骤
4.3 为什么不能直接使用单次的文本纠错?
4.4 不可嵌入词
4.5 实验仿真
4.5.1 数据
4.5.2 超参设置
4.6 结果分析
4.6.1 实验结果
4.6.2 时间分析
4.6.3 隐藏容量
4.6.4 不可见性
4.6.5 安全性与鲁棒性
4.7 本章小结
第5章 方法改进思路
5.1 易感知性
5.2 增加输入错误的形式
5.3 真词错误
5.3.1 英文真词错误替换
5.3.2 中文分词歧义
5.4 对BERT进行fine-tune
第6章 结论与展望
6.1 全文总结
6.2 未来展望
参考文献
附录 A名词表
A.1名词与方法
A.1.1 BERT系
A.1.2本文涉及
A.2公式符号说明
致谢
作者简历
发表的学术论文
【参考文献】:
期刊论文
[1]中文文本分类方法综述[J]. 于游,付钰,吴晓平. 网络与信息安全学报. 2019(05)
[2]中文文本信息隐藏研究进展[J]. 吴国华,龚礼春,袁理锋,姚晔. 通信学报. 2019(09)
[3]浅析粤语词汇中的古语来源——以“走”“食”“细”为例[J]. 白雪冬. 赤峰学院学报(汉文哲学社会科学版). 2019(04)
[4]基于门限卷积神经网络和词嵌入的中文分词法[J]. 张竞,刘暾东,陈美谦. 厦门大学学报(自然科学版). 2018(06)
[5]基于矩阵编码的同义词替换隐写算法[J]. 杨潇,李峰,向凌云. 小型微型计算机系统. 2015(06)
[6]网络传播中的错别字探究[J]. 贺洪花,陈铭. 艺术科技. 2014(02)
[7]五笔输入法和拼音输入法的认知效率比较[J]. 方燕红,张积家. 井冈山大学学报(社会科学版). 2013(05)
[8]社交媒体:概念、发展历程、特征与未来——兼谈当下对社交媒体认识的模糊之处[J]. 曹博林. 湖南广播电视大学学报. 2011(03)
[9]基于句法依存分析的文本水印算法[J]. 吴戈,文大化. 长春理工大学学报(自然科学版). 2011(03)
[10]基于字符阶梯边沿调整的文本水印算法[J]. 赵星阳,孙继银,李琳琳. 计算机应用. 2008(12)
博士论文
[1]数字图像盲取证技术研究[D]. 周琳娜.北京邮电大学 2007
硕士论文
[1]基于深度学习的中文分词方法研究[D]. 史宇.南京邮电大学 2019
[2]基于机器翻译模型的汉语近音错别字校对方法研究[D]. 薛鑫.黑龙江大学 2017
[3]面向社会媒体的中文文本校对方法研究与实现[D]. 张鑫.黑龙江大学 2015
[4]基于隐写编码的自然语言信息隐藏技术研究[D]. 杨潇.长沙理工大学 2015
[5]基于虚词变换的文本隐藏信息检测方法研究[D]. 曾莱蓓.湖南大学 2010
[6]拼音输入法视角的网络错别字研究[D]. 耿亮.上海师范大学 2010
本文编号:3643128
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3643128.html