基于文本自动生成的信息隐藏方法
发布时间:2021-06-16 05:50
随着大数据时代的到来,保障用户的信息安全成为目前的研究热点。信息隐藏是信息安全领域的重要技术之一。该技术通过将秘密信息嵌入到在公开信道传输的数据中,使其不易被攻击者察觉。由于文本具有较高的编码性,且是人们日常通信及发表观点时使用最为广泛的载体,基于文本的信息隐藏吸引了研究者的关注。受益于深度学习神经网络的飞速发展,将神经网络与信息隐藏相结合成为探索新方法的一个重要分支。基于上述研究背景,本文对基于文本自动生成的信息隐藏方法展开相关研究,主要工作如下:首先,数据集的预处理。神经网络模型依赖于其强大的自我学习能力,因此,需要构建含有大量自然文本的数据集。本文选用评述性文本数据集——影评数据集、正式性文本数据集——新闻数据集以及非正式性文本数据集——推特数据集作为神经网络的训练集,以此构建参数适配的神经网络模型。数据集预处理包括替换字母大小写、删除特殊符号和过滤web链接等,消除文本在自动生成过程中的干扰因素。其次,设计秘密信息嵌入与提取算法。本文选用统计语言模型马尔可夫模型和神经网络模型循环神经网络作为文本生成模型进行对比分析。马尔可夫模型具有与自然语言生成过程所匹配的元结构。循环神经网络...
【文章来源】:沈阳工业大学辽宁省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
信息隐藏结构框图
本文提出一种能够自动生成高质量隐写文本的信息隐藏方法,通过传统的概率统计模型(马尔可夫模型)和自然语言处理技术(循环神经网络)与哈夫曼编码相结合,以生成语法正确、语义连贯的隐写文本,降低被检测器捕获的风险。为了进一步提高隐写文本的隐蔽性和隐藏容量,且考虑到不同单词具有不同的敏感度,在提出的模型基础上对生成过程中构建的候选池进行优化,提出了基于困惑度计算的候选池自收缩机制,以期在提高生成的隐写文本的质量的同时,提高信息隐藏方法整体的隐蔽性。1.2国内外研究现状1.2.1文本信息隐藏研究现状图1.2文本信息隐藏研究现状Fig.1.2Theresearchstatusoftextinformationhiding
7第2章文本生成模型文本的自动生成离不开自然语言生成技术的发展。自然语言生成技术可分为模版生成技术和属性-特征生成技术。针对基于模版的文本生成技术不适用于开放性领域的缺陷,本文采用基于语言模型的生成技术自动生成隐写文本,并选用概率统计模型(马尔可夫模型)和深度学习模型(循环神经网络)对文本的语义特征进行提取和分析,为后文秘密信息的嵌入和提取算法作铺垫。2.1马尔可夫模型在统计自然语言处理领域,通常使用统计语言模型[37]对句子进行建模。语言模型将句子视为序列字符串,对句子中单词的概率分布进行建模,如公式(2.1)所示:niiinnwwwppwwwpwwwpwwpwpS11111213121)|()|()|()|()()((2.1)其中,S表示由单词n,...,,www21组成的句子,长度为n。在语言模型中,生成第nii)1(个单词的概率分布是由此时刻前已经产生的i1个词121,...,,iwww决定的,即),...,|(ii11wwwp。因此,在自动生成隐写文本的信息隐藏方法中,若想自动生成高质量的文本,需要获得训练样本集的统计语言模型的良好的估计。图2.1马尔可夫模型Fig.2.1Markovmodel马尔可夫模型(Markovmodel)[38,39]是具有无后效性的随机过程,是描述了一系列可能事件的随机模型,如图2.1所示。该过程的主要思想为:当过程在时刻t的状态为已知时,过程在t1时刻所处状态的概率特性只与过程在t时刻所处的状态有关,而与过程在t时刻之前的状态无关,可用公式(2.2)表示:)|(),...,,|(1211tkttktPXXsXPXsXX(2.2)其中,},...,,{21TXXXX是一组随机序列,角标t代表该状态所对应的时刻。沈阳工业大学硕士学位论文
【参考文献】:
期刊论文
[1]深度置信网络模型及应用研究综述[J]. 刘方园,王水花,张煜东. 计算机工程与应用. 2018(01)
[2]基于雅克比符号的文本信息隐藏[J]. 左祥建,杨晓莉. 计算机技术与发展. 2016(02)
[3]基于替换有格式文本空间特征信息的隐藏策略[J]. 张鑫. 新乡学院学报(自然科学版). 2011(05)
[4]基于动态模板的电子文书生成技术研究[J]. 尧欣. 信息记录材料. 2010(03)
[5]基于支持向量机的文本隐写分析[J]. 眭新光,罗慧,朱中梁. 计算机工程. 2009(06)
[6]针对同义词替换信息隐藏的检测方法研究[J]. 罗纲,孙星明,向凌云,刘玉玲,甘灿. 计算机研究与发展. 2008(10)
[7]利用范本构建语法模板生成仿自然语言隐写文本[J]. 苏胜君,李维斌,陈超,王朔中. 电子与信息学报. 2008(08)
[8]自然语言生成技术及其应用实例[J]. 贾佩山. 电脑与信息技术. 1997(02)
本文编号:3232494
【文章来源】:沈阳工业大学辽宁省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
信息隐藏结构框图
本文提出一种能够自动生成高质量隐写文本的信息隐藏方法,通过传统的概率统计模型(马尔可夫模型)和自然语言处理技术(循环神经网络)与哈夫曼编码相结合,以生成语法正确、语义连贯的隐写文本,降低被检测器捕获的风险。为了进一步提高隐写文本的隐蔽性和隐藏容量,且考虑到不同单词具有不同的敏感度,在提出的模型基础上对生成过程中构建的候选池进行优化,提出了基于困惑度计算的候选池自收缩机制,以期在提高生成的隐写文本的质量的同时,提高信息隐藏方法整体的隐蔽性。1.2国内外研究现状1.2.1文本信息隐藏研究现状图1.2文本信息隐藏研究现状Fig.1.2Theresearchstatusoftextinformationhiding
7第2章文本生成模型文本的自动生成离不开自然语言生成技术的发展。自然语言生成技术可分为模版生成技术和属性-特征生成技术。针对基于模版的文本生成技术不适用于开放性领域的缺陷,本文采用基于语言模型的生成技术自动生成隐写文本,并选用概率统计模型(马尔可夫模型)和深度学习模型(循环神经网络)对文本的语义特征进行提取和分析,为后文秘密信息的嵌入和提取算法作铺垫。2.1马尔可夫模型在统计自然语言处理领域,通常使用统计语言模型[37]对句子进行建模。语言模型将句子视为序列字符串,对句子中单词的概率分布进行建模,如公式(2.1)所示:niiinnwwwppwwwpwwwpwwpwpS11111213121)|()|()|()|()()((2.1)其中,S表示由单词n,...,,www21组成的句子,长度为n。在语言模型中,生成第nii)1(个单词的概率分布是由此时刻前已经产生的i1个词121,...,,iwww决定的,即),...,|(ii11wwwp。因此,在自动生成隐写文本的信息隐藏方法中,若想自动生成高质量的文本,需要获得训练样本集的统计语言模型的良好的估计。图2.1马尔可夫模型Fig.2.1Markovmodel马尔可夫模型(Markovmodel)[38,39]是具有无后效性的随机过程,是描述了一系列可能事件的随机模型,如图2.1所示。该过程的主要思想为:当过程在时刻t的状态为已知时,过程在t1时刻所处状态的概率特性只与过程在t时刻所处的状态有关,而与过程在t时刻之前的状态无关,可用公式(2.2)表示:)|(),...,,|(1211tkttktPXXsXPXsXX(2.2)其中,},...,,{21TXXXX是一组随机序列,角标t代表该状态所对应的时刻。沈阳工业大学硕士学位论文
【参考文献】:
期刊论文
[1]深度置信网络模型及应用研究综述[J]. 刘方园,王水花,张煜东. 计算机工程与应用. 2018(01)
[2]基于雅克比符号的文本信息隐藏[J]. 左祥建,杨晓莉. 计算机技术与发展. 2016(02)
[3]基于替换有格式文本空间特征信息的隐藏策略[J]. 张鑫. 新乡学院学报(自然科学版). 2011(05)
[4]基于动态模板的电子文书生成技术研究[J]. 尧欣. 信息记录材料. 2010(03)
[5]基于支持向量机的文本隐写分析[J]. 眭新光,罗慧,朱中梁. 计算机工程. 2009(06)
[6]针对同义词替换信息隐藏的检测方法研究[J]. 罗纲,孙星明,向凌云,刘玉玲,甘灿. 计算机研究与发展. 2008(10)
[7]利用范本构建语法模板生成仿自然语言隐写文本[J]. 苏胜君,李维斌,陈超,王朔中. 电子与信息学报. 2008(08)
[8]自然语言生成技术及其应用实例[J]. 贾佩山. 电脑与信息技术. 1997(02)
本文编号:3232494
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3232494.html