网络图片敏感文字的检测研究与实现
发布时间:2021-02-01 21:06
随着互联网的快速发展与应用,网络安全的风险和威胁日益突出。一些不法分子利用音频、文字和图片的传播途径在网络上进行恐怖、淫秽、洗钱、反动、赌博等犯罪活动,严重影响了广大网民的身心健康。目前,纯文本形式的敏感信息过滤技术发展成熟,并得到了广泛的应用。对于其它的传播途径,相关的监管手段还存在着不足。针对一些文字嵌入到图片的传播形式,本文结合了当前自然场景的文本检测与识别的新成果,提出了一种网络图片的敏感文本信息检测方法。(1)针对网络敏感文字图片不同尺度的文字定位困难的问题,本文在Textboxes++文字定位算法的基础上进行改进,提出了DG-Textboxes++文字定位算法,该算法优化了特征提取网络并引入可形变卷积,使其感受野来适应文字序列的变化,并对冗余的定位框进行了优化。该文字定位算法在ICDAR2015数据集中综合指标F_mean达到了69.3%,能准确完成文字的定位。(2)针对网络敏感文字图片的中文识别困难的问题,本文在CRNN文字识别算法的基础上进行改进,提出了DS-RCNN文字识别算法,该算法使用了深度的密集卷积神经网络来提取文字特征,并利用空间变换网络来对网络图片中的倾斜中...
【文章来源】:重庆邮电大学重庆市
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
各类网络上的文字图片示例
重庆邮电大学硕士学位论文第1章绪论7了完整的网络图片的敏感信息解决方案,对图片的定位、提取和图片信息的压缩进行了研究,开发了基于文字与肤色关键语义的敏感影像检测应用系统,并应用到广东移动现网系统中。宋晓敏[30]提出了基于贝叶斯算法的文本分类模型,该模型将词频-逆文档频率特征的权重导入到贝叶斯分类器中,提高了中文文本分类的准确性。文献[31]在深入研究和利用深度学习相关算法的基础上,采用了基于FPGA与CPU的异构架构对含有敏感文字图片进行定位与识别,其方案中特征提取部分采用的是VGG-16[32]网络,随着网络规模和深度的提升,会产生过拟合并难以实现收敛。随着深度学习在不同领域上的快速发展与应用,一些新的算法模型用于文本的分类和文本的情感分析等方面有了更多的研究成果,这对于图片的敏感信息文本的相关研究有着较好的启发。赵宇蕾[33]提出了基于深度学习的中文医疗化验单图像的检测模型,并针对图像特征尺度的问题,对不同的卷积进行有效融合,提高了检测模型对医疗化验单图像的识别准确率。1.2.4当前工作研究难点通过对上述研究现状的分析得知,敏感文字信息的图片检测存在以下几个难点:1.图片定位与识别的复杂性一些复杂背景的网络图片中存在文字大孝方向多变的现象,有的还包含了不规则文字,若倾斜角度较大会导致文字变形,使文字定位与识别的难度变大。比如曲形排列的文本形状难以用一个矩形检测框去覆盖,无论是定位还是识别都比普通的文本行更具有挑战性。如图1.2所示,该广告图片中文字的大孝尺度多变且包含部分艺术字体。图1.2典型难以定位与识别的图片样本
重庆邮电大学硕士学位论文第2章基于DG-Textboxes++文字定位算法14播得到的。对于多尺度文本行来说,在DVGG特征提取网络最后的3层3*3可形变卷积可以减少常规卷积核引入的大量背景对特征的干扰。2.3.2多方向的目标定位框设计SSD系列算法的默认框defaultbox与Faster-RCNN算法中anchor机制类似,设置一个默认框并利用卷积层来预测边框相对于默认框的偏移量。在Textboxes++算法中,defaultbox定义的text-box层(conv4_3,conv7,conv8_2,conv9_2,conv_10_2,conv_11_2)生成在特征图上,通过text-box层可直接预测文本出现的置信度分数和相应的边框的偏移量。为了适应多角度的文本,Textboxes++在SSD和Textboxes的基础上做了一些改进,其中的text-box层输出一系列的多角度文本定位框使用{q}或者{r}集合来表示,同时输出对应于多角度文本定位框的最小外界水平矩形框使用{b}集合来表示。多角度文本定位框是通过defaultbox回归得到的,如图2.6表示,图中绿色虚线表示与真值groundtruth匹配的defaultbox,黄色框表示groundtruth,红色箭头表示回归的方向,黑色框表示未匹配到真值的defaultbox,绿色实线框表示对应groundtruth的最小外界水平矩形框[35]。图2.6定位框表示的示例图[35]假定对应输入特征图上有水平的defaultbox,用0(,,,)0000b=xywh表示,其中(,)00xy表示为defaultbox的中心坐标,0w和0h分别表示为宽和高。回归出来的多角度文本框有两种表示方式,一种是使用四个点表示四边形为:(,,,,,,,)qqqqqqqq0101020203030404=xyxyxyxy0q(2.6)另一种是使用四边形的左上点、右上点和旋转矩形的高表示为:(,,,,)rrrrr010102020=xyxyh0r(2.7)
【参考文献】:
期刊论文
[1]基于词频统计的文本关键词提取方法[J]. 罗燕,赵书良,李晓超,韩玉辉,丁亚飞. 计算机应用. 2016(03)
[2]基于小波变换的图像中维吾尔文字定位[J]. 哈力旦·A,库尔班·买提木沙. 计算机工程. 2011(08)
博士论文
[1]面向互联网的图像敏感内容分析系统的关键技术研究[D]. 李英.西安电子科技大学 2018
[2]基于图像分析和深度学习的船名标识字符检测与识别研究[D]. 刘宝龙.浙江大学 2018
硕士论文
[1]基于改进贝叶斯算法的中文信息分类研究[D]. 宋晓敏.北京邮电大学 2019
[2]中文医疗化验单图像的信息抽取与识别算法研究[D]. 赵宇蕾.北京交通大学 2019
[3]基于异构计算的图片敏感文字检测系统[D]. 彭海.电子科技大学 2018
本文编号:3013436
【文章来源】:重庆邮电大学重庆市
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
各类网络上的文字图片示例
重庆邮电大学硕士学位论文第1章绪论7了完整的网络图片的敏感信息解决方案,对图片的定位、提取和图片信息的压缩进行了研究,开发了基于文字与肤色关键语义的敏感影像检测应用系统,并应用到广东移动现网系统中。宋晓敏[30]提出了基于贝叶斯算法的文本分类模型,该模型将词频-逆文档频率特征的权重导入到贝叶斯分类器中,提高了中文文本分类的准确性。文献[31]在深入研究和利用深度学习相关算法的基础上,采用了基于FPGA与CPU的异构架构对含有敏感文字图片进行定位与识别,其方案中特征提取部分采用的是VGG-16[32]网络,随着网络规模和深度的提升,会产生过拟合并难以实现收敛。随着深度学习在不同领域上的快速发展与应用,一些新的算法模型用于文本的分类和文本的情感分析等方面有了更多的研究成果,这对于图片的敏感信息文本的相关研究有着较好的启发。赵宇蕾[33]提出了基于深度学习的中文医疗化验单图像的检测模型,并针对图像特征尺度的问题,对不同的卷积进行有效融合,提高了检测模型对医疗化验单图像的识别准确率。1.2.4当前工作研究难点通过对上述研究现状的分析得知,敏感文字信息的图片检测存在以下几个难点:1.图片定位与识别的复杂性一些复杂背景的网络图片中存在文字大孝方向多变的现象,有的还包含了不规则文字,若倾斜角度较大会导致文字变形,使文字定位与识别的难度变大。比如曲形排列的文本形状难以用一个矩形检测框去覆盖,无论是定位还是识别都比普通的文本行更具有挑战性。如图1.2所示,该广告图片中文字的大孝尺度多变且包含部分艺术字体。图1.2典型难以定位与识别的图片样本
重庆邮电大学硕士学位论文第2章基于DG-Textboxes++文字定位算法14播得到的。对于多尺度文本行来说,在DVGG特征提取网络最后的3层3*3可形变卷积可以减少常规卷积核引入的大量背景对特征的干扰。2.3.2多方向的目标定位框设计SSD系列算法的默认框defaultbox与Faster-RCNN算法中anchor机制类似,设置一个默认框并利用卷积层来预测边框相对于默认框的偏移量。在Textboxes++算法中,defaultbox定义的text-box层(conv4_3,conv7,conv8_2,conv9_2,conv_10_2,conv_11_2)生成在特征图上,通过text-box层可直接预测文本出现的置信度分数和相应的边框的偏移量。为了适应多角度的文本,Textboxes++在SSD和Textboxes的基础上做了一些改进,其中的text-box层输出一系列的多角度文本定位框使用{q}或者{r}集合来表示,同时输出对应于多角度文本定位框的最小外界水平矩形框使用{b}集合来表示。多角度文本定位框是通过defaultbox回归得到的,如图2.6表示,图中绿色虚线表示与真值groundtruth匹配的defaultbox,黄色框表示groundtruth,红色箭头表示回归的方向,黑色框表示未匹配到真值的defaultbox,绿色实线框表示对应groundtruth的最小外界水平矩形框[35]。图2.6定位框表示的示例图[35]假定对应输入特征图上有水平的defaultbox,用0(,,,)0000b=xywh表示,其中(,)00xy表示为defaultbox的中心坐标,0w和0h分别表示为宽和高。回归出来的多角度文本框有两种表示方式,一种是使用四个点表示四边形为:(,,,,,,,)qqqqqqqq0101020203030404=xyxyxyxy0q(2.6)另一种是使用四边形的左上点、右上点和旋转矩形的高表示为:(,,,,)rrrrr010102020=xyxyh0r(2.7)
【参考文献】:
期刊论文
[1]基于词频统计的文本关键词提取方法[J]. 罗燕,赵书良,李晓超,韩玉辉,丁亚飞. 计算机应用. 2016(03)
[2]基于小波变换的图像中维吾尔文字定位[J]. 哈力旦·A,库尔班·买提木沙. 计算机工程. 2011(08)
博士论文
[1]面向互联网的图像敏感内容分析系统的关键技术研究[D]. 李英.西安电子科技大学 2018
[2]基于图像分析和深度学习的船名标识字符检测与识别研究[D]. 刘宝龙.浙江大学 2018
硕士论文
[1]基于改进贝叶斯算法的中文信息分类研究[D]. 宋晓敏.北京邮电大学 2019
[2]中文医疗化验单图像的信息抽取与识别算法研究[D]. 赵宇蕾.北京交通大学 2019
[3]基于异构计算的图片敏感文字检测系统[D]. 彭海.电子科技大学 2018
本文编号:3013436
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3013436.html
最近更新
教材专著