基于网络涉恐数据Logo识别技术的研究与实现
发布时间:2024-05-19 21:06
伴随着有害数据在互联网中大肆传播,如何有效地检测出这些有害数据,维护网络的健康安全是整个社会所需要研究的重要课题。经过对有害数据的研究分析,逐渐形成了以图像处理技术为核心的检测架构。本课题的研究依托于中国电子科技集团第30研究所成都三零凯天公司的“视图内容检测分析系统—GA”项目。项目要求通过将已掌握的图像、视频等抽取为视觉特征库,并利用特征库匹配及深度学习的视觉分类技术,对内容平台推送的图片、视频、文档内容进行匹配、识别及分析,快速甄别出海量信息中不良有害内容,为相关部门子系统提供有效线索,供其进行进一步的关联分析。本文重点研究如何利用现有的图像处理技术快速甄别有害数据中的涉恐徽标(Logo)。在Logo识别模块中,图像分类模型具有至关重要的作用,而支持向量机(Support Vector Machine,SVM)是图像分类应用中最广泛的一种分类器,因此本文首先对基于传统词袋模型(Bag-of-words model,BOW)的SVM图像分类模型进行研究,分析了传统词袋模型存在的两点缺陷:视觉词信息表征准确性不高和灵活性差。本文根据这两个缺陷结合可对比性词及汉明嵌入技术,对传统词袋模...
【文章页数】:89 页
【学位级别】:硕士
【部分图文】:
本文编号:3978460
【文章页数】:89 页
【学位级别】:硕士
【部分图文】:
图1.2互联网内容监管平台结构图
图1.2互联网内容监管平台结构图1.1.2有害内容识别据有关数据记录,“东伊运”与“ISIS”仅2013年就制作并发布的涉恐涉暴音视频超过100部[3],通过多种渠道妄想传入境内有关地区,散播暴力恐怖、宗教极端、鼓吹“圣战”、民族分裂等思想,从而利用这些数据影响组织....
图2.5空间极值点检测第二步是对关键点进行精确定位
重庆邮电大学硕士学位论文的像素点坐标由(x,y)表示,而是相邻尺度空度。图像的全局特征和局部特征分别集中在以可以使用DoG(DifferenceOfGaussian)函数来如下:(x,y,k)G(x,y,))*I(x....
图5.2改良前词袋模型表征结果示意图
第5章实验结果及性能分析为了方便测试,测试的数据采用涉恐Logo。首先训练集选取900张包括各个涉恐Logo和部分正常网络数据的图像集用于聚类成视觉词典和训练SVM分类器,在训练SVM分类器时需要将数据依据类别划分开;其次选取每一个类别的“纯”图像集大小是4....
图5.3改良后词袋模型表征结果示意图
55图5.3改良后词袋模型表征结果示意图由改良前后词袋模型的词表征结果表明,改良后词袋模型的词表征结果相比于传统词袋模型有了极大的缩短,词表征的形式更加简洁,并且削弱了干扰视觉词对后续处理的影响。为验证改良后词袋模型在鉴别力上的提高,需要结合实际的应用进行测试。以下将对基于传....
本文编号:3978460
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3978460.html
最近更新
教材专著