当前位置:主页 > 法律论文 > 治安法论文 >

基于公安大数据图片存取技术研究

发布时间:2020-07-14 06:27
【摘要】:一方面,随着公安“天网”,视频监控基础设施的建设与完善,监控视频数据出现井喷式的增长,另一方面,随着大数据、云计算、物联网等新一代信息化技术的快速发展,公安部门建设基于大数据技术的数据挖掘信息平台,用于情报分析研判及非接触式犯罪分析与预测。海量视频数据的快速存储、高效检索是完成其它功能的基础,因此海量图片数据的高效存储及快速存取技术的研究与应用,有着重大的现实意义。随着监控视频的井喷式增长,图片的存储量已经达到PB以上,并且不断的在扩大。Hadoop的分布式文件系统HDFS,分布式并行化计算框架MapReduce以及HBase为视频数据处理提供了良好的平台。Hadoop为海量视频图片的检索提供了快速、高效的解决方案。本文介绍了人脸识别、特征值提取、文件合并传输以及分布式存储等海量视频数据处理的一系列过程。重点介绍了公安数据的数据来源、数据格式并结合公安项目本身需求对RowKey、列簇进行设计。公安大数据中有非主键查询的多种需求,为了进一步提升检索效率,文中给出了HBase二级索引方案。本文利用本地服务器提取图片特征值,在Hadoop平台下对图片特征值进行聚类处理,最后利用LSH算法将相似的图片映射到同一个哈希桶内。同时文中对k-means进行了适当的改进。首先对图片特征值进行随机抽样处理,减少计算量,之后对数据进行基于密度的聚类处理,动态的确定k-means聚类算法的类簇中心。由小到大绘制K-dist图,利用k-dist图寻找聚类中心,从而减少k-means算法迭代次数。通过与传统的存储方式、传统的k-means的对比测试,证明本论文的k-means算法以及HBase表的设计很大程度的提高了图片的检索效率。
【学位授予单位】:长江大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:D631.1;TP311.13
【图文】:

特征图,特征图


k-means算法为了确定聚类中心点,开始的时候聚类的中心点是随机的,k-means会进行多次的迭代,甚至有可能进行数百次的迭代,这会极大的浪费计算资源、极大的占用 CPU、减少其性能。为了解决这个问题最好的办法是对数据进行随机抽样处理,在海量的数据集合下抽取出一定比例的数据,进行聚类中心点的确定。这样做的好处抽样处理不会改变数据的本身的特性,用抽样的数据来代替已有的所有的数据进行数据的分析。样本方差:1()n122 = =nxxSii(3-4)抽样平均误差:nxXx =2()μ (3-5)根据下图 3-1所示图像的分布的特点我们可以看出,虽然右边的数据大大的减少了但是右边的数据并没有影响数据的整体的特性规律。对数据集做抽样的处理,会大大降低数据量,大大的提高程序的运行性能。

节点,图片,后台,聚类中心


等以空间划分的图片检索的优点在于他们检索图片的精确高的,但是在海量多维度的向量的检索效率极差。本论文采用的是利于高维向量检索。时间复杂度在使用 LSH 算法之后将会有一个法中,使用 m个哈希表和 k个哈希函数,最终将会形成 m*k个哈的统一的特征向量进行哈希计算,最终结果是在同一个桶中的特以相似的特征都将在相似的桶内。图像检索的模块的图片输入到后台时,后台将会利用 SURF对前台输入的图片进提取,之后用计算得到的特征值与后台中已有的聚类中心进行计聚类中心点,最后通过 LSH计算,将我们需要查询的范围缩小到希桶中的所有的数据,计算距离,只要距离在某一个范围内,我我们想要得到图片,最后将检索的图片输出。特征提取模块分析图像特征值提取模块的性能,分别在不同的节点数下进行分析,的节点个数。具体的实验结果如图 4-7。

【相似文献】

相关期刊论文 前10条

1 李涛;检索效率的提高[J];管理科学文摘;1997年04期

2 翰韬;;检索效率浅析[J];河南图书馆学刊;1987年02期

3 杨恒芬;关于检索效率[J];云南档案;1988年02期

4 任燕鸣;王家治;;浅谈提高计算机检索效率的条件[J];水泥与房建材料;1988年01期

5 傅贤贞;提高《世界专利索引》检索效率的几个问题[J];情报学刊;1989年02期

6 丘峰;;关于提高检索效率的途径与措施[J];图书情报工作;1982年06期

7 李爱军;孙智英;;科学研究中提高信息检索效率的方法探讨[J];农业网络信息;2012年05期

8 张琪玉;自然语言检索中各种因素对检索效率的影响[J];情报理论与实践;1997年05期

9 陈能华;加权检索中影响检索效率的原因分析[J];高校图书馆工作;1995年03期

10 王崇良;余朝晖;;张琪玉“检索效率”思想研究[J];荆楚学刊;2018年02期

相关会议论文 前5条

1 郭军宏;邓娜;;从审查角度谈测量领域的检索查新[A];发展知识产权服务业,支撑创新型国家建设-2012年中华全国专利代理人协会年会第三届知识产权论坛论文选编(第二部分)[C];2011年

2 张宝成;周冬;;谈用清洁能源分类体系提高节能建筑领域申请的检索效率[A];2014年中华全国专利代理人协会年会第五届知识产权论坛论文(第二部分)[C];2014年

3 郑明;朱宁;宋庆华;;把握技术方案核心,提高通知书说服力[A];提升知识产权服务能力 促进创新驱动发展战略——2014年中华全国专利代理人协会年会第五届知识产权论坛优秀论文集[C];2014年

4 曹玉娟;牛振东;彭学平;江鹏;;一个基于特征向量的近似网页去重算法[A];中国索引学会第三次全国会员代表大会暨学术论坛论文集[C];2008年

5 王宗文;彭亮;赵奇;;一种互助检索模型的设计[A];提升知识产权服务能力 促进创新驱动发展战略——2014年中华全国专利代理人协会年会第五届知识产权论坛优秀论文集[C];2014年

相关重要报纸文章 前4条

1 赵硕;因材施“检”提高检索效率[N];中国知识产权报;2013年

2 中国建设银行陕西省分行信息科技处 申飚;存储成本与检索效率的有效平衡[N];计算机世界;2003年

3 本报记者 潘永花;组件化平台提升信息检索效率[N];网络世界;2003年

4 宋家雨;存储一体化关键在于“搜索”[N];网络世界;2007年

相关博士学位论文 前1条

1 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年

相关硕士学位论文 前10条

1 程孝孝;基于公安大数据图片存取技术研究[D];长江大学;2019年

2 白晓丹;搜索引擎网页相关性及检索效率评价体系研究[D];北京交通大学;2015年

3 韩丽华;信息检索可视化效率若干问题研究[D];黑龙江大学;2008年

4 张建静;基于多级缓存的海量感知数据检索优化的研究[D];北方工业大学;2014年

5 周亮;基于OWL-S的Web服务发现[D];南京理工大学;2005年

6 侯丛;DNA数据存储与比对技术研究[D];西安电子科技大学;2004年

7 顾燕;基于内容的图像检索方法及其实验系统设计[D];河海大学;2002年

8 王艳柏;基于内容的图像检索技术研究[D];长春理工大学;2009年

9 华丽君;基于Tag-LDA语义分析的全文检索方法研究[D];华中师范大学;2015年

10 朱晓飞;基于Z39.50的分布式检索技术在数字图书馆系统的应用研究[D];重庆大学;2007年



本文编号:2754623

资料下载
论文发表

本文链接:https://www.wllwen.com/falvlunwen/fanzuizhian/2754623.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c8d56***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com