基于Hadoop的视觉词袋模型图像分类算法
本文选题:Hadoop + 图像分类 ; 参考:《天津大学学报(自然科学与工程技术版)》2017年06期
【摘要】:随着互联网的发展和数字图像获取技术的进步,传统图像分类算法在处理海量数字图像时,面临耗时过多、文件系统及处理架构落后的问题.针对这一问题,利用主流的Hadoop开源分布式计算平台,引入视觉词袋模型实现对图像的表示,并对模型的图像直方图化过程做出改进,提出一种自适应的特征分配方法,最后采用易于并行的随机森林算法作为分类器,以充分利用Hadoop平台强大的分布式计算能力.实验显示,基于Hadoop平台的图像分类方法在处理大规模数据集时较单机环境能有效减少时间消耗,同时具有良好的分类效果.
[Abstract]:With the development of the Internet and the progress of the digital image acquisition technology, the traditional image classification algorithm is faced with the problem of time-consuming and backward file system and processing architecture in processing massive digital images. Aiming at this problem, using the mainstream Hadoop open source distributed computing platform, this paper introduces the visual word bag model to realize the image representation, and improves the image histogram process of the model, and proposes an adaptive feature assignment method. Finally, the stochastic forest algorithm which is easy to parallel is used as classifier to make full use of the powerful distributed computing power of Hadoop platform. Experimental results show that the image classification method based on Hadoop platform can effectively reduce the time consumption and has a good classification effect compared with the single computer environment in dealing with large data sets.
【作者单位】: 天津大学电气自动化与信息工程学院;天津大学信息与网络中心;
【基金】:国家自然科学基金资助项目(61571325)~~
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 刘足华;熊惠霖;;基于随机森林的目标检测与定位[J];计算机工程;2012年13期
2 董师师;黄哲学;;随机森林理论浅析[J];集成技术;2013年01期
3 陈姝;彭小宁;;基于粒子滤波和在线随机森林分类的目标跟踪[J];江苏大学学报(自然科学版);2014年02期
4 王丽婷;丁晓青;方驰;;基于随机森林的人脸关键点精确定位方法[J];清华大学学报(自然科学版);2009年04期
5 李建更;高志坤;;随机森林针对小样本数据类权重设置[J];计算机工程与应用;2009年26期
6 吴华芹;;基于训练集划分的随机森林算法[J];科技通报;2013年10期
7 程光;王贵锦;何礼;林行刚;;人体姿势估计中随机森林训练算法的并行化[J];计算机应用研究;2014年05期
8 于延;王建华;;基于云计算平台的随机森林算法的研究与实现[J];科技通报;2013年04期
9 刘永春;宋弘;;基于随机森林的乳腺肿瘤诊断研究[J];电视技术;2014年15期
10 杨帆;林琛;周绮凤;符长虹;罗林开;;基于随机森林的潜在k近邻算法及其在基因表达数据分类中的应用[J];系统工程理论与实践;2012年04期
相关会议论文 前2条
1 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
2 武晓岩;方庆伟;;基因表达数据分析的随机森林方法及算法改进[A];黑龙江省第十次统计科学讨论会论文集[C];2008年
相关硕士学位论文 前10条
1 贺捷;随机森林在文本分类中的应用[D];华南理工大学;2015年
2 张文婷;交通环境下基于改进霍夫森林的目标检测与跟踪[D];华南理工大学;2015年
3 李强;基于多视角特征融合与随机森林的蛋白质结晶预测[D];南京理工大学;2015年
4 朱玟谦;一种收敛性随机森林在人脸检测中的应用研究[D];武汉理工大学;2015年
5 肖宇;基于序列图像的手势检测与识别算法研究[D];电子科技大学;2014年
6 李慧;一种改进的随机森林并行分类方法在运营商大数据的应用[D];电子科技大学;2015年
7 赵亚红;面向多类标分类的随机森林算法研究[D];哈尔滨工业大学;2014年
8 丁然;基于随机森林大豆籽粒外观品质识别系统的设计与实现[D];东北农业大学;2015年
9 邱佳迪;基于随机森林的恶意移动应用动态检测方法研究[D];浙江工业大学;2015年
10 张兴;基于Spark大数据平台的火电厂节能分析[D];太原理工大学;2016年
,本文编号:1950287
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1950287.html