基于结构化主题模型的图像分类方法研究

发布时间：2021-08-29 14:57

　　图像分类是计算机视觉研究领域的重要问题之一,其准确性直接影响着人们对图像资源的有效利用。人工智能算法在分类速度和准确性等方面都有效地提高了图像分类的效果,但图像的底层特征表达与上层语义之间存在的“语义鸿沟”,仍然是严重影响图像分类准确率的一个重要因素。主题模型的主题是视觉词汇与上层语义之间的媒介,是克服“语义鸿沟”的有效方法之一。以图像分类问题为研究背景,本文针对隐狄利克雷分配（latent Dirichlet allocation,LDA）模型忽略视觉词汇之间空间位置关系的不足开展研究,从不同方面研究和探索具有空间信息的结构化主题模型的构建方法。结合图像数据特点,所提出的模型增强了对图像的表达能力,进而提高了图像分类的准确率;同时结合当前流行的深度学习方法,在主题模型中引入了卷积神经网络的特征表示,增强了主题模型的表达能力。本文研究的主要内容和贡献包括以下几方面:（1）提出融合图像内相邻主题结构关系的主题模型。LDA模型忽略了视觉词汇的空间位置关系,影响了其对图像表达的准确性。作为生成式模型,主题可以理解为视觉对象的组成部件,因此,相邻视觉词汇由同一主题产生的概率较高。据此,本文提出...

【文章来源】：哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】：125 页

【学位级别】：博士

【部分图文】：

基于结构化主题模型的图像分类方法研究

词袋模型的处理过程[18]

模型结构

NN）[43]算法基于区域卷积神经网络（regions CNN, R-CNN）[经网络（fast regions CNN, Fast-RCNN）[45]，将特征提取、区行整合，有效地提高了模型的速度和准确性。Wang 等人[46]将神经网络（recurrent neural networks, RNN）相结合，在图像标义标签依赖关系和图像标签相关性，有效地提高多标签图像[47]

模型图,概率图,模型,文档

PLSI 模型生成文档的过程择一篇文档 dm；得到一个主题 zk；生成一个词 wn。篇文档由多个主题以一定概率混合组Fig. 1-3 Graphical model of PLSI

【参考文献】：
期刊论文
[1]共词网络LDA模型的中文短文本主题分析[J]. 蔡永明,长青.  情报学报. 2018(03)
[2]ZenLDA: Large-Scale Topic Model Training on Distributed Data-Parallel Platform[J]. Bo Zhao,Hucheng Zhou,Guoqiang Li,Yihua Huang.  Big Data Mining and Analytics. 2018(01)
[3]图像物体分类与检测算法综述[J]. 黄凯奇,任伟强,谭铁牛.  计算机学报. 2014(06)
[4]局部特征与多示例学习结合的超声图像分类方法[J]. 丁建睿,黄剑华,刘家锋,张英涛.  自动化学报. 2013(06)
[5]一种新的目标检测方法:Latent Dirichlet classification[J]. 丁轶,郭乔进,李宁.  南京大学学报(自然科学版). 2012(02)
[6]一种自适应的Web图像语义自动标注方法[J]. 许红涛,周向东,向宇,施伯乐.  软件学报. 2010(09)
[7]建模连续视觉特征的图像语义标注方法[J]. 李志欣,施智平,刘曦,史忠植.  计算机辅助设计与图形学学报. 2010(08)
[8]一种基于类主题空间的图像场景分类方法[J]. 唐颖军,须德,解文杰,薄一航.  中国图象图形学报. 2010(07)
[9]图像-文本相关性挖掘的Web图像聚类方法[J]. 吴飞,韩亚洪,庄越挺,邵健.  软件学报. 2010(07)

本文编号：3370862

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/shengwushengchang/3370862.html

上一篇：基于迁移学习的广告点击率预测方法研究
下一篇：多核学习融合中层特征的图像分类算法

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|