图像内容识别技术和对比挖掘在网站分析中的应用研究

发布时间:2021-03-24 01:38
  现如今,随着生活质量提高,人们旅行比以往任何时候都多,对酒店需求也随之增加。信息技术的蓬勃发展使得社交网站为酒店选择提供了便利。但是,由于无法对网站上展示的酒店进行实地考察,消费者如何通过对比以选择满足自身需求的酒店成为广泛关注的问题。而网站上展示的图像在提供视觉享受的同时,为这一问题提供了很好的解决途径,因为图像能反映酒店实际情况。但是随着社交网站上的图像越来越多,图像信息负载问题也越来越严重,这对消费者进行人工对比选择造成了很大的困扰。针对上述问题,本文经过大量调研,发现在国内外社交网站的相关研究中,大多数人倾向于针对评论或者评分进行研究,然而图像内容的对比挖掘相关研究较少,使得图像信息无法得到充分利用。为实现对比两组大规模图像数据集并得到之间的差异,本文首先利用深度学习技术识别图像中的实体并得到标签。随后为消减实体相似性导致的信息冗余对对比分析产生的不利影响,采用:1)文本分析中词向量转化的方法,将实体标签向量化;2)无需指定类别数目的层次聚类算法进行标签向量的聚类。最后利用FP-Growth算法对聚类后的向量集挖掘频繁项集并进行对比挖掘,识别两组图像数据集中的对比模式。通过识别... 

【文章来源】:西安石油大学陕西省

【文章页数】:69 页

【学位级别】:硕士

【部分图文】:

图像内容识别技术和对比挖掘在网站分析中的应用研究


论文组织结构框图

模型图,模型,激活函数


耐黄芠32][52],在后续的跟图像相关的研究和应用中,这种类型的卷积神经网络倍受欢迎。(2)深度学习原理深度学习是一种从海量的数据中通过自身参数设置而自动学习数据之间的非线性关系的模型,其中一个重要的问题是怎样有效的学习这些关系。在建立模型时,如果能够引入一些更为一般的先验假设去表示输入数据的关系或者分布,将会增加算法的智能化程度。其中深度学习中一般的先验性假设包括:连续性、多因素性、分层组织、半监督性学习、特征共享、流形学习、天然聚类、空间时序列一致性、稀疏性、因素依赖简单性。图2-1深度学习模型在深度学习模型中,包含不同的层次,这些不同的层次表示不同尺度上的特定的特征表达,其中靠下层的结构可以反映数据中表达的细节信息,而较上层的结构则反映了数据所表达的全局信息。如图2-1所示,该图展示了四层,第一层反映的比较细小的信息,包含大量图像数据训练所得到的深度学习模型。第二张图为第二层则能得到物体的局部信息。第三层就能反映出比较完整的物体轮廓信息。而第四张图所表达的第四层则反映了比较清晰符合人类认知的信息。这些从不同的抽象程度所得到的特征,其非常强大的表示能力表达了不同的内容,每个特种中还包含着非常丰富的语义信息。(3)神经网络结构感知机是一种二分类的模型,也是深度学习的基本结构,其中包含一个激活函数,这里的激活函数主要是用来确定输入样本所属的类别。设感知机的输入数据为1,2,3则感知机的输出结果如式(2-1)所示:(2-1)其中为边的连接权重,为偏置函数,函数为激活函数。激活函数和权重点将输入数据向量映射到单个标量输出值。感知器输出值的取值范围可通过选择激活函数来确定。常见的节点激活函数包含以下三种形式:Sigmoid函数如式(2-2)所示:

原理图,原理图,神经网络,卷积


第二章图像内容识别技术9该函数的定义域为(∞,+∞),值域为(0,1).双曲正切函数如式(2-3)所示:(2-3)ReLU函数如式(2-4)所示:(2-4)其中,ReLU激活函数更加符合人脑自身对于事物的认知形式,其在一定程度上能增加隐层单元的系数程度,且易于求导,因此该激活函数在深度学习的模型中广泛应用。感知机有一定的信息处理能力,它能通过分类超平面将样本空间划分为两个区域,因此感知机是一种判别式的线性分类器。感知机模型可以当成人脑中的一个神经元,每个感知机模型都有自己单个的特殊识别任务需要完成,然后将许多类似的感知机模型组合在一起,就能构建出能够对任意复杂数据进行处理的非线性分类器。(4)特征学习层在计算机视觉领域中,特征所包含的有用信息量至关重要。好的特征是阶层式的,抽取特征的过程好比由像素到边,再到局部部分,再到整个物体,最后到整个复杂场景,因此特征抽取往往都是一层一层完成的。基于深度学习的框架为抽取特征提供了方便。而且,卷积操作更加接近人眼捕捉特征的生理机制,该操作还能应对图像的旋转、偏移、尺度缩放等变形。使用卷积神经网络来学习深度高层特征,如图2-2所示[49]:图2-2特征学习层的基本原理图卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种多层神经网络,是深度学习中非常基础神经网络。主要有以下特征:(1)通过卷积神经网络可以抽取图像特征,并且该网络的结构具有很强的自学习和并行处理特征的能力。(2)CNN除了拥有神经网络所拥有的最基础的结构之外,同时还可以通过局部感知和权值共享这两种方式有效降低传统网络的复杂程度。(3)CNN是一种多层的前馈网络,这些层是由多个二维平面组成的,并且在每个平


本文编号:3096803

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3096803.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户387b6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com