购物平台商品信息图片中的文字识别
发布时间:2020-12-26 17:05
随着互联网的飞速发展,越来越多的人们开始习惯于在电子商务平台上购物。商品信息图片这种简洁生动而又丰富准确的视觉信息给消费者带来便利的同时也给电子商务网站的管理人员带来了技术方面的挑战。由于商品信息图片中文字的表现形式为受到字符多样性、背景纹理等条件干扰的光学字符,从而不能被计算机直接搜索和处理,这就造成了一部分不良商家通过把违规商品信息以图片的形式面向消费者展示同时还能规避网络监管的事情时有发生。因此,研究如何从这些电商图像中准确提取文字信息具有重要实用价值。自动从商品信息图片中提取文本信息将有助于电子商务企业在大数据时代提高商品的推荐效率、提升售后保障和信息化监管水平。本文主要针对电商图片中的字符定位和识别算法进行了研究,在一系列关于图像处理、文字特征提取、文字定位等算法的研究基础上,抛弃了传统“边缘检测+腐蚀膨胀”的特征提取方法,模拟肉眼的视觉机理提出了通过灰度聚类、图层分解、去噪等步骤进行字符定位的方法,同时进一步结合邻近搜索和统计切割技术针对汉字的几何特征进行了字符切割,最后采用了卷积神经网络模型,通过多层卷积神经网络,构建了单字的识别模型,成功剔除了图片的背景区域,实现了对于...
【文章来源】:西北师范大学甘肃省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
电商平台商
第1章绪论3(a)某平台商品宣传页面(b)消费者实际到手的物品图1-1电商平台商品虚假宣传页面图(a)违规商品宣传页面(b)违规商品宣传页面图1-2电商平台违规商品页面图
第2章文字识别相关技术15模型。卷积神经网络是人工神经网络的一种,已成为当前图像识别领域的主流模型,它通过局部感知野和权值共享方法,降低了网络模型的复杂度,减少了权值的数量,在网络结构上更类似于生物神经网络,这也预示着它必然具有更优秀的效果。本文选择卷积神经网络的主要原因包括以下三点:1.对原始图像自动提取特征:卷积神经网络模型可以直接将原始图像进行输入,免除了传统模型的人工提取特征这一比较困难的核心部分。2.比传统模型更高的精度:比如在MNIST手写数字识别任务中,可以达到99%以上的精度,这远高于传统模型的精度。3.比传统模型更好的泛化能力:这意味着图像本身的形变(伸缩、旋转)以及图像上的噪音对识别的结果影响不明显,这正是一个效果良好的字符识别操作所必需的。卷积神经网络本质上可以看作是全连接神经网络(例如众所周知的多层感知器Multi-LayerPerceptron)的改进版本。由于权重共享属性,网络中包含的参数数量大大减少,并且由于使用卷积核在图像中的每个位置连续执行卷积计算,具有提取局部特征的作用。以上的两个属性使卷积神经网络在进行图像处理任务时比全连接神经网络更方便[41]。卷积神经网络的灵感来自研究大脑视觉原理的过程,如图2-1所示。诺贝尔医学奖获得者TorstenWiesel和DavidHubel在1981年提出人类的大脑在进行视觉系统的信息处理时是通过分级的可视皮层进行的。首先从瞳孔捕获原始信号,然后第一级皮层检测原始信号的轮廓与边缘,接着第二级皮层检测基于前一层信息判断的某些关键形状,最后第三级皮层从第二级皮层检测所得图像中的信息高度抽象总结出具体对象。图2-1大脑视觉原理过程图
本文编号:2940114
【文章来源】:西北师范大学甘肃省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
电商平台商
第1章绪论3(a)某平台商品宣传页面(b)消费者实际到手的物品图1-1电商平台商品虚假宣传页面图(a)违规商品宣传页面(b)违规商品宣传页面图1-2电商平台违规商品页面图
第2章文字识别相关技术15模型。卷积神经网络是人工神经网络的一种,已成为当前图像识别领域的主流模型,它通过局部感知野和权值共享方法,降低了网络模型的复杂度,减少了权值的数量,在网络结构上更类似于生物神经网络,这也预示着它必然具有更优秀的效果。本文选择卷积神经网络的主要原因包括以下三点:1.对原始图像自动提取特征:卷积神经网络模型可以直接将原始图像进行输入,免除了传统模型的人工提取特征这一比较困难的核心部分。2.比传统模型更高的精度:比如在MNIST手写数字识别任务中,可以达到99%以上的精度,这远高于传统模型的精度。3.比传统模型更好的泛化能力:这意味着图像本身的形变(伸缩、旋转)以及图像上的噪音对识别的结果影响不明显,这正是一个效果良好的字符识别操作所必需的。卷积神经网络本质上可以看作是全连接神经网络(例如众所周知的多层感知器Multi-LayerPerceptron)的改进版本。由于权重共享属性,网络中包含的参数数量大大减少,并且由于使用卷积核在图像中的每个位置连续执行卷积计算,具有提取局部特征的作用。以上的两个属性使卷积神经网络在进行图像处理任务时比全连接神经网络更方便[41]。卷积神经网络的灵感来自研究大脑视觉原理的过程,如图2-1所示。诺贝尔医学奖获得者TorstenWiesel和DavidHubel在1981年提出人类的大脑在进行视觉系统的信息处理时是通过分级的可视皮层进行的。首先从瞳孔捕获原始信号,然后第一级皮层检测原始信号的轮廓与边缘,接着第二级皮层检测基于前一层信息判断的某些关键形状,最后第三级皮层从第二级皮层检测所得图像中的信息高度抽象总结出具体对象。图2-1大脑视觉原理过程图
本文编号:2940114
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2940114.html