基于深度学习的电商商品宣传图片文字识别研究
发布时间:2021-09-07 03:10
电商平台管理者需对商铺所售产品的海量商品图片进行信息抽取,进而实现风险管控,因此商品宣传图片文字识别是电商平台管理的技术关键。本文利用深度学习技术实现对电商商品宣传图片的文字检测与识别,为电商管理提供行之有效的技术支撑。主要研究内容如下:(1)针对CTPN(Connectionist Text Proposal Network)文字检测算法检测不同高度文字时易出现的检测框偏移问题,在CTPN的基础上,提出了融合文字高度特征的文字检测算法Hy-CTPN,该方法通过改善CTPN文字框合并机制,将文字高度信息加入文字检测框精修中。在ICDAR2013上的实验结果显示,Hy-CTPN算法的召回率为85%,F1-Measure为89%,检测时间为90ms,相比于原始CTPN,召回率提升了2%,F1-Measure提升了1%,算法平均预测时间缩短了50ms;在自制商品宣传图片检测数据集上HyCTPN也有较为优异的表现;(2)针对Hy-CTPN文字检测后出现的漏检问题,提出了一种基于卷积自动编码器特征的随机森林文字检测后验模型,该方法将深度学习中的卷积自编码特征与随机森林方法相结合。使用随机森林方法...
【文章来源】:河北经贸大学河北省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
商品宣传图片文文字检测随机森林文字检测后验
基于深度学习的电商商品宣传图片文字识别研究112系统处理流程与文字检测算法研究2.1系统处理流程基于深度学习的商品宣传图片文字识别处理流程如图2-1所示。图2-1商品宣传图片文字识别系统处理流程如图所示,商品宣传图片的文字检测与识别处理流程为:(1)使用所提出的融合文字高度信息的文字检测算法Hy-CTPN进行文字检测;(2)使用所提出的Auto-CNN特征+随机森林的文字检测后验模型进行文字检测后验验证;(3)使用所设计基于OP-Niblick的透视变换校正算法对检测后的文字图像进行畸变校正;(4)使用所提出的Simi-DenseNet+CTC特征序列识别算法进行文字序列识别。2.2数据收集及预处理由于目前还没有特定的商品宣传图片文字检测与识别数据集,故本文采用网络爬虫的方式进行数据收集,去除无效图片,剩余的图片共15243幅,使用labelImg进行图像标注。标注完成后,对此15243幅图像进行随机加噪声、随机旋转一定角度操作后,图像扩增至30000幅。此外,考虑到数据量与数据分布问题,对超市商品图像进行拍摄以收集数据,采取拍摄方式收集的数据集图片包括3000幅超市商品宣传图片文字图片,以此增加数据量,提高数据分布宽泛性。随后分别对数据图片进行随机旋转一定角度、加椒盐噪声、增强图片对比度进行数据扩增。经历数据扩增后,图像总体数量变为24000幅,与上文自制的图像数据集组成共54000幅商品宣传图片文字检测数据集。对一幅图像的数据扩增效文字检测随机森林文字检测后验文字畸变校正文字序列识别
RPN网络与CTPN网络对比
【参考文献】:
期刊论文
[1]基于OCR技术的网店工商信息识别提取系统[J]. 高洪坤,任焕海. 信息技术与信息化. 2021(07)
本文编号:3388724
【文章来源】:河北经贸大学河北省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
商品宣传图片文文字检测随机森林文字检测后验
基于深度学习的电商商品宣传图片文字识别研究112系统处理流程与文字检测算法研究2.1系统处理流程基于深度学习的商品宣传图片文字识别处理流程如图2-1所示。图2-1商品宣传图片文字识别系统处理流程如图所示,商品宣传图片的文字检测与识别处理流程为:(1)使用所提出的融合文字高度信息的文字检测算法Hy-CTPN进行文字检测;(2)使用所提出的Auto-CNN特征+随机森林的文字检测后验模型进行文字检测后验验证;(3)使用所设计基于OP-Niblick的透视变换校正算法对检测后的文字图像进行畸变校正;(4)使用所提出的Simi-DenseNet+CTC特征序列识别算法进行文字序列识别。2.2数据收集及预处理由于目前还没有特定的商品宣传图片文字检测与识别数据集,故本文采用网络爬虫的方式进行数据收集,去除无效图片,剩余的图片共15243幅,使用labelImg进行图像标注。标注完成后,对此15243幅图像进行随机加噪声、随机旋转一定角度操作后,图像扩增至30000幅。此外,考虑到数据量与数据分布问题,对超市商品图像进行拍摄以收集数据,采取拍摄方式收集的数据集图片包括3000幅超市商品宣传图片文字图片,以此增加数据量,提高数据分布宽泛性。随后分别对数据图片进行随机旋转一定角度、加椒盐噪声、增强图片对比度进行数据扩增。经历数据扩增后,图像总体数量变为24000幅,与上文自制的图像数据集组成共54000幅商品宣传图片文字检测数据集。对一幅图像的数据扩增效文字检测随机森林文字检测后验文字畸变校正文字序列识别
RPN网络与CTPN网络对比
【参考文献】:
期刊论文
[1]基于OCR技术的网店工商信息识别提取系统[J]. 高洪坤,任焕海. 信息技术与信息化. 2021(07)
本文编号:3388724
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3388724.html
最近更新
教材专著