基于深度学习的场景文字检测与识别方法研究
发布时间:2021-01-28 01:42
场景文字检测与识别是计算机视觉领域的重要任务。场景文字检测的目标是在自然场景图像中定位文字实例。场景文字识别的目标是将只包含单个文字实例的自然场景图像转化为计算机可以理解的字符串。相比于传统的光学字符识别,场景文字检测与识别面临着图像背景复杂,文字样式多变,成像质量不佳等诸多挑战。为了解决上述问题,本文建立了一个工业场景的文字图像数据集,并提出了两种新的基于深度学习的场景文字检测与识别方法。首先,本文建立了一个工业领域的场景文字检测与识别数据集——设备铭牌数据集。该数据集包含502张自然场景下拍摄的设备铭牌图像,并对图像中的铭牌位置、文字位置和内容进行了详细的标注。该数据集涵盖了 175种不同种类的铭牌,包含中文字符、英文字符、数字、符号等多种字符,以及凸起文字、雕刻文字、印刷文字、手写文字等多种形式的文字,具有很强的挑战性。其次,本文针对透视变换影响文字检测精度的问题,提出了一种基于关键点定位的场景文字检测方法。我们设计了一种关键点定位网络,用于定位文字区域的关键点,并根据关键点位置对文字图像进行转正。该方法不仅解决了透视变换影响文字检测精度的问题,还抑制了复杂的图像背景对文字检测的...
【文章来源】:中国科学院大学(中国科学院深圳先进技术研究院)广东省
【文章页数】:55 页
【学位级别】:硕士
【部分图文】:
图2.1设备铭牌标注样例
?基于深度学习的场景文字检测与识别方法研究???4000??3500??I3000??(U??^?2500??^?2000?■??I?1500?||??|||-??n?————屬.JLBI?Jl_I—麵_????I??0?250?500?750?1000?1250?1500?1750?2000??Length?of?Text?Region?in?Pixel??图2.2文字实例长度分布。??Figure?2.2?The?length?distribution?of?text?instance.??CO8000??93??O??(0??-M??-6000??■M??(0??J4000??〇?IllllllllllillllllHlIlllllllllllllliimiiim??0125?电?3AV4a?定.e?-额?C/kStT?压?rE6nR?号?87N?流?Dlo9iPHdLBGIg0uslVI?器??图2.3前50个字符类别的出现频率。??Figure?2.3?The?frequency?of?top?50?character?categories.??140??120??Ei〇〇??E??J?80??|?60??illlh??50?100?150??Number?of?Text?Regions??图2.4每张图像中的文字实例个数。??Figure?2.4?The?number?of?text?instances?in?each?image.??10??
?基于深度学习的场景文字检测与识别方法研究???4000??3500??I3000??(U??^?2500??^?2000?■??I?1500?||??|||-??n?————屬.JLBI?Jl_I—麵_????I??0?250?500?750?1000?1250?1500?1750?2000??Length?of?Text?Region?in?Pixel??图2.2文字实例长度分布。??Figure?2.2?The?length?distribution?of?text?instance.??CO8000??93??O??(0??-M??-6000??■M??(0??J4000??〇?IllllllllllillllllHlIlllllllllllllliimiiim??0125?电?3AV4a?定.e?-额?C/kStT?压?rE6nR?号?87N?流?Dlo9iPHdLBGIg0uslVI?器??图2.3前50个字符类别的出现频率。??Figure?2.3?The?frequency?of?top?50?character?categories.??140??120??Ei〇〇??E??J?80??|?60??illlh??50?100?150??Number?of?Text?Regions??图2.4每张图像中的文字实例个数。??Figure?2.4?The?number?of?text?instances?in?each?image.??10??
本文编号:3004124
【文章来源】:中国科学院大学(中国科学院深圳先进技术研究院)广东省
【文章页数】:55 页
【学位级别】:硕士
【部分图文】:
图2.1设备铭牌标注样例
?基于深度学习的场景文字检测与识别方法研究???4000??3500??I3000??(U??^?2500??^?2000?■??I?1500?||??|||-??n?————屬.JLBI?Jl_I—麵_????I??0?250?500?750?1000?1250?1500?1750?2000??Length?of?Text?Region?in?Pixel??图2.2文字实例长度分布。??Figure?2.2?The?length?distribution?of?text?instance.??CO8000??93??O??(0??-M??-6000??■M??(0??J4000??〇?IllllllllllillllllHlIlllllllllllllliimiiim??0125?电?3AV4a?定.e?-额?C/kStT?压?rE6nR?号?87N?流?Dlo9iPHdLBGIg0uslVI?器??图2.3前50个字符类别的出现频率。??Figure?2.3?The?frequency?of?top?50?character?categories.??140??120??Ei〇〇??E??J?80??|?60??illlh??50?100?150??Number?of?Text?Regions??图2.4每张图像中的文字实例个数。??Figure?2.4?The?number?of?text?instances?in?each?image.??10??
?基于深度学习的场景文字检测与识别方法研究???4000??3500??I3000??(U??^?2500??^?2000?■??I?1500?||??|||-??n?————屬.JLBI?Jl_I—麵_????I??0?250?500?750?1000?1250?1500?1750?2000??Length?of?Text?Region?in?Pixel??图2.2文字实例长度分布。??Figure?2.2?The?length?distribution?of?text?instance.??CO8000??93??O??(0??-M??-6000??■M??(0??J4000??〇?IllllllllllillllllHlIlllllllllllllliimiiim??0125?电?3AV4a?定.e?-额?C/kStT?压?rE6nR?号?87N?流?Dlo9iPHdLBGIg0uslVI?器??图2.3前50个字符类别的出现频率。??Figure?2.3?The?frequency?of?top?50?character?categories.??140??120??Ei〇〇??E??J?80??|?60??illlh??50?100?150??Number?of?Text?Regions??图2.4每张图像中的文字实例个数。??Figure?2.4?The?number?of?text?instances?in?each?image.??10??
本文编号:3004124
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3004124.html