电视视频中的文字识别及检索技术的研究
本文选题:视频字幕 + 文字检测 ; 参考:《北京邮电大学》2016年硕士论文
【摘要】:信息时代的今天,视频多媒体内容呈现爆炸式增长,对大量视频信息进行自动分析整理成为了当下学术界和工业界的迫切需求。视频字幕与视频内容相关度较强,特征明显,并且表达了丰富的视频高级语义信息。本文通过研究视频字幕检测识别问题,依此建立视频检索系统,来解决视频内容提取和检索的相关问题,具体工作如下:(1)提出基于高对比度图进行图像文字二值化的算法。本文通过分析了视频字幕文字的常见特点,利用自适应局部对比度算法得到文字的高对比度图像。然后,利用大津滤波和基于文字图像灰度统计分布的方法进行文字图像二值化。(2)关注字符切分定位算法,通过分析汉字字形特点和常见切分错误,使用基于字宽聚类的方法对二值化文字图像进行单字切分定位。另外,根据字幕文字在视频流中停留的特点,利用帧间字符融合的方法对滤波的二值化文字进行图像去噪。(3)实现了对大量视频快速检索方法。本文以视频字幕为中心对视频信息进行结构化分析,并根据镜头检测算法提取出字幕对应的关键帧。倒排索引和和空间向量模型的引入使得系统检索的效率大大提升。(4)提出视频字幕识别和检索的前后端架构并进行代码实现。前端系统负责对视频流进行文字滤波提取以及识别,由PC或者DSP实现,识别结果回传后端服务器进行建立索引等信息综合操作。实验证明,本文提出的算法对于多种样式的字幕文字都具有较好的效果。本文根据不同视频字幕的特点,建立了视频测试数据集,结果表明,在具有84%左右字幕识别准确度的前提下,系统仍然具有很好的实时性,并且具有多路并行视频处理的潜力。
[Abstract]:With the explosive growth of video multimedia content in the information age, the automatic analysis of a large number of video information has become an urgent need of academia and industry. Video subtitles have strong correlation with video content and are characterized by abundant advanced semantic information. By studying the problem of video subtitle detection and recognition, this paper establishes a video retrieval system to solve the related problems of video content extraction and retrieval. The main work is as follows: 1) an algorithm for binarization of image text based on high contrast graph is proposed. In this paper, we analyze the common features of video captioned text, and use adaptive local contrast algorithm to obtain the high contrast image of text. Then, the text image binarization is carried out by using the Otsu filter and the method based on the grayscale statistical distribution of the character image.) the algorithm of character segmentation localization is concerned. By analyzing the character of Chinese characters and common segmentation errors, A method based on word width clustering is used to locate the binary character image by single word segmentation. In addition, according to the characteristic of subtitle text staying in video stream, a fast retrieval method for a large number of video is realized by using the method of inter-frame character fusion to remove image noise from filtered binary text. In this paper, video subtitles are taken as the center for structured analysis of video information, and key frames corresponding to subtitles are extracted according to shot detection algorithm. With the introduction of inverted index and spatial vector model, the efficiency of system retrieval is greatly improved. (4) the front and back architecture of video subtitle recognition and retrieval is proposed and implemented in code. The front-end system is responsible for the text filtering and recognition of video stream, which is implemented by PC or DSP, and the result is sent back to the back-end server to build the index and other information synthesis operations. Experimental results show that the proposed algorithm is effective for various subtitles. According to the characteristics of different video subtitles, the video test data set is established in this paper. The results show that the system still has good real-time performance and has the potential of multi-channel parallel video processing under the premise of accuracy of about 84% subtitle recognition.
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 安艳辉,董五洲;粘连搭接字符切分方法研究[J];河北师范大学学报;2005年02期
2 安艳辉;董五洲;;基于识别反馈的粘连字符切分方法研究[J];河北省科学院学报;2008年02期
3 刘刚,丁晓青,彭良瑞,刘长松;多知识综合判决的字符切分算法[J];计算机工程与应用;2002年17期
4 魏湘辉;马少平;;粘连字符切分综述[J];计算机科学;2004年11期
5 刘阳兴;;基于折线切分路径的粘连搭接字符切分算法的研究[J];计算机应用研究;2011年10期
6 钟辉;刘辉;姜小帅;;一种基于数据分析的字符切分方法[J];沈阳建筑大学学报(自然科学版);2006年01期
7 安艳辉;陈韶霞;刘宗敏;;基于字符类别的识别反馈混排字符切分方法[J];河北省科学院学报;2011年01期
8 韩智;刘昌平;殷绪成;;手写中文信封的地址行字符切分算法[J];中文信息学报;2006年01期
9 安艳辉;董五洲;张广慧;;基于轮廓线搜索策略的搭接英文字符切分方法[J];河北省科学院学报;2008年01期
10 吴燕;袁保社;;联机手写维文字符切分算法研究[J];微计算机信息;2010年12期
相关会议论文 前7条
1 陈丹雯;吴玲达;;一种基于互增强原则的视频检索重排序方法[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
2 蔡奕奕;覃团发;;一种利用视频切片进行视频检索的方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
3 韩智广;吴玲达;徐建军;栾希道;;一种新的用于视频检索的语义索引[A];第四届和谐人机环境联合学术会议论文集[C];2008年
4 孟岩;刘云;;基于字幕的视频检索[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
5 申铉京;张婷;千庆姬;;基于内容的视频检索中运动分析的研究[A];第三届全国信息获取与处理学术会议论文集[C];2005年
6 彦楠;曾丰;张洪刚;郭军;;基于反馈的车牌颜色分类及字符切分[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
7 尹亚光;;一种基于视频指纹的视频检索方法研究[A];中国新闻技术工作者联合会第六次会员代表大会、2014年学术年会暨第七届《王选新闻科学技术奖》和优秀论文奖颁奖大会论文集(三等奖)[C];2014年
相关重要报纸文章 前2条
1 江西 谭明裕 肖慧清;文字识别利器——ABBYY Finereader[N];电子报;2013年
2 记者 张建琛;文字识别技术为手机“扫盲”[N];科技日报;2005年
相关博士学位论文 前7条
1 顾志伟;面向结构化数据的视频检索研究[D];中国科学技术大学;2008年
2 智敏;基于内容的视频检索和浏览的关键技术[D];北京邮电大学;2006年
3 曹政;电视节目自动分割与相似视频检索[D];中国科学技术大学;2010年
4 林名强;视觉显著性检测模型研究及应用[D];中国科学技术大学;2016年
5 姚超;降维算法和手写文字识别中若干问题研究[D];西安电子科技大学;2014年
6 史迎春;基于内容的视频检索语义提取若干问题研究[D];南京理工大学;2005年
7 李玉峰;基于内容视频检索的镜头检测及场景检测研究[D];天津大学;2009年
相关硕士学位论文 前10条
1 张望舒;电视视频中的文字识别及检索技术的研究[D];北京邮电大学;2016年
2 刘娜;电影《从你的全世界路过》字幕俄译实践报告[D];黑龙江大学;2017年
3 刘彦杰;中国美剧字幕组研究:合作模式与翻译动机[D];西南大学;2017年
4 安艳辉;中英文混排字符切分方法研究[D];河北大学;2004年
5 董五洲;基于统计分类的混排字符切分算法的研究[D];燕山大学;2006年
6 张求真;轮胎表面标识字符切分方法研究[D];沈阳工业大学;2013年
7 高丽媛;纪录片《我从汉朝来》(节选)字幕英译研究[D];山西师范大学;2017年
8 陈威;基于字符切分和无监督聚类的视频字幕提取方法[D];北京邮电大学;2011年
9 郭清;目的论视角下《始祖家族》(第三季)的字幕汉译方法研究[D];西华大学;2017年
10 贾荟弘;网络自制综艺节目特效字幕研究[D];广西大学;2017年
,本文编号:1984975
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1984975.html