基于iOS平台的文本型图像的检索与实现
发布时间:2018-06-16 19:24
本文选题:OCR识别 + Lucene检索 ; 参考:《北京邮电大学》2016年硕士论文
【摘要】:在线教育是目前互联网应用的热点,各种各样的搜题软件越来越多,通过手机拍摄照片,可以迅速搜出几乎所有作业及试题的正确答案和解析过程进行自学。搜题的技术基础建立在图像识别与机器学习上,这些技术正是人工智能的组成部分。本文也将利用图像识别、文本检索技术,初步实现一个搜题应用。论文实现了一种基于C/S架构的搜题应用,通过iPhone手机进行题目拍照,拍照后的图片一般包括很多对识别题目无用的信息,如边框空白信息,噪声信息等,需要对图像进行裁剪滤波等预处理,然后使用OCR技术对文本型图像进行识别,得到题目信息。得到题目信息后,通过手机网络上传到后台服务器,后台服务器根据数据库中的题目信息,进行题目的检索匹配工作。客户端采用OCR实现图像识别。服务器端采用Windows+PHP+Apache+Mysql的技术架构,Apache服务器提供网络服务供终端访问,php技术实现服务器端逻辑,由于Lucene检索引擎是由Java语言实现的,所以需要在PHP中调用Java语言,可以使用PHP-Java-bridge库,在Java代码中需要操作mysql数据库,进行索引的建立,数据的检索等。
[Abstract]:Online education is the hot spot of Internet application at present. There are more and more kinds of search software. By taking photos by mobile phone, we can quickly find out the correct answers and analysis process of almost all homework and test questions for self-study. The technology of searching problems is based on image recognition and machine learning, which are the components of artificial intelligence. This paper will also use image recognition, text retrieval technology, the preliminary implementation of a search application. In this paper, a problem searching application based on C / S architecture is implemented. The photo taken by iPhone usually includes many useless information, such as border blank information, noise information and so on. It is necessary to preprocess the image such as clipping and filtering, and then use OCR technology to recognize the text image and get the title information. After getting the title information, it is uploaded to the background server through the mobile phone network, and the background server carries on the retrieval matching work according to the subject information in the database. The client uses OCR to realize image recognition. The server uses the technical framework of Apache MySQL to provide network services for terminal access to the server logic. Because the Lucene search engine is implemented by the Java language, it is necessary to call the Java language in Apache. PHP-Java-bridge library can be used to operate mysql database, index building, data retrieval and so on.
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41
【参考文献】
相关期刊论文 前6条
1 王文华;;浅谈OCR技术的发展和应用[J];福建电脑;2012年06期
2 刘岩;薛涛;李周;张小英;;图像处理和文字识别技术在手机软件自动化测试系统中的应用[J];现代电信科技;2009年07期
3 李牧;闫继宏;朱延河;赵杰;;一种改进的大津法在机器视觉中的应用[J];吉林大学学报(工学版);2008年04期
4 费岚;张桂香;;远程教育与信息推送技术[J];电脑知识与技术;2006年11期
5 李了了 ,邓善熙 ,丁兴号;基于大津法的图像分块二值化算法[J];微计算机信息;2005年14期
6 王惠琴,李明,王燕;基于Web的数据库安全管理技术与实现[J];计算机应用研究;2002年03期
相关硕士学位论文 前3条
1 张伟杰;基于iOS平台的新闻应用的设计与实现[D];北京交通大学;2014年
2 夏梦;基于iOS的车联网手机客户端的设计与实现[D];南昌大学;2014年
3 赵淼;基于Telematics的iPhone手机客户端系统的研究及应用[D];吉林大学;2014年
,本文编号:2027838
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2027838.html