基于Lucene的手机查询软件的研究与实现
发布时间:2017-04-01 14:13
本文关键词:基于Lucene的手机查询软件的研究与实现,由笔耕文化传播整理发布。
【摘要】:随着互联网的飞速发展,以手机为代表的移动终端产品也在飞速发展,手机的计算处理能力和自身的存储容量变得越来越大,支持的业务种类和数据类型也越来越多,可以说,手机越来越成为用户最重要的数据存储方式之一。因此,针对手机存储资源的自身特点,根据用户获取信息数据的特有需求,如何快速地检索出手机终端上用户所需要的数据信息,已经成为了一个即实际又亟需解决的问题。 本文针对手机存储查询查询存在的不足,设计了一套手机搜索查询软件系统,采用基于开源Lucene的搜索框架架构,通过改进查询算法模型和文档排序评分算法,实现对于搜索结果的排序优化。 本文完成的主要工作如下: (1)本文深入分析了当前手机存储查询领域存在的不足,,通过深入研究搜索引擎的架构、组成和工作原理,提出了基于开源Lucene搜索架构的全文检索解决方案; (2)由于传统的Lucene查询模型过于僵化,没有考虑到相关因素因子的影响,无法很好地适应手机查询软件系统,本文通过对文档评分算法加入经过层次分析法确定的相应影响因子来进行改进,优化了查询算法模型; (3)针对手机查询软件系统索引创建部分和查询部分应当分离的要求,采用分离设计模式,分别设计索引服务器部分和界面查询部分;提出了利用增量算法对文档进行合并的策略,有效的改善了系统的空间利用率;针对支持扩展文件类型的要求,采用插件模式设计了多媒体文本提取插件; (4)基于以上研究和改进优化工作,采用Android开发技术,设计并实现了基于开源Lucene的手机查询软件系统。 综上所述,本文针对手机存储查询技术进行了全面、深入的研究,改进了查询算法模型,优化了文档评分排序算法,采用分离设计模式和插件模式进行设计,使用Android开发技术,在基于开源Lucene搜索架构下设计实现了手机查询软件系统。
【关键词】:搜索引擎 Lucene 全文检索 手机资源 Android
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP311.52
【目录】:
- 摘要3-4
- ABSTRACT4-6
- 目录6-8
- 1 绪论8-12
- 1.1 研究背景及意义8-9
- 1.2 国内外研究现状9-10
- 1.3 本文的主要工作10-12
- 2 相关技术研究12-26
- 2.1 搜索引擎12-14
- 2.1.1 搜索引擎简介12
- 2.1.2 搜索引擎分类12-13
- 2.1.3 搜索引擎工作原理13
- 2.1.4 搜索引擎的组成13-14
- 2.1.5 搜索引擎的现状与发展14
- 2.2 全文检索14-18
- 2.2.1 文本分类14-15
- 2.2.2 文本标记语言15-16
- 2.2.3 文本预处理16
- 2.2.4 文本聚类16
- 2.2.5 中文分词技术简介16-18
- 2.3 ANDROID 开发技术18-22
- 2.3.1 Android系统结构18
- 2.3.2 Android应用程序架构18-19
- 2.3.3 Android应用组件19-21
- 2.3.4 Android平台优势21-22
- 2.4 LUCENE22-26
- 2.4.1 Lucene简介22-23
- 2.4.2 Lucene的系统组织结构23-26
- 3 手机查询软件的需求分析26-34
- 3.1 系统概述及目标26
- 3.2 系统需求26-30
- 3.2.1 系统功能需求26-30
- 3.2.2 系统非功能性需求30
- 3.3 系统分析模型30-34
- 3.3.1 系统的架构30-31
- 3.3.2 系统的业务流程31-34
- 4 LUCENE 算法模型改进34-48
- 4.1 LUCENE 中的算法34-39
- 4.1.1 增量算法的设计34-35
- 4.1.2 归并算法的设计35-37
- 4.1.3 查找算法的设计37-39
- 4.2 LUCENE 的索引模型39-43
- 4.2.1 Lucene中的索引文件39-40
- 4.2.2 三种索引模型介绍40-43
- 4.2.3 三种索引模型的比较43
- 4.2.4 索引模型的选择43
- 4.3 建立查询模型43-48
- 4.3.1 模型的建立43-44
- 4.3.2 文档评分算法44-45
- 4.3.3 文档评分算法的改进45-46
- 4.3.4 算法改进后对比测试46-48
- 5 系统的设计与实现48-70
- 5.1 全文检索系统的设计48-49
- 5.2 索引服务器的设计与实现49-64
- 5.3 系统界面部分的设计与实现64-68
- 5.4 多媒体文本提取插件的设计与实现68-70
- 6 结论与展望70-72
- 6.1 结论70
- 6.2 展望70-72
- 致谢72-73
- 参考文献73-74
【参考文献】
中国期刊全文数据库 前10条
1 曾庆祥;廖建新;安宝贵;朱春梅;于川;;基于Lucene算法的移动终端资源搜索引擎研究与设计[J];北京工商大学学报(自然科学版);2008年05期
2 李晓鑫;;桌面搜索引擎设计[J];电脑知识与技术;2011年20期
3 訾玲玲;杜军平;胡娟;;跨媒体搜索引擎TCSE的研究与实现[J];复杂系统与复杂性科学;2012年01期
4 ;新华社和中移动联手开通盘古搜索[J];中国传媒科技;2011年02期
5 闫旭;;百度阿拉丁:下一代搜索引擎的目标[J];互联网天地;2009年02期
6 马迎春;全文检索系统概述[J];情报科学;2000年12期
7 李广建,黄];元搜索引擎及其主要技术[J];情报科学;2002年02期
8 张启宇;朱玲;张雅萍;;中文分词算法研究综述[J];情报探索;2008年11期
9 许丽丽;;元搜索引擎Clusty研究[J];情报探索;2009年03期
10 刘海峰;王元元;;基于向量模型的文本检索若干问题研究[J];情报杂志;2006年10期
本文关键词:基于Lucene的手机查询软件的研究与实现,由笔耕文化传播整理发布。
本文编号:280763
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/280763.html