Luder基于内容的文档搜索引擎.pdf 全文
本文关键词:Luder基于内容的文档搜索引擎,由笔耕文化传播整理发布。
天津工业大学
硕士学位论文
Luder基于内容的文档搜索引擎
姓名:窦亚君
申请学位级别:硕士
专业:计算机应用技术
指导教师:韩其睿
座机电话号码
中文摘要
Web搜索技术的发展,加快了用户在海量信息的互联网上查找需要的信息的
速度,极大地推动了网络资源的共享。与此同时,同等重要的本地文档资源被忽
视了而且由于本地文档资源的特殊性,不可能与Web共享。用户在本地文件系统
中查相关性质的文件内容时,需要不断地翻阅目录去阅读这些文件,严重地降低
了文档查找效率,本地文档资源没有有效的利用。
本文研究并实现基于全文检索的桌面文档搜索引擎,在Lucene开源搜索框
架基础上,重新封装核心功能,实现对多种格式的本地文档搜索功能,,使用户在
系统中全局地掌握桌面文档资源;构建基于SⅥrl"图形界面库可移植的交互界面,
让用户方便地与系统交互;运用中文分词理论实现支持中/英文的
式匹配,解决了Lucene对中文支持不好的问题;针对不同格式的文档,构建多
种类型解析器 Parser 抽取文档文本用于建立索引,支持多种流行的文档格式。
‘本系统有效地解决了桌面应用中对于文档查询的问题,实现基于内容查找、提高
查找效率与速度,更有效地利用桌面文档资源。
关键词:搜索引擎、桌面搜索、全文检索、倒排索引,文档格式、Lucene、中文
分词
Abstract
The
of
inWeb
the
ofUSerS’
developmenttechnologySearchingquickenspeed
本文关键词:Luder基于内容的文档搜索引擎,由笔耕文化传播整理发布。
本文编号:112663
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/112663.html