基于大型数据库的智能搜索与摘要提取技术研究
本文关键词:基于大型数据库的智能搜索与摘要提取技术研究
【摘要】:数据库全文检索技术的出现大大提高了数据库对于海量数据的检索效率。但是,在中文应用系统尤其是一些指挥信息系统中,采用全文检索技术的并不多,主要是由于特殊原因这些系统不能与互联网对接,无法针对多个数据库表多个字段实现全局数据联合查找,也不能结合具体的作战指挥和平时应用灵活的展示给指挥员感兴趣的内容。因此,急需研究一种能够完善支持中文应用系统、采用全文检索技术、并具备一定智能特性、可以进行摘要提取的通用搜索引擎,能够在相关指挥信息系统中加入全中文智能搜索和摘要提取功能,以便于用户及时查找到所需要的内容,以提高指挥的信息处理能力、快速反应能力和辅助决策能力。以目前单位XX指挥系统的大型数据库无法有效处理中文数据信息的问题为背景,针对中文数据库应用系统数据搜索不灵活的问题开展了深入研究,以大型数据库的全文检索技术为核心,构建了一个全库多表多字段的全局智能搜索引擎,在其实现流程和应用方式上都作了改进和创新,能够真正帮助用户从海量数据中快速的检索有效的信息。针对目前多数数据库在面对大量数据进行检索时出现的信息表现力差的问题,对大型数据库的全文检索机制进行了研究,提出了全局智能搜索的技术,设计了搜索引擎的工作流程;研究了文档去格式化技术和基于XML的文本联结技术,实现了多表多字段的联合数据查询;提出基于正则表达式的摘要提取方法和改进的基于Oracle Text的排序算法,有效地提高了全文检索结果的质量;对搜索结果的展现技术进行了研究,结合用户的具体应用需求,智能搜索引擎能对查询结果做出不同的处理,以最合适的方式展现给用户,体现全局智能搜索引擎的智能化。在单位XX指挥系统中设计了智能搜索与摘要提取工具,建立了全文索引,开发了良好的人机界面,解决了目前大型数据库应用中用户或开发者必须知道数据存放位置才能实现数据搜索的问题,实现了通用的全数据库多表多字段的全局智能联合数据搜索,并进一步实现了结果自动排序、关键词突显、摘要显示等功能,同时在数据的展现上能有效地针对数据的类型和特点,将搜索结果以最直观、最合适的方式展现给用户,使数据库的检索功能能够真正结合具体应用,以满足XX指挥系统的作战指挥、训练演习和平时办公等多项需求。
【关键词】:排序算法 摘要提取 全文检索 智能搜索
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3;TP311.13
【目录】:
- 摘要5-6
- ABSTRACT6-10
- 第一章 绪论10-18
- 1.1 基于数据库的检索技术发展现状10-14
- 1.2 数据库全文检索技术面临的挑战14-15
- 1.3 本文研究的主要内容15-17
- 1.4 文章的结构17-18
- 第二章 大型数据库的全文检索机制研究18-27
- 2.1 ORACLE TEXT全文检索18-21
- 2.1.1 Oracle Text的体系结构18-19
- 2.1.2 Oracle Text的分词技术19-20
- 2.1.3 Oracle Text的排序算法20
- 2.1.4 Oracle Text的索引类型20-21
- 2.2 SQL SERVER全文检索21-25
- 2.2.1 SQL Server全文检索体系结构21-23
- 2.2.2 SQL Server全文检索分词技术23-24
- 2.2.3 SQL Server全文检索排序算法24-25
- 2.3 MYSQL全文检索机制25-26
- 2.4 小结26-27
- 第三章 全局智能搜索工具的关键技术27-40
- 3.1 全局智能搜索工具流程27-30
- 3.1.1 需求分析27
- 3.1.2 功能设计27-30
- 3.2 文本处理30-33
- 3.2.1 文本去格式化30-32
- 3.2.2 索引文本XML处理32-33
- 3.3 排序算法33-36
- 3.3.1 智能搜索引擎排序算法33-34
- 3.3.2 Oracle Text排序算法34-35
- 3.3.3 改进的基于Oracle Text的排序算法35-36
- 3.4 摘要提取技术36-39
- 3.4.1 句子提取37-38
- 3.4.2 计算句子的权值38
- 3.4.3 计算句子之间的相似度38-39
- 3.5 小结39-40
- 第四章 智能搜索与摘要提取工具的实现40-53
- 4.1 搜索工具的实现40-49
- 4.1.1 文本联结的实现41-42
- 4.1.2 排序算法的实现42
- 4.1.3 摘要显示的实现42-43
- 4.1.4 全文索引的建立43-44
- 4.1.5 全文索引的同步与优化44-45
- 4.1.6 索引配置工具的实现45-48
- 4.1.7 人机界面的开发48-49
- 4.2 通用性设计49
- 4.3 表现方式和检索效率49-50
- 4.4 展现方式设计——与用户的具体应用相结合50-52
- 4.5 小结52-53
- 第五章 结束语53-55
- 5.1 研究工作的总结53
- 5.2 下一步需要解决的问题53-55
- 致谢55-56
- 参考文献56-59
【相似文献】
中国期刊全文数据库 前10条
1 侯大银;;智能搜索:梦想照进现实[J];互联网周刊;2009年03期
2 黄昆;;聪明万事通,智能搜索引路[J];中国计算机用户;2006年47期
3 ;智能搜索:学习型组织的推动力[J];计算机与网络;2006年10期
4 ;企业级市场:智能搜索的独角戏?[J];计算机与网络;2006年11期
5 王淑英;张明;刘云;;移动Agent在智能搜索中的应用[J];中小企业管理与科技(下旬刊);2011年04期
6 朱贵宪;芦艳芳;;用于智能搜索的无线通信系统设计[J];煤炭技术;2011年09期
7 翁代云;杨莉;;基于语义Web的智能搜索的研究[J];科技风;2013年06期
8 叶庆卫,陈涛;企业信息智能搜索的研究与应用[J];管理信息系统;1998年09期
9 晏俊德,李雪莲,胡庆伦;基于个人定制的智能搜索助手的研究[J];沈阳工业大学学报;2000年01期
10 杨明莉;陈义辉;;基于概念的语义智能搜索模型体系结构的研究[J];商场现代化;2009年05期
中国重要会议论文全文数据库 前3条
1 何盈捷;冯月利;王珊;;Peer-to-Peer环境下基于内容的智能搜索[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
2 王雪萍;杨青;黄祖锋;;P2P网络中基于蚁群算法的智能搜索研究[A];2006全国复杂网络学术会议论文集[C];2006年
3 丁晓安;徐伯夏;;基于智能搜索功能的Android平台手机拼车系统设计[A];全国第五届信号和智能信息处理与应用学术会议专刊(第一册)[C];2011年
中国重要报纸全文数据库 前10条
1 ;智能搜索:结果最优化 价值最大化[N];中国计算机报;2006年
2 邓健;智能搜索为信息共享提速[N];计算机世界;2006年
3 记者 莫小松 常鑫 通讯员 郝晋薇;广西交通网设交管问答智能搜索[N];法制日报;2010年
4 中国电信上海研究院 邢青;移动智能搜索 所需即所得[N];人民邮电;2011年
5 潘z,
本文编号:900884
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/900884.html