当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于查询日志的数据库关键字查询研究

发布时间:2019-04-24 21:30
【摘要】:数据库系统是用来组织、存储和管理数据的仓库,它在企业、部门乃至个人的日常生产生活等诸多领域都得到了广泛的应用。随着现代互联网的迅速发展,信息呈现爆炸式增长,数据库系统存储的信息不断增多,用户搜索这些信息的需求也日益激增。传统的数据库访问方式需要用户掌握结构化的查询语言,了解并且.熟悉底层的数据模式,而这对于大多数的普通用户来说是非常复杂的。受到关键字查询在Web搜索引擎上获得巨大成功的影响,近些年来在数据库支持关键字查询得到了来自数据库领域和信息检索领域研究人员的广泛关注并且成为新兴的研究热点。不同于传统的数据库查询方式,数据库上的关键字查询简单易用,查询没有固定的格式限制,极大地减轻了用户学习和记忆的压力。但是这也给如何开发一个高效健壮的关键字查询系统带来了巨大挑战。传统的数据库查询的结果是一组孤立的元组,而关键字杏询则需要从数据库的不同表中组合与关键字匹配的元组来形成最终结果,这会导致查询的搜索空间急剧膨胀。一般来讲,关键字查询的搜索空间与查询中的关键字数目成指数型关系。还有关键字查询经常是脏的,用户的查询中经常包含一些不相关或者不正确的词,而通常这些脏查询会对随后的查询处理的效率和准确性产生负面的影响。 为了解决查询的搜索空间指数性爆炸这一问题,一个被称作查询清理的预处理步骤被引入进来,它被用来清理用户提交的原始查询并抽取出高质量的查询项。这个新增的预处理步骤不仅改进后续查询结果的质量,而且还大大地降低了后续的查询搜索算法的搜索空间。但是它仍然存在一些问题,即引入的查询清理算法并没有考虑到用户偏好,而这样的偏好可以用来进一步改进查询清理的质量。 基于模式图的关键字查询方法在它的执行过程中会生成大量的候选网络,其中有些候选网络所表示的关系没有实际意义的或者极少被用户访问,而有些候选网络所表示的关系则史为用户所偏好,即用户经常访问这类关系。而传统的基于模式图的方法通常按照候选网络大小递增的顺序依次求解候选网络,而不是按照用户对候选网络的偏好程度对候选网络求解,这样做也会影响到整个查询执行的效率和查询结果的质量。 本文主要针对数据库关键字查询中存在的上述问题,借助于记录用户行为的查询日志,提出两种基于查询日志方法扩展原有的查询清理方法以进一步改进查询清理的质量。我们还使用树数据挖掘算法来对用户的查询日志进行挖掘来获取用户偏好,并通过它来改进基于模式图的关键字查询方法。本文的主要工作及成果如下: (1)针对提出的查询清理算法中的原始得分函数,在它的基础上提出了两种利用查询日志进行扩展的方法。原始的得分函数仅仅根据数据库来对产生的项进行评分,没有考虑到该项在日志中的使用行为。我们基于查询日志使用两种不同方式来对产生的项进行评分,从而获得一个项的日志评分。最后再将得到的日志评分和原始的评分按照某种方式结合起来形成项的最终评分。我们给出的实验证明提出的两种改进方法都在一定程度上改进查询清理的质量,获得了小错的效果。 (2)通过使用查询日志来进一步改进传统的基于模式图的查询方法。一般地,基于模式图的查询算法通常按两个步骤处理查询:候选网络生成和候选网络求解。我们引入查询日志来记录用户提交的查询和他们选择的候选网络。然后将数据挖掘算法引入到关键字查询中来,使用已有的树挖掘算法来对用户的查询日志进行挖掘,以获取用户偏好的频繁模式树。然后又引入树编辑距离来定义生成的候选网络与挖掘得到的频繁模式树的相似度,基于此对生成的候选网络进行排序并优先求解排位靠前的候选网络,以此来改进查询的质量和效率。
[Abstract]:......
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 黄晓艺;;党员信息管理系统的设计与实现[J];科技信息;2011年20期

2 王金城;李桔;;快堆换料监控系统数据库功能的分析及实现[J];核动力工程;2007年03期

3 王翔;;Amazon进一步开拓云数据服务市场 微软将结束两版本SQL Server支持[J];程序员;2009年12期

4 胡邦喜;;标准体系数据库建设是设备管理信息化的基础工作[J];中国设备工程;2006年12期

5 孙永光;;真正安全的数据库[J];程序员;2006年08期

6 悠虎;;浅谈DB2数据库所支持的外部文件格式[J];网络与信息;2011年03期

7 曲剑;冯红岩;;PB中的数据库事务管理[J];林业科技情报;2007年03期

8 Christopher M.Stone;David Hentchel;朱扬勇;;数据库论战卷土重来[J];计算机科学;1991年05期

9 ;复制功能赋Oracle 8新特性[J];每周电脑报;1997年15期

10 彭群颐;谢桂华;;数据库技术在高校固定资产设备档案管理中的应用[J];湘潭师范学院学报(自然科学版);2006年01期

相关会议论文 前10条

1 周英飚;冯玉才;;数据库支持的工作流管理系统[A];第十五届全国数据库学术会议论文集[C];1998年

2 赵振基;;数据库支持下的结构专业CAD系统[A];中国土木工程学会计算机应用学会第六届年会土木工程计算机应用文集[C];1995年

3 奚东敏;谷波;甄伟;;基于数据库的房间空调器季节能效比计算[A];上海市制冷学会2005年学术年会论文集[C];2005年

4 于水东;梁军;鲍立威;蔡颖;黄文伟;;基于关系数据库的空运快件业务处理系统[A];1999中国控制与决策学术年会论文集[C];1999年

5 倪晟宇;;在流数据模式下计算最长递增子序列长度[A];2005年全国理论计算机科学学术年会论文集[C];2005年

6 蔡德恩;;制图技术的改革与HPD的实现[A];中国航海学会航标专业委员会测绘学组学术研讨会学术交流论文集[C];2009年

7 陈自安;陆蓓;;“连接陷阱”的诊断和消除[A];第九届全国数据库学术会议论文集(下)[C];1990年

8 李志刚;张直明;;油叶型轴瓦性能数据库研究[A];第五届全国摩擦学学术会议论文集(下册)[C];1992年

9 李海斌;胡红青;;企业的谈判活动管理初探[A];中国市场学会2006年年会暨第四次全国会员代表大会论文集[C];2006年

10 李悦;刘广荣;林锡龙;;一种便携式自动指纹识别系统的设计与实现[A];2004全国光学与光电子学学术研讨会、2005全国光学与光电子学学术研讨会、广西光学学会成立20周年年会论文集[C];2005年

相关重要报纸文章 前10条

1 ;Caché数据库支持Mac OS[N];计算机世界;2002年

2 张策;偶连接数据库同步方案的选择[N];计算机世界;2007年

3 顾领;投稿管理与稿件状态查询系统的开发及应用[N];中国社会科学院院报;2008年

4 ;开源:是开始做正事的时候了[N];网络世界;2008年

5 杨霞清;甲骨文过招新老对手[N];计算机世界;2007年

6 记者 谢苗枫 林亚茗 李静睿 通讯员 沈提安;“公共工作银行”破解求职难[N];南方日报;2006年

7 主持人 雷厉风;2.0时代,数据为王[N];中华读书报;2008年

8 余东明;成都警方开通“寻亲网站”[N];法制日报;2008年

9 ;RoR:简化Web开发[N];计算机世界;2007年

10 江涛;收藏网络:走过风雨八年路[N];中国艺术报;2006年

相关博士学位论文 前2条

1 韩道;基于人体和小动物数据库的生理组M3L平台构建[D];华中科技大学;2010年

2 吕艳辉;数据库支持的模糊OWL本体构建与存储的研究[D];东北大学;2010年

相关硕士学位论文 前10条

1 苏国君;人事档案管理系统的设计与实现[D];华南理工大学;2012年

2 姚翠薇;基于C/S架构的高校信息管理系统设计与实现[D];电子科技大学;2012年

3 翁楚桥;基于MDSplus数据库分段技术的Web数据采集及显示系统[D];华中科技大学;2013年

4 张佩琪;湖南建工商品房销售系统的设计与实现[D];电子科技大学;2012年

5 高磊;基于查询日志的数据库关键字查询研究[D];山东大学;2012年

6 乔颖新;医院绩效管理系统的设计与实现[D];北京邮电大学;2011年

7 金云;昆山市某高级中学成绩在线管理平台的设计与实现[D];电子科技大学;2013年

8 赵振江;人民公安报社OA系统的设计与开发[D];北京工业大学;2012年

9 王玉宏;教学信息资源的高效搜索[D];电子科技大学;2008年

10 孙伟平;面向转化医学的生物信息学数据融合与搜索算法研究及应用[D];中南大学;2012年



本文编号:2464802

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2464802.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9b76d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com