关系数据库关键字语义近似查询方法研究
本文关键词:关系数据库关键字语义近似查询方法研究
更多相关文章: 检索 耦合关系分析 Top-k推荐 查询重构 近似查询
【摘要】:随着互联网的普遍应用和网络数据的急剧膨胀,数据库在线关键字检索方式已经成为人们网上查阅和搜索信息的主要手段。然而面临当今数据组织形式和结构的各异性,研究者已经指出了需要采取不同的数据建模形式(如关系、层次、面向对象的、网状、半结构化模型等),进而也引起了大量新颖的数据管理技术的不断发展(如对于XML数据、数据流的处理、网络数据的集成、数据分析及挖掘等)。关系型数据库因其数据结构简单、清晰,且具有较高的独立性和安全保密性,已成为应用最广泛的通用型数据库,且作为Deep Web的重要组成部分,因此关系数据库检索技术应具有更高的用户友好性和通用性。数据库管理系统提供复杂的工具,可使专业用户使用SQL语言进行结构化查询,但对于大多数普通用户来讲,像谷歌、雅虎等搜索引擎那样通过提交几个关键字就能检索到相关信息的关键字查询方式,更容易被其接受和使用。然而由于非专业用户的表达查询意图的方式和检索时所关注的差异、以及对相关数据库存储内容了解的有限,导致许多数据库信息无法被获取,用户的满意程度下降,且进行试探性检索的次数会随之增加。因此针对检索的方式、手段和技术需要不断完善,使其能够对与查询关键字语义相关(但不是明确给出的关键字)的内容给出查询结果,提高查询的准确性,以便更好地向人们提供简单、可依赖的信息获取服务。本文首先提出一种评估数据库中所有存储的数据与用户给定查询条件的关键字之间的语义相关性,即分析词条之间耦合关系的方法TCR(Term Coupling Relationships)。根据TCR评估用户初始条件中的关键字与数据库中全部数据的耦合关系(包括内耦合与外耦合两部分),并生成相关性大小的顺序列。然后利用排名机制将数据库中Top-k排名结果作为候选关键字推荐给用户,最后通过用户重构最贴近自己意图的条件提供给检索系统进行再查询。其中查询重构系统选取基于候选网的DISCOVER系统进行再查询处理,即将TCR方法集成到传统的精确查询系统中。嵌入TCR方法的检索系统,能够使缺乏相关经验的用户根据系统分析初始条件并推荐出相关性高的关键字,使用户能够重构符合自己需求的查询条件,在某种意义上实现了对初始目的的近似查询。并且让用户自己主观的重新构建和选择关键字,使检索更加人性化,更能满足用户的真实想法。同时结合了精确匹配的优势,使检索效率及用户满意程度达到较高的要求。实验采用DBLP、Movie Lens和IMDB数据集,应用TCR算法在关键字与数据库中的信息进行耦合关系分析,证明了参数α对不同数据库的不同影响。并用Top-k推荐算法返回推荐关键字。近而在DISCOVER系统上实现关键字的最终查询。
【关键词】:检索 耦合关系分析 Top-k推荐 查询重构 近似查询
【学位授予单位】:辽宁工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1;TP311.13
【目录】:
- 摘要5-6
- Abstract6-10
- 1 绪论10-16
- 1.1 研究背景及发展现状10-12
- 1.2 课题研究目的及意义12-13
- 1.3 主要研究内容13-15
- 1.4 论文的组织结构15-16
- 2 关键字查询相关理论基础16-24
- 2.1 查询模式16-21
- 2.1.1 基于模式图的关键字查询18-20
- 2.1.2 基于数据图的查询方法20-21
- 2.2 近似查询21-23
- 2.2.1 建模形式的扩展22
- 2.2.2 模糊查询22
- 2.2.3 语义分析及应用22-23
- 2.3 本章小结23-24
- 3 耦合关系分析及Top-k推荐策略24-33
- 3.1 问题定义24
- 3.2 数据预处理24-26
- 3.2.1 词条关系图25-26
- 3.2.2 数据视图26
- 3.3 耦合关系分析26-30
- 3.3.1 节点权重及计算26-28
- 3.3.2 内耦合关系28-29
- 3.3.3 间耦合关系29-30
- 3.4 Top-k推荐策略30-32
- 3.4.1 Top-k的实现30-31
- 3.4.2 TA阈值算法31-32
- 3.5 本章小结32-33
- 4 近似查询系统的实现33-48
- 4.1 引言33
- 4.2 传统DISCOVER系统简介33-36
- 4.2.1 数据模型及相关定义34-35
- 4.2.2 DISCOVER系统的实现35-36
- 4.3 近似查询系统的体系结构36-39
- 4.3.1 DISCOVER的改进36-37
- 4.3.2 近似查询系统的实现37-39
- 4.4 近似查询系统的查询处理39-47
- 4.4.1 候选网的生成39-44
- 4.4.2 候选网的评估44-47
- 4.5 本章小结47-48
- 5 实验设计及对比分析48-58
- 5.1 耦合关系分析下Top-k推荐性能测试48-51
- 5.1.1 实验设置48
- 5.1.2 评估TCR算法的精确度48-50
- 5.1.3 TCR算法性能50-51
- 5.2 基于候选网的DISCOVER性能测评51-55
- 5.2.1 实验设置51
- 5.2.2 候选网生成器的评估51-52
- 5.2.3 贪婪算法的性能52-53
- 5.2.4 对计划生成器的评估53-54
- 5.2.5 执行时间54-55
- 5.3 近似查询系统的性能测评55-57
- 5.3.1 实验环境及参数设置55
- 5.3.2 查询重构对结果满意度的提升55-56
- 5.3.3 系统执行时间56-57
- 5.4 本章小结57-58
- 6 结论和未来工作58-59
- 参考文献59-62
- 攻读硕士期间发表学术论文情况62-63
- 致谢63
【相似文献】
中国期刊全文数据库 前10条
1 赵雪;;试论信息数据库的管理对策[J];计算机光盘软件与应用;2013年08期
2 周亦妹;;企业数据库管理问题浅析[J];计算机光盘软件与应用;2013年17期
3 朱和男;“修路,,还要养路”──注重数据库的更新与维护[J];工商行政管理;1996年13期
4 陈云卿;关于数据库管理的优化[J];管理科学文摘;1998年08期
5 ;用PLATINUM ProVision增强9种系统与数据库管理工具[J];信息系统工程;1998年01期
6 林琼英;;走进魅力数据库[J];中国信息技术教育;2008年06期
7 袁知贵,林焰,纪卓尚;船体零部件数据库管理[J];大连理工大学学报;2000年06期
8 ;2000年全国数据库学术会议征文通知[J];软件学报;2000年01期
9 ;2000年全国数据库学术会议征文通知[J];软件学报;2000年02期
10 ;2001年第18届全国数据库学术会议征文通知[J];计算机研究与发展;2001年05期
中国重要会议论文全文数据库 前10条
1 邱大年;阎承沛;左演声;;第八章 热处理数据库[A];中国电子学会生产技术学会第四届金属材料及热处理年会论文集(增)[C];1991年
2 陆洪毅;王志英;赵龙;;高性能数据库的应用支持[A];第十六届全国数据库学术会议论文集[C];1999年
3 ;前言[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
4 ;前言[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
5 ;前言[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 韩英;马玉红;;基于数据库的档案资料管理软件[A];2010全国非金属矿产资源与勘察技术交流会论文专辑[C];2010年
7 顾少伟;成旭东;唐志军;徐学良;;板坯质量数据库的建立与应用[A];河北省2010年炼钢—连铸—轧钢生产技术与学术交流会论文集(上)[C];2010年
8 顾少伟;成旭东;唐志军;徐学良;;板坯质量数据库的建立与应用[A];第十六届全国炼钢学术会议论文集[C];2010年
9 周俊菊;李艳梅;;中国北方干旱化数据库的建立及其基本问题探讨[A];地理教育与学科发展——中国地理学会2002年学术年会论文摘要集[C];2002年
10 张学军;房生凯;;新型数据库管理预测系统[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(上册)[C];2001年
中国重要报纸全文数据库 前10条
1 韩敏;我市部署人事人才数据库管理工作[N];鄂尔多斯日报;2008年
2 金振蓉;应本着求真务实精神发展国产数据库[N];光明日报;2004年
3 ;下一代数据库六大特点[N];中国计算机报;2005年
4 周健邋芯语;中小型组织的数据库[N];计算机世界;2007年
5 ;数据库归档浮出水面[N];网络世界;2006年
6 本报记者 黄嵘;中期协行业信息数据库管理有新规[N];上海证券报;2007年
7 谢春颖;数据库“经理人”的职能[N];网络世界;2002年
8 本报记者 许泳;数据库更换为哪般?[N];计算机世界;2011年
9 本报记者 那罡;数据库遭受“夹板气”[N];中国计算机报;2010年
10 本报见习记者 王勤;数字印刷方式下的数据库管理[N];中国新闻出版报;2011年
中国博士学位论文全文数据库 前1条
1 张宇宾;脊椎动物进化分支共调控基因数据库LCGbase研究与实现[D];中国科学院北京基因组研究所;2013年
中国硕士学位论文全文数据库 前10条
1 方明;在PostgreSQL数据库单表上实现多级安全等级控制[D];复旦大学;2013年
2 李俊炜;基于Oracle数据库低效语句监控方法的研究与应用[D];上海交通大学;2014年
3 黄晓嫦;基于移动设备的网络教学系统设计与实现[D];电子科技大学;2014年
4 王蒙蒙;基于SQL Server数据库持续数据保护系统的研究与设计[D];华北电力大学;2015年
5 刘颖;基于SDN的数据库型防火墙研究与实现[D];华东理工大学;2015年
6 崔婉秋;关系数据库关键字语义近似查询方法研究[D];辽宁工业大学;2016年
7 王鹏;论数据库权利的法律保护[D];河南大学;2009年
8 许斌;数据库通知服务的研究与实现[D];山东科技大学;2010年
9 年青;我国大学生篮球运动员信息数据库的构建研究[D];东北师范大学;2014年
10 杨素宝;超(超)临界火电机组用钢数据库的开发及其应用[D];昆明理工大学;2009年
本文编号:857264
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/857264.html