基于模糊逻辑的关系数据库信息检索方法研究
本文选题:关系数据库 + 对象级别检索 ; 参考:《大连海事大学》2013年硕士论文
【摘要】:关系数据库关键词检索技术使得用户不需要了解任何SQL语言和底层数据库模式,就可以方便地检索到数据库中存储的信息,就像使用搜索引擎一样简单、便捷,因此关键词检索技术成为数据库查询领域的研究重点。数据库的规范化设计使得检索结果以元组级别的形式展现,这将导致检索结果不完整,语义难以理解,因此提出对象级别的信息检索技术。 对象级别的信息检索技术可以直接地表达检索结果的语义,返回的结果也更加完整。但当用户输入的是具有模糊性的检索关键词时,其检索效果并不好。而模糊数学知识的引入则可以很好地解决数值型关键词的模糊检索问题。在对数值型的关键词进行操作时,首先对数据库进行分析,然后有针对性地提出隶属函数,利用隶属函数和模糊化算子对数值型关键词进行操作。在相关性排序时,通过利用模糊逻辑中的模糊推理方法来计算对象结点的权重。 在对关键词检索结果进行排序时,不仅要考虑信息检索技术本身的特点,还要考虑数据库特性,主要有元组重要性,属性重要性以及属性上关键词的IR分数。数据库中各个元组/属性被检索到的次数是不同的,这就表明不同的元组/属性对用户的重要性是不一样的。在计算属性上关键词的IR分数时,采用传统的TF/IDF可以很好地得到结果,但这只限于对非数值属性的关键词,对于数值属性的关键词则很不实用。因此需要利用隶属函数对数值型关键词进行操作,进而实现对数值属性关键词的模糊检索,并有效地进行相关性排序。 本文采用上述方法设计并实现了一个基于模糊逻辑的关系数据库对象级别信息检索原型系统。利用DBLP数据集对该原型系统进行了实验验证,并采用P@K和MAP两个评价指标对实验进行评价。最终的实验结果表明本文的方法能有效改善检索结果的排序效果。
[Abstract]:Relational database keyword retrieval technology makes it easy for users to retrieve the information stored in the database without knowing any SQL language and underlying database schema, which is as simple and convenient as using search engine. Therefore, keyword retrieval technology has become the research focus in database query field. The standardized design of the database makes the retrieval result display in the form of tuple level, which will lead to incomplete retrieval results and difficult semantic understanding. Therefore, an object-level information retrieval technique is proposed. Object level information retrieval technology can directly express the semantics of retrieval results, and the returned results are more complete. However, when users input fuzzy search keywords, the retrieval effect is not good. The introduction of fuzzy mathematics knowledge can solve the problem of fuzzy retrieval of numerical keywords. When the key words of numerical type are operated, the database is analyzed first, then the membership function is put forward, and the membership function and fuzzy operator are used to operate the key words of numerical type. The weights of object nodes are calculated by using fuzzy reasoning method in fuzzy logic. When sorting the results of keyword retrieval, we should consider not only the characteristics of information retrieval technology, but also the characteristics of database, including tuple importance, attribute importance and IR score of attribute keywords. The number of times each tuple / attribute is retrieved in the database is different, which indicates that the importance of different tuple / attribute to the user is different. When calculating the IR score of the keywords on the attributes, the traditional TF/IDF can get the results well, but this is limited to the keywords of the non-numeric attributes, but it is not practical for the keywords of the numerical attributes. Therefore, it is necessary to use the membership function to operate the numeric keywords, and then to realize the fuzzy retrieval of the numeric attribute keywords, and to sort the correlation effectively. This paper designs and implements a prototype system of object level information retrieval in relational database based on fuzzy logic. The prototype system is verified by using DBLP data set, and the experiment is evaluated by two evaluation indexes: P@ K and MAP. The final experimental results show that the proposed method can effectively improve the ranking effect of retrieval results.
【学位授予单位】:大连海事大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP311.132.3;TP391.3
【相似文献】
相关期刊论文 前10条
1 何莹;;关系数据库的模式抽取[J];信息技术;2009年08期
2 林子雨;杨冬青;王腾蛟;张东站;;基于关系数据库的关键词查询[J];软件学报;2010年10期
3 王斌;杨晓春;王国仁;;关系数据库中支持语义的Top-K关键字搜索(英文)[J];软件学报;2008年09期
4 王翔;;数据库技术[J];程序员;2007年01期
5 王珊;张俊;彭朝晖;战疆;杜小勇;;基于本体的关系数据库语义检索[J];计算机科学与探索;2007年01期
6 曾孟佳;程兆麟;;异种数据库在Lotus Notes中的访问[J];微型电脑应用;2007年08期
7 吕汉兴;孙德保;程良铨;;用关系数据库系统实现中医的辨证论治[J];微型机与应用;1989年02期
8 马宗民,,严丽;关系数据库中一种混合类不完全信息的引入[J];计算机研究与发展;1996年11期
9 唐潜,杨德华;用JAVA类封装RDB库表──在关系数据库上运用OO技术探讨[J];计算机应用研究;1999年11期
10 宋小安,李志华;基于关系数据库的故障诊断专家系统在雷达电源中的应用[J];河海大学常州分校学报;2004年03期
相关会议论文 前10条
1 何义剑;姚青;洪晓光;;基于关系数据库的业务流程本体存储模式研究[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 吴红伟;王庆;萧建昌;周傲英;;XML键约束在关系数据库中的实现[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
3 陈欣;金远平;吕扬;;基于本体的关系数据库的语义设计模式[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 顾平;周力;;基于MDA的关系数据库的设计与实现[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 汪t熺
本文编号:1921933
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1921933.html