Web数据库top-k多样性关键字查询推荐方法
本文关键词: Web数据库 多样性推荐 耦合关系 典型化分析 top-k选取 出处:《计算机研究与发展》2017年07期 论文类型:期刊论文
【摘要】:Web数据库用户通常使用他们熟知的关键字表达查询意图,这可能导致获取的结果不能很好满足其查询需求,因此为他们提供top-k个与初始查询语义相关且多样化的候选查询有助于用户扩展知识范围,从而更准确完善地表达其查询意图.提出一种top-k多样性关键字查询推荐方法.1)利用不同关键字在查询历史中的同现频率和关联关系评估关键字之间的内耦合和间耦合关系;2)根据关键字之间的耦合关系构建语义矩阵,进而利用语义矩阵和核函数方法评估不同关键字查询之间的语义相关度.为了快速返回top-k个与初始查询相关且多样性的候选查询,根据查询之间的语义相关度,利用概率密度函数分析查询的典型程度,并利用近似算法从查询历史中找出典型查询.对于所有的典型查询,从中选出少数代表性查询,根据其他典型查询与代表性查询之间的语义相关度,为每个代表性查询构建相应的查询序列;当一个新的查询到来时,评估其与代表性查询之间的语义相关度,然后利用阈值算法(threshold algorithm,TA)在预先创建的查询序列上快速选出top-k个与给定查询语义相关的多样性候选查询.实验结果和分析表明:提出的关键字之间耦合关系计算和查询之间的语义相关度评估方法具有较高准确性,top-k多样性选取方法具有较好效果和较高执行效率.
[Abstract]:Web database users usually use keywords they know well to express their query intent, which may result in the obtained results not being able to meet their query requirements. Therefore, it is helpful for users to provide top-k with a variety of candidate queries related to the semantics of the initial query. In order to express its query intention more accurately and perfectly, this paper proposes a top-k diversity keyword query recommendation method. 1). The cooccurrence frequency and correlation relation of different keywords in the query history are used to evaluate the coupling and coupling between keywords. 2) constructing semantic matrix according to the coupling relation between keywords. Then the semantic matrix and kernel function are used to evaluate the semantic correlation between different keyword queries. In order to quickly return top-k candidate queries related to the initial query and diversity. According to the semantic correlation of the query, the probability density function is used to analyze the typical degree of query, and the approximate algorithm is used to find out the typical query from the query history. A few representative queries are selected and corresponding query sequences are constructed for each representative query according to the semantic correlation between other typical queries and representative queries. When a new query arrives, the semantic correlation between the query and the representative query is evaluated, and then threshold algorithm is used. ). Top-k multiple candidate queries related to the given query semantics are quickly selected from the pre-created query sequences. The experimental results and analysis show that:. The proposed method for evaluating the semantic correlation between the key words and the query has a high accuracy. Top-k diversity selection method has better effect and higher execution efficiency.
【作者单位】: 辽宁工程技术大学电子与信息工程学院;辽宁工程技术大学软件学院;
【基金】:国家自然科学基金青年科学基金项目(61401185) 辽宁省自然科学基金项目(20170540418) 辽宁省教育厅科学技术研究项目(LJYL018)~~
【分类号】:TP311.13;TP391.3
【正文快照】: 关键字查询无需用户了解Web数据库的结构和内容,而是类似于谷歌和百度等搜索引擎一样仅使用少数几个关键字表达查询意图.近年来,关系数据库上关键字查询的代表性研究工作主要是基于模式图(schema graph,SG)[1-3]和候选网(candidate networks,CNs)[4-6]的全文匹配方法.然而,上
【参考文献】
相关期刊论文 前1条
1 王秀红;鞠时光;;用于文本相似度计算的新核函数[J];通信学报;2012年12期
【共引文献】
相关期刊论文 前2条
1 孟祥福;毕崇春;张霄雁;唐晓亮;唐延欢;;Web数据库top-k多样性关键字查询推荐方法[J];计算机研究与发展;2017年07期
2 王秀红;袁艳;赵志程;李洁玉;刘海军;杨国立;;专利文献的结构树模型及其在相似度计算中的应用[J];情报理论与实践;2015年03期
【二级参考文献】
相关期刊论文 前5条
1 王秀红;鞠时光;;基于混合核函数的分布式信息检索结果融合[J];通信学报;2011年04期
2 任双桥;魏玺章;黎湘;庄钊文;;基于特征可分性的核函数自适应构造[J];计算机学报;2008年05期
3 王华忠;俞金寿;;核函数方法及其模型选择[J];江南大学学报;2006年04期
4 王国胜;;核函数的性质及其构造方法[J];计算机科学;2006年06期
5 吴涛,贺汉根,贺明科;基于插值的核函数构造[J];计算机学报;2003年08期
【相似文献】
相关期刊论文 前10条
1 万洁;张文胜;朱青;王珊;;基于历史信息提升关键字查询效率[J];小型微型计算机系统;2011年11期
2 王焕景;李明;;“关键字查询”教学设计[J];中国教育技术装备;2007年12期
3 宋玉玲;王宁;;利用实体语义信息的关键字查询结果多样化[J];计算机科学与探索;2014年03期
4 陈子军;周同;刘文远;;面向集合和方向的空间关键字查询[J];小型微型计算机系统;2014年05期
5 任建华;周建;孟祥福;魏珂;;基于关键字之间结构关系的XML查询结果排序方法[J];计算机科学;2013年06期
6 黄静;陆嘉恒;孟小峰;;高效的XML关键字查询改写和结果生成技术[J];计算机研究与发展;2010年05期
7 王金宝;高宏;李建中;杨东华;;RB树:一种支持空间近似关键字查询的外存索引[J];计算机研究与发展;2012年10期
8 周军锋;孟小峰;;XML关键字查询处理研究[J];计算机学报;2012年12期
9 吴海涛;;一种改进的XML关键字查询算法[J];南京工程学院学报(自然科学版);2011年02期
10 李艳红;李国徽;张聪;;路网中空间关键字连续k近邻查询算法研究[J];华中科技大学学报(自然科学版);2013年12期
相关会议论文 前5条
1 谢涛;王晓玲;欧阳树生;周傲英;;XML关键字检索的最低公共祖先快速查找方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
2 黄静;陆嘉恒;孟小峰;;高效的XML关键字查询改写和结果生成技术[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
3 方非;朱皓;杨卫东;;基于结构摘要的XML关键字检索[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
4 黄静;徐俊劲;周军锋;孟小峰;;MLCEA:一种基于实体的XML关键字查询语义[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
5 王小锋;张新;谢敏;孟小峰;周军锋;;XML数据流上的关键字查询[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
相关博士学位论文 前1条
1 张晨静;XML关键字过滤技术[D];复旦大学;2011年
相关硕士学位论文 前10条
1 张丹婷;基于事前约束的XML关键字查询处理研究[D];燕山大学;2015年
2 林健;云环境下支持隐私保护的动态模糊多关键字排列查询方法研究[D];东北大学;2014年
3 崔清娟;已知社交的Top-k空间关键字查询[D];燕山大学;2016年
4 方海林;面向LBS的近邻及反近邻空间关键字查询研究[D];苏州大学;2016年
5 杨韵硕;模糊关键字可搜索加密算法的研究与实现[D];电子科技大学;2016年
6 张宇晨;基于图结构的多关键字查询技术研究[D];南京邮电大学;2016年
7 刘勇;基于地理位置的模糊关键字检索[D];黑龙江大学;2016年
8 胡胜平;面向云端加密数据的多关键字模糊检索策略[D];东华大学;2017年
9 李泉霖;基于Hadoop的XML关键字查询算法研究[D];辽宁师范大学;2016年
10 李赫;个人数据空间管理系统关键字查询的研究与实现[D];北京交通大学;2012年
,本文编号:1451076
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1451076.html