概率反Top-k查询上Why-not问题研究
[Abstract]:At present, more and more researches focus on uncertain data sets, such as market analysis, Internet and large sensor networks. At the same time, sorting queries on uncertain datasets have also been widely studied. Among them, probabilistic Top-k query can find k objects of most interest to the user. However, in practical applications, the objects expected by the user may not appear in the query results. Therefore, they can propose a probabilistic Top-k query on the Why-not problem. On the other hand probabilistic anti-Top-k queries are generally used in business decisions to help businesses find the consumer groups most interested in their products in order to better market their products. When manufacturers find that their target population is not in the search results, they may wonder: why is a consumer not interested in their product? Although there have been many researches on the Why-not problem, the existing Why-not problem can not be directly used to solve the probabilistic Top-k query and probabilistic anti-Top-k query. Based on the above analysis, this paper mainly studies two problems: the Why-not problem on the (i) probabilistic Top-k query. In this paper, the way of modifying Why-not vector Wm and parameter k (MWK) to optimize the original probabilistic Top-k query is given. So that Wm can be included on the; (ii) probabilistic anti-Top-k query in the optimized query results. In this paper, a framework WNPTR is proposed. Given an original probabilistic anti-Top-k query and a set of missing vectors, WNPTR will use the following three different strategies to find an optimized query for the user: 1) modify the query object Qn2) modify the missing vector Wm and the parameter KN3) at the same time A large number of experiments on the query object Q, the missing vector Wm and the parameter k on the real and composite datasets show that the proposed algorithm is effective and efficient.
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 沈越泓;;差错概率值的快速算法[J];军事通信技术;1986年03期
2 王建卫;郝忠孝;;一种概率XML数据树的化简算法[J];计算机应用研究;2010年12期
3 彭嘉雄;地形匹配虚定位概率的估计[J];数据采集与处理;1986年01期
4 唐俊;王年;梁栋;;一种结合概率松弛的谱匹配方法[J];计算机工程;2007年21期
5 江彤;;稳态的概率数据库探讨[J];湖南人文科技学院学报;2011年05期
6 杨昕,杨新;匹配概率估计方法[J];红外与激光工程;2003年03期
7 田玉敏;宋君;;利用概率对稀疏域划分的压缩感知方法[J];西安电子科技大学学报;2013年06期
8 盛晟;肖明清;赵亮亮;文莹;胡斌;;故障Petri网的概率变迁方法研究[J];仪器仪表学报;2014年03期
9 裘敬华,唐仙芝;用Excel处理概率与数理统计中两类问题的方法[J];黄河水利职业技术学院学报;2003年02期
10 刘江宁;吴泉源;;规则基专家系统概率区间推理模式研究[J];计算机工程与科学;1993年03期
相关会议论文 前1条
1 王杰;梁华国;李华伟;闵应骅;李晓维;;基于输出违例概率的时延向量测试质量评估[A];第六届中国测试学术会议论文集[C];2010年
相关重要报纸文章 前2条
1 柯果;概率断案有玄机[N];民主与法制时报;2012年
2 李中彩;为什么不选择这样的号码[N];重庆商报;2000年
相关博士学位论文 前4条
1 钟细华;双稳健逆概率加权方法的建立及其在临床试验数据缺失中的应用[D];第二军医大学;2015年
2 王闯;有关建筑用能的人行为模拟研究[D];清华大学;2014年
3 彭荻;动态概率SDG模型及复杂化工过程故障诊断方法研究[D];北京化工大学;2015年
4 余磊;基于认知科学的计算机围棋博弈问题的研究[D];华东师范大学;2011年
相关硕士学位论文 前10条
1 任晓欣;建筑中人行为动作模型研究与分析[D];清华大学;2015年
2 史文君;基于接送行为的中小学校等待集散空间研究[D];东南大学;2015年
3 洪燕如;概率扭曲条件下的一类最优停时[D];福州大学;2013年
4 杨家豪;考虑出力概率分布模型的风储联合发电系统优化配置研究[D];华南理工大学;2016年
5 周圣杰;WSN中三维概率随机多址接入MAC层协议分析[D];云南大学;2016年
6 许灿;基于概率的不确定性传播与计算反求方法研究[D];湖南大学;2015年
7 宋梦;高维模型表达在概率潮流和静态安全域中的应用研究[D];哈尔滨工业大学;2014年
8 李曦;基于FPGA的概率电路仿真方法研究[D];华中科技大学;2015年
9 李雨;概率数据库可扩展查询技术[D];华中科技大学;2015年
10 许敏;概率教学情境下学生随机性思维发展水平研究[D];闽南师范大学;2017年
,本文编号:2126948
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2126948.html