当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于众包平台针对可达性查询的不确定图清洗研究

发布时间:2020-07-16 07:09
【摘要】:图数据库在大数据时代扮演着重要且核心的角色,其中不确定图有着广泛的应用,如合著者关系网、生物分子网络、社交网络等。本文研究的对象是仅边具有存在概率的不确定图,研究的目标是提高不确定图上可达性查询的可靠性。然而,目前关于不确定图清洗的研究仅针对限定距离的可达性查询,且假设众包平台对不确定图的清洗结果是完全正确的。因此,首先研究基于精确众包平台、针对同时限定距离与标签的可达性查询的不确定图清洗;基于此,考虑众包噪声对清洗结果的影响,进行基于非精确众包平台针对可达性查询的不确定清洗的研究。为此,归纳了有关不确定图清洗的研究方法、基础概念与可达率计算方法,提出了进行不确定图清洗的初步理论。其次,对于无众包噪声的情况,设计了基于精确众包的不确定图清洗框架;提出了可以准确快速地计算概率可达性的算法;为减小对最优待清洗边的搜索范围,设计了改进的路径搜索算法以提取有效边;依次设计了不确定图的单边清洗与多边清洗算法,并通过实验验证了清洗算法的选边准确性与高效性。然后,对于基于非精确众包的不确定图清洗,建立了融入众包噪声到清洗结果的不确定图清洗模型;从数值层面考察了众包噪声对清洗结果的影响,发现如果众包精确度保持在50%以上,依然可以通过清洗目标边来提升查询结果质量。接着,归纳出查询结果质量增益函数(?Q),以考察不同边被清洗后对可达性查询结果可靠性的提升程度;通过分析非精确众包答案对查询结果质量增益的影响,提出并证明:边相关因子P_e~*可以替代查询结果质量增益?Q,作为对不同目标边清洗效果的考察标准,为设计清洗算法奠定了理论基础。之后,基于P_e~*分别设计了基于非精确众包的单边清洗与多边清洗算法;提出了缩小目标边搜索范围的优化技术以提高选边效率,设计了避免大量可达率计算的二次剪枝算法。通过实验证明了提出的清洗算法可以高效准确地选取目标边。最后,通过两个案例分析,简述本文的图清洗研究对其他图查询的应用价值。
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP311.13
【图文】:

关系网,图数,不可靠


华东师范大学硕士学位论文不确定数据 然而,由于数据源不可靠、信息丢失及模式不一致等原因,这些知识图谱的质量不甚理想[6]。通常,在一些主流的图数据库中有 69%至 99%的实体数据缺乏完整的属性信息[7]。例如:作者重名可能导致从一些学术网站(DBLP、Google Scholar 等)提取的作者合著关系网不可靠;截至 2016 年,Wikidat仅仅包含全图 2%的人的父亲信息[6]。从某种角度说,在这些不完整的图数据库中,一些实体所缺失的数据是不确定的,即有可能存在也可能不存在或者存在的数量不确定。MarylandStanfordAjim Premji

不确定,可达性,交互网络,限定条件


图 1-2 三种类型的不确定图0.8JiawWei Wang0.3Wei Wang0.90.70.2MusicFashionPoliticsLady GagaA. 边的存在不确定 B. 顶点不确定C. 边的属性不确定

不确定,构成元素


边属性)都可能是不确定的,而一个不确定图至少有一种不确定的构成元素。图1-2 展示了分别包含这三种不确定构成元素的不确定图[5]。其中,顶点不确定的情况一般是实体解析领域的研究对象。本文研究的不确定图仅边的存在性是不确定的,即图中的每条边都有一定的存在概率。这种不确定图是许多应用的基础模型。例如:在机器生成的知识图谱中,由于数据是利用自然语言处理技术从网页文档中提取的,不同实体之间的关系是不确定的;在蛋白质交互网络中,不同蛋BillGatesSergey BrinMarylandStanfordJane StanfordSteveWoznaikJerry YangAjim PremjiWiproYahoo!Googlefoundednationality

【相似文献】

相关期刊论文 前10条

1 马旭燕;;众包在项目翻译教学中的应用初探[J];上海翻译;2017年06期

2 王志宏;傅长涛;李阳阳;;众包的行业应用研究述评[J];长安大学学报(社会科学版);2017年05期

3 李洋;温亮明;李健;;国内图书馆众包研究文献综述[J];知识管理论坛;2018年02期

4 刘彤;;关于档案众包的分析与研究[J];山东档案;2018年04期

5 曾婧婧;;国外政府资助型科研众包研究综述[J];中国科技论坛;2016年12期

6 郝迎春;祖菊;;人力资源众包服务平台应用研究[J];企业改革与管理;2017年07期

7 张永云;张生太;吴翠花;;嵌入还是卷入:众包个体缘何贡献知识?[J];科研管理;2017年05期

8 张宏树;陈雪波;;众包十年背景下的众筹新闻再考察[J];青年记者;2017年17期

9 任重;;基于万众创新的科研众包研究:定义、理论内涵与启示[J];自然辩证法通讯;2017年04期

10 王晔;;科研众包模式下图书馆支持服务研究[J];图书馆研究;2017年04期

相关会议论文 前10条

1 刘世群;李思佳;倪世光;彭凯平;;众包:移动互联网时代的心理研究工具[A];第二十届全国心理学学术会议--心理学与国民心理健康摘要集[C];2017年

2 尹彦;张晋冉;;天津市民参与快递众包意愿的实证研究[A];发挥社会科学作用 促进天津改革发展——天津市社会科学界第十二届学术年会优秀论文集(中)[C];2017年

3 赵巍;;众包负面效应及潜在风险研究[A];“决策论坛——企业行政管理与创新学术研讨会”论文集(上)[C];2016年

4 任延静;林丽慧;;众包平台创新竞赛中加价延期机制采纳决策的研究[A];第八届(2013)中国管理学年会——信息管理分会场论文集[C];2013年

5 周素红;彭伊侬;;众包理念下的参与式新型城市治理[A];持续发展 理性规划——2017中国城市规划年会论文集(12城乡治理与政策研究)[C];2017年

6 张铮;;O2O众包模式交通事故的责任承担——以车辆挂靠关系为类推[A];法院改革与民商事审判问题研究——全国法院第29届学术讨论会获奖论文集(下)[C];2018年

7 刘汕;邓琼;;互联网环境下众包创新服务绩效的关键影响因素研究[A];第十五届全国计算机模拟与信息技术学术会议论文集[C];2015年

8 陈鹤阳;陈婧;;众包模式下应急管理的情报分析[A];“四个全面”·创新发展·天津机遇——天津市社会科学界第十一届学术年会优秀论文集(中)[C];2015年

9 刘春成;唐松源;Chongyi Wei;Joseph Tucker;;从群众中来,到群众中去:众包与健康传播[A];2015年度中国健康传播大会优秀论文集[C];2015年

10 卢新元;黄河;赵敏;卢泉;;众包模式下基于接包方的风险分析及控制研究[A];第十一届(2016)中国管理学年会论文集[C];2016年

相关重要报纸文章 前10条

1 本报记者 胡军;全民快递时代 安全问题待解[N];中国消费者报;2016年

2 本报记者 张露;华少加盟“众包造车” 中国好汽车要出炉了[N];中国青年报;2015年

3 省政协委员 李明喜;致力打造科研众包平台[N];江淮时报;2017年

4 陈健秀 夏福良;从打包生产走向众包定制[N];中国石化报;2018年

5 苏报评论员 金根;攻关技术瓶颈,“科研众包”有戏[N];苏州日报;2018年

6 记者 吴洁;从“双创”到“四众” 创客们准备好了吗[N];昆明日报;2016年

7 季征;云南:搭建平台释放创业创新能量[N];云南经济日报;2016年

8 本报记者 季征;搭建平台释放创业创新能量[N];云南日报;2016年

9 记者 邱登科;广东公布首批科研众包培育平台[N];民营经济报;2017年

10 本报记者 陶力;达达布局同城物流:“跑腿”采用离散式众包模式[N];21世纪经济报道;2017年

相关博士学位论文 前10条

1 张立晔;基于众包的WLAN室内定位技术研究[D];哈尔滨工业大学;2018年

2 向为;创意设计柔性众包的方法与应用[D];浙江大学;2017年

3 吴薇;众包竞赛情境下接包者持续参与行为研究:竞争自我效能的作用[D];中国科学技术大学;2018年

4 林素芬;基于众包参与者网络的众包绩效提升研究[D];华侨大学;2015年

5 冯小亮;基于双边市场的众包模式研究[D];武汉大学;2012年

6 饶华铭;人本计算系统中众包数据质量控制方法的改进及其应用研究[D];南京理工大学;2017年

7 庞建刚;众包社区创新的运营机制设计[D];中国科学技术大学;2014年

8 胡昭阳;众包科学:网络传播语境下的公众参与创新[D];中国科学技术大学;2015年

9 李春华;基于机器学习模型与众包的知识融合方法研究[D];苏州大学;2017年

10 邹凌飞;众包社区成员创造力绩效影响因素分析及其应用研究[D];华中科技大学;2015年

相关硕士学位论文 前10条

1 王梦婧;基于众包的物流配送调度优化方案[D];哈尔滨工业大学;2017年

2 张倩茹;互联网竞赛型众包模式下雇主绩效影响因素与管理策略[D];长安大学;2018年

3 莫小燕;基于众包手机数据的实时路况估计和路径规划研究[D];哈尔滨工业大学;2017年

4 江雨;基于不确定任务环境的众包用户行为分析及调度策略研究[D];华东师范大学;2018年

5 吴永成;基于众包平台针对可达性查询的不确定图清洗研究[D];华东师范大学;2018年

6 章汉铭;基于表示学习的众包服务领域用户消费意图理解技术的研究[D];哈尔滨工业大学;2018年

7 张真铭;科研众包平台双边用户参与行为的影响因素研究[D];太原理工大学;2018年

8 赵敏;众包模式下我国中小企业创新绩效影响研究[D];华中师范大学;2018年

9 艾阔;众包数据提取平台的设计与实现[D];北京交通大学;2018年

10 孙毓鸿;基于众包的CIDP平台出版编撰流程改进研究[D];西安工业大学;2018年



本文编号:2757692

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2757692.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户02472***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com