MTruths:Web信息多真值发现方法
本文关键词:MTruths:Web信息多真值发现方法
更多相关文章: 真值发现 数据冲突 单值属性 多值属性 数据源质量
【摘要】:Web已成为一个浩瀚的信息海洋,其信息分散在不同的数据源中.不同数据源常常为同一对象实体提供冲突的属性值.如何从这些冲突属性值中找到真值被称为真值发现问题.根据属性值数量可将对象属性分为单值属性和多值属性,现有的多数真值发现算法对单值属性的真值发现比较有效.针对多值属性的真值发现问题,提出了一个多真值发现方法 MTruths,该方法将多真值发现问题转化为一个最优化问题,其目标是:各对象的真值与各数据源提供的观察值之间的相似性加权和达到最大.对象真值求解过程中,提出2种方法求真值列表的最优解:基于枚举的方法和贪心算法.与已有方法不同的是MTruths可以直接得到对象的多个真值.最后,通过图书和电影2个真实数据集上的实验表明,MTruths的2种实现方法的准确性以及贪心算法的效率优于现有真值发现方法.
【作者单位】: 中国人民大学信息学院;首都师范大学教育技术系;北京服装学院信息工程学院;
【基金】:国家自然科学基金项目(61379050,91224008,61502279) 国家“八六三”高技术研究发展计划基金项目(2013AA013204) 高等学校博士学科点专项科研基金项目(20130004130001) 中国人民大学科学研究基金项目(11XNL010)~~
【分类号】:TP393.09
【正文快照】: 互联网信息量正以惊人的速度急剧增长,俨然成为一个巨大的信息库.Web已经渗透到人们日常生产、生活的方方面面,逐渐成为人们获取信息的重要来源.人们在享受来自Web丰富信息的同时,也受到信息质量问题的困扰,大量错误、过时、不完整、虚假信息充斥于网络.其中,信息冲突问题尤为
【相似文献】
中国期刊全文数据库 前10条
1 庞东升;;信息化过程中的数据源管理[J];中国高校科技与产业化(学术版);2006年S3期
2 公剑;徐炜民;;基于网格的虚拟数据源的设计与实现[J];计算机应用与软件;2006年10期
3 关卿;王宏;;基于多数据源的网络流量矩阵估计[J];计算机工程;2009年14期
4 戴青云;樊沛;李刚;董逸生;;Web-based多数据源集成系统的研究[J];计算机科学;2002年09期
5 唐九阳;张维明;修保新;肖卫东;;面向异构数据集成的数据源能力描述框架[J];计算机科学;2004年04期
6 成瑜,何洁月;基于本体的生物信息数据源的发现[J];微机发展;2005年01期
7 涂承胜;不同ADO数据源的连接技术分析[J];重庆三峡学院学报;2002年03期
8 毛剑波;易茂祥;;一种JMF数据源多路应用解决方案[J];现代电子技术;2006年23期
9 邓松;万常选;刘喜平;;基于用户反馈的Web多媒体数据源的选取[J];管理学报;2011年12期
10 鲜学丰;方巍;赵朋朋;崔志明;胡鹏昱;;一种Deep Web数据源质量评估模型[J];微电子学与计算机;2008年10期
中国重要会议论文全文数据库 前2条
1 鲜学丰;方巍;赵朋朋;崔志明;胡鹏昱;;一种Deep Web数据源质量评估模型[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
2 岳昆;刘惟一;李维华;王晓玲;;基于多数据源查询处理的Web服务合成[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
中国重要报纸全文数据库 前5条
1 倪显利;VB 6.0与大型数据库的无“数据源”连接[N];计算机世界;2001年
2 博文 编译 Duane Merrill;实施企业级的Mashup[N];计算机世界;2007年
3 PALADIN;编程沙龙[N];电脑报;2003年
4 温海涛、刘占山;给校园网做个留言版[N];中国电脑教育报;2002年
5 丁望;IPsec及在VPN组网中的应用[N];网络世界;2001年
中国博士学位论文全文数据库 前3条
1 邓松;非合作结构化深网数据源选择技术研究[D];江西财经大学;2013年
2 贺金鑫;安全组通信中数据源认证问题的研究[D];吉林大学;2008年
3 方巍;基于本体的Deep Web信息集成关键技术研究[D];苏州大学;2009年
中国硕士学位论文全文数据库 前10条
1 秦争艳;基于采样的Deep Web数据源选择方法研究[D];上海师范大学;2015年
2 胡代勇;一种改进的深层网络数据源描述方法[D];哈尔滨工程大学;2012年
3 祝官文;基于表单特性的深层网络数据源分类方法研究[D];哈尔滨工程大学;2012年
4 周千威;Deep Web数据源分类及用户满意度评估研究[D];重庆大学;2014年
5 李妹芳;Deep Web数据源发现和选择研究[D];东北大学;2008年
6 屈振东;Deep Web环境下数据源选择和结果缓存的研究[D];东北大学;2009年
7 李林;Deep Web数据源发现相关技术研究[D];苏州大学;2009年
8 胡鹏昱;Deep Web数据源质量估计模型及应用研究[D];苏州大学;2009年
9 赵娜;Deep Web数据源发现及选择方法研究[D];山东大学;2009年
10 王海龙;Deep Web数据源发现和分类研究[D];苏州大学;2011年
,本文编号:1244822
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1244822.html