基于Web信息的关系型信息错误自动检测与修复技术研究综述
本文关键词: 关系数据 信息质量 错误检测 数据修复 Web 出处:《计算机学报》2017年10期 论文类型:期刊论文
【摘要】:信息质量已经成为诸多应用领域所面临的一个重要问题,自动检测和修复信息系统中的信息错误是改善信息质量的有效手段.利用Web对关系数据库中的信息进行扩展以助于信息错误的自动检测与修复具有对待检测与修复的信息本身依赖少、信息质量规则更灵活、适用性更广以及信息修复相对更准确等优势,可以有效克服现有的基于规则、基于扩展信息和基于人机交互的信息错误检测与修复技术的不足.文中详细分析了基于Web信息的信息错误自动检测与修复技术的优势及所面临的挑战,提出了基于Web信息的信息错误自动检测与修复技术框架.该框架包括:Web信息自动拓展模型、基于Web信息的信息错误自动检测算法、基于Web信息的信息错误自动修复算法和基于Web信息的信息错误自动检测与修复算法的可靠性评估模型.基于上述框架,文中系统总结了基于Web信息的信息错误自动检测技术、信息错误自动修复技术以及信息扩展核心技术三个方面的研究进展,提炼出了基于Web信息的信息错误自动检测与修复技术需要解决的关键科学问题,对未来的研究方向进行了展望并且讨论了初步的研究思路.
[Abstract]:The quality of information has become an important problem in many application fields. Automatic detection and repair of information errors in information systems is an effective means to improve the quality of information. The use of Web to expand the information in relational databases to help the automatic detection and repair of information errors with the treatment of detection and repair. Complex information itself is less dependent, The advantages of more flexible information quality rules, wider applicability and more accurate information repair can effectively overcome the existing rule-based rules. Based on extended information and human-computer interaction based information error detection and repair technology shortcomings. This paper analyzes the advantages and challenges of automatic information error detection and repair technology based on Web information. In this paper, a technical framework of automatic error detection and repair based on Web information is proposed. The framework includes the automatic extension model of Web information, the algorithm of automatic error detection based on Web information, and the algorithm of automatic error detection based on Web information. The reliability evaluation model of information error auto-repair algorithm based on Web information and information error detection and repair algorithm based on Web information is presented. Based on the above framework, the information error automatic detection technology based on Web information is systematically summarized in this paper. The research progress of information error automatic repair technology and information extension core technology is summarized. The key scientific problems that need to be solved in automatic information error detection and repair technology based on Web information are extracted. The future research direction is prospected and the preliminary research ideas are discussed.
【作者单位】: 西北工业大学计算机学院;
【基金】:国家“九七三”重点基础研究发展规划项目基金(2012CB316203) 国家自然科学基金(61502390,61472321) 西北工业大学基础研究基金(3102014JSJ0013,3102014JSJ0005)资助~~
【分类号】:TP311.13;TP393.09
【相似文献】
相关期刊论文 前10条
1 李艳;图书馆Web信息服务系统的调研与开发[J];图书情报工作;2001年01期
2 傅守灿,李艳;图书馆Web信息服务系统设计与实现[J];现代图书情报技术;2001年03期
3 胡国晴;李建华;;一种自动抽取Web信息方法的设计与实现[J];计算机与现代化;2009年01期
4 杨春蓉;;一种基于XML的Web信息数据库的构建方法[J];无线互联科技;2012年10期
5 李延香;赵娟;袁辉;;XML+RDF+Ontology实现Web信息的语义描述[J];咸阳师范学院学报;2007年04期
6 陈冈;舒建文;;构造基于Intranet的Web信息搜索服务[J];微型电脑应用;2007年11期
7 任瑞娟,吴军霞;DC与图书馆Web信息发布[J];现代图书情报技术;2001年05期
8 邵瑛;;通用工业Web信息实时监测和处理系统的研究与实现[J];微型电脑应用;2010年01期
9 于长钺;于秀山;马睿涵;;基于网站集中的Web信息搜索速度优化研究[J];情报科学;2012年05期
10 黄昱阳;李慧伦;;基于XML的Web信息数据库的建立[J];计算机与现代化;2012年09期
相关会议论文 前3条
1 张凯;李魁;张刚;王斌;;基于站点的Web信息采集器研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
2 刘宝良;李建中;张兆功;;基于本体的Web信息组织[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
3 刘世杰;唐世渭;杨冬青;王腾蛟;李立宇;;基于XML技术的Web信息提取和集成[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
相关硕士学位论文 前6条
1 陈龙;基于WEB信息抽取的企业竞争情报系统研究[D];合肥工业大学;2007年
2 赵靖;面向智能搜索的Web信息挖掘技术研究[D];哈尔滨工程大学;2009年
3 赖春波;Web信息自动抽取技术研究[D];浙江大学;2008年
4 李明浩;基于搜索引擎和数据挖掘的个性化web信息服务[D];吉林大学;2008年
5 王颖;应用于中文人名搜索引擎的Web信息提取技术研究[D];兰州大学;2006年
6 董立;Web信息挖掘在公共信息安全中的应用[D];山东大学;2007年
,本文编号:1528817
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1528817.html