基于Web的实例扩展与属性值扩充方法
本文关键词:基于Web的实例扩展与属性值扩充方法
【摘要】:实例扩展与属性值扩充是Web抽取与集成领域中的一个重要研究课题,将Web数据列表和实例建模成二分图,根据扩展实例的质量分数,对扩展集合进行迭代更新直到扩展集合的质量分数最大,且扩展集合不再更新来实现实例的扩展。同时,为了完善扩展实例的属性信息,对结构化数值属性或离散属性进行抽取,提出了基于整数线性规划的属性值扩充方法。实验表明,与以前的方法相比,本方法能更好地处理含有噪声数据的Web网页,并提高了抽取的准确率和召回率。
【作者单位】: 沈阳建筑大学信息与控制工程学院;
【基金】:国家自然科学基金(61070024) 辽宁省自然科学基金(2014020068)资助
【分类号】:TP393.092
【正文快照】: 本文受国家自然科学基金(61070024),辽宁省自然科学基金(2014020068)资助。1引言随着Web数据的不断增加,访问Web数据已成为获取信息的重要手段。网页上的信息往往包含了现实生活中的某些实例,例如一部电影、一本书籍、一件商品等,它们由若干属性来描述(例如上映时间、作者名、
【参考文献】
中国期刊全文数据库 前2条
1 马安香;张斌;高克宁;齐鹏;张引;;基于结果模式的Deep Web数据抽取[J];计算机研究与发展;2009年02期
2 李贵;张淼;李征宇;孙平;;基于领域模型的Web数据抽取与集成[J];微电子学与计算机;2012年09期
【共引文献】
中国期刊全文数据库 前10条
1 王兰成;刘晓亮;黄永勤;;论互联网新媒体档案信息资源的建设与服务[J];档案与建设;2014年01期
2 胡新海;;微博垃圾评论检测与预处理技术[J];湖南工程学院学报(自然科学版);2014年03期
3 罗彩君;;一种改进的Web社区结构挖掘系统[J];电子设计工程;2014年12期
4 庞红美;刘宏志;;基于PageRank算法的信息工程安全监理风险评估研究[J];计算机安全;2014年08期
5 陈凯;曹晓光;杨冀红;史良树;战鹰;;基于C4.5决策树算法的全国积雪模型生成[J];电子设计工程;2014年17期
6 张文惠;李辉;;数据挖掘助力唯品会突围[J];电子商务;2014年11期
7 申德荣;马也;聂铁铮;寇月;于戈;;一种应用于Deep Web数据集成系统中的查询松弛策略[J];计算机研究与发展;2010年01期
8 王宇;谭松波;廖祥文;曾依灵;;基于扩展领域模型的有名属性抽取[J];计算机研究与发展;2010年09期
9 董永权;李庆忠;丁艳辉;彭朝晖;;基于约束条件随机场的Web数据语义标注[J];计算机研究与发展;2012年02期
10 高明;王继成;李江峰;;基于语义支持的Deep Web数据抽取[J];计算机科学;2010年03期
中国重要会议论文全文数据库 前2条
1 梁浩;左万利;任斐;赫枫龄;;基于启发式信息的Deep Web查询接口属性抽取[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 文俊峰;;山西移动综合监控战略规划[A];中国通信学会第六届学术年会论文集(下)[C];2009年
中国博士学位论文全文数据库 前3条
1 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年
2 丁艳辉;面向Web数据集成的数据抽取问题研究[D];山东大学;2010年
3 吴共庆;基于标签路径特征的Web新闻内容抽取研究[D];合肥工业大学;2012年
中国硕士学位论文全文数据库 前10条
1 毛桂春;Deep Web查询结果后处理[D];吉林大学;2011年
2 李秀兰;基于结果模式的Deep Web语义标注研究[D];兰州理工大学;2011年
3 戚春超;Deep Web数据源发现与分类研究[D];南京信息工程大学;2011年
4 阚述贤;基于本体及概念模式的Deep Web查询结果处理技术[D];广西师范大学;2011年
5 唐黎;Deep Web页面结构分析与核心内容提取研究[D];重庆大学;2011年
6 卓林;增量式Deep Web数据获取技术研究[D];苏州大学;2011年
7 谢莹;Deep Web查询结果抽取及注释[D];吉林大学;2010年
8 高亚;Deep Web数据集成系统中数据抽取与语义标注研究[D];河北大学;2010年
9 于晓;Deep Web查询松弛和实体识别研究[D];辽宁大学;2012年
10 郭建兵;面向特定领域的Deep Web数据获取技术研究[D];苏州大学;2012年
【二级参考文献】
中国期刊全文数据库 前3条
1 廖涛;刘宗田;孙荣;;Web表格定位技术的研究与实现[J];计算机科学;2009年09期
2 刘伟;孟小峰;孟卫一;;Deep Web数据集成研究综述[J];计算机学报;2007年09期
3 鲜学丰;方巍;赵朋朋;崔志明;胡鹏昱;;一种Deep Web数据源质量评估模型[J];微电子学与计算机;2008年10期
【相似文献】
中国期刊全文数据库 前10条
1 张爱平;张小红;;属性值为语言区间的多属性决策方法[J];计算机工程与应用;2011年07期
2 崔勇;高岩;王福利;王子敬;;模糊信息系统属性值的重要性度量[J];河南理工大学学报(自然科学版);2007年04期
3 李中华,施丽华,李玉茜;属性的增量赋值[J];计算机工程;1993年01期
4 ;第六章 多属性索引法[J];计算机工程与应用;1981年Z2期
5 关欣;衣晓;何友;周一宇;;一种区间属性值离散化的新方法[J];宇航学报;2009年03期
6 张艳芹;张虹;杨习贝;;区间属性值信息系统的不确定性度量[J];计算机应用与软件;2009年01期
7 程显毅;施Oz;沈学华;田宇贺;;属性和属性值组合的概念模板[J];北京大学学报(自然科学版);2013年01期
8 林宏康;范成贤;史开泉;;倒向P-推理与属性剩余发现-应用[J];计算机科学;2011年10期
9 坐看云起;《天使》人物属性攻略[J];网络与信息;2002年11期
10 洪帆,饶双宜,段素娟;基于属性的权限—角色分配模型[J];计算机应用;2004年S2期
中国重要会议论文全文数据库 前2条
1 王宇;方滨兴;吴博;宋林海;郭岩;;结合属性分布特征的模式匹配算法[A];第五届全国信息检索学术会议论文集[C];2009年
2 张亮;胡学钢;;多层次属性值下概念格的动态转化[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
中国重要报纸全文数据库 前4条
1 重庆 韩涛;中望CAD中块属性的制作[N];电脑报;2004年
2 7Star;教你做RM压缩程序[N];电脑报;2003年
3 北京邮电大学 张剑;通过DOM操作数据(下)[N];计算机世界;2001年
4 ;查找替换的技巧[N];中国电脑教育报;2001年
中国硕士学位论文全文数据库 前10条
1 徐海堂;属性证书及应用研究[D];中国人民解放军信息工程大学;2005年
2 童先群;基于属性值信息熵的KNN算法改进研究[D];漳州师范学院;2010年
3 张秀丽;符号属性值的相似度学习及属性重要性研究[D];河北大学;2011年
4 张朝胜;领域本体概念实例、属性及属性值提取研究[D];昆明理工大学;2011年
5 雷玉霞;基于本体的军事知识联通[D];中国科学院研究生院(软件研究所);2002年
6 曾宪科;基于博弈论的多属性拍卖模型与机制研究[D];哈尔滨工业大学;2010年
7 王晓阳;基于模块属性的远程证明协议[D];太原理工大学;2012年
8 彭志凯;基于拍卖—谈判的多属性两阶段采购机制研究[D];武汉科技大学;2011年
9 孙正;基于药物属性的中药方剂组网及药物社团发现研究[D];南京大学;2013年
10 张丙辰;基于结构和属性的图挖掘技术应用研究[D];哈尔滨工程大学;2012年
,本文编号:1152762
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1152762.html