当前位置:主页 > 管理论文 > 移动网络论文 >

基于视觉信息和标签路径的数据抽取

发布时间:2017-07-26 05:23

  本文关键词:基于视觉信息和标签路径的数据抽取


  更多相关文章: Deep Web 数据抽取 视觉信息 标签路径


【摘要】:结合网页的视觉信息和DOM树结构,研究从Deep Web查询结果页面中抽取半结构化数据的问题。通过视觉块与整个网页的面积比定位数据区域。根据数据记录两两相邻等视觉特征找到包含数据记录的一组节点,并通过比较各节点的DOM树结构的相似度去除噪音节点。根据xpath属性将各条数据记录的数据项对齐。对整个抽取过程生成模板,可以使抽取效率得到很大提高。对8个Deep Web网站进行了抽取数据实验,结果表明本文方法是有效的。
【作者单位】: 中国海洋大学信息科学与工程学院;
【关键词】Deep Web 数据抽取 视觉信息 标签路径
【基金】:山东省自然科学基金项目(ZR2012FM016)资助
【分类号】:TP393.092
【正文快照】: 随着互联网的飞速发展,其中蕴含了海量的信息可供利用。与Surface Web相比,Deep Web蕴含的信息量是它的400~500倍,并且其信息质量和增长速度要远远高于Surface Web。Deep Web覆盖了现实世界中的各个领域,比如商业、教育、政府等,并且95%的信息可以公开访问,因此如何有效获取De

【参考文献】

中国期刊全文数据库 前1条

1 刘伟;孟小峰;孟卫一;;Deep Web数据集成研究综述[J];计算机学报;2007年09期

【共引文献】

中国期刊全文数据库 前10条

1 陆余良;房珊瑶;刘金红;施凡;;Deep Web站点分类研究进展[J];安徽大学学报(自然科学版);2010年01期

2 陶磊;莫倩;;基于CSS选择器的深网结果页抽取方法[J];北京工商大学学报(自然科学版);2009年02期

3 李颖;刘国华;佟冰;刘顺江;;基于素数的多源模式匹配方法的研究[J];燕山大学学报;2009年02期

4 王彩霞;高明;;Deep Web查询接口及其识别算法[J];电脑知识与技术;2011年22期

5 蒋莘;;基于知网的论文按需检索系统[J];电脑知识与技术;2012年02期

6 赵昊;卫刚;赵晓东;;基于主题Deep Web数据挖掘的研究与探索[J];电脑知识与技术;2012年16期

7 张志平;张云坤;李文骏;;Deep web在个性化信息服务中的应用[J];电子商务;2010年08期

8 郭少杰;陈雅冰;;Deep Web技术在科学数据共享平台中的应用[J];广东科技;2010年14期

9 李春林;;Web数据库集成技术及其发展趋势[J];硅谷;2012年09期

10 常勇;王亮;姚增利;袁方;;基于领域知识和决策树的Deep Web数据标注[J];广西师范大学学报(自然科学版);2009年01期

中国博士学位论文全文数据库 前10条

1 张慧斌;Deep Web查询接口及查询结果抽取研究[D];南开大学;2010年

2 闫中敏;Deep Web数据获取问题研究[D];山东大学;2010年

3 黎方正;关系数据库的关键词检索技术研究[D];中南大学;2010年

4 张卓;基于形式概念分析的Web数据库抽取研究[D];武汉大学;2011年

5 王颜新;非常规突发事件情境重构模型研究[D];哈尔滨工业大学;2011年

6 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年

7 孟祥福;Web数据库柔性查询关键技术研究[D];东北大学;2010年

8 聂铁铮;Deep Web中Web数据库集成关键技术的研究[D];东北大学;2009年

9 黄健斌;基于条件概率图模型的Deep Web数据抽取与集成研究[D];西安电子科技大学;2007年

10 徐和祥;Deep Web集成中若干技术研究[D];复旦大学;2008年

【相似文献】

中国期刊全文数据库 前10条

1 张艳滨;余雁;;视觉信息的多维性探究[J];大众文艺;2013年04期

2 张恒;刘艳丽;;基于视觉信息融合的驾驶员疲劳监测方法综述[J];信息技术;2008年06期

3 李刚;;视觉信息传递的模糊性[J];美术大观;2010年03期

4 寿天德;尹德辉;;关于图形、图像与脑对视觉信息的处理[J];临沂师范学院学报;2010年01期

5 ;非电话类服务[J];视听界;1991年03期

6 韩丛耀;;中华艺术视觉信息数据库建设构想(上)——视觉信息处理机制的建模及在视觉信息数据库建设中的应用[J];中国教育信息化;2009年17期

7 王苗辉;;基于视知觉的视觉信息界面设计研究[J];包装工程;2011年08期

8 汪云九,邢静;视觉信息加工的一些理论和模型[J];机器人;1987年03期

9 刁云程;“视觉信息加工”研究圆满结束[J];中国科学基金;1994年01期

10 陈果;张武昕;高隽;;微小目标的视觉信息获取及系统设计[J];合肥工业大学学报(自然科学版);2007年12期

中国重要会议论文全文数据库 前10条

1 何芸;杜诚;;21世纪的视觉信息技术[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年

2 翁强;闫丽;翁伟生;;多维空间感知觉模型对视觉信息加工缺损的研究[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年

3 刘力;龚海韵;;果蝇蘑菇体对视觉信息的归纳作用[A];首届中国神经信息学讨论会摘要[C];2000年

4 孙明;;视觉信息学的基本概念及其新技术在农业中的应用[A];中国农业工程学会2011年学术年会论文集[C];2011年

5 王书荣;;视觉信息加工中的神经元相互作用[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年

6 苏润娥;吉国明;宋笔锋;;人的视觉信息捕捉能力测试软件[A];陕西省航空装备制造技术发展——第九届陕西省青年科学家论坛论文集[C];2006年

7 杨瑾;李潇;王书荣;;家鸽背外侧丘脑神经元参与外侧单眼视觉和环境亮度检测[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年

8 张春宇;张蔚;刘海鹏;于立平;王小捷;李睿凡;;基于视觉信息的汉语词汇语义习得[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

9 唐克伦;张湘伟;成思源;熊汉伟;张洪;;视觉信息与CMM测量数据的融合[A];第十二届全国图象图形学学术会议论文集[C];2005年

10 李珊珊;于庆宝;冯士刚;鹿麒麟;唐一源;;视觉信息等级处理的双脑协同性研究[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年

中国重要报纸全文数据库 前4条

1 记者 班威;“家务机器人”能走能做家务[N];新华每日电讯;2010年

2 本报驻北京记者 李雪;北京心目影院 盲人的音画世界[N];中国文化报;2014年

3 静涵;聪明机器人自己坐电梯[N];北京科技报;2004年

4 杨雪;“声音照相机”软件让盲人听声辨物[N];科技日报;2012年

中国博士学位论文全文数据库 前6条

1 查正军;基于机器学习方法的视觉信息标注研究[D];中国科学技术大学;2009年

2 祝博荟;基于深度与视觉信息融合的行人检测与再识别研究[D];东华大学;2013年

3 何立火;视觉信息质量感知模型及评价方法研究[D];西安电子科技大学;2013年

4 尹显东;多维随机序列敏感视觉信息隐藏技术研究[D];电子科技大学;2007年

5 沈乔楠;堆石混凝土施工管理中视觉信息的处理方法及应用研究[D];清华大学;2010年

6 王蒙军;唇读发声器中视觉信息的检测与处理[D];天津大学;2007年

中国硕士学位论文全文数据库 前10条

1 彭凌玲;视觉信息的能量[D];吉林大学;2005年

2 张e,

本文编号:574897


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/574897.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6c6ff***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com