基于查询接口特征的Deep Web数据源自动分类
本文选题:Deep + Web ; 参考:《微电子学与计算机》2006年10期
【摘要】:搜索引擎可以很好地搜索出大部分可索引页面,然而,Internet上有大量的页面是由后台数据库动态产生的,传统的搜索引擎搜索不出这部分页面,我们称之为DeepWeb。其中大部分DeepWeb是结构化的,它提供结构化的查询接口和结构化的结果。把这些结构化的DeepWeb数据源按所属领域进行组织可以方便用户浏览这些有价值的资源,并且这也是大规模DeepWeb集成搜索的一个关键步骤。提出了一种基于查询接口特征的DeepWeb数据源自动分类方法,并通过实验验证该方法是非常有效的。
[Abstract]:Search engines can search most indexed pages well, but there are a lot of pages on the Internet that are generated dynamically by backstage databases. Traditional search engines can't search out these pages, which we call DeepWeb. Most of these DeepWeb are structured, providing structured query interfaces and structured results. Organizing these structured DeepWeb data sources according to their domain can facilitate users to browse these valuable resources, and this is also a key step of large-scale DeepWeb integrated search. An automatic classification method for DeepWeb data sources based on query interface features is proposed, and the experimental results show that this method is very effective.
【作者单位】: 苏州大学智能信息处理及应用研究所 苏州大学智能信息处理及应用研究所 苏州大学智能信息处理及应用研究所
【基金】:2005年度教育部科研重点项目(205059) 教育部“高校博士学科点科研基金项目”(20040285016) 江苏省高技术研究计划项目(BG2005019)
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 辛洁;崔志明;赵朋朋;张广铭;鲜学丰;;基于MapReduce虚拟机的Deep Web数据源发现方法[J];通信学报;2011年07期
2 黄蔚;;浅析机器学习及其在教育中的应用[J];科技信息;2011年18期
3 徐栋;;机器学习在网络攻击检测中的应用[J];河南科技;2011年13期
4 刘征;孙汉卿;;机器学习在入侵检测中的应用[J];职业技术;2011年04期
5 赵玉鹏;;论机器学习[J];安阳工学院学报;2011年04期
6 陈可佳;;社会网络分析中的机器学习技术综述[J];南京邮电大学学报(自然科学版);2011年03期
7 长江一号;;三招提升谷歌图片搜索效率[J];电脑迷;2011年14期
8 陈时敏;韩心慧;;基于机器学习的网页木马识别方法研究[J];信息网络安全;2011年09期
9 霍凌化;徐雄;;基于web的电脑生产过程数据管理系统[J];黑龙江科技信息;2011年22期
10 魏华;;关于金融报表系统数据集成问题的探究[J];中国市场;2011年36期
相关会议论文 前10条
1 赵朋朋;高岭;崔志明;;基于查询接口特征的Deep Web数据源自动分类[A];2006年全国开放式分布与并行计算学术会议论文集(二)[C];2006年
2 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
3 李月伦;常宝宝;;基于最大间隔马尔可夫网模型的汉语分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 谢世朋;胡茂林;;基于局部仿射区域对稀疏纹理分类的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
5 夏诏杰;郭力;李晓霞;;化学主题网络爬虫的研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
6 张郴;;基于神经网络集成的旅游需求预测模型[A];中国地理学会百年庆典学术论文摘要集[C];2009年
7 吴宪祥;于培松;万e,
本文编号:1814068
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1814068.html