基于决策树和链接相似的Deep Web查询接口判定
[Abstract]:In view of the shortcomings of the existing Deep Web query interface judgment methods which can not effectively distinguish the search engine interface, a Deep Web query interface decision method based on decision tree and link similarity is proposed. The method uses the information gain rate to select the important attributes, and constructs a decision tree to pre-judge the interface form to identify the interface with obvious features. Then we use the method based on link similarity to determine the unrecognized interface accurately identify the real query interface and exclude the search engine interface. The results show that this method can effectively distinguish search engine interface and improve the accuracy and recall of classification.
【作者单位】: 江苏大学计算机科学与通信工程学院;
【基金】:江苏省高校自然科学重大基金资助项目(08KJA520001) 国家自然科学基金资助项目(70971067)
【分类号】:TP391.3;TP18
【共引文献】
相关硕士学位论文 前1条
1 吴兵华;基于深度网络的信息检索模型研究[D];武汉理工大学;2008年
【二级参考文献】
相关期刊论文 前10条
1 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
2 丁建立,陈增强,袁著祉;遗传算法与蚂蚁算法的融合[J];计算机研究与发展;2003年09期
3 唐焕玲,孙建涛,陆玉昌;文本分类中结合评估函数的TEF-WA权值调整技术[J];计算机研究与发展;2005年01期
4 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
5 陈文亮;朱靖波;朱慕华;姚天顺;;基于领域词典的文本特征表示[J];计算机研究与发展;2005年12期
6 姜远;周志华;;基于词频分类器集成的文本分类方法[J];计算机研究与发展;2006年10期
7 尚文倩;黄厚宽;刘玉玲;林永民;瞿有利;董红斌;;文本分类中基于基尼指数的特征选择算法研究[J];计算机研究与发展;2006年10期
8 王煜,王正欧;基于模糊决策树的文本分类规则抽取[J];计算机应用;2005年07期
9 鲁明羽,李凡,庞淑英,陆玉昌,周立柱;基于权值调整的文本分类改进方法[J];清华大学学报(自然科学版);2003年04期
10 苏金树;张博锋;徐昕;;基于机器学习的文本分类技术研究进展[J];软件学报;2006年09期
相关博士学位论文 前1条
1 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
【相似文献】
相关期刊论文 前10条
1 李明;李秀兰;;基于结果模式的Deep Web数据标注方法[J];计算机应用;2011年07期
2 杨舟;岳亮;卓林;赵朋朋;崔志明;;一种基于领域本体的Deep Web数据自动标注方法[J];苏州大学学报(工科版);2011年04期
3 卓林;杨舟;岳亮;赵朋朋;崔志明;;Deep Web爬虫的一种增量式更新策略[J];苏州大学学报(工科版);2011年04期
4 邵秀丽;孙杰;侯乐彩;;基于整体模式匹配的深度网集成系统的研究[J];计算机工程与设计;2011年08期
5 顾晟;袁红娟;;基于WEB技术的图像索引体系的建构[J];南京工程学院学报(自然科学版);2011年01期
6 余肖生;司新霞;;基于聚类分析的元搜索引擎模型[J];重庆理工大学学报(自然科学);2011年06期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相关会议论文 前10条
1 陶然;江锦华;吴羽;陈刚;;基于树合并的Deep Web查询接口集成[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 梁浩;左万利;任斐;赫枫龄;;基于启发式信息的Deep Web查询接口属性抽取[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 王铎;李文辉;公正;江琦;;深层网查询接口的自动集成[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
4 余伟;李石君;洪辉;田建伟;;基于覆盖关系的Deep Web数据源排名[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
5 王英;左万利;王鑫;彭涛;;Deep Web查询转换研究[A];第六届全国信息检索学术会议论文集[C];2010年
6 方巍;胡鹏昱;赵朋朋;崔志明;;基于语义的Deep Web数据源自动发现技术[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
7 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
8 闫中敏;李庆忠;彭朝晖;董永权;丁艳辉;张永新;徐秀星;;DWDIS:面向分析的Deep Web数据集成系统[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
9 赵朋朋;高岭;崔志明;;基于查询接口特征的Deep Web数据源自动分类[A];2006年全国开放式分布与并行计算学术会议论文集(二)[C];2006年
10 李昭原;刘瑞;陈微;;开放—分布—异构多数据库互连查询接口的基本框架[A];数据库研究与进展95——第十三届全国数据库学术会议论文集[C];1995年
相关重要报纸文章 前1条
1 上海交通大学APEX数据和知识管理实验室 王昊奋邋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
相关博士学位论文 前10条
1 王英;Deep Web数据集成关键技术研究[D];吉林大学;2010年
2 梁浩;Deep Web信息集成架构及相关问题研究[D];吉林大学;2010年
3 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年
4 田建伟;面向领域的高质量Deep Web数据集成技术研究[D];武汉大学;2010年
5 潘鹏;Deep Web查询中的不确定性问题研究[D];山东大学;2010年
6 董永权;Deep Web数据集成关键问题研究[D];山东大学;2010年
7 陈珂锐;基于本体演化的Deep Web数据抽取与注释[D];吉林大学;2011年
8 黄健斌;基于条件概率图模型的Deep Web数据抽取与集成研究[D];西安电子科技大学;2007年
9 赵朋朋;Deep Web信息集成若干关键技术研究[D];苏州大学;2008年
10 寇月;Deep Web实体搜索的关键技术研究[D];东北大学;2009年
相关硕士学位论文 前10条
1 陈雅冰;基于领域的Deep Web查询接口抽取[D];华南理工大学;2011年
2 贺迅;Deep Web查询接口发现与特征提取技术研究[D];重庆大学;2012年
3 杨柳;Deep Web查询接口识别与抽取技术研究[D];西安电子科技大学;2011年
4 朱会峰;Deep Web查询接口模式抽取研究[D];吉林大学;2011年
5 龚桂芬;基于查询接口的Deep Web模式匹配方法研究[D];苏州大学;2011年
6 罗斐;基于本体的Deep Web数据源分类和查询接口模式抽取[D];南京航空航天大学;2010年
7 杜鑫;Deep Web数据源发现与采样研究[D];山东大学;2011年
8 高川;Deep Web数据源的发现与聚类研究[D];北京化工大学;2010年
9 刘凯;Deep Web数据集成关键技术研究[D];长春工业大学;2012年
10 陈文;Deep Web入口识别和个性化搜索研究与设计[D];江苏大学;2010年
,本文编号:2359917
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2359917.html