深层网中基于入口查询的表单填充策略
发布时间:2018-05-02 20:02
本文选题:深层网 + 入口查询 ; 参考:《计算机工程》2010年07期
【摘要】:针对深层网中数据量大导致无法被传统搜索引擎索引的问题,在提取网页中,改进启发式规则识别表单查询入口,在表单标签与内容匹配时,改进基于语义的相似度匹配算法进行表单内容填充。实验结果表明,提取表单标签的准确率达到94.23%,匹配成功率达到88.83%,填充成功率达到95.43%。
[Abstract]:Aiming at the problem that the large amount of data in the deep web can not be indexed by the traditional search engine, the heuristic rules are improved to identify the entry of the form query in the extraction page, and when the form label and the content match, An improved similarity matching algorithm based on semantics is used to fill the form content. The experimental results show that the accuracy of extracting form labels is 94.23, the matching success rate is 88.83, and the filling success rate is 95.43.
【作者单位】: 南京邮电大学教务处;南京师范大学教育技术系;
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 袁小龙;李晓霞;郭力;;深层网技术在专利数据提取中的应用[J];计算机与应用化学;2011年08期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相关硕士学位论文 前2条
1 李三义;基于模型匹配的Deep Web数据库分类[D];吉林大学;2010年
2 郭若飞;支持Ajax的Deep Web爬虫技术研究[D];苏州大学;2010年
,本文编号:1835282
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1835282.html