基于Nutch的XML网站全文搜索引擎实现
[Abstract]:The common search engine web crawler can only understand the common HTML tags, and can not effectively analyze the content of the XML site. In this paper, a pure XML website with dynamic custom tags is established, and a scheme of using XSL style information to help web crawler understand the meaning of XML web page label is proposed. The full-text search engine of XML website based on Nutch is implemented.
【作者单位】: 上海理工大学计算机工程学院;
【分类号】:TP391.3
【参考文献】
相关期刊论文 前1条
1 韩毅;;基于DTD的XML文档内容检索研究[J];情报科学;2006年03期
【共引文献】
相关硕士学位论文 前5条
1 王岩;基于XML技术历史数据归档与重构的研究应用[D];太原理工大学;2011年
2 陈金森;XML搜索引擎中索引技术的研究[D];燕山大学;2006年
3 胡燕;元数据在多媒体电子文件管理中的应用研究[D];苏州大学;2008年
4 王忠义;基于XML的全文检索方法及原型系统实现研究[D];华中师范大学;2009年
5 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年
【二级参考文献】
相关期刊论文 前3条
1 路燕,张亮,汪卫,段起阳,施伯乐;XML查询中DTD的排序技术[J];计算机研究与发展;2003年11期
2 樊小华;庞引明;张谧;汪卫;陈金海;施伯乐;;优化的XML查询匹配:基于B~+-Tree索引的包含段的结构化联接算法[J];计算机科学;2004年06期
3 韩毅;数字图书馆中基于XML的搜索引擎设计[J];情报科学;2003年12期
【相似文献】
相关期刊论文 前10条
1 甘莉;李霖;尹章才;;基于XSL的地图知识表达[J];测绘科学;2006年03期
2 孙晓霞,刘晓霞;用Java扩展XSLT[J];微机发展;2005年08期
3 万常选;鲁远;;基于用户相关反馈的带结构语义的XML查询词扩展[J];情报学报;2009年03期
4 章小龙;衡星辰;;基于四层贝叶斯网络的XML文档信息检索模型[J];计算机应用;2009年10期
5 李春亮;雷永林;张伟;朱一凡;;基于UML的SMP2模型集成方法研究[J];系统仿真学报;2009年21期
6 马振华;陈群;;基于相关性排序改进的ALCA算法[J];科学技术与工程;2010年09期
7 温馨;陈群;娄颖;;基于词项扩展的XML信息检索反馈技术[J];计算机工程;2011年20期
8 王丛刚,瞿裕忠;一个XSLT处理器的设计[J];计算机工程;2002年03期
9 陈传波;段红华;;基于GML与SVG的WebGIS模型研究[J];网络安全技术与应用;2006年07期
10 刘康珍;肖和平;阳国贵;;XML文档处理子系统的设计[J];计算机应用与软件;2008年06期
相关会议论文 前1条
1 禹继波;毛宇光;;基于图型建模的XML信息检索研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
相关硕士学位论文 前4条
1 刘康珍;XML文档管理系统的研究与实现[D];国防科学技术大学;2006年
2 段红华;基于地理标记语言与SVG的WebGIS模型及其应用研究[D];华中科技大学;2006年
3 曹雪冬;基于符合Celts-3标准的XML教育资源查询技术的研究[D];内蒙古大学;2009年
4 王清;基于符合Celts-3标准的XML教育资源索引技术的研究[D];内蒙古大学;2009年
,本文编号:2208205
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2208205.html