以主题爬虫视角进行数字资源的建设探析
本文关键词:以主题爬虫视角进行数字资源的建设探析
【摘要】:作为数字图书馆建设的重要方面之一,数字资源建设可以利用主题爬虫对网络中所蕴含的数字资源进行自动化搜集。主题网络爬虫是主题搜索引擎的重要构成方面,本文以本体指导主题爬虫进行数字资源的建设,实验结果显示:以主题爬虫为基础进行数字资源建设具有一定的实用价值,但性能有待进一步提高。
【作者单位】: 同济大学软件学院;
【关键词】: 主题爬虫 数字资源 本体 建设
【分类号】:TP391.3
【正文快照】: 数字资源在教育及科研等多个领域均具有举足轻重的作用,图书馆是教学及科研的信息中心,因此,数字资源建设也是数字图书馆建设的重要方面之一。万维网的推广与应用使其成为数字资源的主要来源之一,但是,由于其海量化、异构化、增长快速化、半结构化、动态更新化等特点,导致手动
【参考文献】
中国期刊全文数据库 前1条
1 林振洲;;VFP技术在网页数据采集中的应用——以高校数字资源建设为例[J];计算机光盘软件与应用;2013年14期
【共引文献】
中国期刊全文数据库 前10条
1 田雪筠;;网络竞争情报主题采集技术研究[J];图书与情报;2014年05期
2 张引;陈敏;廖小飞;;大数据应用的现状与展望[J];计算机研究与发展;2013年S2期
3 李东晖;廖晓兰;范辅桥;黄九鸣;陈雪刚;;一种主题知识自增长的聚焦网络爬虫[J];计算机应用与软件;2014年05期
4 方星星;鲁磊纪;徐洋;;网络舆情监控系统中主题网络爬虫的研究与实现[J];舰船电子工程;2014年09期
5 杨镇雄;蔡祖锐;陈国华;汤庸;张龙;;分布式开放存取期刊爬虫的设计与实现[J];计算机科学与探索;2014年10期
6 王春艳;李玉福;;垂直搜索引擎中信息过滤技术的研究[J];情报科学;2014年03期
7 郭世龙;王晨升;;主题爬虫设计与实现[J];软件;2013年12期
8 王玉芳;阎亭;康连瑞;杜廷龙;;网络信息自动获取和分析技术研究[J];数字技术与应用;2014年04期
9 乔建忠;;一种基于改进BFS算法的主题搜索技术研究[J];现代图书情报技术;2013年Z1期
10 王贤明;;主题爬虫研究进展[J];现代计算机(专业版);2014年03期
中国博士学位论文全文数据库 前1条
1 李雁妮;深网数据集成与挖掘关键问题的建模及算法研究[D];西安电子科技大学;2013年
中国硕士学位论文全文数据库 前10条
1 芮虎;比价购物平台中网络爬虫的设计与实现[D];华东理工大学;2013年
2 刘建明;垂直搜索引擎中的主题爬虫技术研究[D];广东工业大学;2013年
3 彭小明;主题爬虫的设计与实现[D];北京邮电大学;2013年
4 褚宏爽;主题搜索引擎网络爬虫的设计与实现[D];北京邮电大学;2013年
5 刘徐;网页特征词典生成模型的设计与实现[D];北京邮电大学;2013年
6 周林云;Web信息采集系统设计与实现[D];西南交通大学;2013年
7 王瑶华;基于变精度粗糙集的网络舆情预警研究[D];武汉理工大学;2013年
8 顾迪清;互联网网站属性标识技术的研究与实现[D];北京邮电大学;2012年
9 蒋昌礼;微博网络关键节点和关键链路识别方法研究与软件研制[D];电子科技大学;2013年
10 张涛;Web教学资源采集中超链接可采集度评价研究[D];南京师范大学;2013年
【二级参考文献】
中国期刊全文数据库 前4条
1 王映,于满泉,李盛韬,王斌,余智华;JavaScript引擎在动态网页采集技术中的应用[J];计算机应用;2004年02期
2 孙庚;冯艳红;于红;史鹏辉;;一种基于Heritrix的网络定题爬虫算法——以渔业信息网络为例[J];软件导刊;2010年05期
3 王永国;张士江;谢倩;;基于Visual FoxPro环境ACCESS数据库操作的实现[J];计算机技术与发展;2011年01期
4 马爱芳,仲少云;基于VFP的资料室图书管理系统的设计[J];现代情报;2004年03期
【相似文献】
中国期刊全文数据库 前10条
1 彭轲;廖闻剑;;基于浏览器服务的网络爬虫[J];硅谷;2009年04期
2 王江红;朱丽君;李彩虹;;一种新型网络爬虫的设计与实现[J];微计算机信息;2010年03期
3 孙立伟;何国辉;吴礼发;;网络爬虫技术的研究[J];电脑知识与技术;2010年15期
4 于成龙;于洪波;;网络爬虫技术研究[J];东莞理工学院学报;2011年03期
5 焦赛美;;网络爬虫技术的研究[J];琼州学院学报;2011年05期
6 宋海洋;刘晓然;钱海俊;;一种新的主题网络爬虫爬行策略[J];计算机应用与软件;2011年11期
7 刘金红;陆余良;;主题网络爬虫研究综述[J];计算机应用研究;2007年10期
8 曹忠;赵文静;;一种优化的网络爬虫的设计与实现[J];电脑知识与技术;2008年35期
9 邹海亮;孙莉;;可定制的聚焦网络爬虫[J];电子科技;2009年01期
10 杨松梅;;网络爬虫[J];硅谷;2009年15期
中国重要会议论文全文数据库 前5条
1 夏诏杰;郭力;李晓霞;;化学主题网络爬虫的研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
2 李楠;谷利泽;钮心忻;;用于XSS扫描的网络爬虫的设计与实现[A];2010年全国通信安全学术会议论文集[C];2010年
3 徐剑;柯贵明;;网络爬虫技术在搜索引擎中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
4 张军;于浩;内野宽治;;UGC中产品评论信息的挖掘[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 王庆广;何力;韩伟红;;基于爬虫的有害网站发现与判别系统的实现[A];第27次全国计算机安全学术交流会论文集[C];2012年
中国硕士学位论文全文数据库 前10条
1 龚秋艳;并行网络爬虫设计与实现[D];华东师范大学;2010年
2 么士宇;基于分布式计算的网络爬虫技术研究[D];大连海事大学;2011年
3 陈奋;过滤型网络爬虫的研究与设计[D];厦门大学;2007年
4 金梅;网络爬虫性能提升与功能拓展的研究与实现[D];吉林大学;2012年
5 芮虎;比价购物平台中网络爬虫的设计与实现[D];华东理工大学;2013年
6 赵茉莉;网络爬虫系统的研究与实现[D];电子科技大学;2013年
7 谭龙远;基于领域的网络爬虫技术的研究与实现[D];武汉理工大学;2009年
8 张红云;基于页面分析的主题网络爬虫的研究[D];武汉理工大学;2010年
9 杜一平;主题搜索网络爬虫的设计与研究[D];中国科学技术大学;2009年
10 黄晓鹏;基于网络爬虫技术的内容探测系统设计与实现[D];北京邮电大学;2010年
,本文编号:862035
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/862035.html