基于多权重因子影响的网页排序改进算法
【图文】:
图 5.3 Heritrix 主界面Figure 5.3 The main interface for Heritrix由于本文实验使用的Heritrix版本为 Heritrix3.1.0,与 Heritrix1.14.4 版本最大的不同在于任务配置文件从 order.xml 文件转到了 crawler-beans.cxml 文件。因此在任务建立完成后,进入管理界面,对 crawler-beans.cxml 配置文件进行编辑。
图 5.3 Heritrix 主界面Figure 5.3 The main interface for Heritrix由于本文实验使用的Heritrix版本为 Heritrix3.1.0,与 Heritrix1.14.4 版本最大的不同在于任务配置文件从 order.xml 文件转到了 crawler-beans.cxml 文件。因此在任务建立完成后,进入管理界面,对 crawler-beans.cxml 配置文件进行编辑。
【学位授予单位】:浙江农林大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.3
【参考文献】
相关期刊论文 前10条
1 李跃鹏;金翠;及俊川;;基于word2vec的关键词提取算法[J];科研信息化技术与应用;2015年04期
2 徐山;杜卫锋;;不均衡训练集下短信过滤系统kNN方法的研究[J];计算机应用与软件;2013年11期
3 马海波;杨楠;于新兴;;用户差别化和主题敏感的PageRank算法[J];大连交通大学学报;2013年04期
4 孙佳龙;郭金运;郭淑艳;;基于多种度量的电离层TEC混沌预测分析[J];地球物理学进展;2013年03期
5 冯海涛;;基于网页时间权值的PageRank算法改进[J];西安邮电大学学报;2013年02期
6 刘敏娜;;基于向量空间模型的信息检索技术研究[J];现代电子技术;2012年11期
7 丛帅;张积宾;徐志明;王宇颖;;Feature selection algorithm for text classification based on improved mutual information[J];Journal of Harbin Institute of Technology;2011年03期
8 王德广;周志刚;梁旭;;PageRank算法的分析及其改进[J];计算机工程;2010年22期
9 潘磊;雷钰丽;王崇骏;谢俊元;;基于权重的Jaccard相似度度量的实体识别方法[J];北京交通大学学报;2009年06期
10 高琳;夏清国;王黎明;;基于本体的智能信息检索系统的构建方法[J];计算机工程与设计;2008年24期
,本文编号:2649982
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2649982.html