基于网络爬虫的民用运力数据获取
发布时间:2022-12-11 16:22
为解决军事交通运输民用运力数据获取难的问题,采用主题网络爬虫的方法获取相关数据,在Shark-Search算法基础上,考虑URL结构对主题相关度的影响,使用朴素贝叶斯模型,结合TF-IDF算法对主题相关度进行计算。实验表明,该方法可靠有效,可以作为民用运力数据获取的一种补充手段。
【文章页数】:4 页
【文章目录】:
1 网络爬虫的原理和方法
2 爬取方法
3 主题相关度计算
4 实验测试
5 结 语
【参考文献】:
期刊论文
[1]军交运输军民融合式发展问题研究[J]. 国防. 2017(03)
[2]一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J]. 黄承慧,印鉴,侯昉. 计算机学报. 2011(05)
硕士论文
[1]垂直搜索引擎中主题网络爬虫算法研究[D]. 张环.山东师范大学 2015
本文编号:3719105
【文章页数】:4 页
【文章目录】:
1 网络爬虫的原理和方法
2 爬取方法
3 主题相关度计算
4 实验测试
5 结 语
【参考文献】:
期刊论文
[1]军交运输军民融合式发展问题研究[J]. 国防. 2017(03)
[2]一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J]. 黄承慧,印鉴,侯昉. 计算机学报. 2011(05)
硕士论文
[1]垂直搜索引擎中主题网络爬虫算法研究[D]. 张环.山东师范大学 2015
本文编号:3719105
本文链接:https://www.wllwen.com/shekelunwen/renwuzj/3719105.html