Nutch搜索引擎的公安应用研究
本文关键词:Nutch搜索引擎的公安应用研究
【摘要】:网络"爬虫"作为网络信息搜索的工具,在网络舆情管控、搜查中起着至关重要的作用。随着互联网的广泛普及,网络中不安全因素、不和谐因素日益增多,使用百度等商业搜索引擎已经不能满足日益增长的公安舆情信息监控工作需求。在介绍搜索引擎工作原理的基础上,详细分析了Nutch的工作机制,并与商业搜索引擎进行了比对分析,实验结果表明了商业搜索引擎在公安应用中的局限性,在特定的公安应用背景下,在搜索精度、结果排序方面,Nutch要优于商业搜索引擎。
【作者单位】: 中国刑警学院;大连市公安局西岗分局;
【关键词】: 搜索引擎 Nutch 网络舆情 信息搜索
【基金】:公安部公安理论及软科学研究项目(编号:2012LLYJXJXY052) 辽宁省教育科学“十二五”规划立项课题(编号:JG14db440)
【分类号】:TP391.3
【正文快照】: Nutch是Apache公司推出的一款用JAVA语言编写的支持分布式的开源网络爬虫软件,它提供了用户构建网络搜索引擎的全部工具。Nutch性能卓越,构建简易,功能强大。当下,海量的、复杂的舆情信息充斥在网络间,如何快速、精确地找到网络舆情信息是对公安工作的重大考验。基于Nutch网络
【参考文献】
中国期刊全文数据库 前2条
1 黄德才;戚华春;;PageRank算法研究[J];计算机工程;2006年04期
2 龚磊;武友新;;Lucene全文检索系统的研究与实现[J];计算机与数字工程;2010年05期
【共引文献】
中国期刊全文数据库 前10条
1 钟斌青;刘湘南;;基于空间化PageRank算法的人口流动空间集聚性分析[J];地理与地理信息科学;2011年05期
2 张玉宝;;中文搜索引擎的原理及相关技术分析[J];福建电脑;2008年01期
3 肖卓磊;;搜索引擎作弊及反作弊技术探究[J];阜阳师范学院学报(自然科学版);2011年04期
4 王向阳;马军;;一个基于PageRank的科技文献质量评价算法[J];广西师范大学学报(自然科学版);2009年01期
5 吴迪;周利娟;林鸿飞;;基于随机游走的就业推荐系统研究与实现[J];广西师范大学学报(自然科学版);2011年01期
6 梁迪龙;;云计算技术发展分析及其应用探讨[J];电脑知识与技术;2012年19期
7 连雁平;章甲午;;网络蜘蛛模拟系统分析与设计[J];安阳工学院学报;2012年06期
8 周丰;;基于用户查询偏好的搜索排序算法[J];电脑知识与技术;2013年11期
9 张皓;王玉龙;;一种网站分析系统的设计方案[J];电信网技术;2013年10期
10 刘喜文;郑昌兴;王文龙;汤刚强;;构建数据仓库过程中的数据清洗研究[J];图书与情报;2013年05期
中国重要会议论文全文数据库 前2条
1 徐晓东;郭燕慧;;AppStore应用信息自动化采集系统设计与实现[A];2013年中国信息通信研究新进展论文集[C];2014年
2 徐晓东;郭燕慧;;App Store应用信息自动化采集系统设计与实现[A];2013年中国信息通信研究新进展论文集[C];2014年
中国博士学位论文全文数据库 前10条
1 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
2 陈红涛;基于搜索日志的用户行为研究及应用[D];北京邮电大学;2008年
3 刘馨月;Web挖掘中的链接分析与话题检测研究[D];大连理工大学;2012年
4 马飞;云数据中心中虚拟机放置和实时迁移研究[D];北京交通大学;2013年
5 乐承毅;企业知识与员工知识贡献度集成评价方法及应用研究[D];浙江大学;2013年
6 孙甲申;基于主题模型和随机游走的标签技术研究[D];北京邮电大学;2013年
7 张鹏;数据中心网络的流量管理和优化问题研究[D];北京邮电大学;2013年
8 龚书;抽取式多文档文摘的文本表示研究[D];北京交通大学;2013年
9 尹莉;基础数学领域作者合作网络实证分析[D];西北大学;2013年
10 李朋;异构信息网络分析模型及其应用研究[D];重庆大学;2013年
中国硕士学位论文全文数据库 前10条
1 吴迪;高校毕业生就业推荐系统的设计与开发[D];大连理工大学;2010年
2 龚磊;统一数据交换平台的研究与应用[D];南昌大学;2010年
3 李娟;电信公司薪酬管理系统的设计与实现[D];电子科技大学;2010年
4 周志刚;数据挖掘技术在计算机取证的研究[D];大连交通大学;2010年
5 范先爽;基于个性化服务的汽车信息搜索引擎的研究[D];武汉理工大学;2011年
6 陈凯;搜索引擎有关排序算法研究[D];武汉理工大学;2011年
7 涂能彬;图书馆检索系统中图书推荐技术的研究[D];暨南大学;2011年
8 郭笑笑;基于双结构网络的信息准实时公平共享系统的设计与实现[D];湖北师范学院;2011年
9 李宜兵;基于搜索引擎网页排序算法研究[D];沈阳理工大学;2011年
10 金川明;垂直搜索引擎研究与实现[D];云南大学;2011年
【二级参考文献】
中国期刊全文数据库 前8条
1 徐海;李军民;;基于LUCENE的站内搜索的研究与实现[J];河北软件职业技术学院学报;2009年01期
2 张岭,马范援;加速评估算法:一种提高Web结构挖掘质量的新方法[J];计算机研究与发展;2004年01期
3 宋佳;诸云强;刘润达;;一种基于Lucene改进的全文检索工具包[J];计算机工程与应用;2008年04期
4 严良达;;基于Lucene搜索引擎的设计与实现[J];宁波职业技术学院学报;2009年02期
5 周锦程;王丹;;基于Lucene的全文搜索引擎研究与应用[J];黔南民族师范学院学报;2009年03期
6 宋聚平,王永成,尹中航,滕伟;对网页PageRank算法的改进[J];上海交通大学学报;2003年03期
7 王鹃;洪承煜;沈哲;;基于Compass框架的电子商务网站搜索引擎设计[J];现代计算机(专业版);2009年02期
8 黄少林;王华;张玉红;蒋一峰;;基于Lucene的索引系统的设计与实现[J];现代情报;2009年07期
【相似文献】
中国期刊全文数据库 前10条
1 严春来;;基于Nutch的个性化搜索引擎的研究与探讨[J];电脑编程技巧与维护;2014年04期
2 夏天;;Nutch的插件机制分析[J];广西师范大学学报(自然科学版);2010年01期
3 马睿;黄穗;;基于补偿的Nutch搜索引擎的设计与实现[J];科学技术与工程;2011年34期
4 李村合;吕克强;;Nutch搜索引擎的页面排序修改方法研究[J];计算机工程与设计;2009年06期
5 顾s,
本文编号:1117964
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1117964.html