主题信息搜索系统中的搜索策略研究
发布时间:2017-08-05 14:16
本文关键词:主题信息搜索系统中的搜索策略研究
【摘要】:针对主题搜索引擎反馈信息主题相关度低的问题,提出了将遗传算法与基于内容的空间向量模型相结合的搜索策略。利用空间向量模型确定网页与主题的相关度,并将遗传算法应用于相关度判别,提高主题信息搜索的准确率和查全率。在Heritrix框架基础上,利用Eclipse 3.3实现了相应功能。实验结果表明,搜索策略改进后的系统抓取主题页面所占比例与原系统相比提高了约30%。
【作者单位】: 中南民族大学图书馆;中南民族大学电信学院;
【关键词】: 搜索引擎 搜索策略 遗传算法 空间向量模型
【基金】:中央高校基本科研业务费专项资金项目(ZZQ10011)
【分类号】:TP391.3;TP311.52
【正文快照】: 0引言主题信息搜索系统服务于特定的应用领域,其任务是获取与主题相关的页面,无需遍历全网。在主题信息搜索系统中,搜索策略是影响系统性能的关键。常用的主题搜索策略有:基于网页链接结构的搜索策略和基于内容评价的搜索策略。其中,PageRank[1]和Hits[2]是基于链接结构的搜索
【参考文献】
中国期刊全文数据库 前1条
1 袁鼎荣;钟宁;张师超;;文本信息处理研究述评[J];计算机科学;2011年02期
【共引文献】
中国期刊全文数据库 前10条
1 刘喜文;郑昌兴;王文龙;汤刚强;;构建数据仓库过程中的数据清洗研究[J];图书与情报;2013年05期
2 潘善亮;茅琴娇;韩露;;一种基于虚拟社交化的Web服务发现方法研究[J];电信科学;2013年12期
3 顾益军;解易;张培晶;;面向有组织犯罪分析的人际关系网络节点重要性评价研究[J];中国人民公安大学学报(自然科学版);2013年04期
4 任剑锋;梁雪;李淑红;;基于非线性流形学习和支持向量机的文本分类算法[J];计算机科学;2012年01期
5 杨艺;周元;;基于用户查询意图识别的Web搜索优化模型[J];计算机科学;2012年01期
6 贾长云;梁海军;;基于B-ISVM算法的物联网云存储数据伪装不良信息检测[J];计算机科学;2013年02期
7 戴璐;丁立新;薛兵;;一种摘要中隐含的知识片段的挖掘方案[J];计算机科学;2013年02期
8 范文礼;刘志刚;;一种基于效率矩阵的网络节点重要度评价算法[J];计算物理;2013年05期
9 张s,
本文编号:625307
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/625307.html