校园网信息资源搜索引擎的研究与实现
发布时间:2021-02-25 01:08
校园网已经成为高校信息资源共享和管理的重要平台。网络构建者和网络构建目的不同使得校园网与互联网之间存在着较大差异,这些差异导致校园网搜索引擎的实现需要引进新的技术和方法。通过统计分析,总结出校园网信息资源的特点,并基于这些特点提出了多维度量排序算法等技术,以提高搜索引擎查询准确度。实际构建的校园网搜索引擎系统表现出比传统搜索引擎更优的搜索性能。
【文章来源】:计算机工程与设计. 2006,(24)北大核心
【文章页数】:4 页
【文章目录】:
0 引言
1 校园网与公用互联网的比较
1.1 网站分布
1.2 校园网没有广告和垃圾网页, 网页间的链接稀疏
1.3 Word、PDF等异构文本格式的网页比例高
1.4 用户查询习惯
2 校园网信息资源搜索引擎的实现和主要技术
2.1 采集模块
2.2 排序算法
2.3 异构文本处理
3 性能评价
4 结束语
【参考文献】:
期刊论文
[1]分布式检索中索引数据分布模型与求解方法[J]. 赵仲孟,张选平. 计算机工程与设计. 2005(08)
[2]关于中国Web的大小、形状和结构[J]. 闫宏飞,李晓明. 计算机研究与发展. 2002(08)
本文编号:3050203
【文章来源】:计算机工程与设计. 2006,(24)北大核心
【文章页数】:4 页
【文章目录】:
0 引言
1 校园网与公用互联网的比较
1.1 网站分布
1.2 校园网没有广告和垃圾网页, 网页间的链接稀疏
1.3 Word、PDF等异构文本格式的网页比例高
1.4 用户查询习惯
2 校园网信息资源搜索引擎的实现和主要技术
2.1 采集模块
2.2 排序算法
2.3 异构文本处理
3 性能评价
4 结束语
【参考文献】:
期刊论文
[1]分布式检索中索引数据分布模型与求解方法[J]. 赵仲孟,张选平. 计算机工程与设计. 2005(08)
[2]关于中国Web的大小、形状和结构[J]. 闫宏飞,李晓明. 计算机研究与发展. 2002(08)
本文编号:3050203
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3050203.html