一种自动分类的网页搜索排序算法
发布时间:2021-04-22 11:59
针对传统网页排序算法Okapi BM25通常会出现网页与查询关键词领域无关的领域漂移现象,以及改进算法需要人工建立领域向量的问题,提出了一种基于BM25和softmax回归分类模型的网页搜索排序算法。方法对网页文本进行数据预处理并利用词袋模型进行网页文本的向量表示,之后通过少量的网页数据训练Softmax回归分类模型,来预测测试网页数据的类别分数,并与BM25信息检索的分数结合在一起,得到最终的网页排序结果。实验结果显示该检索算法无须人工建立领域向量,即可达到很好的网页排序结果。
【文章来源】:计算机应用研究. 2019,36(01)北大核心CSCD
【文章页数】:4 页
【文章目录】:
0 引言
1 本文方法
1.1 数据预处理
1.2 Okapi BM25算法
1.3 网页文本分类
1.4 算法整体描述
2 实验结果及分析
2.1 实验设置
2.2 实验检索关键词及语料
2.3 评价标准
2.4 参数调优
2.5 对比实验结果
3 结束语
【参考文献】:
期刊论文
[1]基于领域模型的网页搜索排序算法[J]. 潘澄,吴共庆,李磊,胡学钢. 计算机系统应用. 2015(11)
本文编号:3153736
【文章来源】:计算机应用研究. 2019,36(01)北大核心CSCD
【文章页数】:4 页
【文章目录】:
0 引言
1 本文方法
1.1 数据预处理
1.2 Okapi BM25算法
1.3 网页文本分类
1.4 算法整体描述
2 实验结果及分析
2.1 实验设置
2.2 实验检索关键词及语料
2.3 评价标准
2.4 参数调优
2.5 对比实验结果
3 结束语
【参考文献】:
期刊论文
[1]基于领域模型的网页搜索排序算法[J]. 潘澄,吴共庆,李磊,胡学钢. 计算机系统应用. 2015(11)
本文编号:3153736
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3153736.html