基于主题模型的资源选择算法
本文选题:分布式检索 + 资源选择 ; 参考:《华南理工大学学报(自然科学版)》2017年03期
【摘要】:在具有多个真实搜索引擎的联邦检索环境下,基于小文档的资源选择算法由于难以估计每个搜索引擎的真实网页数量,因此准确率较低.针对这个问题,文中提出了基于主题模型的资源库描述方法,利用LDA主体模型获取每个资源库的描述词;在此基础上提出新的资源选择算法,结合垂直领域权重和词向量计算资源库和查询请求之间的相关度,并根据相关度大小获取最终资源选择结果.实验结果表明,基于主题模型的资源选择算法能很好地提高资源选择效果,可有效应用于分布式搜索引擎的联邦检索环境.
[Abstract]:In the federated retrieval environment with multiple real search engines, the algorithm of resource selection based on small documents is difficult to estimate the number of real web pages of each search engine, so the accuracy is low. In order to solve this problem, a method of describing resource base based on topic model is proposed in this paper. The description words of each resource base are obtained by using LDA agent model, and then a new resource selection algorithm is proposed. Combining the vertical domain weight and word vector to calculate the correlation between the resource base and the query request, the final resource selection results are obtained according to the correlation degree. The experimental results show that the resource selection algorithm based on topic model can improve the efficiency of resource selection and can be effectively applied to the federated retrieval environment of distributed search engines.
【作者单位】: 华南理工大学计算机科学与工程学院∥广东省计算机网络重点实验室;
【基金】:广东省自然科学基金重大基础研究培育项目(2015A030308017) 教育部中国移动科研基金资助项目(MCM20150512)~~
【分类号】:TP301.6;TP391.3
【相似文献】
相关期刊论文 前10条
1 仲盛;多元选择算法的改进[J];微机发展;1996年06期
2 张衡,吴礼发,张毓森,曾庆凯;一种r可变阴性选择算法及其仿真分析[J];计算机学报;2005年10期
3 尹贵祥;刘新茂;;随机选择算法的研究[J];现代电子技术;2011年08期
4 罗一丹;蔡自兴;王勇;江中央;;基于免疫重构的阴性选择算法[J];计算机科学;2008年03期
5 董小刚;赵俊;;一种选择冒泡算法——冒泡算法与选择算法的结合[J];科教文汇(下半月);2006年02期
6 武继刚;一个多元选择算法[J];微机发展;1995年03期
7 杨宁;王茜;;一种基于小生境策略的阴性选择算法[J];计算机科学;2011年S1期
8 戴常英;尹建武;;实数向量型阴性选择算法的改进[J];微计算机应用;2008年02期
9 孟庆华;赵文礼;樊志华;曾复;;基于改进型阴性选择算法的车辆故障检测方法研究[J];兵工学报;2009年12期
10 汪慧敏;高晓智;黄显林;宋卓越;;基于改进负选择算法的异常检测[J];计算机仿真;2008年05期
相关会议论文 前1条
1 王广涛;宋擒豹;车蕊;;一种新的基于信息熵的属性选择算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
相关博士学位论文 前1条
1 王广涛;属性子集选择算法及其推荐方法研究[D];西安交通大学;2017年
相关硕士学位论文 前5条
1 杨宾;车联网中继选择算法研究[D];重庆邮电大学;2014年
2 郭衍奎;基于互信息的属性选择算法研究[D];北京交通大学;2015年
3 阮强;基于SVM-RFE的潜在生物标志物选择算法研究[D];大连理工大学;2011年
4 韩光辉;基于欧式距离的实例选择算法研究[D];河北大学;2011年
5 杨艳艳;基于CP-nets的多议题对称依赖关系的研究[D];郑州大学;2013年
,本文编号:1887296
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1887296.html