基于矩阵加权关联模式的印尼中跨语言信息检索模型
本文选题:点击行为 + 关联模式挖掘 ; 参考:《数据分析与知识发现》2017年01期
【摘要】:【目的】针对跨语言信息检索存在的查询漂移问题,提出一种融合用户点击下载行为与矩阵加权关联模式挖掘的印尼中跨语言信息检索模型。【方法】将矩阵加权关联模式挖掘、查询扩展以及用户点击下载行为集成应用到印尼中跨语言信息检索模型,给出模型实现的关键技术,即面向跨语言信息检索的矩阵加权关联模式挖掘算法、跨语言查询扩展模型以及印尼中跨语言信息检索算法。【结果】在NTCIR-5 CLIR数据集上的实验结果表明,该检索模型的R_prec、p@10和p@20值均达到单语言检索基准的60%以上,比跨语言检索基准提高37%以上,比现有基于伪相关反馈的跨语言检索算法提高28%以上。【局限】该模型实验在基于向量空间模型的跨语言检索系统中进行,需要探讨和研究在实际搜索引擎中的具体应用。【结论】该模型能有效地减少跨语言检索中的查询漂移问题,提高和改善印尼中跨语言检索性能,对长查询的检索效果更好,有较好的实际应用价值。
[Abstract]:[objective] to solve the problem of query drift in cross-language information retrieval, This paper proposes a cross-language information retrieval model in Indonesia, which combines user click-download behavior with matrix weighted association pattern mining. [methods] Matrix weighted association pattern mining is proposed. Query expansion and user click-download behavior integration are applied to the cross-language information retrieval model in Indonesia. The key technologies of the model are given, which is matrix weighted association pattern mining algorithm for cross-language information retrieval. Results the experimental results on the NTCIR-5 CLIR data set show that the RSP @ 10 and PDP 20 values of the retrieval model reach more than 60% of the monolingual retrieval benchmark. It is more than 37% higher than the cross-language retrieval benchmark and more than 28% higher than the existing cross-language retrieval algorithms based on pseudo-correlation feedback. [limitation] this model experiment is carried out in a cross-language retrieval system based on vector space model. This model can effectively reduce the query drift in cross-language retrieval, improve and improve the performance of Indonesian mid-to-medium cross-language retrieval, and improve the retrieval effect of long query, which needs to be explored and studied in practical search engine. [conclusion] this model can effectively reduce the query drift in cross-language retrieval, and improve the performance of mid-to-medium cross-language retrieval in Indonesia. It has good practical application value.
【作者单位】: 广西跨境电商智能信息处理重点实验室培育基地(广西财经学院);广西财经学院计算机系;
【基金】:国家自然科学基金项目“面向东盟国家语言的基于完全加权正负模式挖掘的跨语言查询扩展研究”(项目编号:61262028) 广西财经学院信息与统计学院开放性课题“基于矩阵加权关联模式挖掘的越汉英跨语言信息检索研究”(项目编号:2015XK01) 广西财经学院2016年度应用统计硕士专业学位点学术研究项目“基于完全加权关联模式挖掘的中英跨语言伪相关反馈扩展研究”(项目编号:2016TJYB05)的研究成果之一
【分类号】:TP391.3
【参考文献】
相关期刊论文 前8条
1 魏露;李书琴;李伟男;李新乐;;跨语言查询扩展优化[J];计算机工程与设计;2014年08期
2 罗远胜;王明文;勒中坚;张华伟;;跨语言信息检索中的双语主题相关模型[J];小型微型计算机系统;2013年12期
3 王序文;王小捷;孙月萍;;双语主题跨语言伪相关反馈[J];北京邮电大学学报;2013年04期
4 吴丹;何大庆;王惠临;;一种基于相关反馈的跨语言信息检索查询翻译优化技术研究[J];情报学报;2012年04期
5 宁健;林鸿飞;;基于改进潜在语义分析的跨语言检索[J];中文信息学报;2010年03期
6 黄名选;严小卫;张师超;;基于矩阵加权关联规则挖掘的伪相关反馈查询扩展[J];软件学报;2009年07期
7 闭剑婷;苏一丹;;基于潜在语义分析的跨语言查询扩展方法[J];计算机工程;2009年10期
8 吴丹;何大庆;王惠临;;基于伪相关反馈的跨语言查询扩展[J];情报学报;2010年02期
【共引文献】
相关期刊论文 前10条
1 黄名选;;基于矩阵加权关联模式的印尼中跨语言信息检索模型[J];数据分析与知识发现;2017年01期
2 叶雷;高盛祥;余正涛;秦广顺;洪旭东;;基于事件元素无向图的查询扩展方法[J];中文信息学报;2017年01期
3 邹裕;肖倩;吴树荣;;基于增强关联规则挖掘的大型网站推荐系统[J];计算机与现代化;2016年10期
4 唐亮;赵晓峰;席耀一;易绵竹;;融合局部共现和上下文相似度的查询扩展方法[J];山东大学学报(理学版);2017年01期
5 司莉;何依;;2000年以来我国多语言语料库研究进展[J];现代情报;2016年06期
6 于福超;卢廷钧;王裴岩;张桂平;;一种面向情报服务的交互式主题扩展方法[J];沈阳航空航天大学学报;2016年02期
7 胡旷达;;基于神经网络的个性化信息检索模型研究[J];现代计算机(专业版);2016年11期
8 安建瑞;王海鹏;张龙波;金超;怀浩;;一种基于MapReduce的压缩矩阵关联规则挖掘算法[J];重庆理工大学学报(自然科学);2016年02期
9 陈波;段成永;高秀娥;;基于矩阵加权的VMOApriori算法[J];测控技术;2016年01期
10 钟敏娟;万常选;刘德喜;江腾蛟;刘爱红;;基于伪反馈的有效XML查询扩展[J];计算机科学与探索;2016年12期
【二级参考文献】
相关期刊论文 前10条
1 王旭阳;萧波;;基于本体和局部上下文分析的查询扩展方法[J];计算机工程;2012年07期
2 徐戈;王厚峰;;自然语言处理中主题模型的发展[J];计算机学报;2011年08期
3 李二森;张保明;杨娜;杨靖宇;郭晓刚;;非负矩阵分解在高光谱图像解混中的应用探讨[J];测绘通报;2011年03期
4 田久乐;赵蔚;;基于同义词词林的词语相似度计算方法[J];吉林大学学报(信息科学版);2010年06期
5 陈琴;;跨语言信息检索中双语词典的建立和翻译方法[J];计算机应用与软件;2010年07期
6 宁健;林鸿飞;;基于改进潜在语义分析的跨语言检索[J];中文信息学报;2010年03期
7 邹小芳;王明文;左家莉;余美华;;新的基于中间语义的多语言信息检索模型[J];小型微型计算机系统;2010年04期
8 闭剑婷;苏一丹;;基于潜在语义分析的跨语言查询扩展方法[J];计算机工程;2009年10期
9 郭文;陈毅东;赵欣;;跨语言信息检索中的查询扩展[J];心智与计算;2009年01期
10 黄国斌;王明文;叶浩;;一种新的基于中间语义的跨语言信息检索模型[J];中文信息学报;2009年02期
【相似文献】
相关期刊论文 前10条
1 赵琳;;几种信息检索模型的比较[J];煤炭技术;2012年08期
2 王娟;;基于中文科技期刊数据库信息检索模型的研究[J];科教文汇(中旬刊);2012年10期
3 齐继国,高X},汪东升;基于多用户协同反馈的信息检索模型[J];小型微型计算机系统;2003年07期
4 吴晨;张全;缪建明;;基于语言概念空间的跨语种信息检索模型[J];计算机工程;2006年18期
5 吴丽华;罗云锋;张宏斌;;信息检索模型及相关性算法的研究[J];情报杂志;2006年12期
6 周竹荣;黄果;周亭;;一种混合的文本信息检索模型研究[J];计算机工程与设计;2007年11期
7 钟振鸿;印润远;于庆梅;;基于本体驱动的法律信息检索模型[J];微计算机信息;2007年30期
8 刘伟成;孙吉红;;跨语言信息检索模型应用研究[J];情报杂志;2007年10期
9 张小芳;;几种常见信息检索模型的分析与评价[J];情报杂志;2008年03期
10 丁志刚;王小捷;;一种基于类别意图的信息检索模型[J];郑州大学学报(理学版);2009年01期
相关会议论文 前9条
1 梅伟;刘惟一;;基于可信度的信息检索模型[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 黄名选;严小卫;张师超;;基于完全加权关联规则挖掘的信息检索模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 黄国斌;王明文;叶浩;;一种新的基于中间语义的跨语言信息检索模型[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 张文雅;宋大为;赵晓朝;张鹏;李竞飞;;基于可读性的信息检索模型研究[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
5 李广原;冯嘉礼;;基于属性坐标的文本信息检索模型[A];广西计算机学会2005年学术年会论文集[C];2005年
6 普东航;唐常杰;元昌安;廖勇;张天庆;于中华;;一种基于相邻地址的信息检索模型AAM[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 盛俊;王明文;余俊英;;一种基于潜在语义的Markov网络信息检索模型[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
8 吴晨;张全;缪建明;韦向峰;;自然语言语义理解下的信息检索模型[A];第三届学生计算语言学研讨会论文集[C];2006年
9 孙斌;吕学强;苏祺;;义项矩阵模型SMM简介[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
相关博士学位论文 前7条
1 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
2 徐建民;基于术语关系的贝叶斯网络信息检索模型扩展研究[D];天津大学;2007年
3 陈圣兵;基于商空间理论的海量信息检索模型的研究[D];安徽大学;2010年
4 程凡;基于排序学习的信息检索模型研究[D];中国科学技术大学;2012年
5 涂新辉;基于概念的信息检索模型研究[D];华中师范大学;2012年
6 梁作鹏;面向Web的XML检索关键技术研究[D];东南大学;2005年
7 高琰;基于多特征的Web社区发现关键技术研究[D];中南大学;2007年
相关硕士学位论文 前10条
1 任克江;基于地理信息的检索和用户数据挖掘[D];大连理工大学;2013年
2 丁志刚;基于类别意图的信息检索模型[D];北京邮电大学;2009年
3 王庆华;用户个性化信息检索模型的设计与实现[D];大连理工大学;2004年
4 黄果;文本信息检索模型研究[D];西南大学;2007年
5 张东伟;中英文跨语言信息检索模型研究[D];黑龙江大学;2006年
6 廖亚男;基于多层Markov网络的信息检索模型[D];江西师范大学;2014年
7 左家莉;基于Markov网络的信息检索模型[D];江西师范大学;2005年
8 王艳萍;基于XML的移动信息检索模型研究[D];大连理工大学;2006年
9 甘丽新;基于Markov概念的信息检索模型[D];江西师范大学;2007年
10 姜鹏;Kullback-Leibler距离检索框架下文摘在检索中的应用[D];昆明理工大学;2011年
,本文编号:1903790
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1903790.html