当前位置:主页 > 科技论文 > 软件论文 >

基于加权关联模式挖掘的越英跨语言查询扩展

发布时间:2018-09-03 09:29
【摘要】:本文探讨加权关联模式挖掘在越英跨语言查询扩展中的应用。首先提出面向跨语言查询扩展的基于支持度-CPIR(Conditional Probability Increment Ratio)-兴趣度评价框架的加权关联模式挖掘算法(WARM-SCPIRICLQE)以及越英跨语言查询扩展模型,然后提出基于词间加权关联模式挖掘的越英跨语言用户相关反馈查询扩展算法。该算法将越南语查询通过机器翻译系统翻译为英文并检索英文文档,提取前列初检文档进行用户相关性判断得到初检相关文档集,采用WARM-SCPIRI-CLQE算法对该文档集挖掘加权关联规则,从规则中提取与原查询相关的扩展词实现越英跨语言查询译后扩展。以NTCIR-5 CLIR为实验语料,将本文算法与现有算法进行实验比较,实验结果表明,本文算法能提高和改善越英跨语言信息检索性能,对长查询更有效。
[Abstract]:This paper discusses the application of weighted association pattern mining in cross-language query extension. Firstly, a weighted association pattern mining algorithm (WARM-SCPIRICLQE) for cross-language query extension based on support (Conditional Probability Increment Ratio) / interest evaluation framework and an extended cross-language query model for Yueying are proposed. Then an extended cross-language user feedback query algorithm based on weighted association pattern mining between words is proposed. The algorithm translates Vietnamese query into English and retrieves English documents through machine translation system, extracts the front-line documents for user correlation judgment, and uses WARM-SCPIRI-CLQE algorithm to mine weighted association rules for this document set. The extension words related to the original query are extracted from the rules to implement the post-translation extension of the cross-language query. Taking NTCIR-5 CLIR as the experimental corpus, the experimental results show that the proposed algorithm can improve and improve the performance of cross-language information retrieval, and is more effective for long query.
【作者单位】: 广西跨境电商智能信息处理重点实验室培育基地(广西财经学院);广西财经学院计算机系;
【基金】:国家自然科学基金资助项目“面向东盟国家语言的基于完全加权正负模式挖掘的跨语言查询扩展研究”(61262028)
【分类号】:G354.1;TP391.3

【相似文献】

相关期刊论文 前10条

1 蒋辉;阳小华;;基于文档与搜索结果上下文的查询扩展方法[J];计算机应用;2009年03期

2 阳小华;蒋辉;马家宇;;基于任务上下文的查询扩展方法[J];郑州大学学报(理学版);2010年01期

3 吴煈;张奇;黄萱菁;;基于整数线性规划的查询扩展[J];计算机研究与发展;2013年08期

4 何燕;;基于用户反馈的查询扩展研究[J];情报理论与实践;2013年08期

5 黄伟群;;基于用户视角的交互式查询扩展研究[J];图书情报工作;2014年05期

6 黄名选;严小卫;张师超;;查询扩展技术进展与展望[J];计算机应用与软件;2007年11期

7 林国俊;叶飞跃;耿冬;郑国良;;基于语义的概念查询扩展[J];计算机工程与设计;2009年06期

8 巩玉玺;王大玲;;一种改进的基于伪相关反馈的查询扩展[J];微计算机信息;2009年15期

9 黄名选;张师超;严小卫;;基于查询行为和关联规则的相关反馈查询扩展[J];计算机工程;2009年10期

10 张超盟;李战怀;温宗臣;;局部上下文分析剪枝概念树的查询扩展[J];计算机工程;2009年14期

相关会议论文 前10条

1 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年

2 吕碧波;赵军;;基于相关文档池建模的查询扩展[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

3 林建方;李生;郑德权;;基于词语搭配关系的查询扩展方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

4 丁国栋;白硕;王斌;;一种基于局部共现的查询扩展方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

5 李东园;白宇;蔡东风;;基于用户日志分析的查询扩展研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

6 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年

7 王秉卿;张奇;吴立德;黄萱菁;;机器学习的查询扩展在博客检索中的应用[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

8 王秉卿;黄萱菁;;基于线性模型的查询扩展方法[A];第五届全国信息检索学术会议论文集[C];2009年

9 晋松;林鸿飞;苏绥;;基于标签共现的查询扩展研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

10 郭文;史晓东;陈毅东;;跨语言信息检索中的查询扩展[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

相关博士学位论文 前3条

1 郭晓黎;煤矿安全事件本体及其在查询扩展中的应用研究[D];中国矿业大学(北京);2016年

2 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年

3 王俊义;正负相关反馈与查询扩展技术的研究[D];内蒙古大学;2012年

相关硕士学位论文 前10条

1 吴德钰;基于标签筛选的文档排序方法研究[D];华中师范大学;2015年

2 李维银;基于有监督学习的查询扩展技术研究[D];北京理工大学;2015年

3 钟廷伟;生物医学文本的标注与检索研究[D];电子科技大学;2015年

4 王宇;煤矿安全事件本体构建及其查询扩展的研究与应用[D];北京工业大学;2015年

5 崔倩倩;基于文档重构的查询扩展[D];北京工业大学;2015年

6 陈建荣;基于用户反馈的智能查询扩展技术研究[D];哈尔滨工业大学;2014年

7 燕泽权;基于主题模型的查询扩展技术研究[D];哈尔滨工业大学;2014年

8 李云飞;基于查询日志的动态查询扩展研究[D];内蒙古大学;2016年

9 杨振瑜;基于概念语义相似度的长句查询扩展研究[D];山东理工大学;2013年

10 秦广顺;汉越双语新闻事件检索方法研究[D];昆明理工大学;2016年



本文编号:2219573

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2219573.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户398fd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com