维吾尔文网络查询扩展词的构建研究
本文关键词:维吾尔文网络查询扩展词的构建研究 出处:《计算机工程》2015年04期 论文类型:期刊论文
更多相关文章: 查询扩展 局部共现分析 点互信息算法 扩展词 大规模语料库
【摘要】:为提高维吾尔文网络内容查询的扩展性能,提出一种将维语同义词和互联网资源相结合的扩展词构建算法。利用维吾尔语同义词词典、近义词词典和反义词词典等建立基本候选词库,将互联网作为超大规模语料库,以搜索引擎为工具,使用改进的点互信息对基本扩展词进行相似度评价,选取前N个词形成候选扩展词库1,对包含关键词的互联网语料,基于局部共现和点互信息分析,构建候选扩展词库2,对上述2种候选扩展词库加权求和,按顺序选择部分词为扩展词。通过搜索引擎实现扩展查询验证,结果表明,与常规查询和同义词查询扩展算法相比,该算法能明显提高查询的准确率。
[Abstract]:To improve the performance of network expansion for Uighur content query, a Uighur synonym expansion words and Internet resources of the combination algorithm. Using Uyghur Dictionary of synonyms, antonyms and Synonyms Dictionary dictionary establishment candidate thesaurus, the Internet as a super large scale corpus, using the search engine as the tool, using the improved point mutual information similarity evaluation of extended words, select the first N words form the candidate expansion thesaurus 1, to contain the keywords of the internet corpus, and co-occurrence mutual information based on local analysis, construct the candidate expansion thesaurus 2, extension of the above 2 kinds of candidate thesaurus weighted sum, in order to select some words for expansion words. Through the search engine to achieve the expansion of query verification, the results show that the conventional query and synonym query expansion algorithm, the algorithm can significantly improve the accuracy of the query.
【作者单位】: 新疆大学计算机科学与技术博士后流动站;新疆师范大学网络信息安全与舆情分析实验室;
【基金】:国家自然科学基金资助项目(61163064) 新疆师范大学网络信息安全与舆情分析实验室公开招标课题基金资助项目(WLYQ2012110) 新疆师范大学研究生科技创新基金资助项目(20131204)
【分类号】:TP391.1
【正文快照】: 关键词:查询扩展;局部共现分析;点互信息算法;扩展词;大规模语料库中文引用格式:年梅,张兰芳.维吾尔文网络查询扩展词的构建研究[J].计算机工程,2015,41(4):187-189,194.英文引用格式:Nian Mei,Zhang Lanfang.Research on Construction of Uyghur Network Query Expansion Wor
【参考文献】
相关期刊论文 前5条
1 任永功;范丹;武佳林;;基于语义关联树的分类查询扩展算法[J];计算机科学;2009年09期
2 王力;李培峰;朱巧明;;一种面向主题的关键词查询扩展方法[J];计算机应用与软件;2011年12期
3 崔航,文继荣,李敏强;基于用户日志的查询扩展统计模型[J];软件学报;2003年09期
4 王栋;吴军华;;自动更新的本体概念语义相似度计算[J];计算机工程与设计;2009年19期
5 刘婧婧;张向民;;文献推荐系统:提高信息检索效率之途(英文)[J];图书情报工作;2007年12期
【共引文献】
相关期刊论文 前10条
1 余正涛,樊孝忠,宋丽荣;基于特定问题类别的汉语问答系统查询扩展[J];北京理工大学学报;2005年10期
2 尚福华;韩开旭;;基于相关术语群和同义词的查询扩展研究[J];长江大学学报(自然科学版)理工卷;2010年03期
3 肖海鹏;邓晓衡;;基于Web挖掘的关键词建议模型研究[J];电脑知识与技术;2012年13期
4 翟海军;张刚;张瑾;;基于线性回归的相关查询推荐[J];高技术通讯;2010年06期
5 霍林;王力;黄俊文;潘英花;;一种结合同义词典和词对共现距离的查询扩展方法[J];广西大学学报(自然科学版);2010年02期
6 何攀;刘露;陈荦;王祖文;;基于用户偏好的地理计算应用检索[J];兵工自动化;2012年10期
7 付博;赵世奇;刘挺;;Web查询日志研究综述[J];电子学报;2013年09期
8 林菊英;;基于关系数据库表的双亲结构树实现及基本运算研究[J];福建电脑;2013年12期
9 邹琼;;信息检索中的查询扩展技术综述[J];计算机光盘软件与应用;2014年08期
10 武强;边巴旺堆;;信息检索系统中藏文自动提示的研究与实现[J];电脑知识与技术;2014年19期
相关会议论文 前10条
1 张威;张博刚;廖飞雄;陈月宁;;基于软件运行记录的交互测试研究[A];第六届中国测试学术会议论文集[C];2010年
2 王洪俊;赖志国;施水才;肖诗斌;;基于查询日志的查询建议挖掘[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
3 盛俊;王明文;余俊英;;一种基于潜在语义的Markov网络信息检索模型[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
4 徐小琴;章成志;;Web信息检索中相关词提示技术与评测[A];第三届学生计算语言学研讨会论文集[C];2006年
5 章成志;苏兰芳;;基于多语境的相关词自动提取[A];第三届学生计算语言学研讨会论文集[C];2006年
6 陈志玮;肖诗斌;施水才;王昕;;一种基于HTML位置信息的查询扩展技术[A];第三届学生计算语言学研讨会论文集[C];2006年
7 刘悦;许洪波;程学旗;;互联网挖掘和搜索的研究进展[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 吴京慧;余珊珊;王明文;;基于用户日志聚类的查询扩展模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 李东园;白宇;蔡东风;;基于用户日志分析的查询扩展研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
10 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
相关博士学位论文 前10条
1 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
2 李智;机器学习方法及其在基金项目评审中的应用研究[D];天津大学;2004年
3 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年
4 蔡柯柯;基于查询特征上下文的检索模型研究[D];浙江大学;2007年
5 康宇航;一种基于共现分析的科技跟踪方法研究[D];大连理工大学;2008年
6 田萱;基于上下文的信息检索关键技术研究[D];中国人民大学;2007年
7 吴陈;粒和粗集研究及与证据理论相结合在不完备数据处理中的应用[D];南京理工大学;2007年
8 李粤;引文网络的可调优先粘贴模型及其应用[D];清华大学;2007年
9 罗娜;基于本体的主题爬行技术研究[D];吉林大学;2009年
10 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
相关硕士学位论文 前10条
1 吕晨;搜索竞价广告关键词优化问题研究[D];山东科技大学;2010年
2 杨海南;基于语义词典和局部分析的查询扩展研究[D];武汉理工大学;2010年
3 赵春辉;基于关联规则挖掘的查询扩展[D];河南大学;2011年
4 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年
5 刘亚妮;搜索竞价广告关键词优化算法与实验[D];电子科技大学;2011年
6 王晶;基于领域本体扩展查询的文本信息检索研究[D];东北石油大学;2011年
7 韩开旭;基于查询扩展的油田网络舆情监控系统[D];东北石油大学;2011年
8 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年
9 余强;基于语义的设计知识个性化检索技术研究及应用[D];南京航空航天大学;2010年
10 程鹏;基于本体的文本信息检索研究[D];重庆大学;2011年
【二级参考文献】
相关期刊论文 前6条
1 李卫疆;赵铁军;王宪刚;;基于上下文的查询扩展[J];计算机研究与发展;2010年02期
2 张敏,宋睿华,马少平;基于语义关系查询扩展的文档重构方法[J];计算机学报;2004年10期
3 赵军;金千里;徐波;;面向文本检索的语义计算[J];计算机学报;2005年12期
4 丁国栋;白硕;王斌;;一种基于局部共现的查询扩展方法[J];中文信息学报;2006年03期
5 ;Query Expansion Based on Semantics and Statistics in Chinese Question Answering System[J];Wuhan University Journal of Natural Sciences;2008年04期
6 张晓孪;王西锋;;FCA中的概念语义相似度计算[J];现代图书情报技术;2007年03期
【相似文献】
相关期刊论文 前10条
1 林国俊;叶飞跃;耿冬;郑国良;;基于语义的概念查询扩展[J];计算机工程与设计;2009年06期
2 巩玉玺;王大玲;;一种改进的基于伪相关反馈的查询扩展[J];微计算机信息;2009年15期
3 黄名选;张师超;严小卫;;基于查询行为和关联规则的相关反馈查询扩展[J];计算机工程;2009年10期
4 张超盟;李战怀;温宗臣;;局部上下文分析剪枝概念树的查询扩展[J];计算机工程;2009年14期
5 罗小聪;;基于专用双语词典的查询扩展[J];现代计算机(专业版);2009年10期
6 李卫疆;赵铁军;王宪刚;;基于上下文的查询扩展[J];计算机研究与发展;2010年02期
7 黄明初;钟威;何拥军;蒙斌;;数字档案检索的查询扩展方法[J];广西科学院学报;2010年04期
8 王旭阳;萧波;;基于本体和局部上下文分析的查询扩展方法[J];计算机工程;2012年07期
9 朱鲲鹏;魏芳;;基于用户日志挖掘的查询扩展方法[J];计算机应用与软件;2012年06期
10 曹均阔;吴丽华;;一种基于依赖关系的综合查询扩展方法[J];计算机与数字工程;2012年11期
相关会议论文 前10条
1 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年
2 吕碧波;赵军;;基于相关文档池建模的查询扩展[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 林建方;李生;郑德权;;基于词语搭配关系的查询扩展方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 丁国栋;白硕;王斌;;一种基于局部共现的查询扩展方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 李东园;白宇;蔡东风;;基于用户日志分析的查询扩展研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
6 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
7 王秉卿;张奇;吴立德;黄萱菁;;机器学习的查询扩展在博客检索中的应用[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 王秉卿;黄萱菁;;基于线性模型的查询扩展方法[A];第五届全国信息检索学术会议论文集[C];2009年
9 晋松;林鸿飞;苏绥;;基于标签共现的查询扩展研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 郭文;史晓东;陈毅东;;跨语言信息检索中的查询扩展[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
相关重要报纸文章 前2条
1 钟威 何拥军;数字档案信息扩展查询功能需求分析及实现方式[N];中国档案报;2011年
2 潇然;扩展名信息全攻略[N];中国电脑教育报;2005年
相关博士学位论文 前2条
1 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
2 王俊义;正负相关反馈与查询扩展技术的研究[D];内蒙古大学;2012年
相关硕士学位论文 前10条
1 姚小同;查询扩展技术研究[D];北京邮电大学;2009年
2 许威;基于概念格的查询扩展系统及建格算法研究[D];北京邮电大学;2008年
3 胡保祥;基于查询日志的查询扩展研究[D];北京邮电大学;2013年
4 董静;基于信任网络的查询扩展技术研究[D];哈尔滨工程大学;2013年
5 瞿国忠;查询扩展技术研究[D];华中师范大学;2007年
6 林智超;基于查询扩展的网络信息语义检索服务的研究与实现[D];华东师范大学;2012年
7 陈U,
本文编号:1414582
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1414582.html