跨语言智能学术搜索系统设计与实现
本文关键词: 跨语言信息检索 搜索结果聚类 个性化信息检索 查询扩展 学术搜索 出处:《山东大学学报(工学版)》2011年05期 论文类型:期刊论文
【摘要】:学术搜索是一种行业化的搜索引擎,因其缺乏个性化、智能化的服务,使得用户的学术文献检索效率低下,海量的数字学术资源得不到充分利用。本研究跨语言智能学术搜索系统的设计与实现,旨在让用户可以在尽可能短的时间内找到所需学术资源。系统的几个关键技术包括:研究混合语种文本的分词技术;研究基于机器翻译的跨语言信息检索;研究搜索结果聚类算法在不同语言文本上的性能差异问题;研究基于聚类的个性化信息检索方法以及交互式查询扩展技术。实验测试结果表明:系统具有较好的扩展性,能为用户提供良好的学术检索服务。
[Abstract]:Academic search is an industry-oriented search engine, because of its lack of personalized and intelligent services, users of academic literature retrieval efficiency is low. Large amounts of digital academic resources are not fully utilized. The design and implementation of a cross-language intelligent academic search system is presented in this paper. Several key technologies of the system include: word segmentation technology for studying mixed language texts; Research on cross-language information retrieval based on machine translation; The performance difference of search result clustering algorithm in different languages is studied. The clustering based personalized information retrieval method and interactive query extension technology are studied. The experimental results show that the system has good scalability and can provide users with a good academic retrieval service.
【作者单位】: 广东外语外贸大学国际工商管理学院;卡迪夫大学卡迪夫商学院;广东外语外贸大学信息学院;
【基金】:国家自然科学基金资助项目(61070061) 广东省自然科学基金资助项目(9151026005000002) 广东省高层次人才项目 广东外语外贸大学研究生创新团队资助项目(10GWCXTD0-8)
【分类号】:TP391.3
【正文快照】: 0引言随着网络上文本数据的指数增长,传统的综合搜索引擎已不能很好地满足用户快速获取所需信息的需求,如何提高信息获取的效率成为亟待解决的问题。搜索引擎行业化、个性化、智能化是解决该问题的最有效途径之一。学术搜索引擎是一种行业化搜索引擎,着力于解决如何高效地检
【参考文献】
相关期刊论文 前1条
1 王进,陈恩红,张振亚,王煦法;基于本体的跨语言信息检索模型[J];中文信息学报;2004年03期
【共引文献】
相关期刊论文 前10条
1 余正涛,樊孝忠,宋丽荣;基于特定问题类别的汉语问答系统查询扩展[J];北京理工大学学报;2005年10期
2 郭宇锋;黄敏;;跨语言信息检索理论与应用研究[J];图书与情报;2006年02期
3 郭岩;白硕;于满泉;;Web使用信息挖掘综述[J];计算机科学;2005年01期
4 黄名选;严小卫;张师超;;查询扩展技术进展与展望[J];计算机应用与软件;2007年11期
5 闵金明;孙乐;张俊林;;重新审视跨语言信息检索[J];中文信息学报;2006年04期
6 王昊;基于跨语言信息检索的数字图书馆系统模型[J];情报科学;2005年10期
7 吴丹;李瑞芬;;跨语言信息检索技术应用与进展研究[J];情报科学;2006年09期
8 王昊;跨语言信息检索实现方法与关键技术探讨[J];情报杂志;2005年07期
9 刘颖;詹萌;;Ontology在数字图书馆领域中的应用与研究综述[J];图书馆杂志;2005年06期
10 任成梅;;跨语言信息检索的发展与展望[J];图书馆学研究;2006年04期
相关会议论文 前7条
1 王洪俊;赖志国;施水才;肖诗斌;;基于查询日志的查询建议挖掘[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 盛俊;王明文;余俊英;;一种基于潜在语义的Markov网络信息检索模型[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 徐小琴;章成志;;Web信息检索中相关词提示技术与评测[A];第三届学生计算语言学研讨会论文集[C];2006年
4 章成志;苏兰芳;;基于多语境的相关词自动提取[A];第三届学生计算语言学研讨会论文集[C];2006年
5 陈志玮;肖诗斌;施水才;王昕;;一种基于HTML位置信息的查询扩展技术[A];第三届学生计算语言学研讨会论文集[C];2006年
6 刘悦;许洪波;程学旗;;互联网挖掘和搜索的研究进展[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 吴京慧;余珊珊;王明文;;基于用户日志聚类的查询扩展模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
相关博士学位论文 前5条
1 李智;机器学习方法及其在基金项目评审中的应用研究[D];天津大学;2004年
2 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
3 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年
4 蔡柯柯;基于查询特征上下文的检索模型研究[D];浙江大学;2007年
5 田萱;基于上下文的信息检索关键技术研究[D];中国人民大学;2007年
相关硕士学位论文 前10条
1 尚志豪;战略研究支持系统中的结构化检索方法研究[D];大连理工大学;2006年
2 杭月芹;基于文档查询信息的检索系统研究与实现[D];扬州大学;2005年
3 左家莉;基于Markov网络的信息检索模型[D];江西师范大学;2005年
4 谭利文;基于用户模型的个性化网络文献检索系统的研究与设计[D];吉林大学;2004年
5 罗建利;基于用户兴趣的概念查询扩展研究[D];扬州大学;2005年
6 顾德访;语义Web环境下基于ontology的语义检索应用研究[D];南京理工大学;2005年
7 陈琮;基于Jena的本体检索模型设计与实现[D];武汉大学;2005年
8 覃华兵;知识组织工具—本体研究[D];武汉大学;2005年
9 吴炜;基于用户日志的信息检索研究[D];同济大学;2006年
10 唐明;文本挖掘及其在多文化交流平台中的应用[D];西南大学;2006年
【二级参考文献】
相关期刊论文 前1条
1 张清军,朱才连;基于统计的中文文本主题自动提取研究[J];四川大学学报(工程科学版);2004年03期
【相似文献】
相关期刊论文 前10条
1 赵小兵;邱莉榕;赵铁军;;多民族语言本体知识库构建技术[J];中文信息学报;2011年04期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相关会议论文 前8条
1 张sソ,
本文编号:1489661
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1489661.html