当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于多语言本体的中英跨语言信息检索模型及实现

发布时间:2021-04-04 20:40
  [目的 /意义]构建一个基于多语言本体的跨语言信息检索模型,有助于用户通过该模型使用自己熟悉的语言来获取不同语种的信息资源。[方法 /过程]通过本体设计及检索模型功能模块设计建立一个基于数字出版领域本体的中英跨语言信息检索模型,并利用Java语言及Lucene搜索引擎架构对该模型进行编程实现。[结果/结论]多语言领域本体具有明确、形式化、共享、概念化、结构清晰等特征,可以作为语义层应用于跨语言信息检索系统之中,实现信息资源的语义表达。经测试,本文构建的模型能够较好地实现分词、查询扩展和语义关联等功能,促进跨语言信息检索向语义层次发展。 

【文章来源】:图书情报工作. 2017,61(01)北大核心CSSCI

【文章页数】:9 页

【部分图文】:

基于多语言本体的中英跨语言信息检索模型及实现


使用类SearchGUI创建的图形交互界面

数字期刊,控制台,学术出版,跨语言信息检索


??书馆和学术用户市潮,在Eclipse控制台输出的分词结果为“爱思唯尔代表跨国科技出版集团不断培育图书馆学术用户市场Elsevier”,相关选项为“[STM出版,数字期刊,EBSCO,出版单位,Scopus,数字学术出版,ScienceDirect,EES,案例,LexisNexis,数字期刊出版,IFLA,Brill,Unicorn,Millennium,WorldShare,共享空间,Apollo,Sierra,MODS,ISBD,Symphony,In-genta,Dspace,Library.Solution,Aleph,Polaris,World-Cat,DC,NLM,OpenDLib,OCLC,CrossRef,Horizon,相关概念,DOI,Alma,DOAJ]”,图3为第1组测试的图形界面:图3第1组测试3.3.2第2组测试跨语言信息检索功能测试检索式为“Mobilephonepublishing,onlinegamesandinternetadvertisingareinthedevelopmentstage”,在Eclipse控制台输出的分词结果为“手机出版网络游戏网络广告106

标记语言,内容,跨语言信息检索,网络广告


司莉,陈雨雪,曾粤亮.基于多语言本体的中英跨语言信息检索模型及实现[J].图书情报工作,2017,61(1):100-108.发展阶段Mobilephonepublishing手机出版onlinegames网络游戏andinternetadvertising网络广告areinthedevelopment发展stage阶段”,相关选项为“[彩铃,彩信,手机出版物,移动出版,网易游戏,网络游戏出版,网络出版物,网络广告产业]”,图4为第2组测试的图形界面:图4第2组测试3.3.3第3组测试相关查询功能测试检索式为“SGML与XML是典型的描述性标记语言”,在Eclipse控制台输出的分词结果为“典型描述性标记语言SGMLXML”,相关选项为“[XML,HTML,内容加工,相关概念,DTD,RDF,ISO,格式标准,DocBook,XSL,复合出版,ECIP,S1000D,XPS,标记语言,XMLSchema,技术标准,DREL,信息组织,EPUB,Ne-wsML,OFD,SGML,ODRL,W3C,语义网,ODF,DI-TA工具,DITAworks,动态出版,DC,DITA,XHTML,CEBX,CNONIX,DITAStorm]”,图5为第3组测试的图形界面:图5第3组测试双击相关选项列表中的“DITA”,程序便以“DI-TA”为检索词进行第二次检索,在Eclipse控制台输出“DITA”的相关选项为“[DTD,元数据,全媒体出版,版式渲染,DITA技术委员会,DITA工具,XMLSchema,内容重组,XSL-FO,DocBook,URI,XSD,内容验证,内容加工,IBM,复合出版,Adobe,流程再造,XML,信息组织,XSL,技术标准,内容资源整合,OASIS,按需出版]”,测试结果如图6所示:图6点击相关查询测试从以上3组测试的结果可以看出,本文实现的基于数字出版领域本体的跨语言信息检索模型基本满足了设计需求。其中,第1组测试表明模型能对单字词及纯数字进行一定的处理,第2组测试验证了模型使用英语进行检索时,反馈

【参考文献】:
期刊论文
[1]基于主题词表的数字出版领域本体构建[J]. 司莉,陈雨雪,庄晓喆.  出版科学. 2015(06)
[2]信息检索模型及其在跨语言信息检索中的应用进展[J]. 吴丹,齐和庆.  现代情报. 2009(07)
[3]基于本体的跨语言信息检索模型和关键技术研究[J]. 郝嘉树,王惠临,刘耀.  情报科学. 2009(02)
[4]结合本体论和统计方法的跨语言信息检索模型[J]. 郑德权,李生,赵铁军,于浩.  哈尔滨工业大学学报. 2008(01)
[5]跨语言信息检索模型应用研究[J]. 刘伟成,孙吉红.  情报杂志. 2007(10)
[6]本体在跨语言信息检索中的应用机制研究[J]. 吴丹,王惠临.  图书情报工作. 2006(09)
[7]本体驱动的跨语言信息检索研究[J]. 吴丹.  现代图书情报技术. 2006(05)
[8]基于本体的跨语言信息检索模型[J]. 王进,陈恩红,张振亚,王煦法.  中文信息学报. 2004(03)

博士论文
[1]面向复杂语义的专利本体构建方法研究[D]. 李蓉蓉.武汉大学 2014

硕士论文
[1]基于跨语言信息检索的企业竞争情报收集系统模型研究[D]. 孙耀.山东科技大学 2011
[2]基于形式概念分析的领域本体构建方法研究[D]. 张云中.吉林大学 2009
[3]基于本体的跨语言全文检索模型的研究[D]. 吴芳.北京邮电大学 2006



本文编号:3118454

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3118454.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户42ca8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com