当前位置:主页 > 社科论文 > 图书档案论文 >

基于内容的汉语文献信息检索系统的设计与实现

发布时间:2021-02-28 19:51
  本文针对目前基于标引的检索系统和全文检索系统存在的问题,分析了词性标注对检索性能的影响、基于重要句群检索的可行性以及自然提问语句模式等方面内容,并以此为基础,提出一种改进的信息检索系统模型:基于内容的汉语文献信息检索系统的模型。先把文章的句子按权重排序,然后根据用户选择阈值的范围,把阈值范围内的重要句子群作为待检段落,在待检段落中进行检索;同时在预处理的时候,对文献的语词进行词性标注,达到部分消歧的效果;当用户需要对文献进行扩检的时候,可以通过扩大阈值以及放松对词性匹配的限制而扩大待检段落的范围,最终实现全文检索的目的;此外,文章还对网站上的用户提问语句做了分析,提出常见用户提问模式,支持用户用自然语句进行提问检索。本实验系统是针对中文计算机领域文献的检索系统,以《软件学报》发表的部分文献以及其他一些计算机文献作为系统开发和测试时候的测试集。在测试中,系统和中国期刊网全文数据库检索性能做了比较,其中大部分检索结果优于中国期刊网的检索效果。 本实验系统的设计与传统的中文信息检索系统比较起来,具有以下五点主要成果:1、实现了词性匹配检索。实验通过具体数据来说明汉语词性标注和汉语信息检... 

【文章来源】:南京农业大学江苏省 211工程院校 教育部直属院校

【文章页数】:73 页

【学位级别】:硕士

【部分图文】:

基于内容的汉语文献信息检索系统的设计与实现


实验系统主界面

工具栏,菜单,语词,语句


.1主窗口菜单和工具栏介绍主窗口菜单和工具栏如图4一3所示:图4一3:系统主窗口菜单和工具栏4.2.1.1文件菜单文件菜单下面包含有三个选项:保存、打印、退出。“保存”项:把检索出来的内容(文献题录信息)保存到本地。“打印”项:把检索出来的内容(文献题录信息)打印出来。“退出”项:结束程序。4.2.1.2编辑菜单编辑菜单下面包含有六个选项:撤消、剪切、复制、粘贴、删除、全选。“撤消”项:撤消刚才的操作。“剪切”项:对本文进行剪切操作。“复制”项:对文本进行复制操作。“粘贴”项:对文本剪切或复制后进行粘贴操作。“删除”项:删除文本。“全选”项:选择所有文本。4.2.1.3检索菜单检索菜单下面包含有两个选项:语句检索、语词检索。“语句检索”:首先,在语句检索框里输入检索语句。然后,选择合适的检索效果。最后再点击“语句检索”项。语词检索”:首先,在检索框中输入检索语词,并选择相应的词性和词性匹配模式。然后,选择合适的检索效果。最后再点击“语词检索”项。4.2.1.4原文菜单原文菜单下面只包含一个选项:运行。点击“运行”,将运行副窗口,获得原文。

系统帮助,版权,显示系统,文件


还有详尽的检索示例。阅读帮助,可以使用户很快地掌握系统的操作。如图4一4所示:图4一4:系统帮助文件“关于”项:显示系统的版本、版权等信息。4.2.1.6工具栏主窗口的工具栏上的按钮和其对应的主窗口菜单关系,见表4一l:表4一1:主窗口工具栏按钮与菜单对应表

【参考文献】:
期刊论文
[1]一种新颖的词性标注模型[J]. 袁里驰,钟义信.  微电子学与计算机. 2005(09)
[2]电子编辑和电子出版物:概念、起源和早期发展(上)[J]. 林穗芳.  出版科学. 2005(03)
[3]词性标注对信息检索系统性能的影响[J]. 苏祺,昝红英,胡景贺,项锟.  中文信息学报. 2005(02)
[4]基于层叠隐马模型的汉语词法分析[J]. 刘群,张华平,俞鸿魁,程学旗.  计算机研究与发展. 2004(08)
[5]汉语自然语言检索中的词法分析处理[J]. 耿骞,毛瑞.  情报科学. 2004(04)
[6]一个改进的汉语词性标注系统[J]. 屈刚,陆汝占.  上海交通大学学报. 2003(06)
[7]基于特征的汉语词性标注模型[J]. 屈刚,陆汝占.  计算机研究与发展. 2003(04)
[8]信息抽取研究综述[J]. 李保利,陈玉忠,俞士汶.  计算机工程与应用. 2003(10)
[9]情报检索系统评价研究:回顾与展望[J]. 杨立英,尚克聪.  图书情报工作. 2003(02)
[10]自动文摘综述[J]. 郭燕慧,钟义信,马志勇,姚均勇.  情报学报. 2002(05)



本文编号:3056367

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3056367.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ac86f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com