当前位置:主页 > 科技论文 > 搜索引擎论文 >

中学文科教材全文检索系统的设计与实现

发布时间:2018-05-18 02:39

  本文选题:中学文科教材 + 全文检索 ; 参考:《中央民族大学》2017年硕士论文


【摘要】:随着信息时代的来临和信息技术的迅猛发展,学习资源不仅仅以纸为载体,将一部分学习资源信息化、电子化已经是现代教育的发展趋势,其中教材资源就包括在这学习资源中。学生、教师在大规模的信息中如何快速精确的找到自己所需要的学习信息,而不是迷失在茫茫数据的大海中,这是一个需要思索的问题。全文检索是对文档集中的词建立倒排索引,记录每个词语在文档集中出现的频率和位置,在进行查询时会对倒排索引进行检索,提高检索效率,而全文检索系统就是应用全文检索技术建立起来的系统体系。因此,针对教育领域的全文检索系统的开发与实现是有意义的。本次毕业设计使用Elastic Search搜索引擎调用底层Lucene工具包开发了中学文科教材全文检索系统,主要工作内容如下:(1)收集和整理中学文科教材语料;(2)对全文检索的相关技术进行研究,对全文检索技术中计算相似度值的公式进行了分析,提供了条件检索的功能,包括全文检索、复合检索、作者、科目、年级、题目检索类别;(3)在系统后台我们使用ES库来存储收集到的教材文本,并且将这些文档使用IK分词器进行分词,通过ES建立倒排索引,在检索模块使用MVC框架来搭建,将系统的数据、显示、业务功能分成不同的模块,使得开发过程中逻辑层次更加清晰,在后期的维护中也更加便捷;(4)系统前台页面使用JSP技术,为信息检索提供界面,前台页面主要包括了查询页、结果列表页和信息详情页,通过接口的调用和方法类的实现,将检索得到的信息展示在Web页面并且在前台检索结果页面高亮显示检索词。本次毕业设计希望可以帮助学生和教师在进行检索之后,对与输入关键字相关的各大初中文科教材内容有一个整体的把握,便利用户查找感兴趣的相关内容。本次毕业设计将有助于用户提高检索效率,促进用户深入地学习相关知识,提高教学质量。
[Abstract]:With the advent of the information age and the rapid development of information technology, learning resources not only take paper as the carrier, part of the learning resources information, electronic has been the development trend of modern education. Among them, the textbook resources are included in the learning resources. It is a problem that students and teachers need to think about how to find the learning information they need quickly and accurately in the large-scale information, instead of being lost in the sea of vast data. Full-text retrieval is to build inverted index of words in document set, record the frequency and position of each word appearing in document set, search inverted index in query, improve retrieval efficiency. And the full-text retrieval system is the system established by using the full-text retrieval technology. Therefore, it is meaningful to develop and implement the full-text retrieval system in the field of education. This graduation project has developed a full-text retrieval system for liberal arts textbooks in middle schools using the Elastic Search search engine calling the underlying Lucene toolkit. The main work is as follows: 1) collecting and sorting out the corpus of Chinese liberal arts textbooks. (2) researching on the related techniques of full-text retrieval. This paper analyzes the formula of calculating similarity value in full-text retrieval technology, and provides the functions of conditional retrieval, including full-text retrieval, compound retrieval, author, subject, grade, etc. In the background of the system, we use es library to store the collected text of teaching materials, and use IK participle to segment these documents, build inverted index through es, and use MVC framework to build the retrieval module. The data of the system, display, business function are divided into different modules, which makes the logic level more clear in the development process, and also more convenient in the later maintenance) the system foreground page uses JSP technology to provide the interface for information retrieval. The front page mainly includes the query page, the result list page and the information detail page, through the interface call and the method class realization, displays the retrieved information in the Web page and highlights the key words in the foreground retrieval result page. This graduation project hopes to help the students and teachers to have a comprehensive grasp of the contents of the liberal arts textbooks related to the input keywords after the retrieval, and to facilitate the users to find the relevant content of interest. This graduation project will help users to improve the efficiency of retrieval, promote the users to learn relevant knowledge, improve the quality of teaching.
【学位授予单位】:中央民族大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3;G434

【相似文献】

相关期刊论文 前9条

1 杨则正;Calera's Wordscan全文检索系统[J];管理科学文摘;1997年09期

2 周拴龙;全文检索系统软件功能研究[J];河南师范大学学报(哲学社会科学版);1994年02期

3 林永照;;学生优秀论文全文检索系统的开发与利用[J];济南职业学院学报;2009年01期

4 李琳;超文本全文检索系统模型分析[J];青岛海洋大学学报(社会科学版);1997年02期

5 钟锋;;基于Lucene的全文检索系统研究与实现[J];浙江外国语学院学报;2013年04期

6 潘以锋;;基于Lucene的网站全文检索系统的开发[J];广西教育学院学报;2006年05期

7 胡飞龙;;用VFP开发文本全文检索系统[J];常州教育学院学报(综合版);1999年01期

8 谢松;杨志永;;CNKI知识搜索检索技术及评价[J];科教文汇(下旬刊);2009年08期

9 ;[J];;年期

相关会议论文 前2条

1 赵慧;李春明;鲍可进;;一种基于DotLucene搜索引擎的知识库中文全文检索系统[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

2 周小庭;;用Info Digger全文检索系统构建首都师大基教中心网上平台[A];OA’99办公自动化全国学术研讨暨展示会论文集[C];1999年

相关重要报纸文章 前2条

1 肖诗斌;全文检索技术的深层剖析[N];中国计算机报;2003年

2 罗懿;世纪永联搜索引擎获奖[N];中国企业报;2000年

相关博士学位论文 前1条

1 吴炜;密文全文检索系统中的索引机制研究[D];华中科技大学;2009年

相关硕士学位论文 前10条

1 黄小文;基于NoSQL存储的海量文档全文检索系统的研究与实现[D];华北电力大学;2015年

2 张雯;TextRank算法的改进及在政法全文检索系统中的应用[D];广西大学;2015年

3 陶化忠;基于MapReduce全文检索系统设计与实现[D];东北大学;2014年

4 陈碧荣;中学文科教材全文检索系统的设计与实现[D];中央民族大学;2017年

5 何胜利;矿山法律法规全文检索系统的研究与应用[D];西安建筑科技大学;2005年

6 杨镒菲;基于云存储的分布式全文检索系统的设计与实现[D];华南理工大学;2012年

7 蔡晶晶;多文档全文检索系统的设计与开发[D];电子科技大学;2013年

8 王红胜;多文档全文检索系统的设计与开发[D];电子科技大学;2010年

9 刘超;专利全文检索系统的设计与实现[D];北京邮电大学;2010年

10 李秦;基于用户行为的全文检索系统个性化推荐研究[D];西南大学;2009年



本文编号:1904036

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1904036.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户851dd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com