当前位置:主页 > 科技论文 > 搜索引擎论文 >

SLR系统基于QGS的半自动化检索模块的设计和实现

发布时间:2020-06-04 03:27
【摘要】:系统化评价(Systematic Literature Review,SLR)方法是经验软件工程领域常用的研究方法之一,使用系统化评价方法的研究者需要在网络上收集大量的文献数据,而“Quasi-Gold Standard”(QGS)是评价所收集文献数据合理性的准黄金准则,能够帮助研究者完成文献检索。然而,研究者在使用SLR方法进行研究时,需要消耗大量的时间,且研究过程中产生的数据难以保存。对此,某国家重点实验室开发了SLR系统,旨在为使用SLR方法的研究者提供帮助,覆盖了SLR方法的各个阶段,为研究者记录过程数据。其中,文献检索阶段是实际实施SLR的第一阶段,这一阶段得到的检索结果能够影响甚至决定项目研究的成败,而基于QGS的文献检索过程是十分耗时的,目前,还没有任何在QGS概念的基础上帮助研究者完成文献检索的在线协作工具发布。本文所介绍的SLR系统基于QGS的文献检索模块,为研究者提供了基于QGS的文献检索功能。本文阐述了SLR系统的产生背景,说明了基于QGS的半自动化检索在其中的重要作用,概述了学术研究中一些辅助工具的发展状况,综述了构建基于QGS的半自动化检索模块所采用的Django、Redis和主题网络爬虫等技术。论文在详细分析了系统需求后,设计了系统总体结构、模块总体结构和数据库,并将该模块细分成了四个子模块:代理池模块、数字图书馆爬虫模块、文献检索模块和数据导出模块,从功能层面给出了这四个子模块的详细设计和实现细节。最后,给出了模块主要功能的测试情况。为了解决不同数字图书馆对于搜索字符串解析规则的不同,论文所实现的检索功能,提出并实现了搜索字符串的格式化,实现了语义一致性。相对于其他基于主题网络爬虫实现的垂直搜索引擎,加入csv文件的获取和解析,减少了爬虫所固有的高HTTP请求数量,降低了时间消耗,另外加上年份区间检索的优化策略,进一步减少了检索所需的时间代价。最后,独有的QS值计算功能为使用系统化评价方法的研究者提供了有力的支持。
【图文】:

搜索过程,框架,相关文献,方法


图2.2:邋Django框架示意图逡逑经过多年的发展,Django框架在Python轻量级开发中已经占据了重要的位逡逑

用例图,用例图,系统管理员,需求分析


结果g义贤迹常保哄澹眩牵拥陌胱远焖髂?橛美煎义细菪枨蠓治觯冢眩牵拥陌胱远焖髂?榈挠美既缤迹常彼荆麇义弦治低彻芾碓焙陀没Я街纸巧O低彻芾碓备涸鸾写沓毓芾砗团莱婀苠义希保村义

本文编号:2695822

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2695822.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户44679***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com