基于文献相似度的系统评价引文筛选系统的设计与实现

发布时间:2021-04-03 23:37
  系统评价是循证医学非常重要的证据基础,它对于临床治疗、诊断测试和风险分析等都具有重要的参考价值。筛选参考文献是系统评价一个的步骤,通常需要至少两名专家进行人工审阅。由于医学文献数量的快速增长和医学数据库搜索引擎的特异度较差等问题,使得筛选参考文献成为了一个耗时耗力的过程。许多研究表明使用自动文本分类技术可以极大减少专家人工审阅文献的工作量。本文提出了一种基于文献相似度的系统评价引文筛选算法。该算法针对现阶段基于机器学习的自动文本分类算法存在的数据集不均衡和结合主动学习的机器学习分类算法训练初期数据不足等问题,通过使用文献的标题、摘要和出版类型等信息来计算文献之间的相似度,根据专家的文献筛选情况和文献之间相似度对文献进行优先级的排序以达到加速引文筛选过程的目的。本文使用LDA(Latent Dirichlet allocation)主题模型分别构建了标题和摘要的特征向量,使用词袋模型构建出版类型的特征向量,通过计算特征向量之间的余弦值来衡量文献之间的相似度。为了验证本文算法的有效性,本文基于Cochrane图书馆(Cochrane Library)提供的数据构建了十个主题的系统评价引文集... 

【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校

【文章页数】:61 页

【学位级别】:硕士

【部分图文】:

基于文献相似度的系统评价引文筛选系统的设计与实现


方案一示意图

示意图,方案,示意图,分类器


电子科技大学硕士学位论文12供训练的难度。方案二的设计方式如图2-2所示。图2-2方案二示意图方案三是使用二叉树的结构,每一个节点都是一个分类器,每一层的分类器完成一个类比的数据与其他类别数据的分类问题[53]。如果有N种类别的数据,则需要构建N-1个分类器。这个方案的优点是分类器的数目较少且训练的数据量也比较少。缺点是如果某一个节点的分类器训练出错,那么之后的其他的节点的分类器也会收到影响导致一系列的连锁反应。并且使用这种结构会极大的增加训练时间,因为下一个分类的训练需要等待上一个分类器训练完成才能进行。这几种方案都是将一个多分类问题拆分成多个二分类问题以实现多分类任务。但是在实际应用中,如果样本分类数量的不断增加,分类器的训练复杂度和计算量也会不断增加。因此怎样减少训练的复杂度和计算量是在实际应用中需要着重考虑的问题。方案三的设计方式如图2-3所示。图2-3方案三示意图支持向量机模型的优点是它避免了当前的统计方法的从归纳到演绎的过程。

示意图,方案,示意图,分类器


电子科技大学硕士学位论文12供训练的难度。方案二的设计方式如图2-2所示。图2-2方案二示意图方案三是使用二叉树的结构,每一个节点都是一个分类器,每一层的分类器完成一个类比的数据与其他类别数据的分类问题[53]。如果有N种类别的数据,则需要构建N-1个分类器。这个方案的优点是分类器的数目较少且训练的数据量也比较少。缺点是如果某一个节点的分类器训练出错,那么之后的其他的节点的分类器也会收到影响导致一系列的连锁反应。并且使用这种结构会极大的增加训练时间,因为下一个分类的训练需要等待上一个分类器训练完成才能进行。这几种方案都是将一个多分类问题拆分成多个二分类问题以实现多分类任务。但是在实际应用中,如果样本分类数量的不断增加,分类器的训练复杂度和计算量也会不断增加。因此怎样减少训练的复杂度和计算量是在实际应用中需要着重考虑的问题。方案三的设计方式如图2-3所示。图2-3方案三示意图支持向量机模型的优点是它避免了当前的统计方法的从归纳到演绎的过程。

【参考文献】:
期刊论文
[1]信息系统中的角色权限管理设计[J]. 朱军红,唐明根,张小玲.  中国管理信息化. 2019(23)
[2]基于Python与flask工具搭建可高效开发的实用型MVC框架[J]. 牛作东,李捍东.  计算机应用与软件. 2019(07)
[3]无监督学习、GAN和强化学习将构建机器学习的未来[J]. Al Gharakhanian,张含阳.  机器人产业. 2017(02)
[4]MVC模式在Web管理信息系统中的应用[J]. 徐春雨.  福建电脑. 2014(04)
[5]基于机器学习的自动文本分类模型研究[J]. 陈立孚,周宁,李丹.  现代图书情报技术. 2005(10)

硕士论文
[1]基于监督学习的网络优化问题求解研究[D]. 李佳.电子科技大学 2019



本文编号:3117298

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3117298.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6195b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com