当前位置:主页 > 医学论文 > 医卫管理论文 >

医学文献相似性研究

发布时间:2021-10-24 07:34
  科学技术突飞猛进的发展使得科学领域的每一项技术都有日新月异的变化。随之产生的则是海量的数据信息,而计算机技术的发展为其创造了新的存储方式一数据库。而不同的时代会有不同的结构的数据,如何把这些异构数据统一成一个易查询的数据库,已经越来越成为人们关注的焦点。国内外相继涌现出了大量的文献数据库,如:MEDLINE、中文科技期刊数据库、中国期刊网等,充分显示出人们对信息检索问题的重视。虽然数据库资源异常丰富,检索文献的手段多种多样,但是检索结果的正确性和准确性却往往因检索出很多无关的文献而不尽如人意。因而,提高检索效率、正确性及相关性已经成为检索领域迫切需要解决的问题。本文针对上述两个问题,以各种形式的医学文档信息数据为基础,设计出一个基于关系数据库模型的异构数据存储方案,该方案统一了异构数据;并在此数据库基础上,利用后缀树向量空间模型(VSM),为每篇文献建立相应的基于内容的向量模型,通过计算夹角的余弦值得出文献之间的相似度,最终构建一个医学文献相关性数据库。接着,以医学文献的相似性研究为出发点,从搜集数据、整理数据、处理数据直到为用户提供检索接口,最终构建了一个“医学文献信息检索系统”。本... 

【文章来源】:首都师范大学北京市

【文章页数】:59 页

【学位级别】:硕士

【部分图文】:

医学文献相似性研究


系统设计过程

流程图,流程,中英文,中介


图2一2系统主要流程2.IJ系统流程如图2一2所示,系统分为两个部分:(1)数据处理部分,(2)系统功能部分。其中数据处理部分又可以分为两个部分:(1)数据的导入;(2)相关性计算。系统功能部分在下2.2节中介绍,有关相关性的具体计算将在第四章中介绍。数据处理部分:如图2一3所示,异构数据分为三个部分,第一部分是中英文XML文献,第二部分是中英文DBF文献,第三部分是EXCEL文档,最终将三者统一导入到 MssQLservcr数据库HcaithyGuide中。其中

计算流程,DBF数据库,中英文,异构数据


绍系统的主要功能及其子功能。2.2.1导入异构数据如图2一4所示,数据导入部分,可以导入XML,中英文DBF数据库,Exeel数据表等。导入的过程中如果发现数据有异常,可以及时清理数据。

【参考文献】:
期刊论文
[1]向量空间模型在医学文献相关性研究中的应用[J]. 邱宇红,郭继军.  现代图书情报技术. 2007(07)
[2]基于后缀树的骨干网络垃圾邮件检测方法[J]. 郑耀东,谭建龙,郭莉.  计算机工程与应用. 2006(28)
[3]向量空间模型信息检索技术讨论[J]. 刘斌,陈桦.  情报杂志. 2006(07)
[4]基于后缀树模型的文本实时分类系统的研究和实现[J]. 郭莉,张吉,谭建龙.  中文信息学报. 2005(05)
[5]基于向量空间模型的信息检索系统的设计[J]. 包金龙.  情报杂志. 2005(07)
[6]基于N元汉字串模型的文本表示和实时分类的研究与实现[J]. 王映,常毅,谭建龙,白硕.  计算机工程与应用. 2005(05)
[7]基于规则的自动分类在文本分类中的应用[J]. 李渝勤,孙丽华.  中文信息学报. 2004(04)
[8]基于向量空间模型的文本自动分类系统的研究与实现[J]. 庞剑锋,卜东波,白硕.  计算机应用研究. 2001(09)
[9]独立于语种的文本分类方法[J]. 黄萱菁,吴立德,石崎洋之,徐国伟.  中文信息学报. 2000(06)
[10]文档中词语权重计算方法的改进[J]. 鲁松,李晓黎,白硕,王实.  中文信息学报. 2000(06)

硕士论文
[1]基于Agent专业搜索引擎的研究[D]. 邹庆欣.大连海事大学 2008
[2]专业搜索引擎的数据存储研究[D]. 陈小峰.南京师范大学 2007
[3]中国生物医学工程文献相关性数据库建设研究[D]. 万莉莉.中国协和医科大学 2007
[4]搜索引擎中的数据存储问题研究[D]. 何华.浙江大学 2005



本文编号:3454863

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/3454863.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户511a0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com