阿尔兹海默病文献可视化平台的设计与实现
发布时间:2020-07-27 15:35
【摘要】:阿尔兹海默病(AD)至今尚无有效治疗手段,其致死率极高。近年来,关于AD的研究日渐升温,AD相关文献高达12万篇。如何从海量文献中获取对科研工作者、医学研究人员有用的信息变得至关重要。为了从海量的AD相关文献中获知其研究变化趋势,设计并实现一个可以清晰展示AD文献变化趋势的可视化平台是本文的主要目的。为了解阿尔兹海默病的动态,对相关文献展开分析跟踪。本文的可视化平台致力于AD文献相对变化趋势的研究,涉及到科学计量学、LDA(Latent Diriehlet Allocation)主题模型、DEA(data envelopment analysis)模型、可视化技术等内容。本文的主要研究内容主要包括以下三个方面。(1)本文对可视化平台的技术和手段进行了研究。其中科学计量学涉及到科学知识结构分析和科学知识演化分析,本文针对文献进行科学知识演化分析,选择目前较流行的主题模型进行了深入的探讨和研究,并对DEA模型进行了研究。(2)研究并实现了 AD可视化系统。根据系统的实际需求,本文设计了 AD可视化平台的总体架构,并完成了系统中数据收集、数据库设计、数据分析、平台可视化等主要模块的设计与实现。(3)基于计量学的方法,利用Biopython获取NCBI网站AD相关文献,并针对文献个数、国家发文量、期刊被引用量、关键词的相对变化趋势进行了可视化分析。基于DEA模型,对变化趋势进行了科学性的分析。基于LDA主题模型建立的主题演化模型,将AD相关文献按照时间进行划分,用LDA模型获取其隐含的主题,利用Gibbs算法进行参数估计,获取连续的文档-主题,主题-词语的概率分布,通过主题强度、主题相似度两个方面来展示主题演化。
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP311.52
【图文】:
图中涂色的信息集是由可观测变量组成的,未涂色的z集表示隐含变量,该信逡逑息集是未知变量,同样N表示文档的词汇量,M表示该模型包含M篇文档,其图逡逑模型如下图2.3所示:逡逑z逦w邋N逡逑逦L—逦J邋M逡逑图邋2.3Mixture邋of邋unigrams邋model邋图模型逡逑Figure邋2.3Mixture邋of邋unigrams邋model邋graph邋model逡逑(3)邋PLSI邋model逡逑PLSTXPoobabilistic邋Latent邋Semantic邋Index,概率潜在语义索弓|)模型懫用了生成逡逑模型。这里假设各个因素间相互关联,每一篇文档都是以不同的概率映射到多个逡逑主题上。生成模型描述的就是各个因素都服从某种概率密度函数而相互作用的过逡逑程。对于非生成类模型直接将各因素整合形成信息集,整个过程没有建立概率函逡逑数等生成形式。它通常都要做各种理想的假设,需要经过一定的处理后,以满足逡逑推导数学公式的前提条件,这样才能得到该模型所需要的结果。而生成模型都是逡逑通过不停的迭代,不断地提高近似值的精确度来获得结果。逡逑PLSI是一种综合性模型,将很多潜在主题生成一个模型当中。在PLSI模型中逡逑经常另潜在主题或是隐性主题符合某种规律的服从某项随机分布
图中涂色的信息集是由可观测变量组成的,未涂色的z集表示隐含变量,该信逡逑息集是未知变量,同样N表示文档的词汇量,M表示该模型包含M篇文档,其图逡逑模型如下图2.3所示:逡逑z逦w邋N逡逑逦L—逦J邋M逡逑图邋2.3Mixture邋of邋unigrams邋model邋图模型逡逑Figure邋2.3Mixture邋of邋unigrams邋model邋graph邋model逡逑(3)邋PLSI邋model逡逑PLSTXPoobabilistic邋Latent邋Semantic邋Index,概率潜在语义索弓|)模型懫用了生成逡逑模型。这里假设各个因素间相互关联,每一篇文档都是以不同的概率映射到多个逡逑主题上。生成模型描述的就是各个因素都服从某种概率密度函数而相互作用的过逡逑程。对于非生成类模型直接将各因素整合形成信息集,整个过程没有建立概率函逡逑数等生成形式。它通常都要做各种理想的假设,需要经过一定的处理后,以满足逡逑推导数学公式的前提条件,这样才能得到该模型所需要的结果。而生成模型都是逡逑通过不停的迭代,不断地提高近似值的精确度来获得结果。逡逑PLSI是一种综合性模型,将很多潜在主题生成一个模型当中。在PLSI模型中逡逑经常另潜在主题或是隐性主题符合某种规律的服从某项随机分布
图3.1邋UML用例图逡逑Figure邋3.1邋UML邋use邋case邋diagram逡逑3.1.2非功能需求逡逑AD可视化平台对系统的可用性,可靠性,高性能,可维护性,可扩展性等方逡逑面有着一定的要求。逡逑下面列出这些非功能需求的一些指标逡逑(1)可用性:AD可视化平台必须支持多个浏览器模式,使得用户能方便与逡逑之交互。要力求最大限度地满足实际的功能需要,充分考虑各业务层次及数据处逡逑理的实用性。用户接口和操作界面尽可能做到界面美观大方,操作简便实用。逡逑(2)可靠性:AD可视化平台需达到7x24小时不宕机。逡逑(3)高性能:AD可视化平台主要是提供用户在前台界面访问,需满足用户逡逑访问页面l ̄2s内可得到可视化结果。逡逑(4)可维护性:AD可视化平台需要具备较高的可维护性。软件设计尽可能逡逑
本文编号:2772030
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP311.52
【图文】:
图中涂色的信息集是由可观测变量组成的,未涂色的z集表示隐含变量,该信逡逑息集是未知变量,同样N表示文档的词汇量,M表示该模型包含M篇文档,其图逡逑模型如下图2.3所示:逡逑z逦w邋N逡逑逦L—逦J邋M逡逑图邋2.3Mixture邋of邋unigrams邋model邋图模型逡逑Figure邋2.3Mixture邋of邋unigrams邋model邋graph邋model逡逑(3)邋PLSI邋model逡逑PLSTXPoobabilistic邋Latent邋Semantic邋Index,概率潜在语义索弓|)模型懫用了生成逡逑模型。这里假设各个因素间相互关联,每一篇文档都是以不同的概率映射到多个逡逑主题上。生成模型描述的就是各个因素都服从某种概率密度函数而相互作用的过逡逑程。对于非生成类模型直接将各因素整合形成信息集,整个过程没有建立概率函逡逑数等生成形式。它通常都要做各种理想的假设,需要经过一定的处理后,以满足逡逑推导数学公式的前提条件,这样才能得到该模型所需要的结果。而生成模型都是逡逑通过不停的迭代,不断地提高近似值的精确度来获得结果。逡逑PLSI是一种综合性模型,将很多潜在主题生成一个模型当中。在PLSI模型中逡逑经常另潜在主题或是隐性主题符合某种规律的服从某项随机分布
图中涂色的信息集是由可观测变量组成的,未涂色的z集表示隐含变量,该信逡逑息集是未知变量,同样N表示文档的词汇量,M表示该模型包含M篇文档,其图逡逑模型如下图2.3所示:逡逑z逦w邋N逡逑逦L—逦J邋M逡逑图邋2.3Mixture邋of邋unigrams邋model邋图模型逡逑Figure邋2.3Mixture邋of邋unigrams邋model邋graph邋model逡逑(3)邋PLSI邋model逡逑PLSTXPoobabilistic邋Latent邋Semantic邋Index,概率潜在语义索弓|)模型懫用了生成逡逑模型。这里假设各个因素间相互关联,每一篇文档都是以不同的概率映射到多个逡逑主题上。生成模型描述的就是各个因素都服从某种概率密度函数而相互作用的过逡逑程。对于非生成类模型直接将各因素整合形成信息集,整个过程没有建立概率函逡逑数等生成形式。它通常都要做各种理想的假设,需要经过一定的处理后,以满足逡逑推导数学公式的前提条件,这样才能得到该模型所需要的结果。而生成模型都是逡逑通过不停的迭代,不断地提高近似值的精确度来获得结果。逡逑PLSI是一种综合性模型,将很多潜在主题生成一个模型当中。在PLSI模型中逡逑经常另潜在主题或是隐性主题符合某种规律的服从某项随机分布
图3.1邋UML用例图逡逑Figure邋3.1邋UML邋use邋case邋diagram逡逑3.1.2非功能需求逡逑AD可视化平台对系统的可用性,可靠性,高性能,可维护性,可扩展性等方逡逑面有着一定的要求。逡逑下面列出这些非功能需求的一些指标逡逑(1)可用性:AD可视化平台必须支持多个浏览器模式,使得用户能方便与逡逑之交互。要力求最大限度地满足实际的功能需要,充分考虑各业务层次及数据处逡逑理的实用性。用户接口和操作界面尽可能做到界面美观大方,操作简便实用。逡逑(2)可靠性:AD可视化平台需达到7x24小时不宕机。逡逑(3)高性能:AD可视化平台主要是提供用户在前台界面访问,需满足用户逡逑访问页面l ̄2s内可得到可视化结果。逡逑(4)可维护性:AD可视化平台需要具备较高的可维护性。软件设计尽可能逡逑
【参考文献】
相关期刊论文 前10条
1 刘金花;;领域性科研机构的研究热度评价方法[J];现代计算机(专业版);2015年29期
2 傅成红;刘国买;段爱华;;综合运输协调发展的DEA评价[J];系统工程;2012年07期
3 林依;;高校科研绩效评价新方法之综述[J];学理论;2011年10期
4 侯海燕;刘则渊;栾春娟;;基于知识图谱的国际科学计量学研究前沿计量分析[J];科研管理;2009年01期
5 阳丹;肖宏;;1996—2005年阿尔茨海默病研究文献计量分析[J];第二军医大学学报;2007年12期
6 邸雅军;;科技创新中的科学计量学参照与意义[J];泸州科技;2007年01期
7 陈顺正,宋国防,杨国东;基于DEA灵敏度分析的物流系统综合评价研究[J];工业工程与管理;2005年05期
8 李美娟,陈国宏;数据包络分析法(DEA)的研究与应用[J];中国工程科学;2003年06期
9 周纯,马丝竹,姚志彬;阿尔茨海默病的文献计量学分析[J];解剖学研究;2002年02期
10 李梅,陈鸣凤;阿尔茨海默病文献计量分析研究[J];中华神经科杂志;2000年01期
本文编号:2772030
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2772030.html