基于主题模型的机构研究状况可视分析

发布时间:2021-01-06 01:50
  在互联网时代,由于信息技术的迅速发展,数据呈现出一种爆炸式增长。对于学术研究领域来说,科研人员的增加导致学术文献也与日俱增。利用和理解这些数据能更好地了解科学本身的结构和动态,这就需要数据分析和可视化的结合。不同的研究机构所涉及的研究领域、方法以及模型有很大的区别,对学术文献进行主题建模和可视分析能反映一个机构在各个研究领域的发展和态势。主题模型成为研究学术文献的主要文本挖掘算法,用来提取文献中隐藏的信息—主题。然后结合可视化方法将主题和其他数据信息通过可视化图元展示并分析,以此来了解和掌握一个机构的科研发展趋势。针对以上需求,本文提出一种基于主题模型的机构研究状况的可视分析方法。帮助用户了解机构当前的研究状况,寻找最有影响力的科研领域,发现学科优势。本文主要做了如下研究工作:1.提出了基于主题模型的机构研究状况分析的研究方法。该方法的主要流程为:首先对收集的SCI学术文献进行数据清洗得到主题建模的语料库;其次利用主题建模算法提取语料库的主题,然后进行文献聚类;最后将文献数据的其他维度信息与提取的主题进行数据融合,从不同角度对机构研究状况进行可视分析并做出预测。2.结合本文所提出的方法... 

【文章来源】:重庆邮电大学重庆市

【文章页数】:81 页

【学位级别】:硕士

【部分图文】:

基于主题模型的机构研究状况可视分析


学术数据中的引文可视化

框架图,学术,数据可视化,框架


重庆邮电大学硕士学位论文第1章绪论4可视化技术应用在学术数据中,使得研究人员在理解学术数据并加以利用就变得容易得多。例如,在学术数据中学术网络是它的研究中心[15],它可以帮助研究人员了解科学家之间如何相互作用,它还可以使研究人员能够挖掘隐藏在引文网络中的隐含关系,特别是在共引网络[16]中。在数据可视化工具中,CiteSpace[17,18]通过对科学信息研究所、中国社会科学院、中国国家知识基础设施的可视化,以及对其他文献数据库的分析,可以帮助跟踪研究领域的热点和趋势。它有助于研究人员了解研究前沿和关键途径、重要文献、作者和机构的演变。如图1.2总结了学术数据可视化的总体思路。本部分将介绍学术数据集中的实体以及如何实现它们的可视化。图1.2学术数据可视化框架1.文本内容学术数据中文本内容是它的核心组成部分,因为它记录了其主要的科学研究焦点。自然语言处理用于对文本内容多个部分进行编码,包括标题、摘要、文本主体和结论。一些以文本形式存储的信息可以自动提取,例如:文本内容中每个引用的原因,以及正在使用或者提出的技术概念。从多个文献的文本中提取结构信息,如流行的研究主题以及随时间的流行程度。由于自动分析文本本身就是一项困难的任务,所以很自然地要将人参与到分析循环中来指导分析。一些可视化方法直接

框架图,可视,文本,框架


重庆邮电大学硕士学位论文第2章可视分析技术与主题模型13第2章可视分析技术与主题模型本章主要介绍了基于可视分析技术和主题模型来分析机构学术数据所用到的技术和理论。学术数据属于非结构化数据,而主题模型通常用于处理此类数据,从中提取出有价值的信息。国内外的研究人员为了能够更好地表示学术数据集的结构,揭示数据中隐藏的模式,将各种可视分析技术相结合应用在学术数据可视化和可视分析中。可视分析技术和主题模型等文本数据挖掘方法的结合,与纯视觉呈现相比,能够分析更加复杂且大量的数据。学术数据可视化属于文本可视化的范围,图2.1展示了人们利用文本可视化系统对文本进行分析和理解的基本过程,其中主要部分包括以下3个方面:1.文本分析。文本分析就是对文本信息进行挖掘的过程。它主要依赖数据挖掘、自然语言处理等技术。根据用户需求对原始数据进行特征提娶分析、归一化和转换,把数据从其原始的非结构状态转换为结构化数据,可以由计算机灵活地对其进行处理以进行可视化呈现和交互。2.可视化呈现。运用可视化技术,以合适的视觉编码和布局方式呈现转换后的数据,以表示文本信息中的各种特征。3.交互。对同一个可视化结果,不同用户可能有不一样的感兴趣程度的部分,交互操作给用户提供可视化分析中探索和洞悉隐藏在文本信息背后的特征和规律的一种手段。图2.1文本可视化的基本框架[6]

【参考文献】:
期刊论文
[1]大数据可视分析综述[J]. 任磊,杜一,马帅,张小龙,戴国忠.  软件学报. 2014(09)
[2]基于主题的文本可视分析研究[J]. 巫英才,崔为炜,宋阳秋,陈杨,刘世霞.  计算机辅助设计与图形学学报. 2012(10)
[3]EM算法研究与应用[J]. 王爱平,张功营,刘方.  计算机技术与发展. 2009(09)
[4]信息可视化初探[J]. 赵刚,崔军.  晋图学刊. 2007(02)
[5]基于多层次信息的可视化研究[J]. 王非,赵强,唐定勇.  微计算机信息. 2006(19)

硕士论文
[1]大数据时代背景下的数据可视化概念研究[D]. 曾悠.浙江大学 2014



本文编号:2959694

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2959694.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9cbb5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com