信息系统领域热点研究主题演化及合作关系研究
【学位单位】:北京邮电大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:G353.1
【部分图文】:
对信息系统领域的研究进展贡献大。??1.4研究框架??研宄技术路线的框架如图1-1:??原始数据收集?..占(所有作者/机构)??国际顶级学术期刊在?:(去除失误和重复项,.?G印hi建立??5角定唯-ID)?边(所有合作关系)社交嶋??所有论文基本丨B息)??分析合作??网络图谱??文本数据预处理?/文档-关键人工判断??(去除标点、停用词、?词列表?丨主题实际意义?十日??词根处理等)??'文档-主题,/立姓士?:分析主题随时间的??LDA概率主题麵?概率矩阵?文档-±iE^配演化规律??图1-1技术路线??第一章为绪论。介绍本文的研宄背景和意义,包括信息系统的产生与发展,引出??研宂H标与意义以及研究内容,提出本文研宄的两个主要科学问题,总结出研究的技??术路线,介绍研究的方法,并指出研宄的创新点。??第二章为文献综述。主要对国内外关于信息系统领域主题与热点研究、概率主题??建模(LDA)以及社交网络分析法的研究现状进行总结与分析,从中归纳总结出对于??本研究具有参考和借鉴价值的内容。??第三章是数据对象介绍。介绍了数据对象的来源,数据的预处理以及后续借助模??型与软件进行分析时
也大幅度增加了人们在搜索、整理以及分析所需知识的难度。海量的文本信息导??致了基于主题的分层次统计模型的研究需求,在此背景下,产生了以LDA为代表的??概率主题模型M。它的发展史可以简单概括为三个阶段,如图1-2所示。??LSA?存在一词多?LDA??义等问题?过渡丨Ua?I??0?#?#??茳抑了咯维?引入?弓丨入Dirichlet??概率统计学先验分布??图1-2?LDA的发展??概率栏题模型的前身可以追溯到潜在语义分析(Latent?Semantic?Analysis,?LSA),??它将文本表示为低维潜在语义空间的语义向量w。这是?种创新地引入了语义维度、??实现了将原始的高维词空间映射到低维的潜在i/丨义空间成'K题空间,从而挖掘文本潜??在的语义结构的方法。但是LSA在降维过程可能带来分类受损问题,此外还存在无??法处理“?一词多义”等问题。??针对这些缺点,?夫曼提出了一种基于吋靠的概率统计学的新方法,叫做概率潜??在语义分析(Probabilistic?Latent?Semantic?Analysis,PLSA)?也就是以统计学的角??度考虑LSA。两者的区别在标准潜在语义分析(LSA)的表现形式是共现矩阵的??奇异值分解,而概率潜在语义分析则是基于派生自LCM的混合矩阵分解。简单地说,??LSA中一个语义维度对应的是-?个特征向量,而PLSA中?个语义维度对应的是?个??词典上的概率分布。PLSA的优点包括可以区分单词使用的不同意思和不同类型
LDA是一种非监督学习的方法,rT以用来识别大规模文档集(document?collection)??或语料库(corpus)中潜藏的主题信息[9]。它是一个分层的贝叶斯模型,有文档、主??题和词三个层次,如图1-3所示。其中,每一个文档由多个隐含的主题按照一定概率??组成,而每一个主题又可以根据一定概率由文档中的多个词语进行表示[1°]。??文裆丨)?主题T?間语W???1?I?1:?':'?If-I?词激.I??t?^?‘?......?‘??-n?1?mh?^?|?邱驭?|??图1-3文档-主题-词语关系[1。]??通过LDA建模方法,对输入的文本内容进行主题抽取,可以得到对应的两个概??率分布:主题一词多项式分布巾,以及文档一主题多项式分布0。主题一词分布0可??以获得每个潜在主题的结构,这种结构由每个支持该主题的词的概率值来表示,概率??值越大,代表该词与主题的关联程度越大,通过主题一词分布可以实现主题层面的数??值计算,比如主题信息的熵计算、主题间的相似度度量等;而文档一主题分布则可以??获得每一t主题F的文档支撑度(也就是在该主题下的文档的条件概率值),该值越??大表明对应的文档与主题的关联程度越大
【相似文献】
相关期刊论文 前10条
1 ;省汽车站车辆进站系统正式运行[J];广东交通;2010年02期
2 南中;;信息系统建设审计中应注意的几个问题[J];工业审计与会计;2007年01期
3 黄琦;彭武;;智慧与智慧信息系统[J];中国电子科学研究院学报;2018年06期
4 豆华;刘珂羽;张建龙;;有效利用信息系统提高企业竞争力[J];信息记录材料;2018年12期
5 裘昱;潘登;;信息系统建设中数据工程作用浅析[J];电脑知识与技术;2019年01期
6 谢栋梁;李文源;谭剑;黄煌镜;;基于微信小程序的健康小屋信息系统设计与实现[J];数字通信世界;2019年03期
7 关存云;;浅谈数字化信息系统与物理教学的有效整合[J];课程教育研究;2019年17期
8 田琛;;试析医院计算机信息存在的问题及对策[J];现代经济信息;2017年22期
9 王海洋;;社会保险业务一体化信息系统之档案管理子系统初探[J];中国管理信息化;2017年19期
10 杨晓磊;;智能化煤矿信息系统建设关键技术分析[J];山西能源学院学报;2017年04期
相关博士学位论文 前10条
1 沈张帆;基于复杂信息系统的界面辅助设计软件架构及核心功能模块研究[D];东南大学;2018年
2 余梅;基于失败风险视角的政府信息系统质量控制研究[D];武汉大学;2015年
3 王姣;组织间信息系统协同形成机理研究[D];吉林大学;2008年
4 吕苗荣;信息提取与矿山信息系统的研究开发[D];中南大学;2003年
5 阎志华;虚拟企业信息系统若干关键技术研究[D];南京航空航天大学;2005年
6 梁爱民;大型信息系统柔性体系框架多簇理论研究[D];铁道部科学研究院;2004年
7 党毅;中国保健食品的整理研究及信息系统的建立[D];中国协和医科大学;1999年
8 罗伟其;信息大系统的综合集成方法研究与应用[D];华南理工大学;2000年
9 谷勇浩;信息系统风险管理理论及关键技术研究[D];北京邮电大学;2007年
10 胡勇;网络信息系统风险评估方法研究[D];四川大学;2007年
相关硕士学位论文 前10条
1 吕彤晖;信息系统领域热点研究主题演化及合作关系研究[D];北京邮电大学;2019年
2 徐亚平;铁路信息系统虚拟化可用性技术研究和实现[D];中国铁道科学研究院;2018年
3 龚图南;示能性视角下自助医疗服务信息系统采纳研究[D];昆明理工大学;2018年
4 陈李沁;数字化信息系统辅助中学物理实验教学中的应用研究[D];四川师范大学;2018年
5 邢兆瀚;吉林省福彩中心信息系统运维管理研究[D];吉林大学;2018年
6 爱丽(Momina Mohamed Ali);信息系统和决策对吉布提银行组织的绩效的影响[D];首都经济贸易大学;2018年
7 苏林;基于智慧水务的呼和浩特市供排水信息系统改进[D];内蒙古大学;2018年
8 戴靖钰;某物流公司仓储管理信息系统的设计与实现[D];厦门大学;2017年
9 黄毅松;基于认知理论的SaaS信息系统用户体验设计与研究[D];湖南大学;2018年
10 刘永瑞;高校党风廉政建设信息系统的设计与实现[D];湖南大学;2018年
本文编号:2835844
本文链接:https://www.wllwen.com/tushudanganlunwen/2835844.html