词频分析方法在“热点”类文章中的应用研究
发布时间:2020-03-29 20:43
【摘要】:文献中的关键词和主题词是文献核心内容的浓缩与提炼,在相同或相近的研究领域中,相同的关键词和主题词会反复出现;因此某一研究领域中热点可以通过文献库中反复出现的关键词或主题词来确定,重复次数越高则越可能是领域研究重点。在科学研究中,研究者们常通过统计表达文献核心内容的关键词或主题词在总样本中的出现频次来确定此领域的研究重点和发展动向;词频分析方法也随之成为了研究者们最常用的文献分析方法之一。目前我国学界围绕词频分析方法进行的研究大致可以分为两类:一类是对词频分析方法本身的研究与完善,即从词频分析的对象词选词策略、高频词选取方法等方面对词频分析方法进行方法论层面的改进和完善;另一类是关于词频分析方法的应用研究,即通过词频分析的方法用对确定某特定研究领域的研究热点。研究者可能同时利用词频分析或其他内容分析方法,如多维尺度、共词聚类、因子碎石等一同用于研究热点主题的探析,加深对研究主题的理解。对比之下此类词频分析方法的应用文章的数量远远高于前者。由于词频分析方法是基于对客观数据的统计分析结果,对研究问题进行分析,具有较高的可信性和准确性,因而被广泛应用在领域现状分析、研究主题与发展趋势分析、热点探析等方面。现今,词频分析方法在被学界更普遍的应用、为学者提供更简单的数据处理方法的同时,也在一定程度上为词频分析方法在应用过程中带来了一些新的问题。本研究以我国“词频—热点”类文章作为分析对象,进行抽样统计,并从内容分析的角度探讨此类文章的发展现状、所采用的主要研究方法及其方法的演变规律等。本文通过提取样本文献的数据,归纳总结出我国“词频—热点”类文章常用的三类高频词选取方法,并对其中三种最主要的高频词选取方法进行对比实验,总结出现阶段我国高频词选取存在明显的主观性过强、所用方法原理不明、套用高低词频界定公式和普莱斯公式适用性待定等问题。以时间顺序,将“词频—热点”类文章所用研究方法的演变过程划分为两大阶段,详细整理了其不同阶段的写作模式的变化及特点,并指出现今存在写作模式固化的问题。通过梳理和横向对比了我国“词频—热点”类文章在不同学科之间的传播扩散过程,总结出其跨学科扩散的特点、范围和扩散速率的变化等问题。由此总结出我国“词频—热点”类文章普遍存在重实践、轻理论的问题,无论从方法应用的选择和应用过程,还是从对应用方法后的数据处理与分析上均可体现。希望通过本文的梳理和分析,能够为我国“词频—热点”类文章的后续发展和研究提供些许有益的方向,促进此类型文章和研究良性发展。
【图文】:
图 2-1 2008 年以后的年发文量及文献类型分布图同中文文献的基本情况一样,国外的“词频—热点”类文章也呈现出了基本相同的增长特征。外文“词频—热点”类文章自 2008 年后,也进入到了一种较为快速的发展状态,2012年以后此类文献的年均发文量超过10篇。但不同的是,在 2013 年到达一次峰值以后,“词频—热点”类文章连续 2 年发文量呈明显下降趋势。而会议论文类型发文数量最多的一年在 2013 年,在 16 篇样本文献中,有4 篇为会议论文。在 2014 年进入稳定发展阶段以后,“词频—热点”类文章的发文量于 2016 年再次到达峰值,但与之前不同的是,学术会议的关注度有所下降,仅为 1 篇;而期刊论文则占据了主要发文类型。2.2 发文机构统计为更好地总结出我国“词频—热点”类文章的主要研究力量,笔者提取了1199 篇中文文献样本的作者,以及其隶属机构,予以分类统计,现列出排名前
图 2-3 发文机构分布图由图 2-3 可以看出,,国内进行领域热点分析的主要力量来自武汉大学学院,其次是浙江树人大学、南京大学、大连理工大学和天津大学。另外,笔者总结了机构之间的合作情况如图,发现 70%的“词频—热章没有进行机构之间的合作,都是由本机构内部的人员独立或合力完成%的是采用机构合作形式共同完成的,但其中 8%的文献属于同机构合一个上级机构下设的不同附属部门之间的合作;而另有 22%的文献是跨完成的,详见图 2-4:02
【学位授予单位】:东北师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:G353.1
本文编号:2606493
【图文】:
图 2-1 2008 年以后的年发文量及文献类型分布图同中文文献的基本情况一样,国外的“词频—热点”类文章也呈现出了基本相同的增长特征。外文“词频—热点”类文章自 2008 年后,也进入到了一种较为快速的发展状态,2012年以后此类文献的年均发文量超过10篇。但不同的是,在 2013 年到达一次峰值以后,“词频—热点”类文章连续 2 年发文量呈明显下降趋势。而会议论文类型发文数量最多的一年在 2013 年,在 16 篇样本文献中,有4 篇为会议论文。在 2014 年进入稳定发展阶段以后,“词频—热点”类文章的发文量于 2016 年再次到达峰值,但与之前不同的是,学术会议的关注度有所下降,仅为 1 篇;而期刊论文则占据了主要发文类型。2.2 发文机构统计为更好地总结出我国“词频—热点”类文章的主要研究力量,笔者提取了1199 篇中文文献样本的作者,以及其隶属机构,予以分类统计,现列出排名前
图 2-3 发文机构分布图由图 2-3 可以看出,,国内进行领域热点分析的主要力量来自武汉大学学院,其次是浙江树人大学、南京大学、大连理工大学和天津大学。另外,笔者总结了机构之间的合作情况如图,发现 70%的“词频—热章没有进行机构之间的合作,都是由本机构内部的人员独立或合力完成%的是采用机构合作形式共同完成的,但其中 8%的文献属于同机构合一个上级机构下设的不同附属部门之间的合作;而另有 22%的文献是跨完成的,详见图 2-4:02
【学位授予单位】:东北师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:G353.1
【参考文献】
相关期刊论文 前10条
1 熊回香;杨雪萍;;社会化标注系统中的个性化信息推荐研究[J];情报学报;2016年05期
2 巴志超;李纲;朱世伟;;共现分析中的关键词选择与语义度量方法研究[J];情报学报;2016年02期
3 郑秀花;;中国传统经典家训词频统计与分析[J];图书情报知识;2015年03期
4 姚小娇;;我国财经类高校近10年图书情报学研究热点分析[J];图书馆学刊;2015年02期
5 安兴茹;;基于正态分布的词频分析法高频词阈值研究[J];情报杂志;2014年10期
6 杨建林;;关键词选择策略及其对共词分析的影响[J];情报学报;2014年10期
7 唐晓波;肖璐;;融合关键词增补与领域本体的共词分析方法研究[J];现代图书情报技术;2013年11期
8 任红娟;;一种内容和引用特征融合的知识结构划分方法研究[J];中国图书馆学报;2013年05期
9 柯平;朱明;闫娜;;国外图书馆管理研究述评[J];中国图书馆学报;2013年05期
10 杨爱青;马秀峰;张风燕;薛卫双;;g指数在共词分析主题词选取中的应用研究[J];情报杂志;2012年02期
本文编号:2606493
本文链接:https://www.wllwen.com/tushudanganlunwen/2606493.html