当前位置:主页 > 科技论文 > 软件论文 >

基于语义网络和BOW模型的中文议题框架量化分析

发布时间:2021-08-06 21:02
  【目的/意义】在大数据和信息爆炸的背景下,为改善传统中文议题框架分析方法中信效度难以保证、分析效率低下等问题,本文提出基于语义网络和Bag-of–words(BOW)模型两种方法结合的量化模型。【方法/过程】该模型首先利用语义网络分析提取样本的议题框架种类和整体集群分布,然后利用BOW模型对每个分析单元进行议题量化统计分析。最后,以《人民日报》转基因相关报道文本为例,验证量化模型议题分析的可行性和有效性。【结果/结论】结果表明,该方法可高效完成分析,同时保证了议题框架分析的客观性。 

【文章来源】:情报科学. 2017,35(05)北大核心CSSCI

【文章页数】:6 页

【部分图文】:

基于语义网络和BOW模型的中文议题框架量化分析


语义网络分析逻辑基于恩特曼的观点——框架通过使用一系列特定的词【2】

量化分析模型,议题,框架


,不考虑语法结构和词序【14】。但是,在中文语境下,统计词频时要特别注意分词的精准性,因为中文词语由可独立存在的单字组成。本文将介绍如何利用语义网络分析提取框架、BOW模型对议题框架进行量化分析。2议题框架量化模型建构本文提出的议题框架量化模型(Quantitativemodelofissueframeanalysis)主要基于语义网络分析和BOW模型,是各阶段数据分析的定性和定量的结合,如图2所示。第一部分为基于语义网络提取整体样本的框架,第二部分利用BOW模型是提取每篇文本的框架,并进行统计。图2议题框架量化分析模型情报科学第35卷第5期2017年5月·业务研究·-101-

示意图,词语,矩阵,议题


拿芏龋???到裘艿慕诘慊?治??一集群,从而集群内的节点之间联系紧密程度要比与网络中其他节点的联系紧密程度要强【18】。最后,对每个集群的议题,进行编码,即可得整体样本的议题框架以及分布。2.2基于BOW模型的议题框架作为一个分析单元的文本可能同时包含几个议题框架,传统的框架分析倾向于给每个单元赋予一个议题,即使赋予同一篇单元多个议题框架,也无法精确到不同议题在同一单元中的比重。此处采用扩展的BOW模型【14】,对每个单元所含的议题框架进行精确统计,并大大提高分析效率。图3年份——词语矩阵示意图注:Y1到Yl表示年份(year);D1到Dm表示每篇文档(document);T1到Tn表示BOW模型中词语(term);C1到Ck表示聚类分析后有意义的集群(community);大括号表示包含的意思本研究中,我们在BOW模型基础上进行了改进和扩展,图3描述了此扩展的BOW模型。其中,T(term)表示语义网络中的词语,D(document)表示每篇文档,并定义在第i篇文章(Di)中第j个词(Tj)的值fij(Termscore):fij=wjFijNi(1)此处,wj(weightfactor,权重)表示Tj的权重(本研究中,所有语意网络中的词语经过词频筛选,权重设定为1);Fij表示Tj在Di中的词频;Ni表示Di的词数目。基于文档——词语矩阵以及年份与文档的从属关系,通过求和即可得到每年中不同议题的报道量。同样的思路,基于文档——词语矩阵以及集群与词语的从属关系,通过求和计算可得到每个集群中不同年份的报道量Spq,Spq=∑k=0nfij,Di∈Y

【参考文献】:
期刊论文
[1]微信公众平台的转基因新闻报道框架偏向性研究[J]. 褚建勋,纪娇娇,黄晟鹏.  情报科学. 2016(11)
[2]内容分析法在公共管理学研究中的应用[J]. 刘伟.  中国行政管理. 2014(06)
[3]社会网络分析在组织管理研究中的应用与展望[J]. 黎耀奇,谢礼珊.  管理学报. 2013(01)
[4]内容分析法在网络传播研究中的应用[J]. 范龙.  情报科学. 2010(06)



本文编号:3326483

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3326483.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f5ae9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com