《科学数据管理办法》语词分析
发布时间:2025-02-09 10:39
文章分析了《科学数据管理办法》的文本语词,有助于把握国家对科学数据管理的政策导向。文章对《科学数据管理办法》的文本内容进行分词、词频合并、词性筛选、虚词剔除等预处理操作,基于文本预处理结果筛选得出频繁词和热词,构建"语词—条款"共现矩阵并可视化展示。研究发现:《科学数据管理办法》共有11个核心频繁词、9个重点频繁词、8个主要频繁词和若干个一般频繁词,各主题语词在文本中均有对应的核心条款,但主题语词和核心条款分布不均。
【文章页数】:9 页
【部分图文】:
本文编号:4032094
【文章页数】:9 页
【部分图文】:
图1《办法》语词分析研究框架
按照上述思路,设计了本文的研究框架,如图1所示。图1中,虚词剔除及其之前的所有操作属于文本预处理阶段,频繁词判别、热词判别及其后续操作属于文本分析阶段,主题划分、条款编码及其后续操作属于主题关联分析阶段,文本分析和主题关联分析属于并列关系。
图2 各主题“语词-条款”关联网络
将各主题的“语词-条款”共现矩阵导入NetDraw软件绘制的共现网络图谱如图2所示。其中,各个圆点代表主题语词,方形代表相关条款,圆点与方形之间有连线则表示它们存在关联关系,线条数量越多,表明该语词与条款之间的关联关系越强[40]。图2各主题“语词-条款”关联网络
图2 各主题“语词-条款”关联网络
图2各主题“语词-条款”关联网络从图2可以看出各主题的关联关系存在显著差异。
本文编号:4032094
本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/4032094.html