当前位置:主页 > 经济论文 > 旅游经济论文 >

自然语言处理视角下分散化政策情报信息量化研究——以1986-2018年旅游交通政策演进为例

发布时间:2020-12-14 05:46
  [目的/意义]情报信息的分散化分布规律是情报活动的基石,一些交叉性、前沿性政策类情报文本,呈现明显分散化特征,探寻此类情报信息量化研究方法,具有重要学术意义和现实紧迫性。[方法/过程]该文利用自然语言处理方法(Natural Language Processing,NLP),对旅游交通政策这一交叉领域的分散化政策演进进行量化分析。[结果/结论]研究验证了该方法对分散化政策类情报信息分析的适用性。结果表明:基于规则的命名实体识别对政策总量与结构的分析显示,发文总量逐年上升,不同时期政策结构有所差异。基于规则和统计模型的命名实体识别对政策制定主体的分析显示,政策颁发机构数量呈起伏上升趋势,多部门参与局面渐显。基于词性和句法分析的政策内容演进显示:"事故"始终是政策内容的语义核心词;语义聚焦主题词演进兼具继承性和发展性。 

【文章来源】:情报杂志. 2020年08期 北大核心CSSCI

【文章页数】:9 页

【部分图文】:

自然语言处理视角下分散化政策情报信息量化研究——以1986-2018年旅游交通政策演进为例


语言单元与自然语言处理任务

政策,自然语言,文本,分析模型


综合运用基于规则和基于统计模型的命名实体识别方法,对政策文本中反映发文时间、政策类型、发文机构等的要素,进行识别和抽取。具体而言,利用Stanford CoreNLP中的命名实体识别分析任务[29],对“发文时间”“发文类型”“发文机构”等相关字符进行判别(见表1),从而实现对不同阶段中央和地方层面旅游交通政策的数量、结构、发文主体等基本属性的分析。表1 政策基本属性命名实体识别 要素 方法 规则/模型内容 发文时间 基于规则的命名实体识别方法 判别与发文时间相邻字段的词汇位置,获取发文时间 政策类型 基于规则的命名实体识别方法 包含法律、规定、条例、意见、办法、决定、公告、通知8个类型 发文机构 中央发文机构 基于规则的方法与基于统计模型的方法相结合 利用Stanford NER模型对组织机构名称识别难以识别的机构名称,补充判别 地方发文机构 利用Stanford NER模型对发文省份和组织机构名称识别难以识别的机构名称,补充判别

序列,示例,序列,单字


利用中文分词方法将“句子”语言单元切分为“词汇”语言单元,形成自然语言处理分析的基础模块。原始语句通过序列标注得到分词结果,如图3所示,选取旅游交通相关政策条文的分词序列标注作为示例。一般而言,一个字符在词语中的序列位置有4种:词首(B,Begin)、词中(M,Middle)、词尾(E,End)和单字词(S,Single)。一个词语应是以B开头、以E结尾,中间可能有M的标记,或是以单字词S标记[30]。第二,词性标注。

【参考文献】:
期刊论文
[1]新技术驱动的自然语言处理进展[J]. 王飞,陈立,易绵竹,谭新,张兴华.  武汉大学学报(工学版). 2018(08)
[2]基于自然语言处理技术的定题监测功能实现研究[J]. 刘巍,王思丽,祝忠明,吴志强.  图书与情报. 2018(03)
[3]共词分析识别研究热点的内容效度研究:基于自然语言处理[J]. 李承晋,高冲,周文杰.  图书与情报. 2018(01)
[4]自然语言处理中的深度学习:方法及应用[J]. 林奕欧,雷航,李晓瑜,吴佳.  电子科技大学学报. 2017(06)
[5]基于半监督CRF的跨领域中文分词[J]. 邓丽萍,罗智勇.  中文信息学报. 2017(04)
[6]美国一流智库在网络安全领域的研究成果分析——基于文本量化的视角[J]. 刘昊,张志强,田鹏伟,徐婧.  图书与情报. 2017(03)
[7]基于统计自然语言处理的央行货币政策研究[J]. 孔希希,程兵.  数学的实践与认识. 2017(07)
[8]跨学科协同信息行为模式及特征研究[J]. 叶艳,代君.  图书馆学研究. 2017(04)
[9]信息分散下的信息行为——基于国外图书情报学领域跨学科研究的回顾[J]. 马翠嫦,曹树金.  中国图书馆学报. 2014(01)
[10]自然语言处理中的一些宏观问题之我见[J]. 冯志伟.  中国外语. 2009(05)



本文编号:2915928

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/lyjj/2915928.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户45c2e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com