基于改进LDA主题模型的中日美氢能产业链技术布局研究
【部分图文】:
和分类号等关键信息,并保存至本地以备后续研究使用。3.2数据处理3.2.1数据预处理在KNIME平台上对文献的题目与摘要进行分词、词性标注、提取名词与去燥处理等步骤,以保证结果的客观性和科学性。其中去噪处理主要包括:提取词干、限制最小字符(2字符)、去除标点与数字、去除例如描述性质词(如comprise,in-volves)、学术词汇(如advantage,method)以及一些本实验特有的、出现频率高但对结果没有意义的词语(如hydrogen)等词。数据处理流程如图3所示。图3数据预处理流程3.2.2技术词语境赋予在为聚类词提供产业链语义时,依据调研与专家咨询的基础上把氢能产业链分为氢能制备、氢能纯化、氢能储运与氢能应用,并确定利用IPC大组为所有专利赋予产业链语义,最后划分出来的结果得到氢能领域专家的认可。在为聚类词提供IPC语义时,选取专利的主IPC小类作为聚类词语义情景的限定。同时为了过程中的简易性以及结果展示的直观性,对数据涉及的IPC小类与产业链进行编码,部分编码分布如表1所示。3.2.3WIC-I-LDA主题挖掘本实验工具利用R语言的lda工具包,参数具体设置如下:alpha(docu-ment—topicassociations)=50/K(K为文档的主题数),beta(topic—termassociatios)=0.1,迭代次数为2000次。实验过程中,由于主题数目对聚类结构以及主题解读上产生影响,需人工调整,本文依据专家意见将主题数目划分为5~30类进行概率分析,选取各主题名词拥有最佳区分度和相对较高概率时的主题数作为主题个数。表1氢能领域IPC小类与产业链编码分布情况(部
续表2WIC-I-LDA主题模型下氢能领域主题分布主题内容Topic19:material03-86gas03-86fuel03-86carbon03-86metal03-86reaction03-86heat03-86compound03-86Topic20:alloy03-140material03-140metal03-140composition03-140magnesi-um03-140titanium03-140method03-140hydride03-140Topic21:water01-146electrode01-146gas01-146electrolysis01-146device01-146oxygen01-146power01-146electrolyte01-146注:主题内容栏中每个WIC-I主题词的结构为主题词-产业链编码—分类号编码分布3.2.4综合主题强度计算本文经过征询相关专家意见与讨论认为:主题下文档数量与文本概率两者相互补充,互为表里,因此赋予α与β的值为0.5。根据WIC-I-LDA模型提取的文档-主题概率分布,依据上文2.2模型介绍计算综合主题强度。三国在各产业链的综合主题强度如图4所示,产业链下三国在各技术主题的综合主题强度如图5所示。为动态比较产业链下三国在各技术主题的发展趋势,文章计算了各技术主题在时间切片上的综合主题强度:在时间切片上,考虑到氢能是新兴的能源领域,专利数据从2010年多了起来,故将2010年之前申请的专利数据作为一个时间切片,其他时间的专利数据按照每2年一个时间切片(见图6)。图4三国产业链的综合主题强度图5产业链下三国各技术主题的综合主题强度图6产业链下三国各技术主题在时间切片上的综合主题强度·28·情报杂志第38卷
续表2WIC-I-LDA主题模型下氢能领域主题分布主题内容Topic19:material03-86gas03-86fuel03-86carbon03-86metal03-86reaction03-86heat03-86compound03-86Topic20:alloy03-140material03-140metal03-140composition03-140magnesi-um03-140titanium03-140method03-140hydride03-140Topic21:water01-146electrode01-146gas01-146electrolysis01-146device01-146oxygen01-146power01-146electrolyte01-146注:主题内容栏中每个WIC-I主题词的结构为主题词-产业链编码—分类号编码分布3.2.4综合主题强度计算本文经过征询相关专家意见与讨论认为:主题下文档数量与文本概率两者相互补充,互为表里,因此赋予α与β的值为0.5。根据WIC-I-LDA模型提取的文档-主题概率分布,依据上文2.2模型介绍计算综合主题强度。三国在各产业链的综合主题强度如图4所示,产业链下三国在各技术主题的综合主题强度如图5所示。为动态比较产业链下三国在各技术主题的发展趋势,文章计算了各技术主题在时间切片上的综合主题强度:在时间切片上,考虑到氢能是新兴的能源领域,专利数据从2010年多了起来,故将2010年之前申请的专利数据作为一个时间切片,其他时间的专利数据按照每2年一个时间切片(见图6)。图4三国产业链的综合主题强度图5产业链下三国各技术主题的综合主题强度图6产业链下三国各技术主题在时间切片上的综合主题强度·28·情报杂志第38卷
【参考文献】
相关期刊论文 前3条
1 唐果媛;张薇;;基于共词分析法的学科主题演化研究进展与分析[J];图书情报工作;2015年05期
2 吴红;董坤;付秀颖;;中国燃料电池领域专利情报对比分析[J];情报杂志;2014年07期
3 潘颖;卢章平;;国内氢能源专利技术发展战略研究[J];情报杂志;2012年06期
【共引文献】
相关期刊论文 前3条
1 黄蕾;张鹿;;我国燃料电池技术专利有效性研究[J];情报杂志;2015年04期
2 张春博;沈喜玲;丁堃;;国内可替代能源专利情报分析——基于技术主题和专利权人的双重视角[J];情报杂志;2015年01期
3 张东方;;基于TRIZ对智能手机交互技术成熟度的预测[J];价值工程;2014年28期
【二级参考文献】
相关期刊论文 前10条
1 唐果媛;张薇;;国内外共词分析法研究的发展与分析[J];图书情报工作;2014年22期
2 蔡治东;虞荣娟;汤际澜;;知识图谱视野下我国体育志愿服务研究热点综述[J];体育科技;2014年01期
3 冯佳;张云秋;;国内泌尿生殖器肿瘤领域研究热点分析[J];医学信息学杂志;2014年01期
4 姜霖;王子朴;王晓虹;;基于CSSCI的体育人文社会学论文关键词分析[J];西南民族大学学报(人文社会科学版);2014年01期
5 徐棣枫;陈瑶;;中国专利促进政策的反思与调整——目标、机制、阶段性和开放性问题[J];重庆大学学报(社会科学版);2013年06期
6 樊霞;吴进;任畅翔;;基于共词分析的我国产学研研究的发展态势[J];科研管理;2013年09期
7 马晨峰;谷祖莎;沈君;;我国贸易与环境问题研究的文献计量分析——基于聚类和战略坐标方法的对比分析[J];科技管理研究;2013年17期
8 马海群;姜鑫;;我国档案学研究热点与前沿演进的知识图谱分析[J];档案学研究;2013年04期
9 侯元元;;三维专利技术生命周期模型构建与实证研究[J];情报杂志;2013年03期
10 吴明智;高硕;杨错;;基于关键词词频和g指数的高校图书馆学科服务研究热点分析[J];医学信息学杂志;2013年01期
【相似文献】
相关期刊论文 前10条
1 时玉丰;王飞;;各地争当氢能之都:大同、广州、成都……谁将率先走进氢的春天?[J];新能源经贸观察;2019年04期
2 陈梅芬;;加快四川省氢能产业发展[J];决策咨询;2019年03期
3 茹毅;苏丹;张明宇;黄孟阳;杨玺;张国莹;;云南培育发展氢能产业的对策建议[J];云南科技管理;2019年03期
4 袁华堂;;氢能:21世纪最重要的能源[J];国际学术动态;1998年12期
5 许帆婷;;氢能产业发展应当建立良好生态——访国际氢能协会副主席、清华大学核能与新能源技术研究院教授毛宗强[J];中国石化;2019年05期
6 赵旭;杨艳;高慧;;世界主要国家和能源企业加快氢能产业布局[J];中国石化;2019年05期
7 ;我国将研究制定氢能产业发展路线图[J];低温与特气;2018年05期
8 马曹冉;;日本政商学三方合力打造氢能社会[J];金融世界;2018年07期
9 胡文瑞;;氢能:梦想照进现实[J];中国石油石化;2010年06期
10 毛宗强;;东瀛归来话氢能——记中国氢能代表团成功访问日本[J];太阳能;2009年03期
本文编号:2875508
本文链接:https://www.wllwen.com/jingjilunwen/chanyejingjilunwen/2875508.html