开源/免费工具比较及专利分析全流程解决方案研究
发布时间:2022-01-22 00:11
利用开源/免费工具进行信息分析对科研活动、教学实践等具有重要实践意义。文章从操作角度对专利分析进行维度划分,对主要开源/免费工具进行对比分析,从工具的功能、易用、重复性等角度,遴选OpenRefine、Bib Excel、Node XL、VOSviewer 4个免费工具嵌入专利分析全流程,尤其OpenRefine的引入解决了专利分析的数据清洗环节为利用开源工具实现专业专利分析奠定基础,并利用极紫外光刻技术实际案例加以论证。本文为需要进行专业专利信息分析的对象,如大规模教学实践、预算有限的情报机构、短期需求的科研人员等,提供一种全流程的解决方案。
【文章来源】:情报理论与实践. 2016,39(01)北大核心CSSCI
【文章页数】:5 页
【部分图文】:
专利分析流程
欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟信息系统图2免费工具嵌入专利分析全流程表1免费分析工具对比软件名称(免费)导入数据格式数据处理分析可视化是否开源BibExcelISI/Scopus等导出数据;XML/制表符分隔等格式归一化处理一维统计分析;二维统计分析;三维统计分析;共现分析(自定义);耦合分析(引文耦合、自定义耦合)利用Excel进行可视化;导出数据到NodeXL、Pajek、VOSviewer进行可视化否CitespaceWOS/PUBMED/NSFAwards等导出数据数据清洗部分一维统计分析;部分共现分析部分耦合分析;其他分析可视化分析是Leydesdorff系列Scopus/GoogleScholar/Google、WOS等导出数据;其他文本数据无部分一维统计分析;部分二维统计分析;部分共现分析;引文耦合分析可视化是NodeXLPajek/UCINET/Graph-yML等导出数据;Twitter/YouTube等网络数据无复杂网络分析可视化是NWBToolGraphML/XGMML/Pa-jek/NWB/Tree-ML/Sco-pus/NSF/WOS等导出数据;.CSV格式无部分共现分析;引文耦合分析;其他分析可视化是OpenRefineTSV/CSV/*SV/Excel/JSON/XML/RDF/GoogleDatadocuments等数据归一化;数据清洗;数据标引一维统计分析;二维统计分析;三维统计分析;复杂统计分析利用Excel进行可视化是Pajek.net/.vgr/.mat等格式无复杂网络分析可视化否ScienceofScienceToolGraphML/XGMML/Pa-jek/NWB/Tree-ML/Sco-pus/NSF/WOS等导出数据;.CSV格式无部分一维统计分析;部分二维统计分析;部分共现分析;部分耦合分析;其他分析可视化是VOSviewerPajek/WOS/Sc
393个,数据以制表符分割格式导出,当前大多免费数据库都支持该类格式导出。利用OpenRefine处理数据需要实现:①数据清洗;②根据Derwent导出数据情况提取专利的最早优先权年、优先国/地区、公开国/地区等特征单元信息;③技术功效标引。利用OpenRefine、BibExcel、Excel、NodeXL、VOSviewer等工具对极紫外光刻技术进行专利分析。专利申请时间分析(一维统计分析)主要是分析EU-VL技术领域专利数的年趋势,观察EUVL专利技术产出数量变化,通过BibExcel对最早优先权年进行一维统计分析并用Excel进行图表化后如图3所示。图3EUVL技术专利申请时间趋势技术生命周期(复杂统计分析)依据专利申请数量与专利申请人数随时间的消长,观察EUVL技术所处的技术生命周期阶段,统计的数据不仅有年度专利数量而且有年度专利申请人数量,通过OpenRefine时间和申请人共现来实现对年度申请人数量的统计,最后用Excel进行图表化后如图4所示。图4EUVL技术专利技术生命周期技术功效分析(二维统计分析)主要是将EUVL技术的技术手段与实现的技术功效构成矩阵,直观揭示技术密集区、空白区等,基于OpenRefine的技术功效标引,利用BibExcel实现技术手段、功效二维共现统计,最后在Ex-cel中进行透视表统计并图表化,如图5所示。图5EUVL专利技术功效分析·第39卷2016年第1期·—121—
【参考文献】:
期刊论文
[1]利用主题自动标引生成技术功效矩阵[J]. 王丽,张冬荣,张晓辉,杨小薇,吴鸣. 现代图书情报技术. 2013(05)
[2]国外知识图谱绘制的方法与工具分析[J]. 杨思洛,韩瑞珍. 图书情报知识. 2012(06)
本文编号:3601208
【文章来源】:情报理论与实践. 2016,39(01)北大核心CSSCI
【文章页数】:5 页
【部分图文】:
专利分析流程
欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟信息系统图2免费工具嵌入专利分析全流程表1免费分析工具对比软件名称(免费)导入数据格式数据处理分析可视化是否开源BibExcelISI/Scopus等导出数据;XML/制表符分隔等格式归一化处理一维统计分析;二维统计分析;三维统计分析;共现分析(自定义);耦合分析(引文耦合、自定义耦合)利用Excel进行可视化;导出数据到NodeXL、Pajek、VOSviewer进行可视化否CitespaceWOS/PUBMED/NSFAwards等导出数据数据清洗部分一维统计分析;部分共现分析部分耦合分析;其他分析可视化分析是Leydesdorff系列Scopus/GoogleScholar/Google、WOS等导出数据;其他文本数据无部分一维统计分析;部分二维统计分析;部分共现分析;引文耦合分析可视化是NodeXLPajek/UCINET/Graph-yML等导出数据;Twitter/YouTube等网络数据无复杂网络分析可视化是NWBToolGraphML/XGMML/Pa-jek/NWB/Tree-ML/Sco-pus/NSF/WOS等导出数据;.CSV格式无部分共现分析;引文耦合分析;其他分析可视化是OpenRefineTSV/CSV/*SV/Excel/JSON/XML/RDF/GoogleDatadocuments等数据归一化;数据清洗;数据标引一维统计分析;二维统计分析;三维统计分析;复杂统计分析利用Excel进行可视化是Pajek.net/.vgr/.mat等格式无复杂网络分析可视化否ScienceofScienceToolGraphML/XGMML/Pa-jek/NWB/Tree-ML/Sco-pus/NSF/WOS等导出数据;.CSV格式无部分一维统计分析;部分二维统计分析;部分共现分析;部分耦合分析;其他分析可视化是VOSviewerPajek/WOS/Sc
393个,数据以制表符分割格式导出,当前大多免费数据库都支持该类格式导出。利用OpenRefine处理数据需要实现:①数据清洗;②根据Derwent导出数据情况提取专利的最早优先权年、优先国/地区、公开国/地区等特征单元信息;③技术功效标引。利用OpenRefine、BibExcel、Excel、NodeXL、VOSviewer等工具对极紫外光刻技术进行专利分析。专利申请时间分析(一维统计分析)主要是分析EU-VL技术领域专利数的年趋势,观察EUVL专利技术产出数量变化,通过BibExcel对最早优先权年进行一维统计分析并用Excel进行图表化后如图3所示。图3EUVL技术专利申请时间趋势技术生命周期(复杂统计分析)依据专利申请数量与专利申请人数随时间的消长,观察EUVL技术所处的技术生命周期阶段,统计的数据不仅有年度专利数量而且有年度专利申请人数量,通过OpenRefine时间和申请人共现来实现对年度申请人数量的统计,最后用Excel进行图表化后如图4所示。图4EUVL技术专利技术生命周期技术功效分析(二维统计分析)主要是将EUVL技术的技术手段与实现的技术功效构成矩阵,直观揭示技术密集区、空白区等,基于OpenRefine的技术功效标引,利用BibExcel实现技术手段、功效二维共现统计,最后在Ex-cel中进行透视表统计并图表化,如图5所示。图5EUVL专利技术功效分析·第39卷2016年第1期·—121—
【参考文献】:
期刊论文
[1]利用主题自动标引生成技术功效矩阵[J]. 王丽,张冬荣,张晓辉,杨小薇,吴鸣. 现代图书情报技术. 2013(05)
[2]国外知识图谱绘制的方法与工具分析[J]. 杨思洛,韩瑞珍. 图书情报知识. 2012(06)
本文编号:3601208
本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/3601208.html