基于专利挖掘的关键共性技术识别研究
发布时间:2022-01-01 21:48
关键共性技术识别影响政府在不确定性市场环境中的资源投入及企业研发方向,制约制造业发展。如何准确识别关键共性技术是政府和企业急需解决的问题。本研究基于专利数据及LDA主题模型,提取隐含技术主题,选取高强度技术主题为研究对象,以技术共现率评估技术主题通用性,结合技术主题活跃度、效益性及关联性,识别共性技术。在此基础上,借鉴社会网络分析方法,以技术主题为节点,技术主题共现强度为边权,量化技术主题权利,筛选关键节点,识别关键共性技术。并以新材料领域为例进行研究,结果显示高性能铝合金制备、纳米粉末及其薄膜制备工艺、金属粉末的制备及应用、高强度高硬度陶瓷模具制备是新材料领域的关键共性技术。
【文章来源】:情报学报. 2020,39(10)北大核心CSSCICSCD
【文章页数】:11 页
【部分图文】:
关键共性技术识别思路
LDA主题模型能够反复迭代自发学习进化,识别大规模文档集中潜藏的主题信息,实现文档的高效聚类;与采用IPC分类号及德温特手工代码相比,更能识别隐藏的技术信息,摆脱技术种类属性限制,因此LDA主题模型作为本文首选。LDA主题模型作为新颖无监督机器学习方式,最早由Blei等[31]提出,其利用狄利克雷分布寻找主题在文档的分布以及词语在主题中的分布,以此描述文档形成过程。LDA主题模型通过限定主题个数来避免过度拟合,可高效提取技术主题,实现文档聚类。具体而言,形成文档的过程如图2所示。对于文档d,其技术主题z发生的概率θ服从Dirichlet (α)分布。
随着主题数的增加,困惑度(perplexity)不断下降,主题泛化能力加强。若A点为最优主题数,该点的困惑度与前一个点的困惑度差值极大,与后一个点的困惑度差值极小,则A点被称为“肘形”[41]。当主题数为71时,“主题数-困惑度”曲线出现肘形,为保证LDA主题模型主题数量精确性,对主题模型进行可视化,其中随机选择的主题数为65、80,相比于其他主题数量,当主题数量为71时可视化结果显示主题重叠度较小,分布于4个象限(图3),达到最佳主题数量。因此,将LDA主题模型主题参数Z设置为71,借鉴Heinrich[42]研究成果,设置参数α=50/Z,β=0.1。运用Python计算LDA主题模型,提取新材料领域技术主题及主题特征词。LDA主题模型运行后得到71个新材料领域的技术主题,技术主题与新材料技术领域密切相关,各技术主题区别明显,提取效果理想。LDA主题模型运算得到14896×142的“文档-主题”矩阵(表1)及71×20的“主题-特征词”矩阵(表2),鉴于数据量较大,仅对部分数据进行展示。
【参考文献】:
期刊论文
[1]基于LDA的国内图书馆学研究主题发现及演化研究[J]. 吴查科,王树义. 新世纪图书馆. 2019(07)
[2]基于专利信息的OLED技术创新网络演化研究[J]. 姜春林,贾龙川,张光耀. 情报杂志. 2019(08)
[3]基于LDA模型与ATM模型的学者影响力评价研究——以我国核物理学科为例[J]. 赵蓉英,戴祎璠,王旭. 情报科学. 2019(06)
[4]知识扩散视角下共性技术的商业化评价——基于多层网络的反向识别方法[J]. 朱桂龙,朱明晶,尹潇. 科学学与科学技术管理. 2019(02)
[5]基于LDA主题模型与链路预测的新兴主题关联机会发现研究[J]. 刘俊婉,龙志昕,王菲菲. 数据分析与知识发现. 2019(01)
[6]基于专利共类的关键技术识别及技术发展模式研究[J]. 李瑞茜,陈向东. 情报学报. 2018(05)
[7]制造范式升级期共性使能技术扩散的影响因素分析与实证研究[J]. 周源. 中国软科学. 2018(01)
[8]产学研合作对共性技术创新的影响效用研究[J]. 樊霞,黄妍,朱桂龙. 科研管理. 2018(01)
[9]GPS产业的共性技术识别、演进及其启示——基于专利分析[J]. 张鹏,杨艳君,宋丽雪. 技术经济. 2016(12)
[10]基于产业创新链的产业共性技术识别基本理论探讨[J]. 郑彦宁,浦墨,刘志辉. 情报理论与实践. 2016(09)
本文编号:3562902
【文章来源】:情报学报. 2020,39(10)北大核心CSSCICSCD
【文章页数】:11 页
【部分图文】:
关键共性技术识别思路
LDA主题模型能够反复迭代自发学习进化,识别大规模文档集中潜藏的主题信息,实现文档的高效聚类;与采用IPC分类号及德温特手工代码相比,更能识别隐藏的技术信息,摆脱技术种类属性限制,因此LDA主题模型作为本文首选。LDA主题模型作为新颖无监督机器学习方式,最早由Blei等[31]提出,其利用狄利克雷分布寻找主题在文档的分布以及词语在主题中的分布,以此描述文档形成过程。LDA主题模型通过限定主题个数来避免过度拟合,可高效提取技术主题,实现文档聚类。具体而言,形成文档的过程如图2所示。对于文档d,其技术主题z发生的概率θ服从Dirichlet (α)分布。
随着主题数的增加,困惑度(perplexity)不断下降,主题泛化能力加强。若A点为最优主题数,该点的困惑度与前一个点的困惑度差值极大,与后一个点的困惑度差值极小,则A点被称为“肘形”[41]。当主题数为71时,“主题数-困惑度”曲线出现肘形,为保证LDA主题模型主题数量精确性,对主题模型进行可视化,其中随机选择的主题数为65、80,相比于其他主题数量,当主题数量为71时可视化结果显示主题重叠度较小,分布于4个象限(图3),达到最佳主题数量。因此,将LDA主题模型主题参数Z设置为71,借鉴Heinrich[42]研究成果,设置参数α=50/Z,β=0.1。运用Python计算LDA主题模型,提取新材料领域技术主题及主题特征词。LDA主题模型运行后得到71个新材料领域的技术主题,技术主题与新材料技术领域密切相关,各技术主题区别明显,提取效果理想。LDA主题模型运算得到14896×142的“文档-主题”矩阵(表1)及71×20的“主题-特征词”矩阵(表2),鉴于数据量较大,仅对部分数据进行展示。
【参考文献】:
期刊论文
[1]基于LDA的国内图书馆学研究主题发现及演化研究[J]. 吴查科,王树义. 新世纪图书馆. 2019(07)
[2]基于专利信息的OLED技术创新网络演化研究[J]. 姜春林,贾龙川,张光耀. 情报杂志. 2019(08)
[3]基于LDA模型与ATM模型的学者影响力评价研究——以我国核物理学科为例[J]. 赵蓉英,戴祎璠,王旭. 情报科学. 2019(06)
[4]知识扩散视角下共性技术的商业化评价——基于多层网络的反向识别方法[J]. 朱桂龙,朱明晶,尹潇. 科学学与科学技术管理. 2019(02)
[5]基于LDA主题模型与链路预测的新兴主题关联机会发现研究[J]. 刘俊婉,龙志昕,王菲菲. 数据分析与知识发现. 2019(01)
[6]基于专利共类的关键技术识别及技术发展模式研究[J]. 李瑞茜,陈向东. 情报学报. 2018(05)
[7]制造范式升级期共性使能技术扩散的影响因素分析与实证研究[J]. 周源. 中国软科学. 2018(01)
[8]产学研合作对共性技术创新的影响效用研究[J]. 樊霞,黄妍,朱桂龙. 科研管理. 2018(01)
[9]GPS产业的共性技术识别、演进及其启示——基于专利分析[J]. 张鹏,杨艳君,宋丽雪. 技术经济. 2016(12)
[10]基于产业创新链的产业共性技术识别基本理论探讨[J]. 郑彦宁,浦墨,刘志辉. 情报理论与实践. 2016(09)
本文编号:3562902
本文链接:https://www.wllwen.com/jingjilunwen/jiliangjingjilunwen/3562902.html