专利视角下融合多属性的技术创新主题挖掘方法——以芯片领域专利为例
发布时间:2021-01-12 03:01
[目的/意义]使用融合多属性的量化方法,快速且有效地挖掘出领域内多个技术创新主题,为技术创新方向的确定提供借鉴。[方法/过程]将LDA(Latent Dirichlet Allocation)主题模型与专利价值评价指标相结合,提出一种挖掘技术创新主题的量化方法。首先,综合运用TF-IDF、困惑度和四分位数法构建领域专利的LDA主题模型。然后,利用LDA输出的概率分布矩阵,结合专利价值评价指标(权利要求和IPC),构建量化指标体系。接着,选取芯片专利进行验证实验,计算量化指标并运用热力图对其可视化,识别出技术创新主题。最后,基于专利、LDA的输出矩阵、创新主题和量化指标之间的映射关系,进行专利筛选和技术创新主题的合理标记。[结果/结论]通过邀请微电子领域专家和参考最新国内外芯片技术两种方式对实验结果进行评估,结果表明:融合多属性的领域技术创新主题挖掘方法能够快速且有效地挖掘出多个技术创新主题,在实践层面可以更好地为相关领域企业和科技工作者发现技术创新主题提供思路。
【文章来源】:图书情报工作. 2020,64(11)北大核心CSSCI
【文章页数】:12 页
【部分图文】:
CTM和CTS
其一,提取技术创新主题专利文档。首先将5个技术创新主题在LDA生成的文档-主题矩阵中对应的部分构成一个新的文档-创新主题矩阵,建立语料库与新矩阵的映射关系,提取出符合条件的专利文档。由于符合条件的专利文档数量较大,设置不同阈值选取专利文档,依次将新矩阵中的概率值保留两位小数、一位小数和不保留小数,以创新主题Topic-5为例提取到专利文档数量分别是5 284、3 256和122,其他4个主题呈现相同的递减规律。经过讨论确定使用不保留小数的矩阵生成布尔索引与语料库映射提取合理数量的专利文档,Topic-5、Topic-8、Topic-25、Topic-27、Topic-28这5个创新主题对应文档数量分别是122、87、121、134、165。表10 技术主题创新度排序 序号 技术主题 技术主题创新度(TI) 序号 技术主题 技术主题创新度(TI) 1 Topic-5 157.66 17 Topic-4 26.57 2 Topic-27 125.14 18 Topic-29 24.38 3 Topic-25 78.08 19 Topic-20 23.17 4 Topic-28 74.75 20 Topic-10 22.52 5 Topic-8 72.43 21 Topic-17 21.56 6 Topic-1 70.36 22 Topic-22 21.55 7 Topic-14 69.90 23 Topic-15 21.34 8 Topic-3 69.72 24 Topic-9 20.04 9 Topic-16 45.53 25 Topic-19 17.44 10 Topic-26 39.78 26 Topic-7 17.19 11 Topic-12 39.20 27 Topic-2 17.15 12 Topic-18 35.64 28 Topic-30 16.95 13 Topic-13 34.81 29 Topic-31 14.34 14 Topic-6 30.50 30 Topic-23 13.70 15 Topic-21 29.88 31 Topic-24 6.56 16 Topic-11 26.95
由于领域内的技术主题在一定程度上相互交叉重叠[34],拟定的技术创新主题也存在一定程度的重叠,单独评分并不符合有效性的准则,专家通过对拟定的技术创新主题进行整合,从整体上对主题进行评分。共邀请了5名微电子领域的专家,他们在芯片技术创新领域具有专业知识和丰富经验。具体评分规则为:1到10分代表技术创新主题的质量由低到高,技术创新主题的质量评分综合3个方面考量:技术价值、创新价值和应用价值,每位微电子专家都对5个拟定的技术创新主题给出自己专业的评判,最后评分如图6 所示,评分统计结果见表14。3.6.2 最新国内外芯片技术研究
【参考文献】:
期刊论文
[1]国内外芯片产业技术现状与趋势分析[J]. 张百尚,商惠敏. 科技管理研究. 2019(17)
[2]专利、技术创新与经济增长——一个综述[J]. 温军,张森. 华东经济管理. 2019(08)
[3]2018年全球半导体领域规划与发展态势分析[J]. 王立娜,唐川,房俊民,张娟,田倩飞,徐婧. 世界科技研究与发展. 2019(02)
[4]一种基于词加权LDA模型的专利文献分类方法[J]. 孙伟,刘文静,葛丽阁,余璇. 计算机技术与发展. 2019(03)
[5]基于改进PageRank算法的核心专利发现研究[J]. 张欣,马瑞敏. 图书情报工作. 2018(10)
[6]基于LDA和战略坐标的专利技术主题分析——以石墨烯领域为例[J]. 伊惠芳,吴红,马永新,冀方燕. 情报杂志. 2018(05)
[7]专利技术信息挖掘研究进展[J]. 赵阳,文庭孝. 图书馆. 2018(04)
[8]高职软件专业学生职业素养量化评价[J]. 温颖,周昕,赵文明. 计算机工程与设计. 2017(09)
[9]LDA模型在专利文本分类中的应用[J]. 廖列法,勒孚刚,朱亚兰. 现代情报. 2017(03)
[10]专利技术主题分析:基于SAO结构的LDA主题模型方法[J]. 杨超,朱东华,汪雪锋,朱福进,衡晓帆. 图书情报工作. 2017(03)
本文编号:2972008
【文章来源】:图书情报工作. 2020,64(11)北大核心CSSCI
【文章页数】:12 页
【部分图文】:
CTM和CTS
其一,提取技术创新主题专利文档。首先将5个技术创新主题在LDA生成的文档-主题矩阵中对应的部分构成一个新的文档-创新主题矩阵,建立语料库与新矩阵的映射关系,提取出符合条件的专利文档。由于符合条件的专利文档数量较大,设置不同阈值选取专利文档,依次将新矩阵中的概率值保留两位小数、一位小数和不保留小数,以创新主题Topic-5为例提取到专利文档数量分别是5 284、3 256和122,其他4个主题呈现相同的递减规律。经过讨论确定使用不保留小数的矩阵生成布尔索引与语料库映射提取合理数量的专利文档,Topic-5、Topic-8、Topic-25、Topic-27、Topic-28这5个创新主题对应文档数量分别是122、87、121、134、165。表10 技术主题创新度排序 序号 技术主题 技术主题创新度(TI) 序号 技术主题 技术主题创新度(TI) 1 Topic-5 157.66 17 Topic-4 26.57 2 Topic-27 125.14 18 Topic-29 24.38 3 Topic-25 78.08 19 Topic-20 23.17 4 Topic-28 74.75 20 Topic-10 22.52 5 Topic-8 72.43 21 Topic-17 21.56 6 Topic-1 70.36 22 Topic-22 21.55 7 Topic-14 69.90 23 Topic-15 21.34 8 Topic-3 69.72 24 Topic-9 20.04 9 Topic-16 45.53 25 Topic-19 17.44 10 Topic-26 39.78 26 Topic-7 17.19 11 Topic-12 39.20 27 Topic-2 17.15 12 Topic-18 35.64 28 Topic-30 16.95 13 Topic-13 34.81 29 Topic-31 14.34 14 Topic-6 30.50 30 Topic-23 13.70 15 Topic-21 29.88 31 Topic-24 6.56 16 Topic-11 26.95
由于领域内的技术主题在一定程度上相互交叉重叠[34],拟定的技术创新主题也存在一定程度的重叠,单独评分并不符合有效性的准则,专家通过对拟定的技术创新主题进行整合,从整体上对主题进行评分。共邀请了5名微电子领域的专家,他们在芯片技术创新领域具有专业知识和丰富经验。具体评分规则为:1到10分代表技术创新主题的质量由低到高,技术创新主题的质量评分综合3个方面考量:技术价值、创新价值和应用价值,每位微电子专家都对5个拟定的技术创新主题给出自己专业的评判,最后评分如图6 所示,评分统计结果见表14。3.6.2 最新国内外芯片技术研究
【参考文献】:
期刊论文
[1]国内外芯片产业技术现状与趋势分析[J]. 张百尚,商惠敏. 科技管理研究. 2019(17)
[2]专利、技术创新与经济增长——一个综述[J]. 温军,张森. 华东经济管理. 2019(08)
[3]2018年全球半导体领域规划与发展态势分析[J]. 王立娜,唐川,房俊民,张娟,田倩飞,徐婧. 世界科技研究与发展. 2019(02)
[4]一种基于词加权LDA模型的专利文献分类方法[J]. 孙伟,刘文静,葛丽阁,余璇. 计算机技术与发展. 2019(03)
[5]基于改进PageRank算法的核心专利发现研究[J]. 张欣,马瑞敏. 图书情报工作. 2018(10)
[6]基于LDA和战略坐标的专利技术主题分析——以石墨烯领域为例[J]. 伊惠芳,吴红,马永新,冀方燕. 情报杂志. 2018(05)
[7]专利技术信息挖掘研究进展[J]. 赵阳,文庭孝. 图书馆. 2018(04)
[8]高职软件专业学生职业素养量化评价[J]. 温颖,周昕,赵文明. 计算机工程与设计. 2017(09)
[9]LDA模型在专利文本分类中的应用[J]. 廖列法,勒孚刚,朱亚兰. 现代情报. 2017(03)
[10]专利技术主题分析:基于SAO结构的LDA主题模型方法[J]. 杨超,朱东华,汪雪锋,朱福进,衡晓帆. 图书情报工作. 2017(03)
本文编号:2972008
本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/2972008.html