基于引文网络的专利自动推荐关键技术研究
发布时间:2021-04-04 13:07
在十九大报告中强调要坚定实施创新驱动发展战略,加快建设创新型国家,而作为集经济性、法律性以及技术性为一体的专利文献是实现创新驱动战略的重要支撑之一,另外,专利是先进科技信息的承载体,因此对于专利信息的分析是国家和企业实施创新驱动发展的第一助力,有利于国家和企业不断提高自身“软件”实力和创新能力,以及进行产业布局和技术管理。但随着海量的专利数据的出现,如何从中快速识别核心技术和新兴技术是国家和企业急需解决的问题。本文基于引文网络分别从核心技术领域识别、核心专利识别以及新兴领域发现进行专利自动推荐关键技术研究。首先将专利按照IPC分类号的部进行划分,获得技术领域之间的有向连接图,然后计算各领域内所含专利的被引次数之和作为权威因子矩阵,同时计算各领域在引用网络中的中介中心性构建中介因子矩阵,最后将这两个矩阵带入Page Rank算法中,获得核心技术领域识别算法即PBR算法。其次,本文基于Page Rank算法,考虑专利的连接属性(被引次数、专利年龄)和自身属性(同族专利数量、权利要求数量),引入了入度占比因子、时间因子、同族专利因子和权利因子,提出了改进的Page Rank算法即PPR算法。...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
最大连通子图
哈尔滨工业大学应用统计硕士专业学位论文-31-图5-1最大连通子图5.2基于PBR算法的核心技术领域自动推荐技术本节将IPC分类号属性引入所获得的最大连通子图中,然后按照IPC分类号的部对专利进行划分,可以发现,当前引文网络可以被划分到7个部中,分别为A部、B部、C部、E部、F部、H部以及G部。图5-2带有IPC属性的引文网络图5.2.1参数计算—确定权重本文应用熵权法计算PBR算法加入的两个因子矩阵的权重参数1和2.熵权法是一种客观赋权算法,不受主观因素影响,若某个指标的变异程度越大,则对应的信息熵就越小,那么可以表明该指标含有的信息量也越多,换句话说该指标在评价中具有较大的作用。因此指标的信息熵越小,则权重也就越大,反之则权
哈尔滨工业大学应用统计硕士专业学位论文-33-排名的相关系数虽然为0.75,但是没有通过显著性检验,其次,中介中心性排名结果与PBR算法排名结果相一致,说明PBR算法相比于PR算法充分考虑了被引次数和中介中心性对识别核心技术领域的重要性,具有优势性。本文依据PBR算法所获得的的排名结果见表5-2,由表5-2可以发现PBR排名与PR排名相差较大的领域就是F部,F部为机械工程、照明、加热、武器、爆破领域,可以看出该领域的专利在引文网络中被引次数较高,可以在7个领域中排名第三,说明F部技术领域是航空、航天器设备制造业中较重要专利,其次F部在技术领域引用网络中的中介中心性为0.17,排名第二,说明该技术领域是较为基础的关键领域。因此说明PBR算法相比于PR算法可以挖掘出行业内较为关键的基础领域。表5-2PBR排名表IPC分类号PBR排名PR排名被引次数中介中心性B1117080.27F253580.17G32370.1H433730.03E54160.03A66280C7700本文还绘制了各技术领域对应的PBR值和PR值的折线图,见图5-3。由图5-3可以发现,PBR值的极差大于PR值的极差,在最开始分值相差较大,但随着排名靠后,分值也逐渐接近,则说明PBR算法比PR算法的结果更具有差异性,可以更好的筛选出核心技术领域。图5-3PBR值和PR值得分对比图
【参考文献】:
期刊论文
[1]基于加权流量介数中心性的路网脆弱性分析——以无锡市为例[J]. 杜佳昕,张丰,杜震洪,刘仁义. 浙江大学学报(理学版). 2020(02)
[2]网络节点中心性与均衡性结合的作者网络特征分析[J]. 马蒙,李秀霞. 情报科学. 2020(03)
[3]基于节点亲密度的标签传播重叠社区发现算法[J]. 梁世娇,柴争义. 云南大学学报(自然科学版). 2020(01)
[4]基于小世界网络特性的核心技术识别研究——以石墨烯为例[J]. 戚筠,唐恒,石俊国. 情报杂志. 2020(02)
[5]基于专利的两阶段新兴技术识别研究——以图像识别技术为例[J]. 罗建,蔡丽君,史敏. 情报科学. 2019(12)
[6]基于多维度专利指标分析的优势技术领域识别研究[J]. 汪庆,朱钦磊,杨芳. 情报杂志. 2020(01)
[7]基于专利引文网络的智能物流技术演进路径研究[J]. 曹蕾,来尧静. 物流技术与应用. 2019(10)
[8]基于PageRank的论文引用网络关系挖掘[J]. 金洁,徐岳皓,刘振宇. 中国电子科学研究院学报. 2019(09)
[9]基于专利分析的食品行业技术创新研究[J]. 吴素春,胡青枝,王纯阳. 湖北农业科学. 2019(15)
[10]新兴技术概念辨析及其识别方法研究进展[J]. 周萌,朱相丽. 情报理论与实践. 2019(10)
博士论文
[1]若干社区发现算法研究[D]. 潘磊.南京大学 2014
硕士论文
[1]基于合作与引文网络的学者学术影响力评价研究[D]. 刘凯玉.山东师范大学 2019
[2]基于专利引文的人工智能领域科学-技术关联分析[D]. 郜梦蕊.南京大学 2019
[3]基于中心边选择的重叠社区发现算法研究[D]. 张方.吉林大学 2019
[4]网络中心性、进出口与国际碳排放研究[D]. 徐绍婷.浙江工商大学 2019
[5]核心专利识别综合价值模型的构建及实证研究[D]. 亢川博.吉林大学 2018
[6]基于文本向量表示学习的引文推荐方法研究[D]. 李飞.西北农林科技大学 2018
[7]基于引文网络的核心专利发现研究[D]. 张欣.山西大学 2017
[8]基于引文网络的文献在线推荐系统研究和实现[D]. 马丙超.大连理工大学 2016
[9]基于专利引文网络的技术科学图谱分析[D]. 裴艳林.北京邮电大学 2016
[10]基于多因素的引文推荐策略研究[D]. 石杰.东北大学 2011
本文编号:3118090
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
最大连通子图
哈尔滨工业大学应用统计硕士专业学位论文-31-图5-1最大连通子图5.2基于PBR算法的核心技术领域自动推荐技术本节将IPC分类号属性引入所获得的最大连通子图中,然后按照IPC分类号的部对专利进行划分,可以发现,当前引文网络可以被划分到7个部中,分别为A部、B部、C部、E部、F部、H部以及G部。图5-2带有IPC属性的引文网络图5.2.1参数计算—确定权重本文应用熵权法计算PBR算法加入的两个因子矩阵的权重参数1和2.熵权法是一种客观赋权算法,不受主观因素影响,若某个指标的变异程度越大,则对应的信息熵就越小,那么可以表明该指标含有的信息量也越多,换句话说该指标在评价中具有较大的作用。因此指标的信息熵越小,则权重也就越大,反之则权
哈尔滨工业大学应用统计硕士专业学位论文-33-排名的相关系数虽然为0.75,但是没有通过显著性检验,其次,中介中心性排名结果与PBR算法排名结果相一致,说明PBR算法相比于PR算法充分考虑了被引次数和中介中心性对识别核心技术领域的重要性,具有优势性。本文依据PBR算法所获得的的排名结果见表5-2,由表5-2可以发现PBR排名与PR排名相差较大的领域就是F部,F部为机械工程、照明、加热、武器、爆破领域,可以看出该领域的专利在引文网络中被引次数较高,可以在7个领域中排名第三,说明F部技术领域是航空、航天器设备制造业中较重要专利,其次F部在技术领域引用网络中的中介中心性为0.17,排名第二,说明该技术领域是较为基础的关键领域。因此说明PBR算法相比于PR算法可以挖掘出行业内较为关键的基础领域。表5-2PBR排名表IPC分类号PBR排名PR排名被引次数中介中心性B1117080.27F253580.17G32370.1H433730.03E54160.03A66280C7700本文还绘制了各技术领域对应的PBR值和PR值的折线图,见图5-3。由图5-3可以发现,PBR值的极差大于PR值的极差,在最开始分值相差较大,但随着排名靠后,分值也逐渐接近,则说明PBR算法比PR算法的结果更具有差异性,可以更好的筛选出核心技术领域。图5-3PBR值和PR值得分对比图
【参考文献】:
期刊论文
[1]基于加权流量介数中心性的路网脆弱性分析——以无锡市为例[J]. 杜佳昕,张丰,杜震洪,刘仁义. 浙江大学学报(理学版). 2020(02)
[2]网络节点中心性与均衡性结合的作者网络特征分析[J]. 马蒙,李秀霞. 情报科学. 2020(03)
[3]基于节点亲密度的标签传播重叠社区发现算法[J]. 梁世娇,柴争义. 云南大学学报(自然科学版). 2020(01)
[4]基于小世界网络特性的核心技术识别研究——以石墨烯为例[J]. 戚筠,唐恒,石俊国. 情报杂志. 2020(02)
[5]基于专利的两阶段新兴技术识别研究——以图像识别技术为例[J]. 罗建,蔡丽君,史敏. 情报科学. 2019(12)
[6]基于多维度专利指标分析的优势技术领域识别研究[J]. 汪庆,朱钦磊,杨芳. 情报杂志. 2020(01)
[7]基于专利引文网络的智能物流技术演进路径研究[J]. 曹蕾,来尧静. 物流技术与应用. 2019(10)
[8]基于PageRank的论文引用网络关系挖掘[J]. 金洁,徐岳皓,刘振宇. 中国电子科学研究院学报. 2019(09)
[9]基于专利分析的食品行业技术创新研究[J]. 吴素春,胡青枝,王纯阳. 湖北农业科学. 2019(15)
[10]新兴技术概念辨析及其识别方法研究进展[J]. 周萌,朱相丽. 情报理论与实践. 2019(10)
博士论文
[1]若干社区发现算法研究[D]. 潘磊.南京大学 2014
硕士论文
[1]基于合作与引文网络的学者学术影响力评价研究[D]. 刘凯玉.山东师范大学 2019
[2]基于专利引文的人工智能领域科学-技术关联分析[D]. 郜梦蕊.南京大学 2019
[3]基于中心边选择的重叠社区发现算法研究[D]. 张方.吉林大学 2019
[4]网络中心性、进出口与国际碳排放研究[D]. 徐绍婷.浙江工商大学 2019
[5]核心专利识别综合价值模型的构建及实证研究[D]. 亢川博.吉林大学 2018
[6]基于文本向量表示学习的引文推荐方法研究[D]. 李飞.西北农林科技大学 2018
[7]基于引文网络的核心专利发现研究[D]. 张欣.山西大学 2017
[8]基于引文网络的文献在线推荐系统研究和实现[D]. 马丙超.大连理工大学 2016
[9]基于专利引文网络的技术科学图谱分析[D]. 裴艳林.北京邮电大学 2016
[10]基于多因素的引文推荐策略研究[D]. 石杰.东北大学 2011
本文编号:3118090
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3118090.html
最近更新
教材专著