基于主题突变检测的颠覆性技术识别——以无人机技术领域为例
发布时间:2021-06-23 07:36
颠覆性技术对实现中国科技创新跨越式发展具有重要战略意义。以无人机技术领域为例,获取Web of Science论文数据库和德温特(Derwent)专利数据库2005—2019年收录的2812篇论文与专利数据,基于LDA-LSTM文本分类算法得到技术主题,采用CiteSpace构建共现网络,从突变权重排序及突变时间段和突变共词聚类知识图谱2个角度进行主题突变检测,进而识别出无人机交互技术中的脑机接口技术及手势控制技术为该领域内的颠覆性技术,通过2020年无人机技术领域相关论文专利验证了识别框架的有效性。
【文章来源】:科技导报. 2020,38(20)北大核心CSCD
【文章页数】:9 页
【部分图文】:
颠覆性技术识别框架
采用机器学习分类算法,对论文专利摘要进行分类。文本分类即依照一定的分类标准或体系对文本进行自动分类,即通过对已分类数据的分析,总结出划分各类别的规则,并以此为基础识别其他更多数据所属的类别,常用的有传统机器学习分类算法如K近邻算法[15](K-nearest neighbor,KNN)、支持向量机[16](support vector machine,SVM),深度学习算法如卷积神经网络[17](convolutional neural networks,CNN)、长短时记忆神经网络[18](long short-term memory network,LSTM)等。以上分类算法均采用基于LDA(latent dirichlet allocation)主题模型的特征提取方法构建文本分类器,形成LDA-KNN、LDA-SVM、LDA-CNN、LDA-LSTM分类器,对论文专利摘要数据集进行分类,分类框架如图2所示。最终表明LDA-LSTM分类性能最好,对于待分类数据分类流程图如图3所示。图3 LDA-LSTM分类流程图
图2 机器学习分类主题模型流程图1) LDA主题模型。隐含狄利克雷分布(latent Dirichlet allocation,LDA)是Blei等[19]于2003年提出的基于概率模型的主题模型算法,是一种无监督的文本聚类方法。LDA主题模型是包含文档-主题-词的3层贝叶斯结构。其基本思想是把文档看成其隐含主题的混合,而每个主题则表现为跟该主题相关的词项的概率分布。该方法通过对语料库的建模训练,从而发现文档中潜在隐藏的主题信息,LDA主题模型如图4所示。
【参考文献】:
期刊论文
[1]基于离群专利的颠覆性技术预测——以中药专利为例[J]. 罗素平,寇翠翠,金金,袁红梅. 情报理论与实践. 2019(07)
[2]基于突变检测与共词分析的关联数据新兴趋势探测[J]. 杨选辉,蔡志强. 情报科学. 2018(11)
[3]基于双向LSTM模型的文本情感分类[J]. 任勉,甘刚. 计算机工程与设计. 2018(07)
[4]基于科学论文和专利信息的基因测序技术领域创新态势分析[J]. 孙轶楠,杜建,唐小利. 中华医学图书情报杂志. 2017(05)
[5]浅析颠覆性技术的内涵与培育——重视颠覆性技术背后的基础科学研究[J]. 李政,刘春平,罗晖. 全球科技经济瞭望. 2016(10)
[6]基于多分类器协同学习的卷积神经网络训练算法[J]. 陈文,张恩阳,赵勇. 计算机科学. 2016(09)
[7]基于TRIZ理论的颠覆性技术选择环境研究[J]. 许泽浩,张光宇,亢凯,王星羽. 工业工程. 2016(04)
[8]文档内可视化分析工具的比较研究[J]. 陆泉,赵琴,陈静. 信息资源管理学报. 2016(02)
[9]颠覆性技术的演化轨迹及早期识别——以智能手机等技术为例[J]. 苏敬勤,刘建华,王智琦,陈悦,姜照华. 科研管理. 2016(03)
[10]基于突变词检测的世界核桃研究前沿热点分析[J]. 罗明英,李东丽,岳丕昌,翁琴,王银方. 农业图书情报学刊. 2016(02)
本文编号:3244536
【文章来源】:科技导报. 2020,38(20)北大核心CSCD
【文章页数】:9 页
【部分图文】:
颠覆性技术识别框架
采用机器学习分类算法,对论文专利摘要进行分类。文本分类即依照一定的分类标准或体系对文本进行自动分类,即通过对已分类数据的分析,总结出划分各类别的规则,并以此为基础识别其他更多数据所属的类别,常用的有传统机器学习分类算法如K近邻算法[15](K-nearest neighbor,KNN)、支持向量机[16](support vector machine,SVM),深度学习算法如卷积神经网络[17](convolutional neural networks,CNN)、长短时记忆神经网络[18](long short-term memory network,LSTM)等。以上分类算法均采用基于LDA(latent dirichlet allocation)主题模型的特征提取方法构建文本分类器,形成LDA-KNN、LDA-SVM、LDA-CNN、LDA-LSTM分类器,对论文专利摘要数据集进行分类,分类框架如图2所示。最终表明LDA-LSTM分类性能最好,对于待分类数据分类流程图如图3所示。图3 LDA-LSTM分类流程图
图2 机器学习分类主题模型流程图1) LDA主题模型。隐含狄利克雷分布(latent Dirichlet allocation,LDA)是Blei等[19]于2003年提出的基于概率模型的主题模型算法,是一种无监督的文本聚类方法。LDA主题模型是包含文档-主题-词的3层贝叶斯结构。其基本思想是把文档看成其隐含主题的混合,而每个主题则表现为跟该主题相关的词项的概率分布。该方法通过对语料库的建模训练,从而发现文档中潜在隐藏的主题信息,LDA主题模型如图4所示。
【参考文献】:
期刊论文
[1]基于离群专利的颠覆性技术预测——以中药专利为例[J]. 罗素平,寇翠翠,金金,袁红梅. 情报理论与实践. 2019(07)
[2]基于突变检测与共词分析的关联数据新兴趋势探测[J]. 杨选辉,蔡志强. 情报科学. 2018(11)
[3]基于双向LSTM模型的文本情感分类[J]. 任勉,甘刚. 计算机工程与设计. 2018(07)
[4]基于科学论文和专利信息的基因测序技术领域创新态势分析[J]. 孙轶楠,杜建,唐小利. 中华医学图书情报杂志. 2017(05)
[5]浅析颠覆性技术的内涵与培育——重视颠覆性技术背后的基础科学研究[J]. 李政,刘春平,罗晖. 全球科技经济瞭望. 2016(10)
[6]基于多分类器协同学习的卷积神经网络训练算法[J]. 陈文,张恩阳,赵勇. 计算机科学. 2016(09)
[7]基于TRIZ理论的颠覆性技术选择环境研究[J]. 许泽浩,张光宇,亢凯,王星羽. 工业工程. 2016(04)
[8]文档内可视化分析工具的比较研究[J]. 陆泉,赵琴,陈静. 信息资源管理学报. 2016(02)
[9]颠覆性技术的演化轨迹及早期识别——以智能手机等技术为例[J]. 苏敬勤,刘建华,王智琦,陈悦,姜照华. 科研管理. 2016(03)
[10]基于突变词检测的世界核桃研究前沿热点分析[J]. 罗明英,李东丽,岳丕昌,翁琴,王银方. 农业图书情报学刊. 2016(02)
本文编号:3244536
本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/3244536.html