基于LDA-SVM论文摘要多分类新兴技术预测
发布时间:2019-06-17 20:16
【摘要】:[目的/意义]基于文献计量学的新兴技术预测方法能够避免现有德尔菲法的专家依赖性,但是文献所属技术领域的划分仍需依据领域知识设计复杂的检索式。[方法/过程]提出了一种基于机器学习和时间序列预测的新兴技术预测方法,LDA主题模型与SVM(支持向量机)分类模型连用的机器学习方法解决了海量论文摘要数据按照新兴技术类别的多分类,通过ARIMA(差分自回归移动平均模型)模型对时序论文未来数量的预测,分析以技术为驱动力的新兴技术发展趋势。[结果/结论]最后,以机器人技术为例,提取Web of Science(WOS)论文数据库上万条数据,对7个新兴领域发展趋势进行预测,为新兴技术预测工作提供有益的数据和方法支持。
[Abstract]:[objective / significance] the new technical prediction method based on bibliometrics can avoid the expert dependence of the existing Delphi method, but the division of the technical domain to which the literature belongs still needs to design the complex retrieval formula according to the domain knowledge. [methods / process] A new technology prediction method based on machine learning and time series prediction is proposed. The machine learning method used by LDA topic model and SVM (support Vector Machine) classification model solves the multi-classification of massive paper abstract data according to new technology categories, and forecasts the future number of time series papers by ARIMA (differential autoregression moving average model) model. The development trend of new technology driven by technology is analyzed. [results / conclusion] finally, taking robot technology as an example, tens of thousands of data from Web of Science (WOS) paper database are extracted, and the development trends of seven new fields are predicted, which provides useful data and method support for the prediction of new technologies.
【作者单位】: 华中科技大学机械科学与工程学院;华中科技大学生命科学与技术学院;清华大学公共管理学院;
【基金】:国家自然科学基金“支持技术预见的多源异构大数据融合与时序文本预测方法研究”(编号:91646102)研究成果之一;国家自然科学基金“面向2035的中国工程科技发展路线图绘制理论与方法研究”(编号:L1624045)研究成果之一;国家自然科学基金“面向2035的中国工程科技发展路线图应用案例及软件研究”(编号:L1624041)研究成果之一;国家自然科学基金“2035发展战略文献计量与专利分析方法研究”(编号:L1524015)研究成果之一;国家自然科学基金“示范项目对产业技术轨道的作用机理研究——以新能源汽车和新能源产业为例”(编号:71203117)研究成果之一
【分类号】:G353.1
[Abstract]:[objective / significance] the new technical prediction method based on bibliometrics can avoid the expert dependence of the existing Delphi method, but the division of the technical domain to which the literature belongs still needs to design the complex retrieval formula according to the domain knowledge. [methods / process] A new technology prediction method based on machine learning and time series prediction is proposed. The machine learning method used by LDA topic model and SVM (support Vector Machine) classification model solves the multi-classification of massive paper abstract data according to new technology categories, and forecasts the future number of time series papers by ARIMA (differential autoregression moving average model) model. The development trend of new technology driven by technology is analyzed. [results / conclusion] finally, taking robot technology as an example, tens of thousands of data from Web of Science (WOS) paper database are extracted, and the development trends of seven new fields are predicted, which provides useful data and method support for the prediction of new technologies.
【作者单位】: 华中科技大学机械科学与工程学院;华中科技大学生命科学与技术学院;清华大学公共管理学院;
【基金】:国家自然科学基金“支持技术预见的多源异构大数据融合与时序文本预测方法研究”(编号:91646102)研究成果之一;国家自然科学基金“面向2035的中国工程科技发展路线图绘制理论与方法研究”(编号:L1624045)研究成果之一;国家自然科学基金“面向2035的中国工程科技发展路线图应用案例及软件研究”(编号:L1624041)研究成果之一;国家自然科学基金“2035发展战略文献计量与专利分析方法研究”(编号:L1524015)研究成果之一;国家自然科学基金“示范项目对产业技术轨道的作用机理研究——以新能源汽车和新能源产业为例”(编号:71203117)研究成果之一
【分类号】:G353.1
【参考文献】
相关期刊论文 前7条
1 刘宇飞;周源;廖岭;;大数据分析方法在战略性新兴产业技术预见中的应用[J];中国工程科学;2016年04期
2 王志玲;王云飞;;基于文献计量方法的技术评价——以深水钻井平台动力定位技术为例[J];中国科技信息;2016年10期
3 李湘东;高凡;丁丛;;LDA模型下不同分词方法对文本分类性能的影响研究[J];计算机应用研究;2017年01期
4 李欣;黄鲁成;;基于文献计量和专利分析的战略性新兴产业研发竞争态势研究——以OLED产业为例[J];科技管理研究;2016年08期
5 魏芳芳;段青玲;肖晓琰;张磊;;基于支持向量机的中文农业文本分类技术研究[J];农业机械学报;2015年S1期
6 萧莉明;于宽;蔡s,
本文编号:2501238
本文链接:https://www.wllwen.com/tushudanganlunwen/2501238.html