语义增强的科技创新路径识别研究
发布时间:2017-07-14 01:20
本文关键词:语义增强的科技创新路径识别研究
更多相关文章: 语义增强 科技创新路径 支持向量机 LDA模型 语义相似度
【摘要】:进入21世纪以来,科技创新发展领域的竞争已经演变成为国际竞争成败的主导因素。在此背景下,如何运用情报学分析方法与信息处理技术识别科技创新路径揭示出科技创新的发展过程及其演化趋势更显得尤为重要。科技创新一般是在之前他人科技创新成果的基础上实现新的创新,具有时间戳的科技文献之间的科技创新成果相互连接构成了科技创新的动态发展路径,为科技创新路径识别提供了真实可靠的数据源。传统科技创新路径识别的研究注重量化统计研究,忽略科技文本内容的理解,丢失了大量科技创新的语义信息,未深入到科技创新路径内部对科技创新内容进行系统的分析和解读。随着计算机信息处理技术以及文本数据挖掘技术的发展,研究人员开始利用语义分析技术深入分析科技文献文本数据。本文利用浅层语义分析技术,标引出科技文献句子中研究目的、方法等科技创新内容,对科技创新主题演化路径进行语义化解读,形成语义增强的科技创新路径,主要包括四个部分的研究内容:(1)分析总结科技创新路径研究的最新进展。(2)语义增强的科技创新内容表征研究。根据Keygraph算法抽取科技文献中表征科技创新内容的关键词的语义角色,构建科技创新内容4部图谱对科技创新内容进行特征选择,基于SVM完成科技创新内容的语义表征。(3)基于LDA的科技创新主题识别研究。将科技文献按照时间段进行切分,在科技创新内容语义表征结果的基础上,利用LDA模型识别出科技创新主题。(4)语义增强的科技创新路径识别研究。构建科技创新主题网络,利用Jaccard系数分析科技创新主题之间的语义相似度,利用纳入指数计算各子时期科技创新主题重叠关系,基于Node XL形成了语义增强的科技创新路径。实验结果表明,本文提出的语义增强的科技创新路径识别方法能够有效地识别出科技创新路径,挖掘出其关键节点中包含的科技创新内容,帮助用户缩短查阅科学文献的时间,快速地掌握科技创新内容的传承与演化,从单一的科技创新路径识别与可视化解读转变成对科技创新整个发展过程中所有路径的可视化语义解读。由于受到专业领域语料库以及可视化技术的限制,本文构建的语义增强的科技创新路径,还有待于更加深入全面地研究科技创新演化路径现状、规律、进展与趋势等相关内容。
【关键词】:语义增强 科技创新路径 支持向量机 LDA模型 语义相似度
【学位授予单位】:山东理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:G350
【目录】:
- 摘要4-5
- Abstract5-12
- 第一章 绪论12-16
- 1.1 研究背景与研究意义12-13
- 1.1.1 研究背景12
- 1.1.2 研究意义12-13
- 1.2 研究内容13-15
- 1.3 本文主要创新点15
- 1.4 本章小结15-16
- 第二章 科技创新路径识别研究进展16-26
- 2.1 科技创新与科技创新路径16-17
- 2.1.1 科技创新16
- 2.1.2 科技创新路径16-17
- 2.2 科技创新路径识别数据源17-18
- 2.2.1 学术文献数据库17
- 2.2.2 新兴的网络学术数据源17-18
- 2.3 科技创新路径识别方法研究18-21
- 2.3.1 基于关键词或者主题词的识别方法18-19
- 2.3.2 基于引文分析的识别方法19-21
- 2.4 科技创新路径识别可视化工具研究21-24
- 2.4.1 科技创新路径可视化工具21-22
- 2.4.2 科技创新路径可视化图谱分析22-23
- 2.4.3 可视化工具比较评估23-24
- 2.5 科技创新路径识别面临的挑战和发展趋势24-25
- 2.5.1 面临的挑战24
- 2.5.2 发展趋势24-25
- 2.6 本章小结25-26
- 第三章 语义增强的科技创新内容表征研究26-45
- 3.1 相关理论基础26-31
- 3.1.1 语义增强26
- 3.1.2 语义角色标注26-30
- 3.1.3 Keygraph算法30-31
- 3.2 语义增强的科技创新内容表征研究31-37
- 3.2.1 科技创新内容的结构分布研究32-33
- 3.2.2 语义增强的科技创新内容的特征选择研究33-35
- 3.2.3 语义增强的科技创新内容的特征权重研究35
- 3.2.4 基于SVM科技创新内容语义表征研究35-37
- 3.3 语义增强的科技创新内容表征实验与分析37-44
- 3.3.1 实验环境和数据集37-38
- 3.3.2 数据集预处理38
- 3.3.3 构建训练数据集38-39
- 3.3.4 语义增强的科技创新内容特征选择实验39-40
- 3.3.5 基于SVM的科技创新内容语义表征实验40-43
- 3.3.6 实验结果分析与讨论43-44
- 3.4 本章小结44-45
- 第四章 基于LDA的科技创新主题语义识别研究45-54
- 4.1 相关理论基础45-46
- 4.1.1 科技创新主题探测与追踪45
- 4.1.2 LDA主题识别模型45-46
- 4.2 基于LDA模型的科技创新主题语义识别研究46-48
- 4.2.1 LDA的科技创新主题语义识别模型构建研究46-47
- 4.2.2 基于LDA的科技创新主题语义识别研究47-48
- 4.3 实验与分析48-53
- 4.3.1 实验环境和数据集48
- 4.3.2 数据集预处理48-49
- 4.3.3 基于LDA的科技创新主题语义识别实验49-50
- 4.3.4 实验结果分析与讨论50-53
- 4.4 本章小结53-54
- 第五章 语义增强的科技创新路径识别研究54-75
- 5.1 相关理论与工具54-55
- 5.1.1 复杂网络54
- 5.1.2 NodeXL54-55
- 5.2 语义增强的科技创新路径识别研究55-62
- 5.2.1 科技创新主题网络识别研究56-57
- 5.2.2 科技创新主题类型分析研究57-59
- 5.2.3 科技创新主题路径识别研究59-60
- 5.2.4 语义增强的科技创新路径识别研究60-62
- 5.3 语义增强的科技创新路径识别实验与分析62-74
- 5.3.1 实验环境和数据集62
- 5.3.2 科技创新主题网络识别实验62-64
- 5.3.3 科技创新主题类型识别实验64-66
- 5.3.4 科技创新主题路径识别实验66-69
- 5.3.5 语义增强的科技创新路径识别实验69-73
- 5.3.6 实验结果分析与讨论73-74
- 5.4 本章小节74-75
- 第六章 总结与展望75-76
- 参考文献76-80
- 附录A:科技创新主题分析的相关数值80-83
- 附录B:硕士在读期间的科研情况83-84
- 致谢84
【参考文献】
中国期刊全文数据库 前10条
1 白如江;杨振瑜;王效岳;;基于KeyGraph关键词抽取的长句查询扩展技术研究[J];情报理论与实践;2014年06期
2 白如江;冷伏海;;“大数据”时代科学数据整合研究[J];情报理论与实践;2014年01期
3 吴平;;3D打印技术及其未来发展趋势[J];印刷质量与标准化;2014年01期
4 熊皓;刘群;吕雅娟;;联合语义角色标注和指代消解[J];中文信息学报;2013年06期
5 张泽宇;李莉;谭凤;晏萍丽;;基于语义的文档标注方法研究[J];计算机工程与科学;2013年09期
6 齐燕;;引用语义化相关问题初探[J];情报理论与实践;2013年08期
7 冷伏海;白如江;祝清松;;面向科技文献的混合语义信息抽取方法研究[J];图书情报工作;2013年11期
8 高劲松;梁艳琪;马倩倩;周习曼;付旭雄;;面向关联数据的引文知识链接模式研究[J];现代图书情报技术;2013年03期
9 杨思洛;;引文分析存在的问题及其原因探究[J];中国图书馆学报;2011年03期
10 杨选选;张蕾;;基于语义角色和概念图的信息抽取模型[J];计算机应用;2010年02期
,本文编号:539142
本文链接:https://www.wllwen.com/tushudanganlunwen/539142.html
教材专著