当前位置:主页 > 科技论文 > 软件论文 >

面向航天领域知识管理的信息采集与分类应用研究

发布时间:2017-05-13 09:26

  本文关键词:面向航天领域知识管理的信息采集与分类应用研究,由笔耕文化传播整理发布。


【摘要】:我国航天事业蓬勃发展,在日益发达的互联网、大数据和知识经济时代,为应对海量信息资源,作为知识密集型的航天从业机构,开始引入知识管理相关理论与技术,以有效挖掘、组织、管理、利用和传承领域的核心知识资源。知识获取是知识管理过程中的基础环节,而知识获取相关系统的设计实施需要诸多关键技术支撑,如信息采集、文本分类、信息抽取、知识图谱、语义网络等自然语言处理、数据挖掘相关的技术。近年来,对信息的获取与处理技术在学术界和实际应用中有了突飞猛进的发展,本文将对航天领域知识管理系统中知识获取环节的信息采集和文本自动分类两个关键技术进行应用研究。航天领域的知识信息冗杂多样,包含于相关企业及科研机构的生产研究过程中产生的大量文档,也贮藏在巨大庞杂的互联网信息资源中。针对航天领域信息的这些特点,实施有效知识管理首先迫切需要的关键技术是如何高效准确获取行业情报信息,并能有效组织管理信息,进而才能实现进一步的信息抽取、知识挖掘。对于航天情报信息的高效获取,能够在满足科研人员对航天情报数量大、专业性强、新颖及时、完整准确需求的同时,避免从庞杂异构的互联网中大海捞针,降低信息获取成本;而对于航天信息的自动分类,可以准确高效地组织已有的或获取到的杂乱无章的信息,能够帮助快速建设航天领域知识库,优化信息检索系统的信息组织结构和检索效果,满足从业人员对领域知识的进一步的挖掘需求。因此本文面向航天领域知识管理进行的信息采集与文本自动分类关键技术的应用研究具有重要的现实意义和实用价值。本文的主要研究工作如下:(1)介绍面向航天领域知识管理进行信息采集和文本分类两个关键技术应用研究的背景及意义;调研知识管理及其在航天领域应用的发展现状,信息采集和文本分类技术及其在航天领域内应用的发展现状。(2)研究基于主题爬虫的航天领域情报采集方法,设计航天情报采集主题爬虫的总体框架,实现相关程序部件,并基于主题向量空间模型和支持向量机(SVM)二类分类器两种方法实现主题判定模型,与基于关键词匹配的方法进行对比实验验证。(3)研究基于支持向量机(SVM)的航天领域文本多类分类算法,设计航天领域内不同类别信息的多类分类流程框架,并考虑航天领域特点,在特征加权阶段提出了针对性改进,针对航天领域专业术语等区分度较高的词汇增加了额外权重,以提高分类效果。实现相关程序部件,并与基于朴素贝叶斯和K近邻的文本分类算法进行对比实验。通过相关实验验证表明,本文面向航天领域知识管理的情报采集与文本分类应用研究达到预期效果,具有实际意义。其中,本文设计的基于主题爬虫的航天领域情报采集方法是可行的、高效的,能够满足实际知识管理过程中对航天领域情报的采集需求;本文设计并改进的基于支持向量机(SVM)的航天领域文本多类自动分类算法是可行的、高效的,并且相比同类算法表现更加优秀,能够满足实际知识管理过程中对航天领域文本信息的高效准确自动分类组织需求。
【关键词】:航天领域 知识管理 信息采集 主题爬虫 文本分类 支持向量机
【学位授予单位】:中国科学院国家空间科学中心
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
  • 摘要5-7
  • ABSTRACT7-14
  • 第1章 绪论14-28
  • 1.1 课题背景及研究意义14-16
  • 1.1.1 课题背景14-15
  • 1.1.2 研究意义15-16
  • 1.2 国内外研究现状16-24
  • 1.2.1 航天领域知识管理16-20
  • 1.2.2 信息采集技术20-22
  • 1.2.3 文本分类技术22-24
  • 1.3 主要研究内容24-25
  • 1.3.1 基于主题爬虫的航天领域信息采集技术24
  • 1.3.2 基于SVM的航天领域文本分类技术24-25
  • 1.4 论文组织结构25-28
  • 第2章 相关技术与理论概述28-38
  • 2.1 中文分词28-29
  • 2.2 文本表示与特征选择方法29-31
  • 2.2.1 向量空间模型29-30
  • 2.2.2 特征选择30-31
  • 2.3 网络爬虫31-32
  • 2.4 支持向量机32-38
  • 2.4.1 线性可分33-34
  • 2.4.2 线性不可分34-36
  • 2.4.3 多类分类问题36-38
  • 第3章 基于主题爬虫的航天情报采集38-46
  • 3.1 航天情报采集总体框架38-40
  • 3.2 主题判定模型40-46
  • 3.2.1 主题向量空间模型41-42
  • 3.2.2 SVM主题分类器42-46
  • 第4章 基于SVM的航天领域文本分类46-54
  • 4.1 SVM文本分类总体框架46-47
  • 4.2 SVM文本分类主要流程47-54
  • 4.2.1 语料预处理47-48
  • 4.2.2 文本表示与特征选择48-49
  • 4.2.3 分类模型训练与优化49-52
  • 4.2.4 文档分类预测52-54
  • 第5章 实验论证与结果分析54-64
  • 5.1 实验环境54
  • 5.2 评价指标54-56
  • 5.2.1 航天主题爬虫54-55
  • 5.2.2 航天SVM文本分类55-56
  • 5.3 论证过程56-58
  • 5.3.1 航天主题爬虫56-57
  • 5.3.2 航天SVM文本分类57-58
  • 5.4 结果分析58-64
  • 5.4.1 航天主题爬虫58-61
  • 5.4.2 航天SVM文本分类61-64
  • 第6章 总结与展望64-68
  • 6.1 工作总结64-65
  • 6.2 研究展望65-68
  • 参考文献68-70
  • 作者简历及攻读学位期间发表的论文与研究成果70-72
  • 致谢72-73

【相似文献】

中国期刊全文数据库 前10条

1 ;中国航天机电集团公司第八三五八研究所简介[J];科学学与科学技术管理;2000年11期

2 胡绍林,黄刘生;航天故障的成因分析与诊断技术[J];控制工程;2003年04期

3 ;《上海航天》简介[J];电子科技文摘;2003年04期

4 王礼恒,潘坚,曹秀云;近期世界航天科技发展及我们的思考[J];中国科技论坛;2004年06期

5 李程;;2012年世界航天发展回顾[J];卫星与网络;2013年03期

6 许达哲;;中国航天取得举世瞩目的成就[J];卫星与网络;2013年10期

7 尚昭;;神七飞船:来自太空的IT挑战[J];中国计算机用户;2008年40期

8 ;航空、航天与航海工程[J];电子科技文摘;1999年04期

9 ;2010年航天工程育种论坛成功召开[J];卫星与网络;2010年09期

10 ;航空、航天与航海工程[J];电子科技文摘;2003年09期

中国重要会议论文全文数据库 前9条

1 ;清华大学航天航空学院[A];庆祝中国力学学会成立50周年暨中国力学学会学术大会’2007论文摘要集(上)[C];2007年

2 王永志;;钱学森在中国导弹航天事业中的科学成就[A];钱学森科学贡献暨学术思想研讨会论文集[C];2001年

3 李勇;肖瑾;颜廷贵;;优秀文化在建设一流总体部中的作用[A];军工文化论文集[C];2006年

4 麦强;;航天工程项目风险分析研究现状[A];国家自然科学基金委员会管理科学部宏观管理与政策学科青年基金获得者交流研讨会论文集[C];2010年

5 汤莉;;把责任担在肩上将理想托付蓝天[A];中国有色金属工业企业管理现代化成果、优秀论文专集[C];2003年

6 张健;安军社;汪大兴;;基于国产CPU的航天用计算机的研制[A];中国空间科学学会空间探测专业委员会第十七次学术会议论文集[C];2004年

7 孙家栋;;钱学森带领我们搞航天[A];钱学森科学贡献暨学术思想研讨会论文集[C];2001年

8 张传军;侯宇葵;;国防科技查新在航天工程实践中的应用探讨[A];第二十五届全国空间探测学术研讨会摘要集[C];2012年

9 韩恩厚;;航天用镁合金与空间环境损伤[A];中国空间科学学会空间材料专业委员会2012学术交流会议论文(摘要)集[C];2012年

中国重要报纸全文数据库 前10条

1 酒泉卫星发射中心副主任 于本城;关于我国航天文化的思考[N];光明日报;2008年

2 本报特派记者 张晓鸣;航天游有待突破一日游[N];文汇报;2013年

3 ;为航天事业发展提供坚强保证[N];中国航天报;2013年

4 本报评论员;确保航天重大工程圆满完成的必然要求[N];中国航天报;2013年

5 ;大力协同 同舟共济[N];中国航天报;2006年

6 林大安;全国邮展航天类邮集的成功与不足[N];中国集邮报;2006年

7 综言;航天科技图书出版基金设立[N];中国文化报;2007年

8 王杭生;航天科技书出版基金设立[N];中国新闻出版报;2007年

9 本报记者 孙敏邋徐莹波 实习生 冯晓文;桂林航天人:见证中国航天新纪元诞生[N];桂林日报;2008年

10 本报记者 汪挺;中国正在迎来“后航天经济时代”[N];中国商报;2005年

中国硕士学位论文全文数据库 前7条

1 郭颂;面向航天领域知识管理的信息采集与分类应用研究[D];中国科学院国家空间科学中心;2016年

2 邵雪山;航天工程项目组织管理能力的分阶段综合评价方法及应用[D];南京航空航天大学;2012年

3 胡发兴;航天三十五所知识管理系统研究[D];哈尔滨工业大学;2010年

4 王根平;基于人才成长规律的航天科技人员培养与激励机制研究[D];天津大学;2013年

5 张继红;航天科技人员工作压力与绩效的相关性分析[D];首都经济贸易大学;2005年

6 赵杨杨;基于FMI的一体化仿真平台及其在航天工程中的应用[D];哈尔滨工业大学;2013年

7 袁赵祥;宇航元器件在航天工程中应用管理研究[D];首都经济贸易大学;2013年


  本文关键词:面向航天领域知识管理的信息采集与分类应用研究,由笔耕文化传播整理发布。



本文编号:362193

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/362193.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户325dd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com