基于Mapreduce计算模型的专利技术—功效—应用图构建与应用研究
发布时间:2017-09-28 14:01
本文关键词:基于Mapreduce计算模型的专利技术—功效—应用图构建与应用研究
更多相关文章: 专利信息 文本挖掘 MapReduce 分布式计算 技术功效图 技术应用图
【摘要】:Ernst提出了使用专利信息作为技术管理的一项创新度量的一个抽象性框架。专利是创造性过程的直接输出,而且由于一项发明生效必须由政府审核,所以专利是一种客观标准,它是世界上数量最大的信息资源之一,也是当今知识经济时代最重要的战略资源之一。它涉及所有技术领域最新、最活跃的创新信息,对科技创新和战略决策有非常重要的参考价值。然而专利信息浩如烟海,现在对专利信息的利用多是某个年份某类专利申请情况的分析,或是根据申请日期来判断专利技术的生命周期。再进一步的分析还有基于专利摘要的文本挖掘得到的语义网络分析,但由于语言表达的多样性和专利价值隐藏的深层性,要实现全面、准确的利用专利信息并用于决策支持却非常困难。如何能够全面有效的挖掘出专利信息中隐藏的技术等信息,提高基于专利信息的决策的正确性,是本文研究的核心任务。 本论文通过将文本挖掘与分布式计算相结合的方法来实现基于专利领域信息的技术功效与技术应用矩阵图的构造,充分利用人工整合后的德文特专利数据的专利摘要的特殊结构来充当数据基础,,进而来提高专利信息的利用价值。在全方位地研究了现阶段基于专利信息的技术功效与技术应用矩阵图的现状之后,本文提出了整体研究框架。其主要研究内容有:首先,构建基于句式结构的专利领域语料库,此部分主要依据句式结构将专利摘要进行细化、拆分,使其足够结构化,再通过构建语料库的方式将摘要的各个部分单独存储下来;其次,设计基于云平台的矩阵共现算法,解决海量数据或大矩阵运算过于消耗系统资源的问题。并将上一步中构建的语料库的各个部分转化成技术与功效和技术与应用共现的矩阵。最后,在第三章的数据源和第四章的矩阵共现算法的基础上,搭建专利领域的技术功效矩阵图和技术应用矩阵图,并在此基础上挖掘其潜在的应用价值。
【关键词】:专利信息 文本挖掘 MapReduce 分布式计算 技术功效图 技术应用图
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:G306;TP391.1
【目录】:
- 摘要4-5
- Abstract5-8
- 第1章 绪论8-16
- 1.1 选题背景及意义8-9
- 1.2 技术功效图国内外研究现状9-11
- 1.2.1 文本挖掘在技术功效图中的应用9-11
- 1.2.2 分布式计算在海量专利文本挖掘中的应用11
- 1.3 主要研究内容及论文结构11-16
- 第2章 相关理论及技术研究16-28
- 2.1 文本挖掘理论16-22
- 2.1.1 文本挖掘的主要任务16-17
- 2.1.2 信息抽取17-19
- 2.1.3 文本分类19-20
- 2.1.4 文本聚类20-21
- 2.1.5 文本挖掘工具21-22
- 2.2 语料库的基本理论22-23
- 2.2.1 语料库理论概述22
- 2.2.2 专利领域语料库建设的基本步骤22-23
- 2.3 分布式平台理论23-25
- 2.3.1 分布式文件系统 Hadoop23
- 2.3.2 Mapreduce 计算模型23-25
- 2.4 技术功效图理论25-26
- 2.4.1 技术功效图概念及应用25
- 2.4.2 技术功效图常见绘制方法25-26
- 2.5 本章小结26-28
- 第3章 基于文本挖掘的专利领域语料库的构建28-42
- 3.1 专利语料库构建28-33
- 3.1.1 语料库构建整体框架28-29
- 3.1.2 专利文本预处理29-31
- 3.1.3 文本特征标注31-33
- 3.2 基于句式结构专利领域语料获取33-40
- 3.2.2 专利领域概念关系的抽取35-40
- 3.2.3 专利领域语料库的存储40
- 3.3 本章小结40-42
- 第4章 基于分布式计算的大矩阵共现构建42-54
- 4.1 基于 hadoop 的分布式环境搭建42-46
- 4.1.1 分布式平台的应用42
- 4.1.2 实验平台的配置42-46
- 4.2 基于 Mapreduce 框架模型的算法改进46-52
- 4.2.1 数据预处理上的算法优化46-47
- 4.2.2 矩阵共现算法的优化47-52
- 4.3 本章小结52-54
- 第5章 技术功效图的半自动化构建54-68
- 5.1 技术功效特征的数据准备54-60
- 5.1.1 技术功效与应用词的自动抽取54-58
- 5.1.2 专家参与特征词的筛选与分类58-60
- 5.2 技术功效矩阵的绘制60-67
- 5.2.1 技术功效矩阵的构建60-64
- 5.2.2 技术功效矩阵的验证64-67
- 5.3 本章小结67-68
- 第6章 技术功效图的应用68-76
- 6.1 技术功效图的技术空白点分析68-73
- 6.1.1 定位具体的研发位置68-72
- 6.1.2 从研发位置思考研发策略72-73
- 6.2 技术功效图的多阶层分析73-75
- 6.2.1 国家级别分析73-75
- 6.2.2 发明人级别分析75
- 6.3 本章小结75-76
- 总结76-78
- 参考文献78-82
- 附录 A 常见国家缩写及所在经纬度82-84
- 攻读硕士学位期间发表的学术论文84-86
- 致谢86
【相似文献】
中国期刊全文数据库 前10条
1 马海群;论支撑技术创新的专利信息管理与服务体系[J];图书情报知识;2001年01期
2 李新京;侯姝芬;;巧用 CA 或 WPI 检索化学化工专利信息[J];化工之友;1998年03期
3 吴原萍;图书馆开发利用专利信息资源的现状及对策[J];河北科技图苑;2001年01期
4 崔雅晖;;专利信息分析系统[J];中国发明与专利;2007年05期
5 宋保华;从专利信息中获取创新灵感[J];发明与创新;2004年10期
6 陈s
本文编号:936221
本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/936221.html