当前位置:主页 > 管理论文 > 科研管理论文 >

面向专利的功能信息抽取方法的研究

发布时间:2017-10-05 12:44

  本文关键词:面向专利的功能信息抽取方法的研究


  更多相关文章: 功能信息抽取 专利摘要 词法分析 句法分析 最大熵 本体知识库


【摘要】:专利文档中包含产品的组成结构、设计原理、组件功能等相关内容,蕴含了丰富的创新性技术信息,是领域内创新性和实用性的解决方案,被看作是产品创新设计的重要知识来源。功能的创新是产品创新的基础,从专利中获取其功能信息成为研究的热点。然而由于自然语言对知识表述的随意性,给这项研究带来一定的难度和挑战性。 本文经过大量的专利文献的阅读,分析了专利文档的组成结构和知识分布,,确定了专利摘要文本为功能信息抽取对象,通过分析当前功能本体对于知识的表达方式,本文采用动宾短语来表达专利中的功能信息。 在自然语言处理方法的基础上,提出了一种基于词法分析、语法分析、最大熵分类模型的专利功能信息抽取方法。词法分析采用中科院的开源ICTCLAS组件得到中文语句的分词结果,在此基础上的句法分析采用Stanford大学的Stanford Parser组件得到语句的句法树,然后运用最大熵分类模型进行基于句法树特征向量的语义角色标注,并结合本文提出的文本预处理和句法树的特征属性值自动提取算法,设计了一个专利功能信息抽取系统模型,基本实现了中文专利摘要的功能信息抽取。同时本文构建了专利功能本体模型,提出了专利功能信息与功能本体的映射方法,为功能本体知识库的构建与自动填充提供了基础。通过对洗衣机发明专利文献的分析及功能信息抽取实验表明,该方法具有一定的正确性和有效性。
【关键词】:功能信息抽取 专利摘要 词法分析 句法分析 最大熵 本体知识库
【学位授予单位】:河北工业大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:G306;TP391.1
【目录】:
  • 摘要4-5
  • ABSTRACT5-8
  • 第一章 绪论8-11
  • §1-1 课题研究背景和意义8
  • §1-2 课题研究现状8-9
  • §1-3 课题的研究目标和主要工作9-10
  • §1-4 论文的组织结构10-11
  • 第二章 信息抽取原理及应用11-17
  • §2-1 信息抽取理论概述11-13
  • 2-1-1 信息抽取的概念11
  • 2-1-2 信息抽取的研究对象11-12
  • 2-1-3 信息抽取的流程12-13
  • §2-2 信息抽取方法分类13-15
  • 2-2-1 基于自然语言处理的信息抽取13
  • 2-2-2 基于本体的信息抽取13-14
  • 2-2-3 基于规则的信息抽取14
  • 2-2-4 基于统计模型的信息抽取14-15
  • 2-2-5 基于 XML 结构的信息抽取15
  • §2-3 信息抽取技术的应用15-16
  • §2-4 本章小结16-17
  • 第三章 专利功能信息表达17-24
  • §3-1 专利文档结构和知识分布17-18
  • 3-1-1 专利文档结构分析17
  • 3-1-2 专利文档知识分布17-18
  • §3-2 功能本体概述18-22
  • 3-2-1 功能的定义18-19
  • 3-2-2 功能本体的概念19
  • 3-2-3 功能的表达方式19-20
  • 3-2-4 专利知识本体库模型20-22
  • §3-3 功能信息抽取和功能本体的关系22-23
  • 3-3-1 专利功能信息分类22
  • 3-3-2 专利功能信息在功能本体中的映射22-23
  • §3-4 本章小结23-24
  • 第四章 专利功能信息抽取模型的建立24-38
  • §4-1 功能信息抽取流程设计24-25
  • §4-2 专利摘要预处理25-26
  • §4-3 词法分析处理26-29
  • 4-3-1 词法分析概述26-27
  • 4-3-2 ICTCLAS 流程分析27-28
  • 4-3-3 ICTCLAS 组件的应用方法28-29
  • §4-4 句法分析处理29-34
  • 4-4-1 句法分析概述29
  • 4-4-2 Stanford Parser 组件的应用29-33
  • 4-4-3 句法树的剪枝算法和遍历算法33-34
  • §4-5 最大熵模型分类34-37
  • 4-5-1 最大熵模型的形式化描述34-35
  • 4-5-2 最大熵模型的特征选择35-36
  • 4-5-3 最大熵模型的标注步骤36-37
  • §4-6 本章小结37-38
  • 第五章 系统实现和实例验证38-46
  • §5-1 系统实现38-41
  • 5-1-1 系统概要设计38-39
  • 5-1-2 系统开发环境39
  • 5-1-3 系统界面展示39-41
  • §5-2 实例验证41-44
  • 5-2-1 数据准备41-42
  • 5-2-2 专利功能信息抽取实例验证42-44
  • §5-3 结果分析44-45
  • §5-4 本章小结45-46
  • 第六章 总结和展望46-47
  • §6-1 论文总结46
  • §6-2 论文展望46-47
  • 参考文献47-49
  • 致谢49

【参考文献】

中国期刊全文数据库 前10条

1 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期

2 占向辉,李彦,贾爱军,孙玉帅;面向创新设计的科学效应库研究[J];工程设计学报;2005年01期

3 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期

4 刘克彬;李芳;刘磊;韩颖;;基于核函数中文关系自动抽取系统的实现[J];计算机研究与发展;2007年08期

5 张德政;庄洪波;;基于领域本体网络模型的知识获取技术[J];计算机工程;2007年07期

6 徐靖;李军辉;朱巧明;李培峰;;中文名词性谓词语义角色标注的特征研究[J];计算机应用;2011年06期

7 陈佳;胡燕;轩艳艳;;一种基于XML的Web信息抽取方法[J];计算机与数字工程;2007年06期

8 刘迁;焦慧;贾惠波;;信息抽取技术的发展现状及构建方法的研究[J];计算机应用研究;2007年07期

9 王朝霞;邱清盈;冯培恩;谢双喜;;机械产品专利技术方案信息抽取方法[J];机械工程学报;2009年10期

10 刘克强;;2009共享版ICTCLAS的分析与使用[J];科教文汇(上旬刊);2009年08期

中国博士学位论文全文数据库 前1条

1 车万翔;基于核方法的语义角色标注研究[D];哈尔滨工业大学;2008年

中国硕士学位论文全文数据库 前7条

1 徐荣华;基于功能本体的产品结构功能映射分析与再创新设计研究[D];南京航空航天大学;2010年

2 杨浩博;基于功能本体的创新知识表达及检索方法研究与实现[D];河北工业大学;2011年

3 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年

4 李飒;基于GATE的中文信息抽取系统的开发和实现[D];中国科学院研究生院(文献情报中心);2006年

5 马腾;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2006年

6 张晓欢;基于本体的产品信息抽取系统的研究[D];天津理工大学;2009年

7 毋菲;数值信息的抽取方法研究[D];山西大学;2010年



本文编号:976891

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/976891.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户77c95***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com