当前位置:主页 > 管理论文 > 科研管理论文 >

基于知识发现的专利检索系统分析与设计

发布时间:2017-08-17 05:24

  本文关键词:基于知识发现的专利检索系统分析与设计


  更多相关文章: 专利检索 知识发现 关联分析 向量空间模型 夹角余弦


【摘要】:专利技术是反映一个国家或一个企业技术创新水平和潜在竞争力的重要因素,无论是国家追求高的专利转化率,还是企业的技术改进与创新,一个准确有效的专利检索平台是连接专利持有方和专利需求方的桥梁,是至关重要的环节。目前我国专利数量激增,专利需求市场不断扩大,专利转化实施率却很低,主要原因之一是现存的专利检索系统大都是基于关键词的简单检索,一方面检索结果过分依赖检索关键词,另一方面对查询用户的要求过高,这都给专利的检索造成了困难。 解决这些问题,探究方便实用的专利检索平台,从宏观上讲能够促进专利的实施转化,提高我国的专利水平;从微观上讲,一个适合的专利对于企业来讲就意味着一个发展机遇,它直接关系到企业的发展前景。本论文运用知识发现方法,提出了一种专利检索的新思路,旨在构建一个高效、准确的专利检索平台,为用户提供方便、有效的检索方法。 本论文研究的是基于知识发现的专利检索系统,讨论了现有的专利检索系统存在的不足,针对现存专利检索系统的不足,提出了一个基于知识发现的专利检索系统,即将知识发现的整个过程融入到专利检索的过程中,通过知识发现的过程达到专利检索的目的。整个专利检索过程主要包括数据准备、查询关键词扩展和相似度计算三个部分,是关联分析、向量空间模型及相似度计算等知识发现方法在专利检索中的综合应用。首先通过分词、滤词及特征筛选将初检到的专利数据进行预处理,然后应用关联分析算法进行查询关键词扩展,以扩展用户需求,使检索结果更全面准确,最后,运用向量空间模型进行专利文本特征表示,并运用夹角余弦进行相似度计算对专利初检结果进行再排序,以得出最终检索结果。不同于传统专利检索,本文所研究的检索技术得到的检索结果不仅是基于用户所给出的关键词,而且在其基础上对查询关键词进行扩展,给用户提供更加全面准确的检索结果。论文第五章的实例演示结果也证明了基于知识发现的专利检索系统对于提高检索结果的准确性与实用性起到了有效作用。 论文所研究的专利检索系统在借鉴国内外当前主流专利检索系统的基础上,综合运用知识发现与数据挖掘的各种方法,提出了一种新的专利检索思路,其研究有助于我国专利检索技术的发展,并为知识发现在专利分析研究等诸多技术领域的进一步推广提供了支持与借鉴,具有积极的现实意义。
【关键词】:专利检索 知识发现 关联分析 向量空间模型 夹角余弦
【学位授予单位】:东北林业大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.3;G306
【目录】:
  • 摘要4-5
  • Abstract5-10
  • 1 绪论10-18
  • 1.1 研究背景及意义10-13
  • 1.1.1 研究背景10-12
  • 1.1.2 研究目的意义12-13
  • 1.2 国内外研究现状13-16
  • 1.2.1 专利检索技术国内外研究现状13-14
  • 1.2.2 知识发现国内外研究现状14-16
  • 1.3 研究内容及技术路线16-18
  • 1.3.1 研究内容16-17
  • 1.3.2 技术路线17-18
  • 2 知识发现基础理论介绍18-26
  • 2.1 知识发现概述18-21
  • 2.1.1 知识发现概念18
  • 2.1.2 知识发现背景18-19
  • 2.1.3 知识发现过程19-20
  • 2.1.4 知识发现常用算法介绍20-21
  • 2.2 本文中的相关知识发现算法21-24
  • 2.2.1 关联分析算法21-23
  • 2.2.2 聚类分析算法23-24
  • 2.3 本章小结24-26
  • 3 基于知识发现的专利检索系统分析与总体设计26-37
  • 3.1 专利检索现状分析26-29
  • 3.1.1 信息检索与专利检索相关概念26
  • 3.1.2 常见专利检索模型26-27
  • 3.1.3 检索技术的发展27-28
  • 3.1.4 专利的分类方法28-29
  • 3.1.5 国内外现有的专利检索系统29
  • 3.2 系统需求与系统目标分析29-32
  • 3.2.1 现有专利检索系统存在的问题及系统需求分析29-30
  • 3.2.2 系统总体目标分析30-32
  • 3.3 基于知识发现的专利检索系统要解决的问题分析32-33
  • 3.3.1 专利文档分词存在问题的分析32
  • 3.3.2 专利文档特征筛选存在问题分析32-33
  • 3.3.3 查询关键词扩展存在的问题分析33
  • 3.3.4 专利特征表示存在的问题分析33
  • 3.4 基于知识发现的专利检索系统总体设计33-36
  • 3.4.1 系统功能结构设计33-35
  • 3.4.2 系统流程设计35-36
  • 3.5 本章小结36-37
  • 4 基于知识发现的专利检索系统具体设计37-48
  • 4.1 专利名称及摘要的分词处理设计37-38
  • 4.1.1 分词算法类型37
  • 4.1.2 文档分词软件的选择37-38
  • 4.2 专利文档特征筛选设计38-39
  • 4.2.1 专利文档特征筛选软件选择38
  • 4.2.2 专利文档特征筛选过程设计38-39
  • 4.3 基于关联分析算法的查询关键词扩展设计39-42
  • 4.3.1 约束条件的设计39-40
  • 4.3.2 约束在查询关键词扩展中的作用40
  • 4.3.3 约束性关联挖掘算法在查询扩展中的应用40-42
  • 4.4 专利特征表示设计42-45
  • 4.4.1 常用专利特征表示方法43-44
  • 4.4.2 基于向量空间模型的专利本文特征表示设计44-45
  • 4.5 专利文本相似度计算设计45-47
  • 4.5.1 文本相似度计算的方法45-46
  • 4.5.2 基于夹角余弦的专利文本相似度计算设计46-47
  • 4.6 本章小结47-48
  • 5 基于知识发现的专利检索系统的实例演示48-62
  • 5.1 准备工作48
  • 5.1.1 系统环境48
  • 5.1.2 实验数据48
  • 5.2 专利文本数据预处理的实现48-50
  • 5.2.1 实现背景48
  • 5.2.2 实验具体操作演示48-50
  • 5.3 查询关键词扩展部分的实现50-56
  • 5.3.1 实现背景50-51
  • 5.3.2 实验具体操作演示51-56
  • 5.4 相似度计算的实现56-60
  • 5.4.1 实现背景56
  • 5.4.2 实现具体操作演示56-60
  • 5.5 结果分析60-61
  • 5.6 本章小结61-62
  • 结论62-64
  • 参考文献64-67
  • 附录1 国家知识产权局网站的专利初检结果67-69
  • 附录2 基于相似度的最终排序结果69-71
  • 攻读学位期间发表的学术论文71-72
  • 致谢72-73

【参考文献】

中国期刊全文数据库 前10条

1 王立伟;;数据挖掘研究现状综述[J];图书与情报;2008年05期

2 游湘涛,叶施仁,史忠植;多策略通用数据采掘工具MSMiner[J];计算机研究与发展;2001年05期

3 李艳;季新生;项君;;基于UIMA的知识发现框架研究及实现[J];计算机工程;2010年21期

4 郭晓;杨乃定;董铁牛;;基于数据挖掘技术的客户知识发现[J];科技管理研究;2010年05期

5 杨丹丹;;基于数据挖掘的企业专利价值评估方法研究[J];科学学与科学技术管理;2006年02期

6 王惠中;彭安群;;数据挖掘研究现状及发展趋势[J];工矿自动化;2011年02期

7 王克奇;于江涛;李海英;;TRIZ理论在专利检索系统中的应用研究[J];情报科学;2011年02期

8 张翠玲;论自然语言检索[J];情报理论与实践;2003年04期

9 刘翔;施干卫;丁祖荣;;论文相似度的计算研究——基于VSM模型[J];情报杂志;2010年02期

10 吴思竹;;数据挖掘和知识发现领域热点主题分析[J];情报杂志;2010年07期



本文编号:687336

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/687336.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户30388***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com