基于语义与语境的专利信息查询扩展的研究
发布时间:2020-12-23 17:38
专利文献信息记载了人类的智慧与创造的成果,是世界上数量最大的信息资源之一,也是当今知识经济时代最重要的战略资源之一。它涉及所有技术领域最新、最活跃的创新信息,对科技创新和战略决策有非常重要的参考价值。然而专利信息浩如烟海,现在对专利信息的检索多是基于关键词的检索。由于语言表达的多样性和模糊性,要实现全面、准确的关键词检索非常困难。如何能够有效的检索出做需要的专利信息,提高专利信息的查询的效率,是本文研究的核心任务。本论文通过语义与语境相结合的方法来实现专利领域信息检索查询扩展,对检索表达式进行扩展和重新构建,进而来提高专利信息检索的效率。在充分研究了专利信息查询的现状后,提出本文的研究内容。其主要研究内容有:首先,构建专利领域语料库,此部分主要结合专利信息的结构特征,专利的国际分类号IPC(International Patent Classification),通过我学院自主研发的专利信息抽取系统进行专利信息抽取,将抽取到的专利信息使用商务智能的集成服务和文本挖掘的技术对文本处理,以此来完成专利领域语料库的构建;其次,建设专利领域本体库,利用文本挖掘技术从上一步中构建的语料库中获取领...
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:75 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
目录
第1章 绪论
1.1 选题背景及意义
1.2 国内外研究现状
1.2.1. 专利信息检索的研究现状
1.2.2 查询扩展的研究现状
1.2.3 国内外研究现状小结
1.3 本文的主要研究工作
1.3.1 本文主要研究内容
1.3.2 本文的总体框架
第2章 基本应用理论与技术
2.1 语义与语境相关理论
2.1.1 语义与语境概述
2.1.2 语义与语境对专利信息查询扩展的影响
2.2 文本挖掘理论
2.2.1 文本挖掘过程
2.2.2 文本特征抽取
2.2.3 文本分类
2.2.4 文本聚类
2.2.5 文本挖掘工具
2.3 语料库理论
2.3.1 语料库概述
2.3.2 领域语料库建设步骤
2.4 本体知识库理论
2.4.1 本体描述语言
2.4.2 本体存储
2.4.3 本体概念相似度计算
2.5 信息检索模型
2.5.1 布尔模型
2.5.2 空间向量模型
2.5.3 概率模型
2.6 本章小结
第3章 专利领域语料库的设计
3.1 专利领域语料库的构建的整体框架
3.1.1 专利领域语料库基本流程
3.1.2 语料库的技术支撑
3.2 专利领域语料预处理
3.2.1 专利领域语料采集
3.2.2 专利领域语料加工
3.3 专利领域语料特征抽取
3.3.1 领域词典资源的构建
3.3.2 专利领域基本语料的特征抽取
3.3.3 专利领域基本语料特征的标注
3.4 本章小结
第4章 专利领域本体库的建设
4.1 专利领域本体知识库构建
4.1.1 专利领域本体知识库构建的目标
4.1.2 专利领域本体知识库构建的框架
4.2 专利领域本体构建的关键步骤
4.2.1 领域概念的获取
4.2.2 领域概念关系的抽取
4.3 专利领域本体的编辑与存储
4.3.1 专利领域本体的编辑与验证
4.3.2 专利领域本体的数据库存储
4.4 本章小结
第5章 专利领域信息查询扩展原型系统的实现
5.1 原型系统设计
5.1.1 原型系统开发平台
5.1.2 系统的功能设计
5.2 系统实现
5.2.1 本体查询扩展算法
5.2.2 系统前台界面实现
5.2.3 关键功能的具体实现
5.3 查询扩展实验验证
5.4 本章小结
总结与展望
总结
展望
参考文献
攻读硕士学位期间发表的学术论文
致谢
【参考文献】:
期刊论文
[1]基于语义相似度的个性化信息检索方法[J]. 谢文玲,潘建国. 计算机应用与软件. 2011(05)
[2]专利信息检索技术[J]. 白宇,王裴岩,蔡东风,董燕举. 沈阳航空工业学院学报. 2010(04)
[3]如何提高文献信息检索中的查全率与查准率[J]. 李璐,江葆红,孙红红. 科技文献信息管理. 2010(01)
[4]基于本体的查询扩展研究[J]. 胡哲,朱强. 电脑知识与技术. 2010(05)
[5]质子交换膜燃料电池及其双极板的研究[J]. 倪红军,汪兴兴,黄明宇,李飞. 材料科学与工艺. 2008(02)
[6]近几年来国外信息检索模型研究进展[J]. 孙坦,周静怡. 图书馆建设. 2008(03)
[7]OWL本体关系数据库存储模式设计[J]. 陶皖,姚红燕. 计算机技术与发展. 2007(02)
[8]从OWL本体到关系数据库模式的转换[J]. 许卓明,黄永菁. 河海大学学报(自然科学版). 2006(01)
[9]本体模型及其在语义Web中的本体描述语言[J]. 唐立民,黄德才. 计算机应用与软件. 2005(07)
[10]基于叙词表的领域本体构建研究[J]. 唐爱民,真溱,樊静. 现代图书情报技术. 2005(04)
博士论文
[1]英语词汇教学的认知语境研究[D]. 陈荣.西南大学 2011
[2]领域本体的构建方法与应用研究[D]. 李景.中国农业科学院 2009
[3]基于本体的语义信息检索研究[D]. 王进.中国科学技术大学 2006
[4]语料库研究[D]. 何婷婷.华中师范大学 2003
硕士论文
[1]基于分布式多索引融合的专利信息检索研究[D]. 朴红吉.大连理工大学 2010
[2]农林自主知识产权专利特征与流转研究[D]. 饶旻.福建农林大学 2010
[3]基于本体的语义检索在轨道交通系统中的应用研究[D]. 张素静.北京交通大学 2010
[4]基于关系数据库的领域本体构建方法的研究与实践[D]. 任柏青.北京邮电大学 2009
[5]基于领域本体的文本信息语义检索研究[D]. 毛平.南京理工大学 2007
[6]基于语料库的计算机辅助英语教学研究[D]. 张尔谦.山东师范大学 2007
[7]中国专利产出研究[D]. 谢炜.电子科技大学 2005
本文编号:2934087
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:75 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
目录
第1章 绪论
1.1 选题背景及意义
1.2 国内外研究现状
1.2.1. 专利信息检索的研究现状
1.2.2 查询扩展的研究现状
1.2.3 国内外研究现状小结
1.3 本文的主要研究工作
1.3.1 本文主要研究内容
1.3.2 本文的总体框架
第2章 基本应用理论与技术
2.1 语义与语境相关理论
2.1.1 语义与语境概述
2.1.2 语义与语境对专利信息查询扩展的影响
2.2 文本挖掘理论
2.2.1 文本挖掘过程
2.2.2 文本特征抽取
2.2.3 文本分类
2.2.4 文本聚类
2.2.5 文本挖掘工具
2.3 语料库理论
2.3.1 语料库概述
2.3.2 领域语料库建设步骤
2.4 本体知识库理论
2.4.1 本体描述语言
2.4.2 本体存储
2.4.3 本体概念相似度计算
2.5 信息检索模型
2.5.1 布尔模型
2.5.2 空间向量模型
2.5.3 概率模型
2.6 本章小结
第3章 专利领域语料库的设计
3.1 专利领域语料库的构建的整体框架
3.1.1 专利领域语料库基本流程
3.1.2 语料库的技术支撑
3.2 专利领域语料预处理
3.2.1 专利领域语料采集
3.2.2 专利领域语料加工
3.3 专利领域语料特征抽取
3.3.1 领域词典资源的构建
3.3.2 专利领域基本语料的特征抽取
3.3.3 专利领域基本语料特征的标注
3.4 本章小结
第4章 专利领域本体库的建设
4.1 专利领域本体知识库构建
4.1.1 专利领域本体知识库构建的目标
4.1.2 专利领域本体知识库构建的框架
4.2 专利领域本体构建的关键步骤
4.2.1 领域概念的获取
4.2.2 领域概念关系的抽取
4.3 专利领域本体的编辑与存储
4.3.1 专利领域本体的编辑与验证
4.3.2 专利领域本体的数据库存储
4.4 本章小结
第5章 专利领域信息查询扩展原型系统的实现
5.1 原型系统设计
5.1.1 原型系统开发平台
5.1.2 系统的功能设计
5.2 系统实现
5.2.1 本体查询扩展算法
5.2.2 系统前台界面实现
5.2.3 关键功能的具体实现
5.3 查询扩展实验验证
5.4 本章小结
总结与展望
总结
展望
参考文献
攻读硕士学位期间发表的学术论文
致谢
【参考文献】:
期刊论文
[1]基于语义相似度的个性化信息检索方法[J]. 谢文玲,潘建国. 计算机应用与软件. 2011(05)
[2]专利信息检索技术[J]. 白宇,王裴岩,蔡东风,董燕举. 沈阳航空工业学院学报. 2010(04)
[3]如何提高文献信息检索中的查全率与查准率[J]. 李璐,江葆红,孙红红. 科技文献信息管理. 2010(01)
[4]基于本体的查询扩展研究[J]. 胡哲,朱强. 电脑知识与技术. 2010(05)
[5]质子交换膜燃料电池及其双极板的研究[J]. 倪红军,汪兴兴,黄明宇,李飞. 材料科学与工艺. 2008(02)
[6]近几年来国外信息检索模型研究进展[J]. 孙坦,周静怡. 图书馆建设. 2008(03)
[7]OWL本体关系数据库存储模式设计[J]. 陶皖,姚红燕. 计算机技术与发展. 2007(02)
[8]从OWL本体到关系数据库模式的转换[J]. 许卓明,黄永菁. 河海大学学报(自然科学版). 2006(01)
[9]本体模型及其在语义Web中的本体描述语言[J]. 唐立民,黄德才. 计算机应用与软件. 2005(07)
[10]基于叙词表的领域本体构建研究[J]. 唐爱民,真溱,樊静. 现代图书情报技术. 2005(04)
博士论文
[1]英语词汇教学的认知语境研究[D]. 陈荣.西南大学 2011
[2]领域本体的构建方法与应用研究[D]. 李景.中国农业科学院 2009
[3]基于本体的语义信息检索研究[D]. 王进.中国科学技术大学 2006
[4]语料库研究[D]. 何婷婷.华中师范大学 2003
硕士论文
[1]基于分布式多索引融合的专利信息检索研究[D]. 朴红吉.大连理工大学 2010
[2]农林自主知识产权专利特征与流转研究[D]. 饶旻.福建农林大学 2010
[3]基于本体的语义检索在轨道交通系统中的应用研究[D]. 张素静.北京交通大学 2010
[4]基于关系数据库的领域本体构建方法的研究与实践[D]. 任柏青.北京邮电大学 2009
[5]基于领域本体的文本信息语义检索研究[D]. 毛平.南京理工大学 2007
[6]基于语料库的计算机辅助英语教学研究[D]. 张尔谦.山东师范大学 2007
[7]中国专利产出研究[D]. 谢炜.电子科技大学 2005
本文编号:2934087
本文链接:https://www.wllwen.com/tushudanganlunwen/2934087.html