国际专利分类法与中图分类法类目映射研究
发布时间:2022-02-22 10:43
信息资源的海量剧增,导致我国科技信息用户在“信息爆炸”的环境中,饱受“知识饥荒”和“找不到真正所需求的和最新的信息和数据”。专利作为一种具有特殊性质的文献,包含了先进的技术方案,但同时存在管理困难、相对孤立、使用率低等弊端。《国际专利分类法》(International Patent Classification,以下简称IPC)是目前国际上最通用的管理和利用专利文献的工具,通过在IPC与《中国图书馆分类法》(Chinese Library Classification,以下简称CLC)的类目之间建立映射从而建立二者的关联,为实现专利和期刊资源交叉浏览和交叉检索提供极大的便利。本文在调研相关领域现有的方法后,采用两种映射方法来实现IPC与CLC之间的类目映射,二者分别基于类目相似度和交叉检索原理。在计算类目相似度的过程中本文为类目定义一个概念模型,同时引入两种词汇相似度计算方法。考虑到用这种方法建立映射过程中受到的人工干预比较大,为了降低人工干预对实验结果的影响,本文设计了另一种基于交叉检索的方法进行映射实验,该方法的实现更多依赖于数学统计而非某种知识组织。最后通过实验证明这两种方法的...
【文章来源】:北京林业大学北京市211工程院校教育部直属院校
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 研究背景
1.2 研究目的和意义
1.3 研究内容及方法
1.4 IPC与CLC的体系结构分析
1.4.1 编制原则的差异
1.4.2 体系结构的差异
1.4.3 类目描述的差异
1.5 分类法映射研究现状
1.5.1 国外分类法映射研究
1.5.2 国内分类法映射研究
1.6 论文组织结构
2 IPC、CLC映射方法研究与实现
2.1 基于类目相似度实现分类法映射
2.1.1 基本原理
2.1.2 类目概念模型的设计
2.1.3 类目特征词的抽取
2.1.3.1 现有关键词抽取技术
2.1.3.2 词库设计
2.1.3.3 方法概述
2.1.3.4 最大匹配算法
2.1.3.5 权重计算
2.1.4 词汇相似度计算
2.1.4.1 基于主题词表的相似度计算
2.1.4.2 基于双序列比对的相似度计算
2.1.5 类目相似度计算
2.1.5.1 类目特征词集的相似度
2.1.5.2 类目所在环境的相似度
2.2 基于交叉检索实现分类法映射
2.2.1 基本原理
2.2.2 实现方法
2.3 小结
3 实验验证
3.1 实验数据
3.1.1 中文期刊语料库
3.1.2 专利文献库
3.2 关键词抽取实验
3.3 词汇相似度计算实验
3.4 映射实验
3.4.1 基于交叉检索的映射实验
3.4.2 基于类目相似度的映射实验
3.5 小结
4 结论与展望
4.1 结论
4.2 展望
参考文献
个人简介
导师简介
获得成果目录清单
致谢
【参考文献】:
期刊论文
[1]我国专利文献信息利用的现状与问题及对策[J]. 李保集,郭小秦. 科技情报开发与经济. 2009(06)
[2]正向最大匹配法在中文分词技术中的应用[J]. 胡锡衡. 鞍山师范学院学报. 2008(02)
[3]《中国图书馆分类法》(第四版)修订构想[J]. 卜书庆,汪东波. 国家图书馆学刊. 2008(02)
[4]一种基于TFIDF方法的中文关键词抽取算法[J]. 徐文海,温有奎. 情报理论与实践. 2008(02)
[5]自动标引研究的回顾与展望[J]. 章成志. 现代图书情报技术. 2007(11)
[6]知识组织系统的互操作及其实现[J]. 司莉. 现代图书情报技术. 2007(03)
[7]跨领域多来源主题词表集成与服务研究[J]. 朱礼军,赵新力,乔晓东,孙钦山. 现代图书情报技术. 2007(01)
[8]一种改进的MM分词方法的研究与实现[J]. 路永刚,赵伟. 长春工业大学学报(自然科学版). 2006(04)
[9]一种基于词汇链的关键词抽取方法[J]. 索红光,刘玉树,曹淑英. 中文信息学报. 2006(06)
[10]分类法映射在学科信息门户交叉浏览中的应用——以Renardus为例[J]. 李育嫦. 图书馆学研究. 2006(10)
硕士论文
[1]基于情报检索语言互操作技术的集成词库构建研究[D]. 刘华梅.南京农业大学 2006
本文编号:3639290
【文章来源】:北京林业大学北京市211工程院校教育部直属院校
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 研究背景
1.2 研究目的和意义
1.3 研究内容及方法
1.4 IPC与CLC的体系结构分析
1.4.1 编制原则的差异
1.4.2 体系结构的差异
1.4.3 类目描述的差异
1.5 分类法映射研究现状
1.5.1 国外分类法映射研究
1.5.2 国内分类法映射研究
1.6 论文组织结构
2 IPC、CLC映射方法研究与实现
2.1 基于类目相似度实现分类法映射
2.1.1 基本原理
2.1.2 类目概念模型的设计
2.1.3 类目特征词的抽取
2.1.3.1 现有关键词抽取技术
2.1.3.2 词库设计
2.1.3.3 方法概述
2.1.3.4 最大匹配算法
2.1.3.5 权重计算
2.1.4 词汇相似度计算
2.1.4.1 基于主题词表的相似度计算
2.1.4.2 基于双序列比对的相似度计算
2.1.5 类目相似度计算
2.1.5.1 类目特征词集的相似度
2.1.5.2 类目所在环境的相似度
2.2 基于交叉检索实现分类法映射
2.2.1 基本原理
2.2.2 实现方法
2.3 小结
3 实验验证
3.1 实验数据
3.1.1 中文期刊语料库
3.1.2 专利文献库
3.2 关键词抽取实验
3.3 词汇相似度计算实验
3.4 映射实验
3.4.1 基于交叉检索的映射实验
3.4.2 基于类目相似度的映射实验
3.5 小结
4 结论与展望
4.1 结论
4.2 展望
参考文献
个人简介
导师简介
获得成果目录清单
致谢
【参考文献】:
期刊论文
[1]我国专利文献信息利用的现状与问题及对策[J]. 李保集,郭小秦. 科技情报开发与经济. 2009(06)
[2]正向最大匹配法在中文分词技术中的应用[J]. 胡锡衡. 鞍山师范学院学报. 2008(02)
[3]《中国图书馆分类法》(第四版)修订构想[J]. 卜书庆,汪东波. 国家图书馆学刊. 2008(02)
[4]一种基于TFIDF方法的中文关键词抽取算法[J]. 徐文海,温有奎. 情报理论与实践. 2008(02)
[5]自动标引研究的回顾与展望[J]. 章成志. 现代图书情报技术. 2007(11)
[6]知识组织系统的互操作及其实现[J]. 司莉. 现代图书情报技术. 2007(03)
[7]跨领域多来源主题词表集成与服务研究[J]. 朱礼军,赵新力,乔晓东,孙钦山. 现代图书情报技术. 2007(01)
[8]一种改进的MM分词方法的研究与实现[J]. 路永刚,赵伟. 长春工业大学学报(自然科学版). 2006(04)
[9]一种基于词汇链的关键词抽取方法[J]. 索红光,刘玉树,曹淑英. 中文信息学报. 2006(06)
[10]分类法映射在学科信息门户交叉浏览中的应用——以Renardus为例[J]. 李育嫦. 图书馆学研究. 2006(10)
硕士论文
[1]基于情报检索语言互操作技术的集成词库构建研究[D]. 刘华梅.南京农业大学 2006
本文编号:3639290
本文链接:https://www.wllwen.com/tushudanganlunwen/3639290.html