当前位置:主页 > 社科论文 > 图书档案论文 >

中图法与DDC类目自动映射研究

发布时间:2020-10-16 13:23
   随着信息的大量涌现,信息用户对检索的要求越来越高,期望“一站式”浏览和下载所需各类文献信息资源。分类词表作为信息组织工具在信息资源整合、存取过程中担任着非常重要的角色。各国学者均注重对分类法的开发和研究,编制了各具特色的分类词表。正是这些语言也给文献信息数据库带来难以跨越的鸿沟。不同国家、地区、语言的数据库使用不同的分类法组织其信息资源,多数具有不同的检索界面,需要用户掌握不同的检索策略,造成用户检索难、信息资源使用率低、共享性差等诸多问题。 分类法互操作是解决“一站式”获取需求的重要手段。《杜威十进分类法》(简称DDC)是国际上应用最广的分类法,是实现国内分类法与世界接轨的最优选择。当前的研究成果集中在DDC与《中国图书馆分类法》互操作的理论层面,由于匹配准确率低、研究覆盖面小、版权问题等,没有实现二者的互操作。在此背景下,需要一个新的方法来解决这些难题,语义相似度计算、共现映射、交叉浏览等方法相继被应用于类表自动匹配过程中。 本文首先对国内外情报检索语言互操作研究现状进行了简要概述,对目前分类表互操作的类型、实现方法、语义相似度计算的类别和特点进行了详细的研究分析。对DDC与CLC理学类目进行人工映射匹配,从编制原则、类表结构、类目层次、语言等方面对两者之间的异同进行比较,总结分析出类目映射匹配的依据:类名、注释、主题词、语义关系、书目记录等因素在匹配时所应用的情况。旨在将人工映射的数据应用于计算机自动匹配系统设计中。采用基于特征词计算各因素的相似度实现类目部分匹配,进一步结合书目记录共现原理完成类目匹配,以最终提高DDC和《中图法》自动映射的完整性和准确性,克服现有计算机间接映射,单纯依靠类名匹配方法的局限性。本文依据这一方法对实验数据进行了验证,给出特征词相似度计算时应设定的优先度和权重值。
【学位单位】:山西大学
【学位级别】:硕士
【学位年份】:2013
【中图分类】:G254.12
【文章目录】:
中文摘要
ABSTRACT
第一章 绪论
    1.1 中图法到DDC映射研究目的和意义
    1.2 国内外研究动态
        1.2.1 国内研究现状
        1.2.2 国外研究动态
    1.3 本文的主要研究内容
    1.4 本文的创新与不足
第二章 类表互操作的基本理论
    2.1 分类表互操作的类型和实现方法
        2.1.1 基于人工智力的直接映射
        2.1.2 基于语义相似度的间接映射
        2.1.3 基于同现的类目匹配
        2.1.4 基于交叉浏览的类目匹配
    2.2 语义相似度自动算法的种类
        2.2.1 基于词汇的类目概念相似度计算
        2.2.2 基于训练集的特征词归类方法
        2.2.3 基于空间向量模型的类目相似度计算
    本章小结
第三章 CLC和DDC映射人工匹配
    3.1 数据来源
    3.2 DDC与CLC类表特征分析
        3.2.1 DDC与中图法的编制原则比较
        3.2.2 两部分类法文化和语言上的差异比较
        3.2.3 DDC与中图法类表结构比较
        3.2.4 DDC与中图法类目层次比较
        3.2.5 微观上类目差异比较
    3.3 类目映射匹配关系
    3.4 类目映射匹配依据
        3.4.1 类名
        3.4.2 类目注释
        3.4.3 主题词
        3.4.4 类目语义关系
        3.4.5 类目匹配规则
        3.4.6 依据书目记录的匹配
    3.5 匹配映射结果分析
        3.5.1 匹配类型结果分析
        3.5.2 匹配依据分布讨论
        3.5.3 匹配依据在各学科内的分布
        3.5.4 DDC到CLC类目匹配数据跨学科情况
    本章小结
第四章 基于人工匹配结果分析的自动匹配研究和实现
    4.1 计算机匹配的实现流程
    4.2 类名、注释、主题词规范化处理
        4.2.1 建立以学科划分的数据表
        4.2.2 DDC和中图法类目数据结构
        4.2.3 特征词抽取
    4.3 基于特征词集的语义相似度的计算方法
        4.3.1 类目特征词集的相似度计算
        4.3.2 类目层次对语义相似度的影响
    4.4 基于类目规则、类目关系、书目记录的映射方法
        4.4.1 建立类目匹配规则、类目关系匹配
        4.4.2 根据书目记录的匹配及验证映射结果
    4.5 实验结果分析
        4.5.1 类名匹配数据分析
        4.5.2 注释匹配数据分析
        4.5.3 主题词匹配数据分析
        4.5.4 类目规则、类目关系及书目记录匹配数据分析
Depth验证确定匹配关系'>        4.5.5 类目层次差异度DifferenceDepth验证确定匹配关系
第五章 结语与展望
    5.1 总结
    5.2 展望
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式

【参考文献】

相关期刊论文 前10条

1 侯汉清;建立以《中国分类主题词表》为核心的检索语言兼容体系[J];北京图书馆馆刊;1998年04期

2 卜书庆;贺玲勇;宗玥;杜旭;;分类主题一体化的知识组织系统研发述要——兼论《中图法》第五版编辑维护系统[J];国家图书馆学刊;2011年04期

3 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期

4 张琪玉;情报检索全过程中概念与标识的对应转换[J];图书与情报;2002年02期

5 张晓莉,周九常;两种分类转换系统之比较分析[J];高校图书馆工作;2000年03期

6 张山山;地理信息系统数据模型分析[J];计算机工程与应用;2001年08期

7 何娟;高志强;陆青健;瞿裕忠;;基于词汇相似度的元素级本体匹配[J];计算机工程;2006年16期

8 张忠平;赵海亮;张志惠;;基于本体的概念相似度计算[J];计算机工程;2009年07期

9 周林志;齐建东;王建新;朱礼军;;基于词汇相似度的IPC与CLC映射[J];计算机工程;2010年23期

10 刘华梅;侯汉清;;近十年情报检索语言互操作研究进展[J];图书馆理论与实践;2006年04期


相关硕士学位论文 前3条

1 靳雪茹;基于机器学习的IPC与CLC类目映射方法[D];北京林业大学;2011年

2 刘华梅;基于情报检索语言互操作技术的集成词库构建研究[D];南京农业大学;2006年

3 周林志;国际专利分类法与中图分类法类目映射研究[D];北京林业大学;2010年



本文编号:2843312

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2843312.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户934f7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com