数字文献资源多元深度聚合研究
发布时间:2020-06-26 09:24
【摘要】:图书馆是社会文化公共基础设施的重要组成部分之一,在社会文化事业发展中将起到十分重要的积极作用。无论是图书情报学的理论研究还是现实的图书馆事业,均越来越强调实现知识服务的重要性。深化图书馆知识服务能力,提升图书馆知识服务水平已经成为当前亟需解决的问题;此外,随着科学发展所累积的数字文献资源规模越来越庞大,如何高效利用这些数字文献资源也逐渐成为提升知识服务能力的重要研究命题。本文的选题“数字文献资源多元深度聚合研究”正是在这样的大背景下提出来的。 本研究综合运用语义挖掘、自然语言处理、信息计量、网络结构分析等多学科交叉的方法,创新地提出数字文献资源多元深度聚合理论是衔接信息计量与信息检索的重要桥梁,并在此基础上构建了数字文献资源多元深度聚合理论体系,从多个方面论述了其多元性特征和深度特性;进一步明确了多元深度聚合的技术流程和方法,通过两类典型的数字文献资源特征项关联网络论证了该方法体系的实用性和可操作性。本研究力求从新的途径来实现数字文献资源语义揭示与深度聚合,改进图书馆服务方式,提升服务效率和水平,为数字图书馆的建设和多学科交叉的方法体系提供有益的探索成果。 本文坚持“理论结合实践,用实践验证理论”的思想,从理论基础研究,理论体系研究,核心技术流程,典型聚合方式实证等多角度系统化进行数字文献资源多元深度聚合研究。论文第0章引言论述了选题背景、研究意义、国内外研究现状、技术路线与目标,第六章为研究总结和展望;其余核心部分包括如下五章: 第一章是数字文献资源多元深度聚合的理论基础研究,目的在于明确问题来源和理论定位。首先对数字文献资源的概念和构成要素进行分析;进一步阐述了作为聚合前阶段的数字资源整合的主要内容以及与聚合的关联;论述了当前研究中与数字资源聚合最相关的领域-信息检索的基本思想及其与聚合的关联;分析了信息计量学中的集中与离散分布现象,说明这是能够实施聚合的基础,在此基础上将数字文献资源多元深度聚合定位为衔接信息计量学和信息检索的纽带。 第二章是数字文献资源多元深度聚合的内涵和理论框架研究。多元深度聚合是用户和以资源集合为表现形式的知识世界的交互过程;数字文献多元深度聚合的理论模型包括聚合的对象类型、关联网络、测度方法和聚合目的等四个要素,这些要素所具有的多元性特征反映了数字文献资源聚合的多元性。从基于元数据的聚合、基于计量的聚合到基于语义的聚合是一个不断深化的过程,其中包含了多粒度的层次,不同对象的聚合重点也是体现聚合深度特性的一个重要内容。理论框架的建立为进一步明确技术流程提供了基础。 第三章是数字文献资源多元深度聚合的技术体系研究。首先构建了多元深度聚合的通用流程框架,进一步将之归纳为三个核心技术问题,即聚合对象的重要性评价、资源聚合的获取、资源聚合的语义揭示。对比了局部重要性和全局重要性指标,分析了全局重要性评价的优点。针对基于节点和基于聚类的两类现有方法,创新地提出了相对重要性聚合方法。归纳了从词频,共现再到主题模型的语义发现路径,总结了主题语义挖掘的灵活性和可操作性。 第四章是引文网络中核心资源多元深度聚合的实现。引文网络是特征项关联网络中有向-二值网络最典型的代表。本章系统分析了传统引文网络中的重要性评价单一、结构分析粒度过大的问题,并提出改进指标和方法,将多元深度聚合技术流程应用于XML研究论文的引文网络中,发现相对值聚合方法能够揭示网络中最具层次丰富性的核心资源聚合。结合主题语义分析,能够实现聚合中所包含语义内容的深度揭示。基于引文网络的资源深度聚合结果是本文所构建的理论和方法体系有效性的重要体现。 第五章是作者知识关联网络多元深度聚合实现。作者关联网络的类型最丰富,明确作者复合关联网络的聚合流程也就解决了其他多种特征项的聚合问题。本章详细描述了作者数据的著录问题和清洗策略,构建了作者合作、互引、共被引、基于文献的耦合、基于关键词的耦合和基于出版物的耦合等六种关联网络,对网络间的关联性进行分析,为各种共现网络分析方法的结合使用提供更多的支持。利用加入作者的语义主题模型挖掘出作者的主题语义分布,发现作者合作网络、共被引网络、基于文献的耦合网络的聚合均有其独特之处,而互引、基于关键词的耦合、基于出版物的耦合则有许多使用上的限制条件。基于作者关联网络的资源深度聚合能够为满足用户知识需求提供更多角度的支持。
【学位授予单位】:武汉大学
【学位级别】:博士
【学位授予年份】:2014
【分类号】:G250.73
【图文】:
图0.2出现频次大于2的中文关键词共词分析
容和服务的链接,包括全文、文摘、主题网关等。目前许多图书馆在OPAC系统中已经嵌入了 SFX,图1.2是武汉大学图书馆OPAC系统中SFX的实例。用户在OPAC中检索到资源后,点击SFX链接就会显示与该资源相关的服务项列表,例如馆藏查询、馆际互借、查看网络书评和网络搜索引擎中与资源相关的信息等内容。?OCLC. WorIdcat[DB/OL]. [2014-1-7]. http:/Avww.oclc.oiig/about/purpose.en.htmI②Ex Libris. SFX[EB/OL]. [2013-12-11]. http://www.exlibrisgroup.com/cn/category/UsingSFX34
本文编号:2730129
【学位授予单位】:武汉大学
【学位级别】:博士
【学位授予年份】:2014
【分类号】:G250.73
【图文】:
图0.2出现频次大于2的中文关键词共词分析
容和服务的链接,包括全文、文摘、主题网关等。目前许多图书馆在OPAC系统中已经嵌入了 SFX,图1.2是武汉大学图书馆OPAC系统中SFX的实例。用户在OPAC中检索到资源后,点击SFX链接就会显示与该资源相关的服务项列表,例如馆藏查询、馆际互借、查看网络书评和网络搜索引擎中与资源相关的信息等内容。?OCLC. WorIdcat[DB/OL]. [2014-1-7]. http:/Avww.oclc.oiig/about/purpose.en.htmI②Ex Libris. SFX[EB/OL]. [2013-12-11]. http://www.exlibrisgroup.com/cn/category/UsingSFX34
本文编号:2730129
本文链接:https://www.wllwen.com/tushudanganlunwen/2730129.html
教材专著