基于数据挖掘技术的复合图书馆流程优化研究
发布时间:2020-09-18 09:01
早在3000多年前,图书馆已开始产生,数千年以来,图书馆的工作主要围绕竹简、纸质文献等进行人工服务,效率比较低下。而近30年来,以PC和Internet为特征的信息技术快速发展,为新兴的数字图书馆提供强大的技术支持。从上世纪90年代初美国的DL1开始,数字图书馆的发展非常迅速,从最初的图书资源数字化,到Google雄心勃勃的虚拟图书馆计划,短短十几年时间,对图书馆这个有数千年历史传统的产物产生极大的冲击。各个国家和地区投入巨资研发和建设数字图书馆,并把它上升到国家信息基础设施的地位。我国从1996年开始启动数字图书馆项目,一系列项目如中国实验型数字式图书馆(CPDLP)项目、中国数字图书馆工程(CDLP)、国家科技图书文献中心(NSTL)、中国高等教育文献保障系统(CALIS)等数字图书馆示范项目的实施,有力推动了数字图书馆在中国的发展。1996年,英国学者苏顿(S.Sutton)最早提出了复合图书馆这一概念,将来很长一段时间的图书馆形态既不是纯数字图书馆,也非纯传统图书馆,而是二者相互渗透的一种新型图书馆——复合图书馆。复合图书馆要同时承担传统图书馆和数字图书馆的社会职能。数字图书馆的实施,产生了海量的数据资料,几乎与数字图书馆概念同时出现的数据挖掘技术,为我们分析海量的数据资料提供了手段。国内外也有大量学者对采用不同技术手段对相关的数据做了分析和应用,但缺少针对具体高校复合图书馆进行全面的分析和探讨,而本文要解决的问题正是"如何利用数据挖掘的技术手段,通过对实际运行数据的分析,揭示复合图书馆运行内在的一些规律,优化复合图书馆运行流程"。本文抓住资源的采购模型,编目自动化和基于用户兴趣的个性化服务等复合图书馆运行过程中的关键环节进行讨论。(1)本文首先结合实际工作,根据复合图书馆的建设理念,通过对南京财经大学图书馆实际运行过程中的现状进行分析,提出了基于数据挖掘技术的复合图书馆模型,并对复合图书馆模型中的业务流程优化进行了分析,指出通过业务流程的优化,可以优化资源建设的力度,改善运行的环境,减少管理成本,提升图书馆的服务功能。(2)为了服务于图书采购,本文通过对图书馆读者借阅数据进行数据挖掘,揭示图书馆纸本图书使用情况,建立优化的图书采购模型,在不降低读者需求的情况下缩减复本,减少纸本图书采购经费比例,节约经费向数字资源建设倾斜。对图书二级馆藏的可行性进行验证,确立二级图书馆藏架构,减少馆藏环节,节约管理成本。(3)本文针对图书编目的现状,把信息自动化技术引入到图书编目工作中。尝试使用机器学习的方法对图书进行自动分类,克服基于知识工程的图书自动分类和数据挖掘的分类进行图书分类的问题,并验证了机器学习的方法在图书自动分类中的准确性和合理性。本文还对基于条件随机场的书目自动标引进行研究并进行实验分析,得出条件随机场(CRF)的书目自动标引可以只选用书名字段进行标引的结论。同时,为了分析学生读者的借阅行为,本文还针对读者十年来的借阅数据,挖掘和发现读者的读书兴趣,包括读者的个人兴趣和兴趣群体,读者课程成绩与借阅习惯之间的关系,这将有助于针对性的构筑个性化服务体系,提高图书馆的服务能力。纵观全文,主要有以下创新点:(1)通过聚类分析和统计分析清晰的发现图书的使用状态,优化图书采购模型,并实际应用到工作中:图书馆的核心用户群体的发现,读者专业与借阅习惯关系、课程成绩与借阅习惯的关系等信息的挖掘有助于提高图书馆服务的指向性,基于用户兴趣的个性化服务比传统的个性化服务具有更强的针对性。(2)通过流程的优化,可以改善资源建设,编目,流通等业务环节,减少差错,提升服务,提出基于用户需求的复本补充模型;(3)机器学习方法应用于图书自动分类的研究是有效的,基于条件随机场的书目自动标引可以简化。
【学位单位】:南京大学
【学位级别】:博士
【学位年份】:2011
【中图分类】:G250.7
【部分图文】:
国内一个示范性数字图书馆建设架构。它图书馆及互联网上各类数字资源或非数字资源逡逑的加王处理为中必,W为读者提供方便、快捷的知识服务机制为最终目的。围绕资源加工、逡逑资源管理和面向用户的应用服务等=个层面构建了数字图书馆技术架构W。如图2-2所示。逡逑应;逦II逦II逦II逦II逦II逦II逦II逦二□逡逑用:个性化服务数字参考咨询身巧从证信息推送OPAC邋文献传逸馆际互惶VOD点捏光盘vB像逡逑服:逦II逦II逦II逦"逦"逦IL逦n逦逦逡逑t邋:逦图书馆邋n户系统邋OAI-PMH、Z39.加、Z39名8、P3P、METS、1501016扣1逡逑层:逦1^=^逦逡逑逦逦逦逦I逦逦逦逦逦逦逦逦逦逦逦逦—逦—逦■逦-逡逑桯':数字版权管理数字资源发巧元数据管理异构巧源整舍I数字巧塞管理网级语添整鲁与发布逡逑墨邋I邋I逦ex字烱源管理系绳OAIS、239.84、iSO邋10646逡逑层邋I逡逑逦^逦逦—逦逦^逦I逦一-逦*■逡逑v幔保鼻勺肿试椿ぃ保蔽南资只⒆试床杉稍杀暌味韵笫煞庾扒上蟾袷阶诲义蟦
本文编号:2821445
【学位单位】:南京大学
【学位级别】:博士
【学位年份】:2011
【中图分类】:G250.7
【部分图文】:
国内一个示范性数字图书馆建设架构。它图书馆及互联网上各类数字资源或非数字资源逡逑的加王处理为中必,W为读者提供方便、快捷的知识服务机制为最终目的。围绕资源加工、逡逑资源管理和面向用户的应用服务等=个层面构建了数字图书馆技术架构W。如图2-2所示。逡逑应;逦II逦II逦II逦II逦II逦II逦II逦二□逡逑用:个性化服务数字参考咨询身巧从证信息推送OPAC邋文献传逸馆际互惶VOD点捏光盘vB像逡逑服:逦II逦II逦II逦"逦"逦IL逦n逦逦逡逑t邋:逦图书馆邋n户系统邋OAI-PMH、Z39.加、Z39名8、P3P、METS、1501016扣1逡逑层:逦1^=^逦逡逑逦逦逦逦I逦逦逦逦逦逦逦逦逦逦逦逦—逦—逦■逦-逡逑桯':数字版权管理数字资源发巧元数据管理异构巧源整舍I数字巧塞管理网级语添整鲁与发布逡逑墨邋I邋I逦ex字烱源管理系绳OAIS、239.84、iSO邋10646逡逑层邋I逡逑逦^逦逦—逦逦^逦I逦一-逦*■逡逑v幔保鼻勺肿试椿ぃ保蔽南资只⒆试床杉稍杀暌味韵笫煞庾扒上蟾袷阶诲义蟦
本文编号:2821445
本文链接:https://www.wllwen.com/tushudanganlunwen/2821445.html
教材专著