当前位置:主页 > 社科论文 > 图书档案论文 >

个性化推荐技术研究及其在数字图书馆中应用

发布时间:2020-07-19 19:29
【摘要】:近年来,数字存储技术的飞速发展使得几乎所有的事物都可数字化。特别地,以图书馆资源数字化为目的的数字图书馆(Digital Library)建设在各国迅猛发展,其相关研究工作也掀起了一股热潮。 在数字图书馆的众多研究方向中,数字图书馆中的个性化服务已经成为一种趋势,其最大优点就是能为不同背景、不同目的的用户提供满足个性化需求的数字资源。通过对Web环境下的用户数据和用户日志进行深入的统计与分析,可以发现用户的兴趣所在,挖掘隐藏在这些数据背后的更重要的用户兴趣模式信息以及关于这些数据整体特征的描述,并预测其发展趋势,进而在恰当的时间方便快捷地为不同的用户提供恰当的“一对一”的个性化信息服务。个性化服务不仅会改善数字图书馆的Web站点设计,而且对数字图书馆整体的服务决策过程具有重要的意义。 本文首先介绍了国内外数字图书馆及其个性化技术的研究现状以及高等学校中英文图书数字化合作项目(CADAL)的背景和进展;接着本文阐述了Web挖掘技术的基本原理,并在对Web挖掘过程深入分析的基础上提出了一种新的数据结构--序列模式树,并给出其构建算法。基于构建好的序列模式树数据结构,本文提出了一种频繁序列模式挖掘的算法,并将其应用在数字图书馆个性化服务中。最后,本文给出了基于序列模式树和频繁序列模式挖掘算法的CADAL个性化服务系统的具体实现。
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP393.09;G250.76
【图文】:

体系结构图,体系结构,日志文件,网站


CI断slfi“脉助伙山翻图3一 2Web使用挖掘的大致体系结构图33W七b日志挖掘的数据采集数据可靠性是影响网络个性化服务质量的重要因素,准确的用户数据对识别用户、发现用户的兴趣有着重要的作用。数据采集阶段就是根据系统要求,确定从何处采集用户的使用数据,识别出它们的内容和结构。Web服务器、客户端以及代理服务器是目前三个主要数据来源。3.3.1服务器端的数据服务器端的数据主要包括:Web日志文件、Ccokies和用户显示数据输入。 (1)Web日志文件:web日志文件是用户浏览web服务器时记录下来用户访lb]网站的情况,被记录在Web服务器中。万维网协会 (worldwidewebConsortium)组织规定了服务器日志的两种格式 :cLF(common109format)和EcLF (extendedeommon109format)。(2)cookies:Cookies用来追踪用户浏览过的页面,通过Cookies在客户机器上储存一个信息,当用户下次访问该网站时,这个信息会送回到服务器,从而识

界面图,日志文件,界面图,数据预处理


5.3数据预处理过程的实现数据预处理技术在整个web个性化系统中的作用至关重要。数据预处理主要包括数据清洗,数据过滤,用户识别,用户会话识别等过程。具体的流程如图5一4所示:

界面图,界面,格式设置,后台处理


例如,一个序列用户会话为<a,b,c,d,c,b>,改为 PageOccurrence则变成<(a,1),(b,1),(e,1),(d,l),(e,2),(d,2)>·在CADAL的后台处理程序中,创建用户的会话文件的界面如图5一5所示:地....价招阳娜用票热日衡脱栩CF胜B【ion:脚Maximal分 ssionDur减云onOMax诬mal即ge切e.Time,『.5。。.d:}如岭咖L::ie’,’.’..’.’.:.’’.’.’’’..’=.’’.’j匹亚口二竺一)图5一5创建用户会话文件的界面在此界面中,用户可以选择两种不同产生用户会话的方式:即最大会话时间间隔和用户访问的连续页面之间的最大时间间隔。此外,用户可以根据系统提供的格式设置最大时间间隔阀值。在程序中,产生用户会话的是CreateVisitorssessions类,该类通过比较当前的sessinn和分析的日志记录的时间戳,来决定是否需要产生新的session。图5一6给出了从web日志到用户会话的产

【相似文献】

相关期刊论文 前10条

1 华山;;世界数字图书馆探宝[J];黄金时代(学生族);2009年09期

2 ;新研究:图书馆迎来数字图书馆的同时面临预算约束[J];现代图书情报技术;2011年05期

3 傅晨琦;叶辉;;杭州数字图书馆率先实现网站、手机、电视“三网融合”[J];公共图书馆;2011年01期

4 宗和;;全国图书馆藏书一“网”可查[J];公共图书馆;2011年01期

5 李连会;;浅论传统图书馆的数字化发展趋势[J];中国科教创新导刊;2011年17期

6 ;时事[J];黄金时代(学生族);2009年06期

7 员贵云;;中小学数字图书馆在教学中的应用案例[J];中国现代教育装备;2011年16期

8 张夥夥;;云计算系统在数字图书馆中的应用[J];信息技术;2011年08期

9 董文敏;;现代公共图书馆的数字资源建设探讨[J];佳木斯大学社会科学学报;2011年04期

10 ;IEEE与Access Innovations合作对Xplore数字图书馆进行重新索引[J];现代图书情报技术;2011年05期

相关会议论文 前10条

1 刘颖;;论数字图书馆的信息构建[A];华北地区高校图协第二十四届学术年会论文(文章)汇编[C];2010年

2 郭启智;;关于数字图书馆有关问题的探讨[A];山西省科学技术情报学会学术年会论文集[C];2004年

3 符翠;;数字图书馆建设探讨[A];新环境下图书馆建设与发展——第六届中国社区和乡镇图书馆发展战略研讨会征文集(下册)[C];2007年

4 王爱华;张铭;陈捷;杨冬青;唐世渭;;基于形式本体的数字图书馆内容元数据的创建[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年

5 高翔;;浅谈网站模式下的数字图书馆资源建设[A];华北地区高校图协第二十四届学术年会论文(文章)汇编[C];2010年

6 喻浩;潘薇;;数字图书馆支撑技术及其发展[A];数字图书馆资源建设与发展学术研讨会暨中国农学会农业图书馆分会理事工作会议会议资料[C];2007年

7 潘淑春;喻浩;;数字图书馆建设及其运行模式研究[A];数字图书馆资源建设与发展学术研讨会暨中国农学会农业图书馆分会理事工作会议会议资料[C];2007年

8 林英;;谈谈中国数字图书馆的研究、开发与建设[A];福建省图书馆学会2002年学术年会论文集[C];2002年

9 延宏;;数字图书馆:服务如何个性化[A];新观点新学说学术沙龙文集24:数字时代图书馆的创新与共享[C];2008年

10 来雪玲;;数字图书馆的定位与对策[A];图书馆与西部大开发[C];2002年

相关重要报纸文章 前10条

1 吴小宁(作者单位:蚌埠市图书馆);数字图书馆浅谈[N];安徽日报;2000年

2 ;什么是数字图书馆[N];中国妇女报;2001年

3 靳红;世纪超星参与建设数字图书馆[N];人民公安报;2000年

4 杨健;全球最大中文数字图书馆开馆[N];人民日报;2003年

5 刘立玲;扫描仪为数字图书馆奠基[N];人民邮电;2001年

6 静文;这个数字图书馆好“听”[N];中国新闻出版报;2004年

7 本报记者 延宏;数字图书馆:服务如何个性化[N];科技日报;2008年

8 本报记者 洪黎明;数字出版与数字图书馆的互动[N];人民邮电;2008年

9 记者 姚立;联合国教科文组织正式推出“世界数字图书馆”[N];光明日报;2009年

10 关月;印度建传统知识数字图书馆[N];健康报;2009年

相关博士学位论文 前10条

1 于晓燕;基于网格的数字图书馆模式构建研究[D];南开大学;2010年

2 周丽霞;数字图书馆版权获取研究[D];吉林大学;2011年

3 孙坦;数字图书馆理论与发展模式研究[D];中国科学院文献情报中心;2000年

4 关欣;数字图书馆知识管理研究[D];吉林大学;2010年

5 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年

6 杜文华;本体的构建及其在数字图书馆中的应用研究[D];武汉大学;2005年

7 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年

8 卓文飞;中国农业数字图书馆信息集成服务系统研究[D];中国农业科学院;2008年

9 韩毅;语义网格环境下数字图书馆知识组织策略与应用研究[D];吉林大学;2008年

10 牟冬梅;数字图书馆知识组织语义互联策略及其应用研究[D];吉林大学;2009年

相关硕士学位论文 前10条

1 秦凤蕊;个性化推荐技术研究及在数字图书馆中的应用[D];长春理工大学;2010年

2 王春贺;个性化推荐技术研究及其在数字图书馆中应用[D];浙江大学;2007年

3 罗宏;数字图书馆著作权风险规避研究[D];四川大学;2004年

4 罗龙艳;数字图书馆资源主题信息门户的设计与实现研究[D];四川大学;2004年

5 董正伟;Google数字图书馆所引发的著作权问题思考[D];中国政法大学;2011年

6 田艳芳;数字图书馆中数据预处理子系统的设计与实现[D];国防科学技术大学;2001年

7 戴洪霞;数字图书馆信息资源建设研究[D];东北师范大学;2002年

8 阚忠良;数字图书馆中基于结构和内容的文本信息检索技术的研究[D];黑龙江大学;2002年

9 贺玲玲;数字图书馆运行机制与管理模式研究[D];国防科学技术大学;2003年

10 曹树新;图书馆自动化管理信息系统[D];大连理工大学;2005年



本文编号:2762863

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2762863.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户de87b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com