当前位置:主页 > 社科论文 > 图书档案论文 >

基于Web日志挖掘的个性化推荐原型系统研究与实现

发布时间:2020-10-28 02:41
   互联网技术的迅猛发展把我们带进了一个信息爆炸的时代,海量信息使用户很难从中发现自己感兴趣的部分,容易导致信息过载和资源迷向,这使针对用户的个人特定需求而为其提供针对性服务的个性化推荐系统应运而生,将用户可能感兴趣的信息传送或优先传送给用户。为了在更深的层次上理解用户的行为,而不需要用户的参与,需要用到Web日志挖掘,Web日志记录了用户的访问行为。通过Web日志挖掘,比较用户间的访问相似度,找出相似用户组,可以主动地向用户推荐相似用户组访问过而用户本身还没有访问过的网页。基于Web日志挖掘的个性化信息推荐日益成为一个重要的研究课题。 本文主要介绍了国内外个性化推荐技术的现状,提出了个性化推荐技术需要改进之处。阐述了Web日志挖掘的概念和步骤,描述了个性化推荐的概念、分类、核心技术和步骤。分别对基于Web日志挖掘的个性化推荐算法进行中的个性化浏览推荐算法和个性化搜索推荐算法进行了介绍和改进,通过分析Web日志记录的用户的行为特征,对基于向量聚类算法提出了改进的思路,提出基于共同点击网页的用户聚类算法,增加了用户聚类和推荐的准确性,还提出了基于当前点击页的推荐算法,并且通过对查询关键词扩充算法的研究,提出了基于用户兴趣度的结果扩展查询算法和基于用户相似度的个性化搜索推荐排序算法。并将这些算法引入到一个基于Web日志的个性化推荐(包括个性化搜索)原型系统中并给予实现,通过这种界面形式向用户推荐其可能感兴趣的但又未浏览过的网页,并给出了该系统的详细模块设计和功能介绍,对系统的功能进行了测试和评价,证明了算法的准确性。最后总结了本文工作中存在的问题,提出了今后的工作。 其中基于共同点击网页的用户聚类算法、基于用户兴趣度的结果扩展查询算法和基于用户相似度的个性化排序方法是本文及本系统的难点与创新点 总之,本文全面系统地总结了目前国内外个性化推荐技术的现状,为系统的个性化推荐功能提供了很好的借鉴。同时,本文中采用的基于Web日志挖掘的个性化推荐算法,经测试结果证明,具有较高的查准率,有一定的实用价值。
【学位单位】:南京农业大学
【学位级别】:硕士
【学位年份】:2009
【中图分类】:G350.7
【部分图文】:

个性化推荐


用用用用用用用用用用用用用用用用户会话文件 件原原始日志文件 件件 ~户口口口 .---,,、如,..----.口口口尸 尸尸尸尸尸尸尸尸尸尸尸尸尸尸尸图2一ZWeb日志挖掘的步骤1.数据预处理有时由于本地缓存、代理服务器和防火墙的存在,会影响日志数据的准确性。所以在进行挖掘前会先进行数据清理。主要将原始的日志文件过滤、筛选以及重组,将之转变为适合挖掘算法的数据格式,通常以用户会话文件的形式保存到数据库中,后续的挖掘过程可以直接在此上进行挖掘。2.模式挖掘这一阶段是Web日志挖掘的核心,根据挖掘任务的不同,采用不同的挖掘算法,从数据预处理阶段产生的用户会话中挖掘出用户的浏览规则、模式。发现的规则、模式一般分为关联规则、序列模式、用户聚类等。3.模式分析及应用模块经过模式挖掘阶段,可以得到一些先前未知的用户访问模式,但是,并非所有的模式都是准确的和有使用价值的。这一阶段,需要利用领域专家的知识以及其它一些可用的标准来分析这些模式,过滤掉那些没有利用价值以及有偏差的模式,提取有意义、感兴趣的规则和模式作为挖掘结果。 2.2Web个性化推荐个性化推荐实现方式就是当用户访问网站时

个性化推荐


容推荐的缺点有:能够获得网页特征的部分信息,通常是文本信息,其他内视频内容被忽略了。的资源过于狭窄:推荐将局限于用户以前浏览的信息类似改变了,那推荐的效果就不理想了。器(Classifiers)〔,,,类器的分类结果为用户推荐,通常使用的分类方法有神叶斯网络(BayesianNe七刀ork)和规则推导模型(RuleInduetlon要用协同过滤和内容过滤两个推荐技术来进行推荐。个性化推荐的步骤性化推荐的步骤一般为〔33]:第一步为系统收集用户资料,并户信息库;第二步为根据用户信息,进行推荐;第三步为用给系统。其中第二步是关键。

流程图,网页,聚类算法,点击


图3一5墓于共同点击网页的用户聚类算法流程图3.1.2基于当前点击页的推荐算法当用户登陆后,看到网站给予的推荐,可能会点击这些推荐网页,可能会点击其他网页。这时之前的相似用户组对用户来说意义就不大了,因为可能用户新点击的网
【相似文献】

相关期刊论文 前10条

1 梁高卫;;基于多Agent的Web个性化信息检索模型[J];邵阳学院学报(自然科学版);2010年03期

2 田晓珍;尚冬娟;;Web的个性化服务[J];重庆工学院学报(自然科学版);2008年07期

3 李方敏;CGI的安全编程[J];计算机工程与应用;1999年06期

4 宋如顺,姜乃松;基于Web的远程考试系统设计与实现[J];计算机工程;1999年06期

5 王红霞,姚家亮;利用ASP构建新型信息系统的方法与实现[J];计算机应用;1999年09期

6 邓劲生,张银福;面向对象的多媒体信息WEB发布[J];计算机应用研究;1999年09期

7 刁兴春,李赤红;Intranet环境下事务处理的理论研究和实现[J];小型微型计算机系统;1999年06期

8 高昆;基于ASP的WEB站点开发技术分析[J];北华大学学报(社会科学版);1999年05期

9 王清心,胡建华;经贸数据库的WEB集成发布[J];昆明理工大学学报;1999年02期

10 李晶,朱秋萍;Web页制作中的动态表现技术[J];计算机工程;2000年06期


相关博士学位论文 前10条

1 张建武;面向Web应用的安全评测技术研究[D];北京邮电大学;2012年

2 朱俊武;基于本体的Web服务语义支撑技术研究[D];南京航空航天大学;2008年

3 李常宝;基于索引的web服务发现研究[D];北京邮电大学;2011年

4 魏登萍;语义Web服务发现中匹配策略的研究与实现[D];国防科学技术大学;2011年

5 许笑;分布式Web信息采集关键技术研究[D];哈尔滨工业大学;2011年

6 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年

7 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年

8 陈世展;服务网络:基于语义和社会化关系的Web服务计算基础设施[D];天津大学;2010年

9 胡佳;语义Web服务自动组合及验证的研究[D];天津大学;2010年

10 王辉;面向互联网的Web服务基础设施构建和应用[D];天津大学;2010年


相关硕士学位论文 前10条

1 蔡宏果;基于基因表达式编程的Web个性化推荐技术研究[D];广西师范学院;2010年

2 唐黎;Deep Web页面结构分析与核心内容提取研究[D];重庆大学;2011年

3 吴新勇;基于需求群组的Web服务调度模型研究[D];上海交通大学;2011年

4 邵延振;基于Web挖掘的信息提取与推荐相关研究[D];广西师范大学;2010年

5 相景丽;Web挖掘技术在远程教学系统中的应用[D];电子科技大学;2010年

6 徐卫;Web新闻热点发现系统的设计与实现[D];华中科技大学;2011年

7 姜本臣;基于嵌入式Web服务器应用技术的研究[D];沈阳工业大学;2012年

8 温梨梨;基于零拷贝的Web服务器技术研究[D];中国海洋大学;2011年

9 焦燕廷;一种基于领域本体的语义Web服务匹配和组合方法[D];山东科技大学;2011年

10 黄亮;Web漏洞扫描系统中的智能爬虫技术研究[D];杭州电子科技大学;2012年



本文编号:2859451

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2859451.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ac592***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com