基于Web日志挖掘的个性化推荐原型系统研究与实现
【学位单位】:南京农业大学
【学位级别】:硕士
【学位年份】:2009
【中图分类】:G350.7
【部分图文】:
用用用用用用用用用用用用用用用用户会话文件 件原原始日志文件 件件 ~户口口口 .---,,、如,..----.口口口尸 尸尸尸尸尸尸尸尸尸尸尸尸尸尸尸图2一ZWeb日志挖掘的步骤1.数据预处理有时由于本地缓存、代理服务器和防火墙的存在,会影响日志数据的准确性。所以在进行挖掘前会先进行数据清理。主要将原始的日志文件过滤、筛选以及重组,将之转变为适合挖掘算法的数据格式,通常以用户会话文件的形式保存到数据库中,后续的挖掘过程可以直接在此上进行挖掘。2.模式挖掘这一阶段是Web日志挖掘的核心,根据挖掘任务的不同,采用不同的挖掘算法,从数据预处理阶段产生的用户会话中挖掘出用户的浏览规则、模式。发现的规则、模式一般分为关联规则、序列模式、用户聚类等。3.模式分析及应用模块经过模式挖掘阶段,可以得到一些先前未知的用户访问模式,但是,并非所有的模式都是准确的和有使用价值的。这一阶段,需要利用领域专家的知识以及其它一些可用的标准来分析这些模式,过滤掉那些没有利用价值以及有偏差的模式,提取有意义、感兴趣的规则和模式作为挖掘结果。 2.2Web个性化推荐个性化推荐实现方式就是当用户访问网站时
容推荐的缺点有:能够获得网页特征的部分信息,通常是文本信息,其他内视频内容被忽略了。的资源过于狭窄:推荐将局限于用户以前浏览的信息类似改变了,那推荐的效果就不理想了。器(Classifiers)〔,,,类器的分类结果为用户推荐,通常使用的分类方法有神叶斯网络(BayesianNe七刀ork)和规则推导模型(RuleInduetlon要用协同过滤和内容过滤两个推荐技术来进行推荐。个性化推荐的步骤性化推荐的步骤一般为〔33]:第一步为系统收集用户资料,并户信息库;第二步为根据用户信息,进行推荐;第三步为用给系统。其中第二步是关键。
图3一5墓于共同点击网页的用户聚类算法流程图3.1.2基于当前点击页的推荐算法当用户登陆后,看到网站给予的推荐,可能会点击这些推荐网页,可能会点击其他网页。这时之前的相似用户组对用户来说意义就不大了,因为可能用户新点击的网
【相似文献】
相关期刊论文 前10条
1 梁高卫;;基于多Agent的Web个性化信息检索模型[J];邵阳学院学报(自然科学版);2010年03期
2 田晓珍;尚冬娟;;Web的个性化服务[J];重庆工学院学报(自然科学版);2008年07期
3 李方敏;CGI的安全编程[J];计算机工程与应用;1999年06期
4 宋如顺,姜乃松;基于Web的远程考试系统设计与实现[J];计算机工程;1999年06期
5 王红霞,姚家亮;利用ASP构建新型信息系统的方法与实现[J];计算机应用;1999年09期
6 邓劲生,张银福;面向对象的多媒体信息WEB发布[J];计算机应用研究;1999年09期
7 刁兴春,李赤红;Intranet环境下事务处理的理论研究和实现[J];小型微型计算机系统;1999年06期
8 高昆;基于ASP的WEB站点开发技术分析[J];北华大学学报(社会科学版);1999年05期
9 王清心,胡建华;经贸数据库的WEB集成发布[J];昆明理工大学学报;1999年02期
10 李晶,朱秋萍;Web页制作中的动态表现技术[J];计算机工程;2000年06期
相关博士学位论文 前10条
1 张建武;面向Web应用的安全评测技术研究[D];北京邮电大学;2012年
2 朱俊武;基于本体的Web服务语义支撑技术研究[D];南京航空航天大学;2008年
3 李常宝;基于索引的web服务发现研究[D];北京邮电大学;2011年
4 魏登萍;语义Web服务发现中匹配策略的研究与实现[D];国防科学技术大学;2011年
5 许笑;分布式Web信息采集关键技术研究[D];哈尔滨工业大学;2011年
6 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年
7 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
8 陈世展;服务网络:基于语义和社会化关系的Web服务计算基础设施[D];天津大学;2010年
9 胡佳;语义Web服务自动组合及验证的研究[D];天津大学;2010年
10 王辉;面向互联网的Web服务基础设施构建和应用[D];天津大学;2010年
相关硕士学位论文 前10条
1 蔡宏果;基于基因表达式编程的Web个性化推荐技术研究[D];广西师范学院;2010年
2 唐黎;Deep Web页面结构分析与核心内容提取研究[D];重庆大学;2011年
3 吴新勇;基于需求群组的Web服务调度模型研究[D];上海交通大学;2011年
4 邵延振;基于Web挖掘的信息提取与推荐相关研究[D];广西师范大学;2010年
5 相景丽;Web挖掘技术在远程教学系统中的应用[D];电子科技大学;2010年
6 徐卫;Web新闻热点发现系统的设计与实现[D];华中科技大学;2011年
7 姜本臣;基于嵌入式Web服务器应用技术的研究[D];沈阳工业大学;2012年
8 温梨梨;基于零拷贝的Web服务器技术研究[D];中国海洋大学;2011年
9 焦燕廷;一种基于领域本体的语义Web服务匹配和组合方法[D];山东科技大学;2011年
10 黄亮;Web漏洞扫描系统中的智能爬虫技术研究[D];杭州电子科技大学;2012年
本文编号:2859451
本文链接:https://www.wllwen.com/tushudanganlunwen/2859451.html