Web日志中会话识别方法研究与改进
本文关键词:Web日志中会话识别方法研究与改进
【摘要】:随着Internet的不断发展,越来越多的组织、企业、机构通过网络与用户交流或交易。为了留住已有用户,争取潜在客户,必须提高用户体验,使自己的网站更加实用,更加有吸引力。为了实现这个目标,必须知道用户兴趣所在,根据用户的访问特点来优化网站结构,发展个性化服务。通过对用户的访问记录,即Web日志进行分析可以发现潜在的用户访问模式,从而来改善网站结构,发展个性化服务,提升用户体验。Web日志挖掘是Web数据挖掘的一个重要子领域,从Web日志数据里挖掘潜在的、有用的知识或模式。会话识别是Web日志挖掘中的重要步骤。本文针对目前各种会话识别方法,提出了一种优化的会话识别方法,即基于页面兴趣度动态阀值会话识别方法。该方法通过把页面兴趣度和页面的动态平均停留时间相结合生成基于页面兴趣度动态阀值来识别会话。本文主要工作有:1)本文首先系统地介绍了数据挖掘、Web挖掘的概念和分类,然后对Web日志挖掘相关概念、技术和过程进行了详细的阐述,重点研究了Web日志挖掘的数据预处理过程。2)为了生成个性化的动态阀值来识别会话,本文提出了页面兴趣度,即用户对页面感兴趣程度,根据页面的性质和用户相对浏览速度对页面兴趣度进行量化。3)针对目前会话识别方法存在的问题,提出动态阀值会话识别方法,通过把页面兴趣度和页面的动态平均停留时间相结合,产生基于页面兴趣度动态阀值,弥补了传统时间阀值会话识别方法不能根据不同用户、不同网站动态调整阀值的不足。实验结果表明,相对于目前会话识别使用的单一固定阀值进行会话识别,本文提出的方法能更好地利用用户和页面的特点,更为合理有效。
【学位授予单位】:上海师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.09
【相似文献】
中国期刊全文数据库 前10条
1 范纯龙;姜宏飞;李华;;利用图片类日志信息改进会话识别质量[J];计算机应用;2010年04期
2 郑立山;滕少华;;改进的页面与时间阈值的会话识别法[J];计算机应用与软件;2012年10期
3 张晓伟;;一种动态时间阈值的会话识别算法[J];山东电力高等专科学校学报;2012年04期
4 郑立山;滕少华;;改进的页面与时间阈值的会话识别法[J];江西师范大学学报(自然科学版);2012年04期
5 李文骏;黄金晶;;TRDFA:一种用于事务识别的DFA[J];计算机工程与应用;2011年34期
6 张海强;胡学龙;;一种基于引用日志文件的启发式会话识别算法[J];扬州大学学报(自然科学版);2007年03期
7 汪成龙,贺亚茹;基于Web服务器的ASP会话管理机制[J];航空计算技术;2004年02期
8 姜宏飞;范纯龙;徐蕾;;非页面日志信息在改进会话识别中的应用研究[J];沈阳航空工业学院学报;2010年01期
9 田野;王文东;饶京海;王冠;郭亮;陈灿峰;马建;;短信息的会话检测及组织[J];软件学报;2012年10期
10 黄金晶;赵雷;杨季文;;使用DFA的Web会话构造方法[J];计算机工程与应用;2009年08期
中国硕士学位论文全文数据库 前5条
1 袁艺;Web日志中会话识别方法研究与改进[D];上海师范大学;2016年
2 娄新燕;基于统计语言模型的交通会话识别[D];山东大学;2014年
3 张建光;Web会话识别的优化方法研究[D];合肥工业大学;2013年
4 黄金晶;Web使用挖掘方法的研究与改进[D];苏州大学;2009年
5 焦亚丽;Web日志会话中识别方法的改进[D];山西财经大学;2009年
,本文编号:1147207
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1147207.html