基于蚁群算法的WEB日志用户兴趣路径研究
本文选题:web日志挖掘 + 蚁群算法 ; 参考:《江西师范大学》2015年硕士论文
【摘要】:随着信息技术的高速发展,互联网信息呈指数级增长,各类网站如雨后春笋一般活跃在我们的生活中。对于网络服务提供商而言,如何在海量的服务器日志文件中挖掘出用户的兴趣模式,已经成为许多公司的研究热点。利用蚁群算法对web用户群体的访问数据进行挖掘时,把web用户看成是人工的蚂蚁,算法模型展示的蚂蚁偏好路径,就是用户的兴趣路径,根据web用户的兴趣路径,可以适应不同客户需求,优化网站拓扑结构,改善系统运行效率,调整相应营销策略,提高决策的科学性,从而为企业创造更大的商业价值。实践与分析表明,优化的蚁群算法挖掘web用户兴趣路径相比于MF等传统算法具有更高的准确率,在web日志数据挖掘领域有更好的推广应用价值。本文的研究基于蚁群算法的web日志用户兴趣路径展开,主要工作如下:(1)利用web用户兴趣路径与蚁群觅食行为的相似性,提出了“浏览兴趣度”的新概念,用于反应web用户访问站点的兴趣程度,并使用浏览兴趣度给出了基于蚁群算法的web日志用户兴趣路径挖掘方法。即通过对信息素进行全局更新,计算转移概率,设置转移概率阈值等步骤最终得到用户兴趣路径。实验表明该方法是可行的,能够准确反应用户兴趣路径。(2)通过对客户端日志数据的预处理,从日志数据中获取鼠标滚动相对次数、用户相对浏览时间以及页面点击率等能够反映用户兴趣的关键信息。其中鼠标滚动相对次数表示用户浏览web网页时的鼠标滚动次数占所有页面鼠标滚动次数的比例,用户相对浏览时间是指页面总的浏览时间占所有页面平均访问时间的比例,页面点击率表示页面访问的次数占所有页面访问次数的比例,实验表明,三者构成的信息素能够更准确地代表用户对该站点的兴趣度。(3)蚁群算法中?、?决定了信息素浓度和意向偏爱度的影响程度,本文重新定义了?、?,通过?、?的自适应调节对启发函数进行调整,新定义不仅可以加速算法的收敛速度,而且可以避免局部收敛和早熟,实验证明,该方法提高了算法的搜索效率。
[Abstract]:With the rapid development of information technology, Internet information is growing exponentially. For the network service provider, how to mine the user's interest pattern in the massive server log file has become the research hotspot of many companies. When using ant colony algorithm to mine the access data of web user group, the web user is regarded as an artificial ant. The ant preference path shown in the algorithm model is the user's interest path, according to the interest path of web user. It can meet the needs of different customers, optimize the topological structure of the website, improve the operating efficiency of the system, adjust the corresponding marketing strategy, and improve the scientific nature of the decision, thus creating greater commercial value for the enterprise. Practice and analysis show that the optimized ant colony algorithm has a higher accuracy rate than traditional algorithms such as MF in mining web user interest paths and has a better application value in the field of web log data mining. In this paper, the web log user interest path based on ant colony algorithm is developed. The main work is as follows: 1) based on the similarity between web user interest path and ant colony foraging behavior, a new concept of "browsing interest degree" is proposed. It is used to reflect the degree of interest of web users to visit the site, and the method of web log user interest path mining based on ant colony algorithm is presented by using browsing interest degree. In other words, the path of user interest is obtained by updating pheromone globally, calculating transition probability and setting threshold of transition probability. Experiments show that this method is feasible and can accurately reflect the path of user interest. By preprocessing the client log data, the relative times of mouse scrolling can be obtained from the log data. User relative browsing time and page click rate can reflect the key information of user interest. The relative number of mouse scrolling means that the number of times of mouse scrolling is the proportion of the number of times of mouse scrolling of all pages when users browse web pages, and the relative browsing time of users refers to the proportion of the total browsing time of the page to the average visit time of all pages. Page click rate indicates that the number of page visits is the proportion of all page visits. The experiment shows that the pheromone formed by the three can more accurately represent the user's interest in the site. This paper redefines the effect of pheromone concentration and intention preference. The new definition can not only accelerate the convergence speed of the algorithm, but also avoid local convergence and premature convergence. Experimental results show that the new method improves the search efficiency of the algorithm.
【学位授予单位】:江西师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP18;TP311.13
【相似文献】
相关期刊论文 前10条
1 王杰;使图像的编辑更加容易[J];中文信息;1998年Z1期
2 王波,姚敏;基于信息抽取的匿名用户兴趣描述[J];华南理工大学学报(自然科学版);2004年S1期
3 董全德;;用户兴趣迁移模式与个性化服务[J];电脑知识与技术(学术交流);2007年17期
4 郑运刚;马建国;;基于分类的用户兴趣漂移模型[J];情报杂志;2008年01期
5 张涛;;基于浏览历史的用户兴趣提取模型[J];软件导刊;2009年06期
6 杨杰;陈恩红;;面向个性化服务的用户兴趣偏移检测及处理方法[J];电子技术;2009年11期
7 陈圣兵;李龙澍;纪霞;;多层次用户兴趣模式的动态捕捉[J];计算机工程与应用;2009年36期
8 郑晓健;庞淑英;何英;;一种面向主题的用户兴趣挖掘模型研究[J];昆明学院学报;2010年03期
9 花青松;刘海峰;胡铮;;基于基尼系数的用户兴趣分布模式度量方法[J];计算机工程;2012年22期
10 孙雨生;刘伟;仇蓉蓉;黄传慧;;国内用户兴趣建模研究进展[J];情报杂志;2013年05期
相关会议论文 前7条
1 赵琦;骆志刚;田文颖;李聪;丁凡;;一种基于负反馈信息的用户兴趣模型修正方法[A];中国通信学会第六届学术年会论文集(下)[C];2009年
2 孙静;郭奇;张志强;冯建华;;一种基于面向领域检索系统的用户兴趣获取方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 孙铁利;教巍巍;;基于马尔科夫模型的用户兴趣导航模型系统(英文)[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
4 廖祝华;刘建勋;易爱平;;基于用户兴趣的Web服务发现[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
5 李晓黎;史忠植;梁永全;刘福桃;;INTERNET网上一种识别用户兴趣的学习方法[A];第十六届全国数据库学术会议论文集[C];1999年
6 田萱;杜小勇;;基于SAM模型的用户兴趣表示研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 王勇;刘奕群;张敏;马少平;茹立云;;基于用户兴趣分析的网页生命周期建模(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
相关重要报纸文章 前1条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
相关博士学位论文 前8条
1 张召;在线论坛用户兴趣图谱发现与个性化信息推荐[D];华东师范大学;2012年
2 刘淇;基于用户兴趣建模的推荐方法及应用研究[D];中国科学技术大学;2013年
3 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年
4 吴丽辉;个性化的Web信息采集技术研究[D];中国科学院研究生院(计算技术研究所);2005年
5 谢兴;社会网络中兴趣发现与信息组织的研究[D];复旦大学;2011年
6 李东胜;基于兴趣与保护隐私的在线社区推荐技术研究[D];复旦大学;2012年
7 陈浩;Web搜索的用户兴趣与智能优化研究[D];中南大学;2012年
8 姜邵巍;基于竞争关系的推荐技术研究[D];北京邮电大学;2014年
相关硕士学位论文 前10条
1 陈媛媛;用户兴趣图谱演化机制研究[D];武汉理工大学;2014年
2 梁润庭(Runting Leung);面向微博用户的兴趣识别算法的研究与实现[D];西南交通大学;2015年
3 俞忻峰;新浪微博的数据采集和推荐方案研究[D];南京理工大学;2015年
4 杨梅;基于树型网络的多源用户兴趣数据融合方法研究[D];四川师范大学;2015年
5 石光莲;基于形式概念分析的Folksonomy用户兴趣识别研究[D];西南大学;2015年
6 汤文清;微博用户的兴趣及性格分析[D];上海大学;2015年
7 梅佩;基于浏览内容的用户兴趣研究[D];北京化工大学;2015年
8 张少杰;基于用户兴趣的微博广告投放系统的设计与实现[D];山西大学;2015年
9 黄龙伟;基于蚁群算法的WEB日志用户兴趣路径研究[D];江西师范大学;2015年
10 蒋萍;基于用户兴趣挖掘的个性化模型研究与设计[D];苏州大学;2005年
,本文编号:1978743
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/1978743.html