当前位置:主页 > 管理论文 > 移动网络论文 >

基于频繁模式挖掘的网站优化策略研究

发布时间:2017-11-08 13:30

  本文关键词:基于频繁模式挖掘的网站优化策略研究


  更多相关文章: Web日志挖掘 频繁模式挖掘 页面兴趣度 用户频繁访问模式


【摘要】:随着信息技术的发展,互联网的应用得到了很大程度的普及,各种门户网站层出不穷,这虽然丰富了人们获得信息的途径,但同时也带来了一些问题。对于普通用户来说,从种类繁多的门户网站中获得对自己有价值的信息是比较困难的。因此,如何优化网站的拓扑结构和网页内容,方便用户在海量的数据中获得其感兴趣的信息,是网站建设者和管理者必须考虑的问题。Web日志挖掘指的是从网站的日志数据中挖掘出有价值的信息。其中,频繁模式挖掘是Web日志挖掘的一种常用方法,挖掘结果通常是用户感兴趣的浏览路径。利用频繁模式挖掘方法对网站用户的浏览日志进行挖掘,挖掘结果可以用于网站的优化和改进。本文系统的阐述了Web日志挖掘的流程和频繁模式挖掘的相关内容。针对目前频繁模式挖掘算法中存在的不足做出改进,并且重点研究了在频繁模式挖掘过程中结合页面兴趣度算法的应用。最后利用本文的算法对重庆市农业农村信息化网的日志数据进行挖掘,根据挖掘结果优化网站,证实了算法的可行性。论文主要研究内容包括:(1)本文提出了双约束多支持度频繁模式挖掘算法(DS_MSA)。简要分析了目前已有的频繁模式挖掘算法中存在的问题,据此提出了DS_MSA算法。本算法采用多重最小支持度,对模式的最小支持度采用双重约束的方式,根据项集权重,确定不同的约束条件。采用这种方式,可以根据模式的重要性对其挖掘,保证挖掘结果全部是用户感兴趣的。通过多数据集测试,本算法不论是挖掘数量还是挖掘质量都较其他算法有较大改进。(2)提出了改进的页面兴趣度计算方法。为了表示不同的网页对于用户的意义,本文采用页面兴趣度衡量每个页面的重要程度。本文提出的页面兴趣度计算模型综合考虑了可以表现用户兴趣的用户浏览行为、页面出现频次、页面浏览速度、页面入度等多个因素,相较以往的页面兴趣度算法更加科学。通过与用户的显性数据对比,也证实了算法的有效性。(3)将页面兴趣度模型与DS_MSA算法结合。将DS_MSA算法应用到Web日志挖掘中,把每个页面当作一个项目,则需要对每个页面的重要程度进行刻画。本文采用页面兴趣度来表现页面的重要程度。根据页面兴趣度确定页面的权重,并且根据页面兴趣度来限制DS_MSA算法挖掘过程中最小支持度的约束条件。针对重庆市农业农村信息网的日志数据,利用基于页面兴趣度的DS_MSA算法进行挖掘,得到用户的频繁访问模式,利用该模式对网站拓扑结构和内容进行优化和改进,本文对具体的优化策略也进行了简要的说明。本文的主要创新之处在于,改进了页面兴趣度的计算方法,并且采用双约束的方式限制挖掘模式的最小支持度,使挖掘结果更加贴近用户的兴趣,在一定程度上改善了原有挖掘算法的组合爆炸和稀有项目缺失的问题。利用挖掘结果,可以根据农业网站用户的特点,达到网站优化的目标。
【学位授予单位】:西南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;TP393.092

【相似文献】

中国期刊全文数据库 前10条

1 刘君强,潘云鹤;一种基于树的频繁模式挖掘算法[J];系统工程理论与实践;2003年05期

2 李清勇 ,秦亮曦 ,施智平 ,史忠植;最大目标频繁模式挖掘算法研究[J];计算机工程与应用;2004年33期

3 申展,江宝林,唐磊,胡运发;基于互关联后继树的频繁模式挖掘研究[J];计算机工程;2004年21期

4 战立强;刘大昕;;小波滤波在时间序列频繁模式挖掘中的应用[J];哈尔滨工程大学学报;2008年01期

5 何海涛;张世玲;;基于矩阵的频繁模式挖掘及更新算法[J];计算机科学;2008年03期

6 高琳;覃桂敏;周晓峰;;图数据中频繁模式挖掘算法研究综述[J];电子学报;2008年08期

7 孟凡荣;宋春景;张磊;;一种新的多层频繁模式挖掘算法[J];微计算机信息;2009年03期

8 孟彩霞;;频繁模式挖掘的约束算法[J];智能系统学报;2009年02期

9 潘立福;朱利晶;敖富江;杜静;;基于树搜索方式的频繁模式挖掘综述[J];计算机与信息技术;2009年05期

10 白洪涛;欧阳丹彤;何丽莉;;一种基于图形处理器的频繁模式挖掘算法[J];仪器仪表学报;2009年10期

中国重要会议论文全文数据库 前8条

1 侯俊杰;李春平;;一种基于内存索引的频繁模式挖掘算法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

2 任家东;孙亚非;郭盛;;基于约束的交互式频繁模式挖掘算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

3 袁晴晴;楼宇波;周皓峰;汪卫;施伯乐;;基于图论的频繁模式挖掘[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

4 韩蒙;张炜;李建中;;RAKING:一种高效的不确定图K-极大频繁模式挖掘算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年

5 曾涛;向勇;包小源;刘胤田;蒋永光;;中医古方挖掘:一种频繁药组发现与功效标注算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年

6 杨慧;刘红岩;何军;杜小勇;;一种面向高速度数据流的频繁模式挖掘算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

7 王闻;谢伙生;;基于FP树和对称矩阵的最大频繁模式挖掘算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年

8 马秀莉;刘健;童云海;唐世渭;杨冬青;;基于模式索引树的增量挖掘[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年

中国博士学位论文全文数据库 前10条

1 王倩;基于位值压缩存储的频繁模式挖掘方法及应用研究[D];燕山大学;2016年

2 刘勇;频繁模式挖掘相关技术研究[D];复旦大学;2007年

3 战立强;频繁模式挖掘算法研究[D];哈尔滨工程大学;2007年

4 林晓勇;频繁模式挖掘和动态维护的理论与方法研究[D];北京化工大学;2008年

5 郑晓艳;频繁模式挖掘技术研究及其在供应链管理中的应用[D];天津大学;2010年

6 马海兵;频繁模式挖掘相关技术研究[D];复旦大学;2005年

7 张磊;基于约束的频繁模式挖掘方法以及应用研究[D];中国科学技术大学;2014年

8 阮幼林;频繁模式挖掘算法及在入侵检测中的应用研究[D];华中科技大学;2004年

9 耿汝年;加权频繁模式挖掘算法研究[D];江南大学;2008年

10 杨厚群;半结构化数据频繁模式挖掘相关技术研究[D];重庆大学;2010年

中国硕士学位论文全文数据库 前10条

1 朱金华;基于频繁API使用模式挖掘的软件缺陷定位方法研究[D];华中科技大学;2014年

2 张浩然;基于频繁模式挖掘的网站优化策略研究[D];西南大学;2016年

3 刘金凤;频繁模式挖掘技术的研究及其在实时信号处理中的应用[D];电子科技大学;2016年

4 王阳;频繁模式挖掘技术及其在电信收入保障系统中的应用研究[D];湖南大学;2010年

5 张健;基于频繁模式挖掘的不良消息文本检测方法研究与实现[D];复旦大学;2012年

6 张李一;不确定性数据频繁模式挖掘算法的研究[D];复旦大学;2011年

7 屈松;图数据库频繁模式挖掘关键技术研究[D];黑龙江大学;2012年

8 易娟;基于位序列的频繁模式挖掘算法研究[D];燕山大学;2012年

9 原继东;基于阵列的频繁模式挖掘算法研究[D];北京交通大学;2012年

10 陈艳;数据流的最大频繁模式挖掘研究[D];西安科技大学;2010年



本文编号:1157363

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1157363.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1faf3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com