基于路径聚类的页面访问次序的挖掘
本文选题:聚类 切入点:路径聚类 出处:《计算机工程与设计》2013年01期 论文类型:期刊论文
【摘要】:为了发现用户的行为模式以实现Web站点的结构优化,提出了基于用户访问路径的K-PathSearch算法。在对网页实施预处理后,结合页面链接参数,建立用户访问事务处理模型,形成有用数据集。提取样本分析用户的兴趣度,主要影响因素体现在访问次序、次数以及停留时间三方面,并利用重新定义的相似度将兴趣取向相类似的用户划分为一类;在此基础上,定义用户访问最长拟合路径,进而计算路径聚类中心。经计算,聚类数和聚类中心平均长度增比显著,表明模型和算法是可行和有效的。
[Abstract]:In order to discover user behavior patterns to optimize the structure of Web site, a K-PathSearch algorithm based on user access path is proposed. Form useful data set. Extract samples to analyze the interest of users, the main factors are the access order, frequency and stay time, and use the redefined similarity to divide the users with similar interest orientation into a class. On this basis, the user visits the longest fitting path and then calculates the path cluster center. The results show that the clustering number and the average length of the cluster center increase significantly, which shows that the model and algorithm are feasible and effective.
【作者单位】: 辽宁科技大学软件学院;
【分类号】:TP393.09;TP18
【共引文献】
相关硕士学位论文 前2条
1 卢群;UIMA架构下Web访问信息的研究和应用[D];上海交通大学;2007年
2 赵永梅;基于用户浏览路径的协同过滤推荐技术研究[D];西安建筑科技大学;2008年
【二级参考文献】
相关期刊论文 前2条
1 孙承杰,关毅;基于统计的网页正文信息抽取方法的研究[J];中文信息学报;2004年05期
2 刘国营;基于路径聚类的Web用户访问模式发现算法[J];情报杂志;2005年07期
相关博士学位论文 前1条
1 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
【相似文献】
相关期刊论文 前10条
1 徐钦桂;曹可;;一种置信于主流评价的P2P环境信誉模型[J];计算机应用研究;2011年07期
2 刘晓明;;基于通讯网络安全模糊聚类与量子遗传理论的入侵检测研究[J];开封大学学报;2011年02期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相关会议论文 前3条
1 王建伟;谢永强;;基于遗传模糊聚类的异常检测方法[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
2 田小丽;郑康锋;钮心忻;;一种基于改进K-Medoids算法的网络攻击检测技术[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
3 王云龙;李逊;;基于数据场的数据挖掘方法在入侵检测中的应用[A];第十九次全国计算机安全学术交流会论文集[C];2004年
相关博士学位论文 前3条
1 秦胜君;复杂适应信息系统体系结构的研究与应用[D];大连海事大学;2011年
2 李志华;语义属性数据聚类/分类算法及其在异常检测中的应用研究[D];江南大学;2009年
3 王Z,
本文编号:1561146
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1561146.html