Web环境下地学数据共享用户行为模式分析
本文选题:网络数据挖掘 + 空间数据挖掘 ; 参考:《地球信息科学学报》2016年09期
【摘要】:了解科学数据共享用户行为特征对实现高效、精准的数据共享服务具有重要的参考意义。本文基于国家地球系统科学数据共享平台网站服务器日志及服务记录数据,利用空间数据挖掘及Web使用挖掘技术,探索地球系统科学数据共享用户行为模式。在数据预处理阶段,完成用户识别、会话识别、位置识别,并对数据进行空间建模、空间数据库建库。在数据挖掘阶段,分别对用户产生的网页浏览数、会话数、数据集浏览数为对象进行空间"热点"分析,识别用户行为的地域差异。针对用户数据浏览和下载行为,采用FP-growth算法对用户——数据之间进行关联规则挖掘,发现用户对数据关注和使用的高频规律。分析结果表明:(1)该共享平台用户地在国内各省市均有分布,用户最多的3个省(市)分别为北京市、山东省、江苏省,该分布与国内高校学生分布相关程度不高,但与"211工程"高校学生的空间分布相关度较高;(2)空间"热点"分析表明,北京、天津及河北北部无论在网页浏览、数据浏览还是会话量上都是"热点"区域,但识别的"冷点"区域有较大不同,尤其是数据访问"冷点"分布较广,如南方沿海省份、河南省、山东省、四川省等;(3)关联规则挖掘发现多个数据浏览高频项目集以及关联规则。数据下载高频项与数据浏览高频模式较好吻合,但下载行为未表现出明显关联规则。本文提供了一种结合Web使用挖掘和空间数据挖掘的用户行为模式挖掘方法,该方法也可用于其他类型网站的数据挖掘。
[Abstract]:Understanding the behavior characteristics of scientific data sharing users has important reference significance for the realization of efficient and accurate data sharing services. Based on the web server log and service record data of National Earth system Science data sharing platform, this paper explores the user behavior pattern of Earth system Science data sharing by using spatial data mining and Web usage mining technology. In the stage of data preprocessing, user identification, session recognition, location recognition are completed, and the spatial modeling of the data is carried out, and the spatial database is built. In the stage of data mining, the spatial "hot spot" analysis is carried out to identify the regional differences of users' behavior, including the number of page views, the number of sessions and the number of views of data sets generated by users. According to the behavior of user data browsing and downloading, FP-growth algorithm is used to mine association rules between users and data, and the high frequency rules of users' attention and use of data are found. The results show that the shared platform is distributed in all provinces and cities in China, and the three provinces (cities) with the most users are Beijing, Shandong and Jiangsu respectively. The degree of correlation between this distribution and the distribution of college students in China is not high. However, the spatial "hot spot" analysis of Beijing, Tianjin and northern Hebei shows that Beijing, Tianjin and northern Hebei are "hot spots" in terms of web browsing, data browsing and conversation volume. But the "cold spot" areas identified are quite different, especially the "cold spots" of data access, such as southern coastal provinces, Henan Province, Shandong Province, The mining of association rules finds many data browsing high frequency itemsets and association rules. The data download high frequency item is in good agreement with the data browsing high frequency mode, but the downloading behavior does not show obvious association rules. This paper presents a user behavior pattern mining method combining Web usage mining and spatial data mining, which can also be used in other types of Web sites.
【作者单位】: 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室;中国科学院大学;江苏省地理信息资源开发与利用协同创新中心;
【基金】:国家科技基础条件平台——地球系统科学数据共享平台(2005DKA32300) 科技基础性工作重点项目(2011FY110400) 中国工程院国际工程科技知识中心项目
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 郭岩;基于网络用户行为的相关页面挖掘模型[J];微电子学与计算机;2003年05期
2 牛现云;王宇鸽;;1979-2010年图书馆读者行p悍治鑫南籽芯縖J];公共图书馆;2012年01期
3 朱彤;刘奕群;茹立云;马少平;;基于用户行为的长查询用户满意度分析[J];模式识别与人工智能;2012年03期
4 左渭斌;;用户行为特征库的构建方法研究[J];产业与科技论坛;2012年10期
5 苏红;万国根;;基于用户行为关联分析的电子取证系统研究[J];电信科学;2010年12期
6 方彬;胡侠;王灿;;基于用户行为的盲人图书推荐方法[J];计算机工程;2011年15期
7 张书娟;董喜双;关毅;;基于电子商务用户行为的同义词识别[J];中文信息学报;2012年03期
8 李继洪;黄勤;刘益良;柳玉仙;;基于用户行为统计的入侵检测判据研究[J];微计算机信息;2009年03期
9 郑双阳;林锦贤;;基于用户行为聚类的搜索[J];计算机与数字工程;2009年12期
10 徐洋;王文生;谢能付;;基于用户行为学习的元搜索结果聚类方法研究[J];现代图书情报技术;2010年04期
相关会议论文 前10条
1 武小年;周胜源;;数据挖掘在用户行为可信研究中的应用[A];第十一届保密通信与信息安全现状研讨会论文集[C];2009年
2 樊旺斌;刘正捷;陈东;张海昕;;博客服务系统用户行为研究——用户访谈[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国人机交互学术会议(CHCI'06)论文集[C];2006年
3 张书娟;董喜双;关毅;;基于电子商务用户行为的同义词识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 曹建勋;刘奕群;岑荣伟;马少平;茹立云;;基于用户行为的色情网站识别[A];第六届全国信息检索学术会议论文集[C];2010年
5 李海宏;翟静;唐常杰;李智;;基于用户行为挖掘的个性化Web浏览器原型[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
6 寇玉波;李玉坤;孟小峰;张相於;赵婧;;个人数据空间管理中的任务挖掘策略[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
7 徐峗;张盼;丁婕;;只逛不买的电子商务用户分析——以淘宝网为例[A];第六届(2011)中国管理学年会——信息管理分会场论文集[C];2011年
8 蔡皖东;何得勇;;基于用户行为监管的内部网安全机制及其实现技术[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年
9 郑常熠;佘宇东;王新;薛向阳;;CDN与P2P混合网络架构下一种基于用户行为的VoD分发策略[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(下册)[C];2007年
10 ;Internet中的大范围模式及其起源[A];Complexity Problems--Proceedings of CCAST (World Laboratory) Workshop[C];2001年
相关重要报纸文章 前10条
1 张伟;在用户行为中寻找灵感[N];中华合作时报;2014年
2 ;危险的用户行为让网络面临风险[N];网络世界;2007年
3 本报记者 宋丽娜;做安全旗舰品牌[N];网络世界;2004年
4 群邑中国互动营销总裁 MMA中国无线营销联盟联席主席 陈建豪;移动互联催生用户行为变化[N];第一财经日报;2013年
5 本报记者 张樱赢;移动医疗 “笨”有前景[N];计算机世界;2013年
6 盎然;大数据时代来临 你该干什么?[N];中国政府采购报;2013年
7 东软研究院副院长 闻英友;云安全,机遇与挑战并存[N];中国计算机报;2010年
8 本报记者 刘菁菁;Google力拓未来搜索[N];计算机世界;2011年
9 思杰(Citrix)系统工程师 李兵;安全源于架构[N];中国计算机报;2008年
10 本报记者 张伟;“小数据”决胜大数据时代[N];中国高新技术产业导报;2013年
相关博士学位论文 前10条
1 蒋朦;社交媒体复杂行为分析与建模[D];清华大学;2015年
2 陈亚睿;云计算环境下用户行为认证与安全控制研究[D];北京科技大学;2012年
3 杨悦;基于网络用户行为的搜索排行榜研究[D];北京交通大学;2013年
4 阳德青;面向社会网络的用户行为挖掘与应用研究[D];复旦大学;2013年
5 郭U,
本文编号:2038661
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2038661.html