Web环境下地学数据共享用户行为模式分析
本文选题:网络数据挖掘 + 空间数据挖掘 ; 参考:《地球信息科学学报》2016年09期
【摘要】:了解科学数据共享用户行为特征对实现高效、精准的数据共享服务具有重要的参考意义。本文基于国家地球系统科学数据共享平台网站服务器日志及服务记录数据,利用空间数据挖掘及Web使用挖掘技术,探索地球系统科学数据共享用户行为模式。在数据预处理阶段,完成用户识别、会话识别、位置识别,并对数据进行空间建模、空间数据库建库。在数据挖掘阶段,分别对用户产生的网页浏览数、会话数、数据集浏览数为对象进行空间"热点"分析,识别用户行为的地域差异。针对用户数据浏览和下载行为,采用FP-growth算法对用户——数据之间进行关联规则挖掘,发现用户对数据关注和使用的高频规律。分析结果表明:(1)该共享平台用户地在国内各省市均有分布,用户最多的3个省(市)分别为北京市、山东省、江苏省,该分布与国内高校学生分布相关程度不高,但与"211工程"高校学生的空间分布相关度较高;(2)空间"热点"分析表明,北京、天津及河北北部无论在网页浏览、数据浏览还是会话量上都是"热点"区域,但识别的"冷点"区域有较大不同,尤其是数据访问"冷点"分布较广,如南方沿海省份、河南省、山东省、四川省等;(3)关联规则挖掘发现多个数据浏览高频项目集以及关联规则。数据下载高频项与数据浏览高频模式较好吻合,但下载行为未表现出明显关联规则。本文提供了一种结合Web使用挖掘和空间数据挖掘的用户行为模式挖掘方法,该方法也可用于其他类型网站的数据挖掘。
[Abstract]:Understanding the behavior characteristics of scientific data sharing users has important reference significance for the realization of efficient and accurate data sharing services. Based on the web server log and service record data of National Earth system Science data sharing platform, this paper explores the user behavior pattern of Earth system Science data sharing by using spatial data mining and Web usage mining technology. In the stage of data preprocessing, user identification, session recognition, location recognition are completed, and the spatial modeling of the data is carried out, and the spatial database is built. In the stage of data mining, the spatial "hot spot" analysis is carried out to identify the regional differences of users' behavior, including the number of page views, the number of sessions and the number of views of data sets generated by users. According to the behavior of user data browsing and downloading, FP-growth algorithm is used to mine association rules between users and data, and the high frequency rules of users' attention and use of data are found. The results show that the shared platform is distributed in all provinces and cities in China, and the three provinces (cities) with the most users are Beijing, Shandong and Jiangsu respectively. The degree of correlation between this distribution and the distribution of college students in China is not high. However, the spatial "hot spot" analysis of Beijing, Tianjin and northern Hebei shows that Beijing, Tianjin and northern Hebei are "hot spots" in terms of web browsing, data browsing and conversation volume. But the "cold spot" areas identified are quite different, especially the "cold spots" of data access, such as southern coastal provinces, Henan Province, Shandong Province, The mining of association rules finds many data browsing high frequency itemsets and association rules. The data download high frequency item is in good agreement with the data browsing high frequency mode, but the downloading behavior does not show obvious association rules. This paper presents a user behavior pattern mining method combining Web usage mining and spatial data mining, which can also be used in other types of Web sites.
【作者单位】: 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室;中国科学院大学;江苏省地理信息资源开发与利用协同创新中心;
【基金】:国家科技基础条件平台——地球系统科学数据共享平台(2005DKA32300) 科技基础性工作重点项目(2011FY110400) 中国工程院国际工程科技知识中心项目
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 苏红;万国根;;基于用户行为关联分析的电子取证系统研究[J];电信科学;2010年12期
2 方彬;胡侠;王灿;;基于用户行为的盲人图书推荐方法[J];计算机工程;2011年15期
3 张书娟;董喜双;关毅;;基于电子商务用户行为的同义词识别[J];中文信息学报;2012年03期
4 徐洋;王文生;谢能付;;基于用户行为学习的元搜索结果聚类方法研究[J];现代图书情报技术;2010年04期
5 欧嵬;王勇军;韩文报;;基于用户行为的可信模型研究[J];计算机工程与科学;2013年05期
6 周宝定;李清泉;毛庆洲;张星;;用户行为感知辅助的室内行人定位[J];武汉大学学报(信息科学版);2014年06期
7 段云飞;林涛;唐宁九;;基于用户行为的自动任务识别技术研究[J];四川大学学报(自然科学版);2011年01期
8 王继民;李雷明子;郑玉凤;;基于日志挖掘的移动搜索用户行为研究综述[J];情报理论与实践;2014年03期
9 岑荣伟;刘奕群;张敏;茹立云;马少平;;网络检索用户行为可靠性分析[J];软件学报;2010年05期
10 孙达明;张斌;张书波;马安香;;基于用户行为的数据关联关系获取方法[J];东北大学学报(自然科学版);2013年12期
相关会议论文 前2条
1 张书娟;董喜双;关毅;;基于电子商务用户行为的同义词识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 寇玉波;李玉坤;孟小峰;张相於;赵婧;;个人数据空间管理中的任务挖掘策略[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
相关重要报纸文章 前2条
1 本报记者 张樱赢;移动医疗 “笨”有前景[N];计算机世界;2013年
2 思杰(Citrix)系统工程师 李兵;安全源于架构[N];中国计算机报;2008年
相关博士学位论文 前2条
1 蒋朦;社交媒体复杂行为分析与建模[D];清华大学;2015年
2 杨悦;基于网络用户行为的搜索排行榜研究[D];北京交通大学;2013年
相关硕士学位论文 前10条
1 田晓杰;用户行为视频音频数据分析工具的研究与开发[D];大连海事大学;2005年
2 徐江科;信息系统终端用户行为可信评估研究[D];解放军信息工程大学;2012年
3 徐雄威;基于本体的上下文感知“科技论文在线”用户行为推理研究[D];武汉理工大学;2013年
4 孟天宝;基于用户行为可信的可信软件构造方法的研究与应用[D];北京工业大学;2014年
5 周虹;海量数据音乐用户行为的模型研究[D];北京邮电大学;2014年
6 马聪;基于用户行为挖掘的情景感知推荐[D];浙江大学;2015年
7 师亚凯;微博用户行为与信息传播研究[D];西北师范大学;2015年
8 孙超;基于用户行为和关系的内部风险分析[D];山东大学;2015年
9 李波;信誉度模型研究及网络用户行为管理系统设计[D];山东科技大学;2009年
10 孙一鸣;移动互联网用户行为监测数据系统的设计与实现[D];北京邮电大学;2012年
,本文编号:2038660
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2038660.html