基于移动终端日志数据的人群特征可视化
本文选题:数据可视化 + 主题模型 ; 参考:《软件学报》2016年05期
【摘要】:随着我国移动互联网的迅猛发展,如何从海量移动终端日志数据中提取出有效信息,并进行合理、清晰的可视化分析,为工业界等提供有价值的统计分析功能显得尤为重要.目前,对于移动终端日志数据的研究和分析多是基于对单一属性的统计结果分析,如应用下载排行、用户留存率等.为了进一步挖掘移动终端日志数据背后深层次的隐含信息,更加准确地概括出移动终端用户的特征,提出了一种基于移动应用程序日志数据的人群特征分析与画像计算方法,构造了基于移动应用程序数据的主题模型,并将移动设备用户按照与不同应用主题的相关度进行聚类,得到了具有不同特征的人群,从而提出了基于层次气泡图和Voronoi Treemap的可视化展现与分析方案.进一步将人群特征与时间信息、地理位置信息相结合,从多角度可视化展现人群特征.最后,根据该研究内容,实现了B/S架构的日志数据可视化分析原型系统,并通过案例分析验证了该方法的有效性.
[Abstract]:With the rapid development of mobile Internet in China, how to extract effective information from the massive mobile terminal log data and make reasonable and clear visual analysis is particularly important to provide valuable statistical analysis function for industry and so on. At present, the research and analysis of mobile terminal log data is based on the statistical analysis of a single attribute, such as application download ranking, user retention rate and so on. In order to further excavate the deep hidden information behind the log data of mobile terminal and generalize the features of mobile terminal users more accurately, a method of crowd feature analysis and portrait calculation based on log data of mobile application is proposed. A topic model based on mobile application data is constructed, and the users of mobile devices are clustered according to the relevance of different application topics, and the population with different characteristics is obtained. A visual display and analysis scheme based on hierarchical bubble graph and Voronoi Treemap is proposed. Furthermore, the crowd features are visualized from multiple angles by combining the crowd characteristics with time information and geographical location information. Finally, according to the research content, the prototype system of log data visualization analysis based on B / S architecture is implemented, and the effectiveness of the method is verified by a case study.
【作者单位】: CAD&CG国家重点实验室(浙江大学);浙江工业大学计算机科学与技术学院;
【基金】:国家自然科学基金(61232011) 浙江省自然科学基金(LZ12F02002,LY14F020021) 国家科技支撑计划(2014BAH23 F03)~~
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 邓奇强;;高校图书馆流通日志数据整理探讨[J];河北科技图苑;2013年04期
2 黄玮尧;;交通银行集中日志审计管理最佳实践[J];中国金融电脑;2011年10期
3 邹晓峰;李鸣亚;;浅析一个分布式日志服务器的应用[J];考试周刊;2007年49期
4 宋爱波,庄晓青,何洁月,业宁,董逸生;图书馆大规模日志数据的快速聚类[J];应用科学学报;2003年03期
5 叶小莺;;基于回调机制的异步日志服务的开发[J];电子世界;2012年04期
6 刘兴淮;温丛剑;徐燕梅;;临床数据统计日志的科学获取与应用[J];中国医疗设备;2011年12期
7 朱智林,左天军,牛淑龄;基于日志的脏数据检测与恢复[J];电子科技;2004年05期
8 李清;沈彤;关毅;;面向大规模日志数据的聚类算法研究[J];智能计算机与应用;2012年05期
9 吕荣峰;;基于syslog-ng的集中式日志服务器及其客户端配置方法[J];数字技术与应用;2014年04期
10 刘合富;;SYSLOG日志数据采集实现[J];中国教育网络;2007年08期
相关会议论文 前4条
1 王广立;张立群;;一种基于日志的流程挖掘算法的设计与实现[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
2 黄东;;工厂信息化日志的存储及管理[A];中国计量协会冶金分会2011年会论文集[C];2011年
3 刘锟;邢延;蔡延光;;一种针对交互式学习系统日志数据的轻型化挖掘方法[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年
4 郭新涛;梁敏;阮备军;朱扬勇;;挖掘Web日志降低信息搜寻的时间费用[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
相关重要报纸文章 前5条
1 ;日志数据激增困扰数据中心[N];网络世界;2009年
2 ;Google与隐私权[N];网络世界;2009年
3 沈建;谨防安全策略的五大基本错误[N];计算机世界;2008年
4 本报记者 胡英;RSA enVision 4.0让企业更合规[N];计算机世界;2009年
5 ;注重安全管理[N];网络世界;2004年
相关硕士学位论文 前10条
1 曾明宇;一种基于Storm和Mongodb的分布式实时日志数据存储与处理系统的设计与实现及应用[D];浙江大学;2015年
2 徐沛原;基于移动终端日志数据的人群特征可视化研究[D];浙江大学;2015年
3 陈超;基于分布式计算的海量日志数据分析平台的设计与实现[D];北京邮电大学;2015年
4 苏政;基于日志数据的域名访问源多尺度分析[D];南京师范大学;2013年
5 杨尚大;日志数据采集和实时审计关键技术研究与实现[D];浙江工商大学;2009年
6 王兆永;面向大规模批量日志数据存储方法的研究[D];电子科技大学;2011年
7 王高垒;爬虫日志数据信息抽取与统计系统设计与实现[D];北京邮电大学;2012年
8 龚风光;面向地址标定的通联日志分布式存储检索系统的设计与实现[D];北京邮电大学;2015年
9 杨林红;WebGIS日志数据挖掘预处理的研究与实现[D];电子科技大学;2011年
10 王振东;铁路调度指挥系统中日志数据库的设计与优化[D];中国铁道科学研究院;2011年
,本文编号:1831264
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1831264.html