基于智能手机应用数据的用户属性挖掘
本文关键词: 用户属性 数据挖掘 应用安装列表 应用使用序列 出处:《浙江大学》2017年硕士论文 论文类型:学位论文
【摘要】:人们迫切地随时随地从互联网获取信息和服务,这加快了移动互联网的发展,同时促进了移动互联网快速迈入了"大数据"时代。长期以来,智能手机一直是移动互联网的主体,它为了适应用户爆炸式的需求不断地技术创新。用户频繁地使用智能手机,产生了海量的个性化日志数据。这些数据与用户的行为紧密关联,所以隐含了非常广泛的用户属性,如性别、年龄等个人信息以及用户的兴趣爱好和生活习惯等。通过挖掘用户的各种属性,可以加深对用户全面而客观的理解,进而帮助我们来持续改进设备、服务与应用。近年来,越来越多的人开始使用智能手机相关数据来挖掘用户属性,他们大多基于全球定位系统、基站、无线网热点等位置信息,与呼叫详细记录、通讯录等社交信息进行研究。智能手机上的应用,是用户使用手机各种服务的主要入口,手机应用相关的数据也能反映用户广泛的基本属性、兴趣偏好、生活习惯等,这提供给我们一个新的机会来更好地理解用户。智能手机上的应用安装列表数据和应用使用序列数据非常容易采集,并且蕴含丰富的信息量。本文针对性地从这些手机应用相关数据中挖掘用户的属性,完成了以下工作:1.提出了基于手机应用数据的用户属性挖掘方案,并围绕应用安装列表数据和应用使用序列数据设计出用户属性挖掘的具体框架。2.阐述了全面的数据预处理过程,对两组数据做了全面的剖析。从多个角度分别对两组数据设计用户表征方式,并详细阐述了各种表征下特征的含义。在给定的用户基本属性与用户表征方式下,尝试了多种用户分类方法,进行了丰富的对比实验。3.对比了不同手机应用数据的用户属性挖掘能力。
[Abstract]:People are eager to get information and services from the Internet anytime and anywhere, which accelerates the development of mobile Internet, and promotes the mobile Internet to enter the era of "big data" for a long time. Smart phone has always been the main body of mobile Internet, in order to adapt to the explosive needs of users, technology innovation. Users frequently use smart phones. It produces a huge amount of personalized log data. This data is closely related to the behavior of the user, so it implies a very wide range of user attributes, such as gender. Personal information such as age as well as users' interests hobbies and living habits etc. Through excavating the user's various attributes we can deepen the comprehensive and objective understanding of the user and then help us to continuously improve the equipment. Services and applications. In recent years, more and more people begin to use smart phone related data to mine user attributes. Most of them are based on location information such as global positioning system, base station, wireless network hot spots and so on. The application of smart phone is the main entrance for users to use various services of mobile phone. The data related to mobile phone application can also reflect the basic attributes of users. Interest preferences, lifestyle habits, etc., provide us with a new opportunity to better understand the user. The list of apps installed on a smartphone and the sequence of data used by the app are very easy to collect. And contains a wealth of information. This paper specifically mining user attributes from these mobile phone application related data, completed the following work: 1. Put forward a user attribute mining scheme based on mobile phone application data. And around the application installation list data and the application uses the sequence data to design the user attribute mining concrete frame. 2. Elaborated the comprehensive data preprocessing process. Two groups of data are analyzed in a comprehensive way. Two groups of data are designed to represent the user from multiple angles, and the meaning of the features under various representations is elaborated in detail. Under the given user basic attributes and user representation. This paper attempts a variety of user classification methods and carries out rich comparative experiments. 3. The user attribute mining ability of different mobile phone application data is compared.
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13
【相似文献】
相关期刊论文 前9条
1 吴飞;金士尧;胡浩民;;基于用户属性的个性化教学智能辅助研究和设计[J];计算机工程与科学;2012年09期
2 强磊;;3G通用用户属性及其参考结构的研究[J];信息网络;2006年03期
3 叶春晓;符云清;钟将;冯永;;基于属性的委托撤销研究[J];计算机科学;2008年03期
4 余坦;王益民;;一种基于用户属性的搜索算法[J];计算机系统应用;2010年07期
5 唐金鹏;李玲琳;杨路明;;面向用户属性的RBAC模型[J];计算机工程与设计;2010年10期
6 蒋凌志;;基于属性的RBAC系统[J];计算机系统应用;2010年01期
7 叶春晓;符云清;吴中福;;基于角色限制条件的用户-角色指派研究[J];计算机科学;2004年07期
8 ;“小弟弟”盯着你[J];每周电脑报;1997年33期
9 曹玖新;吴江林;石伟;刘波;郑啸;罗军舟;;新浪微博网信息传播分析与预测[J];计算机学报;2014年04期
相关重要报纸文章 前3条
1 马志会;有线无线一体化不等于“统一品牌”[N];网络世界;2009年
2 大竹刚;整合互联网服务[N];中国计算机报;2002年
3 本报记者 别坤;王效辙:扁平化网络更高效[N];计算机世界;2013年
相关博士学位论文 前1条
1 冯珍;产品级再使用研究[D];西安电子科技大学;2005年
相关硕士学位论文 前10条
1 景志珍;基于组合赋权的软件服务评价方法的研究与实现[D];昆明理工大学;2015年
2 薛云霞;微博用户属性识别方法研究[D];苏州大学;2015年
3 张晓;社会网络上的用户属性推测方法研究[D];哈尔滨工业大学;2015年
4 秦Z诼,
本文编号:1460999
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1460999.html