面向移动用户数据的情境识别与挖掘

发布时间：2017-08-01 06:19

本文关键词：面向移动用户数据的情境识别与挖掘

【摘要】：随着移动互联网的兴起,移动设备成为用户使用互联网服务的新途径。通过挖掘移动设备上的情境数据对用户建模是一种新颖的理解用户需求的方案,从而能为互联网服务方提供个性化、情境感知化的服务奠定基础。这里的情境数据指移动设备上的众多传感器探测到的环境和用户行为信息。本文的研究主题是面向移动用户数据的情境识别与挖掘,主要成果如下： 1.提出了使用非监督学习模型对用户情境建模的技术方案：对于用户情境建模问题,由于难以获取情境标识,因而监督学习模型难以适用。鉴于此,本文使用非监督学习模型通过情境数据自身性质挖掘用户的情境。本文提出的方案包括两个步骤。在数据预处理步骤中,对用户情境数据日志提取情境会话,由于情境会话间没有明显的分界标识,本文使用了一种最小熵算法来切分情境数据日志；在数据建模步骤中,本文使用了聚类和概率主题模型来挖掘用户情境。通过聚类模型挖掘用户情境的方式为,首先将情境会话映射到情境特征-值组合空间上,然后对情境会话使用K-means算法聚类,最后从聚类结果提取用户情境。通过概率主题模型挖掘用户情境的方式为,首先对其进行扩展从而适应情境数据的结构化特性,然后将情境会话表示成概率主题模型中的变量,最后通过Gibbs采样算法求解模型从而学习用户情境。在真实用户情境数据集上的实验分析表明了该技术方案的有效性。 2.提出了通过基站标识数据挖掘用户关键地点的技术方案：关键地点是用户最重要的情境。以往的研究工作主要集中于通过GPS数据挖掘关键地点,然而由于常时间开启GPS传感器会比较耗电,从而影响设备续航时间。鉴于此,本文提出通过基站标识数据挖掘用户关键地点。根据基站的地理位置信息,以及利用基站覆盖范围彼此重叠的特性,本文提出了一个两阶段的关键地点挖掘算法。在在线阶段,检测用户的停留状态,并计算停留区域以及更新停留区域中的地理格栅的热度值；在离线阶段,通过一个递归方法挖掘出用户关键地点。为验证该技术方案的实际应用性,本文还开发了一个演示系统。最后,实验结果表明该方案在用户关键地点的查全率和查准率均高于基准方法。 3.监督式情境识别方案的难点在于难以获得大量高质量的情境标识数据。本文提出了结合时间管理软件实现用户情境识别的技术方案。时间管理用户经常面临记录反复发生的情境状态的情况,很多用户厌烦这种重复操作因而放弃了时间管理。本文提出了一种半监督学习方案,通过结合用户时间管理应用中的情境状态记录数据,使用HMM模型来实现用户情境识别,并提出了DP-MUC模型来自动化确定用户情境数目和加速HMM模型的训练时间。最后,同基准算法相比,在真实用户的情境状态记录数据上的实验结果表明该方法具有较好的效果和较高的效率。
【关键词】：移动设备 情境建模 情境识别 关键地点 情境挖掘
【学位授予单位】：中国科学技术大学
【学位级别】：博士
【学位授予年份】：2013
【分类号】：TP311.13
【目录】：

摘要5-7
ABSTRACT7-9
目录9-13
表格13-14
插图14-16
算法16-17
第一章绪论17-33
1.1 引言17-19
1.2 研究背景19-27
1.2.1 移动设备成为用户情境信息的载体19-22
1.2.2 通过移动设备为用户提供情境感知的服务22-25
1.2.3 用户情境数据挖掘25-27
1.3 研究内容27-28
1.4 数据收集平台28-30
1.5 组织结构30-33
第二章相关研究工作概述33-53
2.1 引言33-34
2.2 普适计算中的情境定义回顾34-35
2.3 情境数据挖掘的研究项目35-41
2.3.1 麻省理工学院的现实挖掘项目36-39
2.3.2 微软亚洲研究院的地理人生项目39-41
2.4 情境数据挖掘的研究应用41-50
2.4.1 通过地理位置数据理解用户41-48
2.4.2 通过传感器数据理解用户48-50
2.5 本章小结50-53
第三章使用非监督学习模型对用户情境建模53-81
3.1 引言53-54
3.2 相关工作54-56
3.3 方法概述56-57
3.4 情境会话分割57-60
3.5 通过聚类模型学习用户情境60-64
3.5.1 情境会话相似度定义60-61
3.5.2 情境会话聚类61-62
3.5.3 从情境会话簇中提取情境描述62
3.5.4 确定情境会话聚类簇的数目62-64
3.6 通过概率主题模型学习用户情境64-70
3.6.1 基于单主题模型的情境模型64-67
3.6.2 基于多主题模型的情境模型67-69
3.6.3 确定用户情境的数目69-70
3.7 实验分析70-79
3.7.1 数据集与数据预处理70-71
3.7.2 计算效率比较71-74
3.7.3 建模效果比较74-79
3.8 本章小结79-81
第四章通过基站标识数据挖掘用户关键地点81-99
4.1 引言81-83
4.2 停留区域检测83-86
4.2.1 停留片段提取84-86
4.2.2 计算停留区域对应的地理栅格86
4.3 用户关键地点挖掘86-89
4.4 实验分析89-95
4.4.1 数据集89-90
4.4.2 基准方法90-91
4.4.3 标注结果与评价指标91-93
4.4.4 实验结果93-95
4.4.5 案例分析95
4.5 演示系统95-96
4.6 本章小结96-99
第五章结合时间管理软件实现用户情境识别99-121
5.1 引言99-101
5.2 相关工作101-102
5.3 通过HMM模型实现情境识别102-110
5.3.1 Bayesian HMM模型104-107
5.3.2 Bayesian HMM on Context模型107-110
5.4 通过DPM模型确定情境数目110-112
5.5 实验分析112-118
5.5.1 数据说明112-114
5.5.2 用户情境数目114-115
5.5.3 HMMC模型训练效率115-116
5.5.4 情境识别效果116-118
5.6 本章小结118-121
第六章结束语121-125
6.1 研究工作总结121-123
6.2 对未来工作的展望123-125
参考文献125-133
致谢133-135
在读期间发表的学术论文与取得的研究成果135-136

【引证文献】

中国硕士学位论文全文数据库前1条

1 梁钦沛;基于移动终端的群智感知中情境识别方法的研究与实现[D];华南理工大学;2013年

，

本文编号：602876

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/guanlilunwen/ydhl/602876.html

上一篇：千兆以太网与PC机的通信在LTE中的应用
下一篇：一种基于虚拟隔离机制的安全私有云存储系统

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|