人类行为时空特性的分析、建模及动力学研究
本文关键词:人类行为时空特性的分析、建模及动力学研究,由笔耕文化传播整理发布。
【摘要】:随着电子科学技术的快速发展,使人类行为的大量细节数据能够被记录下来。这些大规模的数据包括从商业记录到智能电话通信,使研究人员能够定量的分析和定性的研究人类动力学。人类行为中的各种模式吸引了大量的关注,对人类行为的深入理解有助于揭示大量社会经济活动中复杂现象的起因。另外,研究人类行为也有重大的科学和应用价值,从商业推销、国防事业到推荐及行为预测等。例如,自从人类交互行为和移动行为中的非泊松统计特性被发现以来,越来越多的科学家关注这些特性对传播动力学的影响。在本论文中,主要包含以下四方面内容:1)从在线行为到离线行为,从个体层面到群体层面的不同类型用户行为的实证分析;2)对人类行为实证数据中观察到的不同模式特征的建模分析;3)研究人类接触活动中非泊松统计特性对疾病传播的影响;4)最后,本文给出了人类时空行为在推荐和行为预测中的作用。首先,分析了真实生活中巨量的数据,包括短消息、看电影、在线交易、书签收藏、微博转发以及人类兴趣轨迹等不同在线和离线行为轨迹。实证结果显示出这些行为中具有一些共有的统计特性,包括1)用户活动数目、用户活跃性及活动间隔时间都服从胖尾分布。2)用户活跃性和间隔时间分布的负相关性。3)群体用户的媒体评分行为服从自相似和长程关联特性,在个体层面却存在极小的关联指数和长程的反关联特性。4)人类兴趣行为中三种基本量,用户连续兴趣长度、用户再次访问特定兴趣时间以及兴趣排名都服从类幂律的胖尾分布。5)用户访问论坛的次数和该论坛对应的访问者数目服从幂指数为0.75的幂律关系。6)通过对用户探索新学术论坛过程研究,证实用户在学术论坛的扩张过程服从幂指数为0.54的幂律关系。7)用户在不同学术论坛返回的物理间隔时间和次数分布都服从幂律分布。8)用户平均访问次数??及其对应的波动性服从指数为1.2的超线性的关系:~??等等。其次,为了拟合实证数据中观察到的一些规律模式,针对不同规律分别给出了具有合理解释的模型。这些模型包括:1)为了区分内在机制策略(高优先级策略)和外在因素(活跃性随着时间变化)对人类活动间隔时间分布的影响,提出了一种新的称为相对时钟的计时方法。使用了一个模型,该模型中用户活动行为遵循固定概率或者服从幂律分布,而且全局活跃性保持不变或者随时间周期变化。结果显示由全局活跃性异质性所造成的胖尾间隔时间分布可以由相对时钟方法消除。2)为了模拟兴趣活动中的胖尾分布,采用了一个有偏的随机游走模型,该模型包括优先返回已访问过的兴趣、探索新兴趣和惯性效应三种特征。3)学术论坛访问中所观察到的标度律暗示了其内在的机制,为了刻画这种机制,使用一套基于探索和带记忆效应的偏好返回模型。4)为了模拟人类移动活动过程中的超线性标度律现象,使用包含两种必备特征:偏好返回和探索的模型来拟合实证观察结果。再次,关注人类非泊松统计特性对层次网络传播过程的影响。一方面,研究了人类接触活动中无标度分布律对疾病传播过程的影响。研究结果表明,和同质接触模式或者随机接触模式相比,用户层次网络结构及其延迟之间的关联能显著的降低疾病传播速度,而且导致不断向上的多峰特征。更重要的是,高层初始种子节点会引起更大的不确定性,而低层初始种子会导致几个对应的不确定性峰值,使对疾病的预测变的困难。另外一方面,又讨论了基于种群模型框架的层次网络的疾病传播模型,该模型中个体沿着网络连边随机进行游走。研究结果表明了疾病传播峰值时间0和种群密度??之间存在类似漂移幂律分布的负相关关系,同时也表明0和网络规模之间的对数正相关性。这两种现象都可以由疾病传播过程中波动的渐近增大来解释。此外,还定量的讨论了边界控制过程对层次网络中疾病爆发延迟有效性,结果显示移动策略有效性非常有限,但是对种群密度、感染入侵检测以及感染地区多样性却存在显著依赖。实验结果表明了人类空间移动、网络拓扑结构和种群因素影响对疾病传播和控制都存在重要影响。最后,我们研究了大数据环境下用户行为在推荐和行为预测方面的应用。协同过滤推荐系统是一个广泛应用的推荐算法,但是,随着人类行为数据量的增多,该算法的计算复杂性也越来越大,很难在应用于大数据环境下。因此,采取将基于用户的协同过滤算法部署于一个大数据计算平台上面,来解决协同过滤算法的数据爆炸问题。为了预测个体下一次行为(或者轨迹),全面分析了个体的移动特征,发现人类移动特征的异质性和弱周时间无关性。利用手机数据,同时使用不同的基于用户移动特征的预测因子来预测用户行为轨迹,结果显示这些都有助于预测精确度的提高。再者,通过将不同人类移动过程中时空特征因素混合策略,开发了一种精确度很高的预测算法。
【关键词】:人类动力学 胖尾分布 兴趣动力学 传播动力学
【学位授予单位】:电子科技大学
【学位级别】:博士
【学位授予年份】:2014
【分类号】:C912.6;TP391.3
【目录】:
- 摘要5-7
- ABSTRACT7-14
- 第一章 绪论14-27
- 1.1 研究背景与意义14-15
- 1.2 国内外研究历史与现状15-25
- 1.2.1 人类行为时间特性分析及建模15-20
- 1.2.2 人类行为空间特性分析及建模20-23
- 1.2.3 人类行为动力学效应及应用研究23-25
- 1.3 本文主要研究内容和组织结构25-27
- 第二章 人类行为的实证分析27-54
- 2.1 数据集介绍27-30
- 2.1.1 Delicious数据27
- 2.1.2 Netflix数据27
- 2.1.3 Movie Lens数据27-28
- 2.1.4 Friend Feed 数据28
- 2.1.5 Twitter数据28
- 2.1.6 短信息数据28-29
- 2.1.7 科学网数据29
- 2.1.8 线上行为和线下行为数据29
- 2.1.9 豆瓣数据29
- 2.1.10 淘宝数据29
- 2.1.11 手机阅读数据29-30
- 2.2 人类行为时间特性研究30-34
- 2.2.1 间隔时间分布研究30-31
- 2.2.2 活跃性研究31-33
- 2.2.3 时间重定标研究33
- 2.2.4 周期现象研究33-34
- 2.3 人类行为记忆效应研究34-39
- 2.3.1 记忆性和阵发性35
- 2.3.2 去趋势波动分析(DFA)35-37
- 2.3.3 去趋势波动分析(DFA)和用户活跃性37-39
- 2.3.4 去趋势波动分析(DFA)和用户间隔时间分布39
- 2.4 人类行为返回时间研究39-41
- 2.5 人类行为活跃次数研究41-42
- 2.6 人类行为非马尔可夫性研究42-44
- 2.6.1 兴趣访问行为的非马尔可夫性42-44
- 2.6.2 移动停留时间的非马尔可夫性44
- 2.7 人类空间移动关联性研究44-46
- 2.7.1 人类移动流量涨落规律及关联44-45
- 2.7.2 不同节点数目 影响45-46
- 2.8 人类行为网络可视化研究46-48
- 2.8.1 人类兴趣跳转网络46
- 2.8.2 人类移动网络46-47
- 2.8.3 学术群组相关性网络47-48
- 2.9 人类行为排名分布研究48-49
- 2.10人类行为其它规律研究49-52
- 2.10.1 活动次数与用户数目关系49-50
- 2.10.2 人类真实行为熵和可预测性50-52
- 2.10.3 学术论坛活动访问扩大过程52
- 2.11本章小结52-54
- 第三章 人类行为的建模及动力学机制54-78
- 3.1 相对时钟模型54-59
- 3.1.1 相对时钟概念54-55
- 3.1.2 相对时钟模型55-58
- 3.1.3 相对时钟模型结果58-59
- 3.2 非马尔可夫模型59-69
- 3.2.1 模型介绍59-60
- 3.2.2 模型模块和参数60-62
- 3.2.3 模型解析62-67
- 3.2.3.1 连续访问兴趣长度 概率分布63-65
- 3.2.3.2 返回间隔长度 概率分布65-66
- 3.2.3.3 兴趣排名分布66-67
- 3.2.4 模型模拟结果67-68
- 3.2.5 在线行为和离线行为活动的非马尔可夫性68-69
- 3.3 科学论坛访问建模69-72
- 3.3.1 模型参数介绍69-70
- 3.3.2 模型及其结果70-72
- 3.4 扩散与聚焦建模72-76
- 3.4.1 模型介绍72-73
- 3.4.2 模型参数及其影响73-74
- 3.4.3 模型解析74-75
- 3.4.4 模型结果75-76
- 3.5 本章小结76-78
- 第四章 人类行为的动力学效应研究78-97
- 4.1 人类行为空间特性对传播动力学的影响78-86
- 4.1.1 模型介绍79-81
- 4.1.1.1 地理层次网络模型79-80
- 4.1.1.2 接触过程中的时间延迟80-81
- 4.1.1.3 传播过程81
- 4.1.2 不同接触模式影响81-86
- 4.1.2.1 随机种子影响82-84
- 4.1.2.2 非随机选取种子84-86
- 4.2 人类行为空间特性对种群传播动力学的影响86-95
- 4.2.1 模型介绍87-89
- 4.2.2 基本模拟结果89-91
- 4.2.3 人.数目和密度的影响91-93
- 4.2.4 长距离出行的影响93-95
- 4.3 本章小结95-97
- 4.3.1 人类时空特性传播总结和讨论95
- 4.3.2 人类时空特性种群传播总结和讨论95-97
- 第五章 人类行为的应用研究97-108
- 5.1 大数据下基于用户的协同过滤算法研究97-102
- 5.1.1 协同过滤算法和 介绍98-100
- 5.1.1.1 协同过滤算法98-99
- 5.1.1.2 过程99-100
- 5.1.2 协同过滤算法的 化100-101
- 5.1.2.1 数据划分阶段100-101
- 5.1.2.2 阶段101
- 5.1.3 实验结果101-102
- 5.2 大数据下人类空间轨迹预测研究102-107
- 5.2.1 预测算法概述103-105
- 5.2.1.1 基于时间特性的预测模型103-104
- 5.2.1.2 基于空间特性的预测模型104
- 5.2.1.3 基于时空等特性的预测模型104-105
- 5.2.2 实验结果105-107
- 5.3 本章小结107-108
- 第六章 全文总结与展望108-112
- 6.1 全文总结108-110
- 6.2 未来研究展望110-112
- 致谢112-113
- 参考文献113-128
- 攻博期间取得的研究成果128-130
【共引文献】
中国期刊全文数据库 前10条
1 周筑文;黄燕芬;邓明森;杨思泽;;大气压等离子体处理黔茄2号种子对茄子产量和品质的影响[J];现代农业科技;2009年19期
2 胡永生;杨玲玲;;基于多重图形剖分算法的免疫策略[J];传感器与微系统;2010年10期
3 石伟;李强;向阳;鞠九滨;;针对幂律泊松模型推测网络蠕虫传播路径[J];东南大学学报(自然科学版);2008年S1期
4 谢意;张晖;;“韩寒代笔门”事件中的人类动力学分析[J];电脑知识与技术;2012年10期
5 朱大智;吴俊;谭跃进;邓宏钟;;度秩函数:一个新的复杂网络统计特征[J];复杂系统与复杂性科学;2006年04期
6 周涛;;在线电影点播中的人类动力学模式[J];复杂系统与复杂性科学;2008年01期
7 李楠楠;周涛;张宁;;人类动力学基本概念与实证分析[J];复杂系统与复杂性科学;2008年02期
8 郑木华;姜罗罗;赵明;;股票交易时间间隔分布特征的实证研究[J];复杂系统与复杂性科学;2012年02期
9 周筑文;黄燕芬;陈伟;杨思泽;;一种新型大气压等离子体装置及其对茄子种子的应用效果(英文)[J];贵州农业科学;2011年03期
10 姚灿中;杨建梅;;幂律拟合的进展及其在产业网络中的应用[J];管理学报;2008年03期
中国博士学位论文全文数据库 前10条
1 马勇;欧盟科技一体化研究[D];华东师范大学;2011年
2 杨波;复杂社会网络的结构测度与模型研究[D];上海交通大学;2007年
3 姚灿中;产业复杂网络的建模、仿真与分析[D];华南理工大学;2010年
4 易兰丽;基于人类动力学的微博用户行为统计特征分析与建模研究[D];北京邮电大学;2012年
5 夏虎;移动社交网络结构和行为研究及其应用[D];电子科技大学;2012年
6 吴联仁;基于人类动力学的社交网络信息传播实证分析与建模研究[D];北京邮电大学;2013年
7 肖云鹏;在线社会网络用户行为模型与应用算法研究[D];北京邮电大学;2013年
8 曾进群;开源社区结构与行为及其特点研究[D];华南理工大学;2013年
9 任薇;基于微博的社会网络特征研究[D];西南大学;2014年
10 林颖婷;社会网络上的舆论一致性与人类创新行为动力学[D];中国科学技术大学;2014年
本文关键词:人类行为时空特性的分析、建模及动力学研究,,由笔耕文化传播整理发布。
本文编号:419220
本文链接:https://www.wllwen.com/shoufeilunwen/sklbs/419220.html