当前位置:主页 > 文艺论文 > 广告艺术论文 >

基于社交媒体数据的人类移动模式发现研究

发布时间:2017-11-24 11:15

  本文关键词:基于社交媒体数据的人类移动模式发现研究


  更多相关文章: 人类移动 日常周期性 社交媒体数据挖掘 时空数据分析 轨迹预测


【摘要】:现代社会经济发展迅速,人类乘坐飞机,火车、巴士等公共交通工具出行成为必然,人类的流动变得越来越频繁。地理空间内人类的移动看似随机且没有规律,但实际上较大规模人群的移动却隐藏着特定的模式。从个体行为出发,发现人类移动模式可以帮助我们研究很多问题,比如人类行为和迁移模式、人口流动预测、传染病的演化和疾病传播预测、优化免疫策略、人类接触模式、城市规划、异常检测、个性化推荐等等。某些传染病正是由于人的旅行和相互接触才发生传播,研究群体的空间移动规律有助于深入理解这些疾病的传播机制,进而提出有效的预防和控制措施;在城市空间中,人在不同地点间的移动直接导致交通网络上的各种复杂的流动现象,只有掌握了人类移动规律,才能合理规划交通设施,进而预防和控制交通拥堵。因此,研究个体或群体行为,发现活动中蕴含的空间认知规律及空间行为和交互模式,理解人类动力学特征,进而支持个体或群体时空行为决策,对预测、规划、监测等领域提供帮助,已经成为当前的研究热点。人类个体或群体在地理空间的移动有多种表现形式。交通运输工具的位置变化、随身携带设备的位移过程、频率及规模等都是个体或群体空间移动特征的真实写照。过去人类移动性研究多基于观察、访问、调查问卷和出行日志等信息获取方式,信息获取成本高、样本量小、时间跨度短,且易受到问卷设计和主观判断的影响,难以大规模、长时间地观测和记录人的空间移动行为。进入大数据时代,随着传感器网络、移动定位、无线通讯和移动互联网技术的快速发展与普及,使得基于个体粒度的时空精细度更高的海量个体移动轨迹获取人类移动模式成为可能。来自不同领域的学者基于手机通话数据、公交卡刷卡记录、社交网站签到数据、出租车轨迹、银行刷卡记录等进行了人类移动模式的研究,这些研究为从个体角度发现人类移动模式提供了一个新视角,同时,移动轨迹处理技术、时空数据表达与挖掘技术的发展和物理学、计算机科学、地理学以及复杂性科学等多学科理论方法的交叉也为人类移动性研究提供了有力支撑,促进了移动行为特征分析的定量化。人类移动模式的研究可以追溯到1885年,E.G. Ravenstein在他发表的文章《The Laws of Migrations》中,通过对统计调查数据的仔细观察与研究,提出一些很重要的关于移居的规则:1)大多数的移居都是近距离的。2)经济发达的地方会“吸引”很多周围地区的人。3)移居有双方向性的性质。4)很多长距离的移居原因都是来自经济因素。他提出的这些规则奠定了人类移动模式研究的基础,现在大部分的研究理论,追寻其根源都和这些规则相关。一直以来,人类移动模式研究面临缺乏个人位置数据的问题。尽管最初手机的普及给研究人员提供了大量的通话、短信、上网等通信数据,但这些数据是通过间隔几公里的基站位置推测用户位置得到的,所以位置准确性不高。获得更准确的定位方法可以通过搭载GPS或者传感器,但是佩戴这些机器的人数非常有限,规模不大。近几年随着搭载GPS的智能手机的普及和基于位置的社交网络服务的快速发展,上千万的用户在这些社交网络上更新和分享他们的状态,利用准确定位的GPS功能获取大量个人位置信息成为解决上述问题的有效途径。个体的活动序列在一定程度上反映了个体的意图、喜好和空间行为模式,从个人移动轨迹中提取出蕴含的活动序列模式,对个体行为理解和个性化推荐至关重要。本文主要包含以下三方面内容:1)从大量Twitter数据出发,着力解决数据的稀疏性问题,提出了SDIM模型(Static and Dynamic Integrated Model)进行人类移动模式预测。实验结果表明,该模型的预测精准度更高;2)开发了一个可视化绘制个人轨迹的3D软件,将Twitter信息进行叠加,在真实地图上显示个人移动轨迹及移动模式;3)在人类移动模式预测的基础上,初步研究了移动模式与个人偏好的关系,进行更有针对性的个性化推荐。具体而言,本文的主要工作包括三个方面。(1)本文分析了真实生活中大量的数据,即社交媒体Twitter上超过800万条数据,对个体移动模式进行预测。在基于位置的社交网络服务(如Twitter)中,数据不仅具有地理位置信息,还包含该位置上所承载的兴趣点语义信息,因此这些信息在行为分析中十分有效。然而,这类数据存在用户只有在主动签到时才有记录的问题,导致用户个人轨迹通常比较稀疏。目前用于人类移动模式预测的主要方法有随机游走模型,蒙特卡罗模型,移动距离分布模型等,但是他们都存在一个共性的问题,即:没有很好解决数据的稀疏性带来的预测准确度差这一问题。由于人类移动存在家和工作地等频繁重访的地点的特点,本文关注个体轨迹中的重访点,对Twitter数据进行预处理,解决数据稀疏性的问题。基于上述思想,本文提出了SDIM模型进行人类移动模式的预测。SDIM模型包括两个基本部分:基于高斯的静态模型和基于高斯的动态模型。根据静态模型估计高斯参数,从人们发送的Twitter信息中确定个人常去的地点。动态模型由24个独立的多高斯混合模型组成,将Twitter数据进行参数估计以抽取出每个时间点的位置特征。如果单独采用高斯静态模型进行人类移动模式预测,由于该模型不考虑时间因素,只考虑个体的位置信息,尽管可以解决数据稀疏性的问题,但是预测精度不高;如果单独采用高斯动态模型进行人类移动模式预测,在一些时间点得到的数据非常少,无法解决数据稀疏性的问题,容易出现过拟合。因此,SDIM模型将两者有机结合在一起,既可以解决数据稀疏性的问题,又提高了预测的精度。无论K值取2还是任意,多个实验结果表明,在与多个基准数据和方法的比较中,SDIM模型预测结果的准确率更高。(2)本文开发了能将个人移动轨迹用可视化方式呈现的3D软件,通过拖拽等操作,可直观形象的在真实地图上显示个人移动轨迹。该软件采用Ruby on Rails Web框架、MySQL数据库、Thin Web服务器和Nginx http服务器技术等作为核心的软件开发技术,实现了如下功能:1)给定时间查询个体发送推特数量;2)真实地图上精准经纬度位置信息查询;3)显示时间分布、方差和Gyration半径等基本数据统计量。该软件既可以作为预测人类移动模式的发现结果,也可以作为个性化推荐等应用的输入,进行下一步的开发。(3)本文还初步研究了个人移动轨迹和个人偏好的关系,提出基于预测到的个体移动位置进行精准的广告投放的思路,具体描述如下。通过分析Twitter数据发现工作日和周末个体移动轨迹有所不同。本文将移动步长设置为一个小时,通过拟合的多高斯模型和K-means发现用户频繁到访的位置,并分析他们的时间模式。利用熵计算时间和地点的关联,综合空间与时间的特征提出了Twitter用户的时空模型,预测个人轨迹及每个用户在给定时间的位置状态。基于以上结果,可以做到广告的精准投放和个性化推荐。本文提出的方法仅考虑利用交通数据中位置信息的特定移动过程,如地铁站的位置信息和每条线路的信息。实际还可以利用轨迹分析的技术,通过计算地铁线(不只是地铁也可以是道路)的形状和个人轨迹的相似度,判断某个人是否正在乘坐地铁(火车)移动。此外,如果能够找到正确的个人移动轨迹的话,可以判断个人和平时不一样的行为(异常发现)。社交媒体上关系和不常见行为是有关联的。已有研究工作发现远距离的移动和社交媒体上好友的关联,以及轨迹和经常访问地(‘家’和‘工作单位’)的关联。基于这些研究,本文拟进一步研究异常移动行为和社交关系等其他因素的关联,进而提出异常行为检测方法。
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:C912.6

【相似文献】

中国期刊全文数据库 前10条

1 朱文馨;;社交媒体盛行下的大学生寒暄文化发展的研究[J];中国传媒科技;2013年08期

2 阴卫芝;;美国五所高校社交媒体准则研究[J];新闻爱好者;2013年02期

3 亚历克斯·皮埃尔·特维斯;;社交媒体过载,我们都抑郁了[J];商学院;2013年09期

4 王忠强;胡增军;郭斌;;基于社交媒体的独立学院招生宣传对策构建[J];文学教育(中);2014年04期

5 刘铭嘉;陈茜;黄庭瑞;翟家琛;荣沛洋;杨柳;;社交媒体对大学生就业的影响与分析——以微博、微信为例[J];西部广播电视;2014年09期

6 虞鑫;徐文擎;;当遇到社交媒体事件[J];北京教育(德育);2012年02期

7 李巍;;社交媒体,品牌与体育的最佳结合体[J];中国广告;2012年07期

8 王宏涛;王宏武;;社交媒体:马克思主义大众化传播新途径[J];广西社会科学;2013年02期

9 倪琳;;社交媒体在实践教学中的应用[J];青年记者;2013年17期

10 高崇;;青少年社交媒体交往中玩商发展存在的问题及其矫治[J];思想理论教育;2013年18期

中国重要会议论文全文数据库 前3条

1 袁靖华;;微博的理想与现实——兼论社交媒体建构公共空间的三大困扰因素[A];数字未来与媒介社会2[C];2010年

2 洪婧茹;;社交媒体与上海大学生的环保参与:从线上关注到线下行动[A];中华新闻传播学术联盟第六届研究生学术研讨会论文集[C];2014年

3 王斌;郑满宁;;扭转“逆差”:社交媒体时代国人形象传播机制及策略[A];新闻学论集(第30辑)[C];2014年

中国重要报纸全文数据库 前10条

1 韩军 编译;社交媒体营销助推器还是新航向?[N];中国民航报;2010年

2 本报记者 陈晓平;社交媒体重构商业?[N];21世纪经济报道;2011年

3 一鸣;出版商介入社交媒体的危险[N];中国图书商报;2011年

4 Chris Nerney;社交媒体带来的5大安全威胁[N];网络世界;2011年

5 李鑫源;社交媒体影响不容小窥[N];科技日报;2011年

6 陈晓平;社交媒体的“葫芦论”[N];21世纪经济报道;2011年

7 肖明超(新生代市场监测机构副总经理);社交媒体引发营销裂变[N];中国图书商报;2011年

8 文化学者 常江;社交媒体的“情绪化”[N];新华每日电讯;2012年

9 朱永磊 贝恩大中华区电信、媒体与高科技业务主管;如何成为社交媒体的长期赢家[N];通信产业报;2012年

10 记者 赵中文;东南亚企业倾向利用社交媒体经商[N];中华工商时报;2012年

中国博士学位论文全文数据库 前6条

1 张雪;复杂网络链路分析与社交媒体预测[D];国防科学技术大学;2013年

2 罗准辰;社交媒体中的信息检索与传播分析[D];国防科学技术大学;2013年

3 丹尼尔;社交媒体在企业传播中的使用:可口可乐中国和可口可乐加纳案例研究[D];复旦大学;2014年

4 唐李洋;基于社交媒体大数据的Twitter营销策略研究[D];合肥工业大学;2015年

5 朱星玮;社交媒体信息结构化组织及其应用研究[D];清华大学;2015年

6 谢松县;社交媒体中观点信息分析与应用[D];国防科学技术大学;2014年

中国硕士学位论文全文数据库 前10条

1 李雪絮;社交媒体广告的表现策略研究[D];浙江理工大学;2013年

2 吕蒙;网络社交媒体关系网络与品牌传播[D];辽宁大学;2013年

3 吴祖宏;大学生手机社交媒体依赖的问卷编制及特点研究[D];西南大学;2014年

4 张茜茹;大学生社交媒体依赖的测量及其与主观幸福感的关系[D];山西师范大学;2015年

5 徐蕾;政务社交媒体用户使用意愿研究[D];南京大学;2015年

6 巩丽;社交媒体对电视节目受众观看行为的影响研究[D];复旦大学;2014年

7 黄睿;台湾反服贸运动中社交媒体的参与及其思考[D];江西师范大学;2015年

8 杨鹏鹏;中国公共政策传播中社交媒体应用研究[D];河南大学;2015年

9 于一恒;基于社交媒体的A公司产品营销策略研究[D];中国海洋大学;2015年

10 李休休;社交媒体上的恐怖活动研究[D];华东政法大学;2016年



本文编号:1222057

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/1222057.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0d964***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com