跨渠道的个人社交生态系统恢复与偏好分析
发布时间:2020-07-18 10:30
【摘要】:对社交网络的深入研究可以帮助我们了解所处的时代,去挖掘社交表象背后更加深层次的关系。虚拟的社交网络很大程度上反映了一个人真实生活的社交状态。本论文的观点在于,从多个渠道包括新浪微博、电子邮件、通话记录、短信记录中用技术手段挖掘数据,将现实中的互动关系转移成可以量化的社交关系。研究人与人之间在各个社交工具渠道的交互过程。人与人之间的距离有远有近,这种远近关系可以用挖掘到的互动关系数据加以准确衡量。本论文在深入研究了国内外关于社交网络相关理论、数据挖掘相关理论与工具、社交网络中社交强度的相关研究,与图论知识相结合,对个人社交生态系统和社交强度进行定义,分析社交强度的影响因素。对于个人社交生态系统的恢复,运用模型以及数据挖掘算法来获取数据。对个人社交数据进行挖掘,其中包括三个渠道的数据,分别为:通过部署Android App在手机端获取通话记录和短信记录;利用基于Java的新浪微博爬虫技术获取微博关注、粉丝、内容、评论、点赞、转发数据;利用邮箱内嵌式插件获取邮件往来记录。将这些原始数据进行处理、清洗后,运用可视化工具Gephi形成网络拓扑图,恢复出跨渠道的个人社交生态系统。由于随着时间变化,数据量的变化,个人社交生态系统也不断变化,对于不断变化的个人社交生态系统,进行全面分析社交偏好,其中包括社交时间点的偏好、社交渠道的偏好以及社交内容的偏好。最后,开发跨渠道的个人社交生态系统恢复与偏好分析工具,此工具基于数据分析并发现规律,有效地提高用户与用户之间的社交效率,从而帮助用户更好地进行社交互动。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F49;TP311.13
【图文】:
最大的特点是,LinkedIn 将好友分为一、二和三度。用户是用户的直接朋友。“二度”指的是与用户“一。对二度的普遍理解即:好朋友的朋友,通常没有直集的人们。“三度”的意思是:与“二度”建立起关系三度就是好友的好友的好友。例如,某用户的直接的好上二度联系人和兴趣组的人,就成了 3,942,895 这样来,社交网络中“度”的概念是真实存在的。社交生态系统模型社交生态系统的定义下,借用 Microsoft Visio 制图工社交数据挖掘恢复出的个人社交生态系统,其中 A 为L 为与 A 进行交互的社交圈的好友,A 与 B,C,D表距离,距离的大小用社交强度来计算,用户会根据与好友之间的距离有远近之分,体现了某个好友对于和重要程度。其中椭圆代表对于 A 来说,椭圆内的念图 2-2 所示:
在本论文的研究中,通讯记录作为恢复个人社交生态系统的主要渠道之一,需要将抓取的通信记录,即通话记录、短信记录作为重要依据。由于该渠道的数据不是存放在网页中,而是在用户手机里,所以需要将数据通过部署APP 的形式传到服务器里。因此,android APP 需要将通讯数据收取,进行数据清洗,洗掉不必要的广告、骚扰电话,只留下已经保存在用户通讯录里的社交数据,将这些数据同步到服务器中,以此作为数据源来恢复个人社交生态系统。由于此处需要获取 Android 原生通讯记录 app 下的数据。利用 Android 在不同进程之间的通信方法而提供的 ContentProvider 作为标准 API[39]。当需要向其他应用程序公开数据时,应用程序可以通过提供内容提供者来实现。外部程序可以通过 ContentResolver 来访问内容提供者提供的数据,因为 Android 提供了源码供开发者进行调用,所以并不需要由开发者编写原生通讯记录 ap的 ContentProvider,只需要通过使用 ContentResolver 调用原生通讯记录 ap提供的 ContentProvider 接口即可获取通讯记录信息。原生通讯记录 app 提供的 ContentProvider 如图 3-1:
图 3-2 实体类 CallLogInfoBean 核心代码后将获取通讯记录的核心代码封装到 CallLogUtils,通过在 Ma即可获取通讯记录信息,其核心程序流程图如图 3-3:开始获取ContentResolverlong lastPostTime=System.currentTimeMillis()-90*24*60*60*10001cursor!=null&&cursor.getCount() > 0Date date;cursor.moveToFirst()int i = 0;if (lastPostTime >cursor.getLong(cursor.getColumnIndex(CallLog.Calls.DATE)))continue得到DATE,NUMBER,TYPE,CATCHED_NAME,ID,DURATIONYNYNi <cursor.getCount()?Ncursor.moveToPosition(i);
本文编号:2760765
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F49;TP311.13
【图文】:
最大的特点是,LinkedIn 将好友分为一、二和三度。用户是用户的直接朋友。“二度”指的是与用户“一。对二度的普遍理解即:好朋友的朋友,通常没有直集的人们。“三度”的意思是:与“二度”建立起关系三度就是好友的好友的好友。例如,某用户的直接的好上二度联系人和兴趣组的人,就成了 3,942,895 这样来,社交网络中“度”的概念是真实存在的。社交生态系统模型社交生态系统的定义下,借用 Microsoft Visio 制图工社交数据挖掘恢复出的个人社交生态系统,其中 A 为L 为与 A 进行交互的社交圈的好友,A 与 B,C,D表距离,距离的大小用社交强度来计算,用户会根据与好友之间的距离有远近之分,体现了某个好友对于和重要程度。其中椭圆代表对于 A 来说,椭圆内的念图 2-2 所示:
在本论文的研究中,通讯记录作为恢复个人社交生态系统的主要渠道之一,需要将抓取的通信记录,即通话记录、短信记录作为重要依据。由于该渠道的数据不是存放在网页中,而是在用户手机里,所以需要将数据通过部署APP 的形式传到服务器里。因此,android APP 需要将通讯数据收取,进行数据清洗,洗掉不必要的广告、骚扰电话,只留下已经保存在用户通讯录里的社交数据,将这些数据同步到服务器中,以此作为数据源来恢复个人社交生态系统。由于此处需要获取 Android 原生通讯记录 app 下的数据。利用 Android 在不同进程之间的通信方法而提供的 ContentProvider 作为标准 API[39]。当需要向其他应用程序公开数据时,应用程序可以通过提供内容提供者来实现。外部程序可以通过 ContentResolver 来访问内容提供者提供的数据,因为 Android 提供了源码供开发者进行调用,所以并不需要由开发者编写原生通讯记录 ap的 ContentProvider,只需要通过使用 ContentResolver 调用原生通讯记录 ap提供的 ContentProvider 接口即可获取通讯记录信息。原生通讯记录 app 提供的 ContentProvider 如图 3-1:
图 3-2 实体类 CallLogInfoBean 核心代码后将获取通讯记录的核心代码封装到 CallLogUtils,通过在 Ma即可获取通讯记录信息,其核心程序流程图如图 3-3:开始获取ContentResolverlong lastPostTime=System.currentTimeMillis()-90*24*60*60*10001cursor!=null&&cursor.getCount() > 0Date date;cursor.moveToFirst()int i = 0;if (lastPostTime >cursor.getLong(cursor.getColumnIndex(CallLog.Calls.DATE)))continue得到DATE,NUMBER,TYPE,CATCHED_NAME,ID,DURATIONYNYNi <cursor.getCount()?Ncursor.moveToPosition(i);
【参考文献】
相关期刊论文 前6条
1 黄河燕;;在线社交网络的可视化分析[J];中国科学院院刊;2015年02期
2 姚士成;刘学锋;毛建华;李神送;刘芽;;基于传感网的传感器感知信息可视化系统设计[J];电子测量技术;2015年01期
3 关迎晖;向勇;陈康;;基于Gephi的可视分析方法研究与应用[J];电信科学;2013年S1期
4 周建利;张爱华;段婧;;社会关系强度对社交网络中应用接受意愿的影响研究[J];中国科技信息;2012年23期
5 谢海涛;孟祥武;;适应用户需求进化的个性化信息服务模型[J];电子学报;2011年03期
6 王晓云;;大学生网络交往中人际吸引因素的研究[J];长沙大学学报;2009年01期
相关硕士学位论文 前4条
1 刘亚;社交网络节点流失模型与应用研究[D];重庆邮电大学;2016年
2 秦隆;复杂数据可视化的研究与应用[D];电子科技大学;2015年
3 张志飞;微博信息流中突现话题检测技术研究[D];杭州电子科技大学;2012年
4 康书龙;基于用户行为及关系的社交网络节点影响力评价[D];北京邮电大学;2011年
本文编号:2760765
本文链接:https://www.wllwen.com/guanlilunwen/sjfx/2760765.html