社交网用户行为关系概率推演模型的研究与实现
本文选题:社交网 + 行为关系 ; 参考:《东北大学》2014年硕士论文
【摘要】:社交网络是一个以用户为中心,由用户来产生各种信息的应用,而这些信息是观察用户间关系的基础,如何发现具有紧密关系的用户并为其提供信息推荐服务,进而服务于社区发现,是目前学术界和工业界关于社交网用户关系研究热点问题之一。Twitter作为典型社交网应用之一,由于拥有众多用户并含有丰富Tweets内容,因此能有效挖掘用户关系,本文基于Twitter平台从用户行为角度对用户关系问题进行了深入研究。首先,针对以往大部分研究仅以社交网用户间“关注”与“被关注”行为作为用户关系研究焦点所导致不能确切反应用户间紧密关系的不足问题。本文认为可根据与用户行为有关的两个关键因素,即活动和位置来分析用户关系,并由此提出了一种用户在相近地理位置进行相似活动的用户关系,即用户间行为关系(Behavior Relationship-BR),简称BR关系,该关系包括与会、旅游、购物等关系。进一步,将BR关系划分为用户对行为关系(User Pair Behavior Relationship-UPBR)和用户群行为关系(User Group Behavior Relationship-UGBR)。其次,由于Twitter平台“@”关系体现了用户关系的紧密程度,因而本文利用“@”关系提出了一种BR关系概率推演模型PIM (Probability Inference Model).该模型首先面向一对用户,计算二者之间的行为活动相似性概率及其位置相似度,从而以概率方法推演出他们是否具有UPBR关系;其次,通过基于BR矩阵的最大树聚类技术(BR Matrix-based Maximal Tree Clustering-BRMC),来发现用户群体间是否具有UGBR行为关系。最后,本文从真实数据与仿真数据两种数据集对BR关系推演的效果进行了扩展性实验。其中,真实数据检验了PIM推断用户地理位置的误差距离、准确率以及@次数与误差距离的关系,实验结果表明PIM在位置推断具有比较高的准确性。仿真数据则从两方面进行了实验,一是测试了不同活动阈值下PIM在推演UPBR的准确率(precision)、召回率(recall)以及F1-Measure;二是以NMI、F1-Measure为指标检验了BRMC的聚类精度,并从聚类敏感度角度测试了与BRMC相关参数,实验结果表明BRMC在发现UGBR具有很好的效果。
[Abstract]:A social network is an application that is user-centric and produces all kinds of information that is the basis for observing the relationships between users, how to discover and recommend information to users who are closely connected. Serving for community discovery, it is one of the hot issues in academic and industrial research on social network user relationship. As one of the typical social network applications, Twitter has a large number of users and contains rich Tweets content. Therefore, the user relationship can be mined effectively. Based on the Twitter platform, the user relationship problem is studied in this paper from the user behavior point of view. First of all, because most of the previous studies only focus on "attention" and "attention" behavior among users of social networks, it can not exactly reflect the lack of close relationship between users. This paper considers that the user relationship can be analyzed according to two key factors related to user behavior, namely, activity and location, and a user relationship in which the user carries out similar activities in a similar geographical location is proposed. The behavior relationship between users is Behavior Relationship-BRN, or Br relationship, which includes participation, travel, shopping and so on. Furthermore, Br relationship is divided into user Pair Behavior relationship and user Group Behavior relationship. Secondly, because the "@" relation of Twitter platform reflects the degree of closeness of user relationship, this paper proposes a Br relational probability deduction model, PIM / probability Inference model, using "@" relation. Firstly, the model is aimed at a pair of users to calculate the similarity probability of behavior activity and the similarity of their position, and then deduces whether they have UPBR relationship by probability method. The maximum tree clustering technique based on Br matrix is used to find out whether there is a UGBR behavior relationship between user groups. At last, this paper makes an extensive experiment on the effect of Br relation deduction from real data and simulation data sets. Among them, real data verify the relationship between error distance, accuracy rate and @ number of users' geographic location inferred by PIM. The experimental results show that PIM has high accuracy in location inference. The simulation data are tested from two aspects, one is to test the accuracy of PIM in deducing UPBR under different activity thresholds, and the other is to test the clustering accuracy of BRMC using NMI-F1-Measure as the index. The parameters related to BRMC are tested from the cluster sensitivity angle. The experimental results show that BRMC has a good effect in finding UGBR.
【学位授予单位】:东北大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.09
【相似文献】
相关期刊论文 前10条
1 来雪玲;图书馆用户关系管理[J];图书馆学研究;2004年09期
2 赵玉敏;;面向知识服务的图书馆用户关系管理[J];科技情报开发与经济;2007年11期
3 徐双;刘勇;;基于用户知识交互的图书馆用户关系管理[J];情报探索;2010年08期
4 付凯芳;;基于知识转移的图书馆用户关系管理分析[J];民营科技;2010年08期
5 ;微博的含义[J];民间传奇故事(A卷);2010年05期
6 孙万军;用户卡——邮政实行用户关系管理的第一步[J];中国邮政;2000年12期
7 陈娟;;媒体的用户关系管理应建立基于大数据的管理理念[J];中国传媒科技;2013年01期
8 陈娟;;大数据时代的媒体用户关系管理[J];传媒观察;2013年07期
9 莫启仪;;新时代图书馆用户关系管理实践研究[J];新世纪图书馆;2013年07期
10 ;移动时代 媒体与用户关系的新变革[J];声屏世界·广告人;2013年07期
相关会议论文 前1条
1 蔡赛缄;丁丽佳;;对气象微博的初步探讨及发展前景思考[A];广东省气象学会2012年学术年会论文摘要文集[C];2012年
相关重要报纸文章 前2条
1 李志廷;党报微博,力量不“微”[N];宁夏日报;2013年
2 实习生 张雪娇;移动社交:一场愈演愈烈的社交变革[N];科技日报;2014年
相关博士学位论文 前1条
1 武慧娟;社会化标注系统中个性化信息推荐模型研究[D];吉林大学;2014年
相关硕士学位论文 前10条
1 李德民;社会网络用户关系分析与预测[D];山东大学;2015年
2 杨珂;电子商务网络水军的智能识别研究[D];北京工商大学;2015年
3 张旭;社交网用户行为关系概率推演模型的研究与实现[D];东北大学;2014年
4 党永杰;新浪微博用户关系研究[D];华中师范大学;2013年
5 刘梦琦;基于用户关系管理理论的高校图书馆发展研究[D];安徽大学;2012年
6 周余姣;基于CRM理念的图书馆用户关系管理研究[D];河北大学;2009年
7 王鹏;运营支撑系统的CRM研究[D];黑龙江大学;2013年
8 陈立锋;基于移动CDR的用户关系分析及应用[D];北京邮电大学;2014年
9 孙大鹏;基于Hadoop的SNS用户关系链分析的研究和应用[D];东北师范大学;2014年
10 白林根;基于复杂网络的微博用户关系网络结构研究[D];杭州电子科技大学;2014年
,本文编号:1854733
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1854733.html