基于文本信息的社会关系分析与研究
本文选题:社会关系分析 切入点:群组分析 出处:《苏州大学》2016年博士论文
【摘要】:目前,随着互联网的发展,大量的信息被呈现在我们面前。社交网络起源于网络交友,人们使用社交网络服务来组织、维护现有的社会关系,发现新的社会关系,从而在网络上呈现自己,并进行相关的社交活动。人与人之间的最简单的社会关系为好友关系。除了好友关系之外,人们还可以根据兴趣和个人属性被区分为不同的群组。比如根据兴趣,人们可以被分为爱好书籍的和爱好跳舞的群组等。另外,根据对于某一事物的专业程度,人们又可以被分为专业人士和普通大众。因此,识别人与人之间的两大类社会关系,即好友关系和群组关系,将是本文的研究的两个主要方面。传统的针对社交网络的研究通常会基于用户之间的联系进行分析,但是很多用户之间并没有足够多的联系用来帮助分析。而用户发表的文本信息在很多情况下能够有效的帮助分析社会关系,比如从文本中能找出有相近爱好或者相近写作风格的用户群组。因此,本文主要将研究基于文本信息的用户间好友和群组关系分析。除此之外,从文本中抽取的用户的个人属性信息能够很好的帮助识别社会关系,因此,本文的另一个研究重点就是从文本中有效的抽取有代表性的个人属性信息。本文主要利用文本信息进行用户社会关系分析,并开展了以下几方面的研究内容:1.我们从简历文本中抽取用户的两类重要的信息来反映用户的基本属性。一类是用户的技能的信息,但是,单纯通过技能信息来描述一个用户又会显得过于简单,因此我们从简历文本中抽取文本摘要信息作为另一类信息,从而更全面地体现用户信息。为了抽取用户的技能和简历信息,我们提出了一个联合预测因子图模型,用来将不同用户与技能通过多种关系联系起来。具体来说,我们提出的因子图模型通过属性函数利用多种文本信息,而基于因子函数将不同的用户联系起来。并利用置信传播算法学习与抽取用户的技能和摘要信息。2.在获取了用户的个人属性信息之后,我们从用户发表的文本中抽取的多种文本信息帮助好友关系预测任务。由于好友关系和兴趣是高度相关的,比如相互联系的好友倾向于有相近的兴趣,我们抽取了多种情感信息来联系有相近兴趣的用户。另外,好友之间的写作风格也会类似,因此,我们抽取了多种写作风格特征,比如,文本结构特征,词法特征,句法与篇章特征来帮助预测好友关系。我们最终基于概率图模型融合上述信息并进行用户好友关系的学习与预测。3.由于区分用户群组有很多种标准,我们分别按照兴趣与专业程度对用户的群组进行区分。值得注意的是,用户之间可能会有多个共同的兴趣群组,而一个用户只可能是专业的或者非专业的。对于基于兴趣的群组推荐,由于同一个用户可能存在多个兴趣群组,而不同群组之间也可能存在关联,因此我们提出了一种新的隐含因子图模型,用来有效的集成表层与潜在的文本与社交信息,从而将用户与群组有效的集成在一起。而对于区分专业和非专业人群,由于专业人士和非专业人士的关注点通常是不同的,而评论的专业程度通常和语言的表达有关。同时,对于同一事物的评论,不同类型的评论者也是有关联的。因此,我们提出一种基于协同矩阵分解的框架,用来预测用户发表评论的专业程度,并结合了多种文本特征与评论之间的联系。目前,用户社会关系分析研究尚处于起步阶段,本文研究亦属探索性工作,上述工作对用户社会关系分析在理论、资源、计算上均有不同程度的创新,对该领域的相关研究具有重要参考价值。
[Abstract]:At present, with the development of the Internet, a large amount of information to be presented in front of us. The social network originated in the network of friends, people use social networking services to organize, maintain the existing social relations, the discovery of new social relations, which presents itself in the network, and related social activities. The most simple social relationship between people and people's friendship. In addition to a friend relationship, people can also be divided into different groups according to their interests and personal attributes. For example, according to the interest, people can be divided into love books and loving dance group. In addition, according to the professional degree for one thing, it can be divided into professionals and the general public. Therefore, two kinds of social relations between recognition of people, namely friends and group relations, will be the two main aspects of this research. The traditional acupuncture on social networks Network research will usually be analyzed based on the link between the user, but many users is not enough to help the user contact analysis. While the published text information can effectively help the analysis of social relations in many cases, for example, from the text can be found with similar hobbies or similar writing styles of users. Therefore, this paper will study and analyze the text information between users and groups based on the relationship between friends. In addition, the personal information in the text selected users can help identify social relations, therefore, another focus of this paper is effective from the text of the selected personal information representative in this paper. The main use of text analysis of the information users of social relations, and carried out as follows: 1. we extracted from the text of the two types of user resume weight The basic attribute to the information to reflect the user. One is user skills information, but only by skill information to describe a user will seem too simple, so we extracted from text summarization information resume text as another type of information, which reflects the user information in a more comprehensive way. In order to extract the user skills and resume information, we propose a joint prediction factor graph model, for different users and skills linked through a variety of relationships. Specifically, the factor graph model we propose using a variety of text information through the attribute function, and function will link users based on different. And the belief propagation algorithm learning and extraction user skills and abstract information.2. after obtaining the user's personal information, a variety of text information extraction from text published by users in good help The relationship between the prediction task. Because friends and interests are highly relevant, such as mutual contact friends tend to have similar interests, we selected a variety of emotional contact information to users with similar interest. In addition, between friends writing style will be similar, therefore, we selected a variety of writing style, for example. The text structure features, lexical features, syntactic and textual features to help predict friendship. We finally learn and predict the probability of.3. graph model and the information fusion based on user friend relationship due to distinguish between user groups there are many standards, we respectively according to the degree of interest and professional user groups are distinguished. It is worth noting that, there may be many common interests between the users in a group, and a user can only be professional or non professional. Recommended for interest groups based on the In the same user may have more than one interest group, and may also exist between different groups, so we propose a new implicit factor graph model for the effective integration of the surface and the potential of text and social information to users and groups will effectively integrated together. The distinction between professional and non because of professional groups, professional and non professional persons concerned are usually different, and professional comments usually associated with the expression of language. At the same time, the same thing comments, different types of reviewers is also related. Therefore, we propose a collaborative framework based on matrix decomposition, used to predict professional the degree of user comments, and combination between text features and reviews a variety of contact. At present, analysis of user of social relations is still in its infancy, this study is exploratory work The above work has a different degree of innovation on the analysis of social relations in the theory, resources and calculation, and has important reference value for the related research in this field.
【学位授予单位】:苏州大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 史加荣;郑秀云;周水生;;矩阵补全算法研究进展[J];计算机科学;2014年04期
2 李聪;骆志刚;;用于鲁棒协同推荐的元信息增强变分贝叶斯矩阵分解模型[J];自动化学报;2011年09期
3 袁运祥;基于矩阵分解的子结构法求解介绍[J];计算机应用通讯;1981年00期
4 张海建;;分布式矩阵分解算法在推荐系统中的研究与应用[J];科技通报;2013年12期
5 何朕,赵文斌,于达仁;摄动矩阵的分解[J];电机与控制学报;2004年03期
6 李华云;;F范数及矩阵分解实例研究[J];现代情报;2008年10期
7 邹理和;;系数矩阵分解二维谱估值[J];信号处理;1985年03期
8 陈伯伦;陈];邹盛荣;徐秀莲;;基于矩阵分解的二分网络社区挖掘算法[J];计算机科学;2014年02期
9 王锋;赵志文;牟盛;;整数提升小波多相矩阵分解系数的快速提取算法[J];中国图象图形学报;2012年03期
10 段华杰;;考虑时间效应的矩阵分解技术在推荐系统中的应用[J];微型电脑应用;2013年03期
相关会议论文 前2条
1 王春江;钱若军;王人鹏;杨联萍;;矩阵分解在张力集成体系模态分析中的应用[A];第九届全国结构工程学术会议论文集第Ⅰ卷[C];2000年
2 王春江;王人鹏;钱若军;王颖;;矩阵分解技术在体系性态综合分析中的初步应用[A];“力学2000”学术大会论文集[C];2000年
相关博士学位论文 前6条
1 王中卿;基于文本信息的社会关系分析与研究[D];苏州大学;2016年
2 李英明;矩阵分解在数据挖掘中的应用[D];浙江大学;2014年
3 赵科科;低秩矩阵分解的正则化方法与应用[D];浙江大学;2012年
4 郭亦鸿;利用穆勒矩阵分解定量测量各向异性介质微观结构[D];清华大学;2014年
5 胡惠轶;基于分解的系统辨识方法研究[D];江南大学;2014年
6 陈根浪;基于社交媒体的推荐技术若干问题研究[D];浙江大学;2012年
相关硕士学位论文 前10条
1 秦晓晖;个性化微博推荐方法研究[D];华南理工大学;2015年
2 刘凤林;基于矩阵分解的协同过滤推荐算法研究[D];南京理工大学;2015年
3 李源鑫;基于提升的信任融合矩阵分解推荐算法[D];福建师范大学;2015年
4 陈洪涛;基于矩阵分解的常规与长尾捆绑推荐的博弈研究[D];福建师范大学;2015年
5 张济龙;基于概率矩阵分解的推荐算法研究[D];燕山大学;2015年
6 邓志豪;基于物品相似度和主题回归的矩阵分解推荐算法[D];浙江大学;2015年
7 余露;利用矩阵分解算法建模数据稀疏环境下用户协同行为[D];杭州师范大学;2015年
8 倪泽明;混合用户行为建模的概率矩阵分解推荐算法[D];浙江大学;2015年
9 丁浩;基于协同矩阵分解的药物靶标相互作用关系预测[D];复旦大学;2014年
10 吴世伟;社会网络中的链接分析[D];复旦大学;2014年
,本文编号:1700864
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1700864.html