当前位置:主页 > 管理论文 > 移动网络论文 >

在线社会网络分析与挖掘若干关键问题研究

发布时间:2018-09-17 11:37
【摘要】:社会网络因为其结构复杂,用户行为各异,用户各种活动产生的数据量巨大,因此,对其的研究充满了挑战。正因为如此,也吸引了各方研究人员的注意,取得了丰富的研究成果。但是,在线社会网络作为近几年新生事物,还在发展壮大之中,这其中必然有很多问题等待人们的研究。本文针对社会网络个体特点、群体特点以及结构特点,对社会网络中几个关键的问题进行了讨论和研究,主要研究内容和成果包括:(1)在社会网络用户个体分析方面,本文重点研究了通过用户发表内容来计算用户-话题之间的关系。在对用户-话题关系计算方面,本文以用户在社会网络上公开发表内容为数据来源,利用非负矩阵分解技术,提出了用户-话题敏感度计算算法。该算法能够通过分析用户过去发表的内容,有效计算用户对话题感兴趣程度。在真实数据集上的实验结果表明文中提出的算法能够有效分析用户发表内容,计算用户-话题敏感度。特别的,随着微博的流行,信息过载情况越来越严重,用户越来越倾向发表短文本数据。短文本数据使用户数据非常稀疏,本文特别提出基于单词共现的短文本用户-话题敏感度计算算法。普通算法不能很好的处理短文本稀疏数据,而本文提出的专门针对短文本的算法可以有效的避免数据稀疏问题,有效计算出结果。对真实数据进行实验测试结果表明,本文提到的短文本用户-话题关系计算算法能够避免数据稀疏带来的各种问题,有效进行计算。(2)在社会网络结构挖掘方面,本文提出了临界节点和临界块的概念,并设计了有效算法,在网络中发现这类特殊节点。社会网络中不同节点有不同的重要程度,这一概念早已深入人心,但是如何度量节点的重要性,人们提出了各种度量方法以及算法,包括各种中心性,k-shell、k-core等概念以及基于PageRank和HITS的各种算法。本文另辟蹊径,从另一个角度提出了发现社会网络中一类重要节点——临界节点的算法。本文利用矩阵中Fiedler向量的性质,提出了启发式算法有效地发现它们,并且针对真实数据集进行了大量实验。实验结果表明,在社会网络中确实存在着临界节点,本文提出的算法能够有效发现它们。(3)在社会网络群体分析方面,本文研究如何发现网络中的社区问题。社区发现问题吸引了众多研究人员的注意,但是,当前的研究大都基于网络的结构来进行分析。考虑到用户加入社区更多的原因是为特定的话题所吸引,话题对社区形成有重要影响,因此,本文综合考虑了网络结构与用户文本之间的关系,提出了同时基于结构和话题进行社区发现的算法。实验结果表明该算法能够同时综合利用社会网络的结构信息和文本中话题信息,有效的进行社区发现。综上所述,本文针对社会网络中用户分析,特殊节点发现以及社区发现等三个问题,提出了用户-话题计算、临界节点发现和话题社区发现等关键技术,对于社会网络的分析和挖掘工作具有重要的理论意义与应用价值。
[Abstract]:Because of its complex structure, different user behaviors and huge amount of data generated by various user activities, social networks are facing great challenges. As a result, it has attracted the attention of researchers from all walks of life and has made abundant research achievements. In this paper, we discuss and study several key issues in social networks, including individual characteristics, group characteristics and structural characteristics of social networks. The main research contents and achievements include: (1) In the aspect of individual analysis of social network users, this paper focuses on the use of user-generated. In the aspect of user-topic relationship calculation, this paper proposes a user-topic sensitivity calculation algorithm based on non-negative matrix decomposition technique, which takes publicly published content of users on social networks as data source. Experimental results on real data sets show that the proposed algorithm can effectively analyze user publications and calculate user-topic sensitivity. In particular, with the popularity of micro-blogs, information overload is becoming more and more serious, and users are increasingly inclined to publish short text data. In this paper, we propose a short-text user-topic sensitivity algorithm based on word co-occurrence. The general algorithm can not deal with sparse short-text data very well, and the special algorithm for short-text proposed in this paper can effectively avoid the problem of data sparsity and calculate the results. Experimental results on real data are given. The results show that the short-text user-topic relationship algorithm mentioned in this paper can avoid all kinds of problems caused by data sparsity and efficiently compute. (2) In the aspect of social network structure mining, this paper puts forward the concept of critical node and critical block, and designs an effective algorithm to find these special nodes in the network. Points have different degrees of importance, this concept has long been deeply rooted in people's hearts, but how to measure the importance of nodes, people have proposed a variety of measurement methods and algorithms, including various concepts such as centrality, k-shell, k-core and algorithms based on PageRank and HITS. In this paper, a heuristic algorithm based on the properties of Fiedler vectors in matrices is proposed to effectively discover critical nodes, and a large number of experiments are carried out on real data sets. Community discovery has attracted the attention of many researchers, but most of the current research is based on the structure of the network. Therefore, considering the relationship between network structure and user text, this paper proposes an algorithm for community discovery based on both structure and topic. Experimental results show that the algorithm can make use of both the structure information of social network and the topic information in text to effectively discover communities. Aiming at the three problems of user analysis, special node discovery and community discovery in social networks, this paper puts forward the key technologies of user-topic computing, critical node discovery and topic community discovery, which have important theoretical significance and application value for the analysis and mining of social networks.
【学位授予单位】:东北大学
【学位级别】:博士
【学位授予年份】:2014
【分类号】:TP393.09;TP391.1

【相似文献】

相关期刊论文 前10条

1 何光辉;张太平;;保持拓扑性非负矩阵分解法在人脸识别的应用[J];计算机工程与应用;2010年14期

2 史加荣;焦李成;尚凡华;;不完全非负矩阵分解的加速算法[J];电子学报;2011年02期

3 王文俊;张军英;;一种非负矩阵分解的快速方法[J];计算机工程与应用;2009年25期

4 张雷鸣;李秋丹;廖胜才;;非负矩阵分解在标签语义分析中的应用[J];计算机科学;2010年04期

5 于彬;;基于局部非负矩阵分解的人脸识别[J];科学技术与工程;2010年33期

6 姜伟;杨炳儒;隋海峰;;局部敏感非负矩阵分解[J];计算机科学;2010年12期

7 宋金歌;杨景;陈平;佘玉梅;;一种非负矩阵分解的快速稀疏算法[J];云南民族大学学报(自然科学版);2011年04期

8 高燕燕;;非负矩阵分解及其应用探讨[J];硅谷;2011年23期

9 郝红;徐常青;张新平;;基于非负矩阵分解的航拍图像信息提取[J];浙江农林大学学报;2012年01期

10 吴荣玉;樊丰;舒建;;基于非负矩阵分解的鲁棒哈希函数验证性研究[J];电子技术应用;2012年01期

相关会议论文 前10条

1 孙江明;李通化;;非平滑三维非负矩阵分解[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年

2 蒋永锴;叶东毅;;基于稀疏非负矩阵分解的自动多文摘方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

3 马帅;吴飞;杨易;邵健;;基于稀疏非负矩阵分解的图像检索[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年

4 徐利民;龚珊;余再军;;奇异值分解与非负矩阵分解色在数据降维方面的特性分析[A];2010年通信理论与信号处理学术年会论文集[C];2010年

5 蔡蕾;朱永生;;基于稀疏性非负矩阵分解和支持向量机的轴心轨迹图识别[A];2008年全国振动工程及应用学术会议暨第十一届全国设备故障诊断学术会议论文集[C];2008年

6 蒋霈霖;;KL散度下的非负矩阵分解[A];中国自动化学会中南六省(区)2010年第28届年会·论文集[C];2010年

7 杨宝;朱启兵;黄敏;;基于非负矩阵分解一稀疏表示分类的玻璃缺陷图像识别[A];第24届中国控制与决策会议论文集[C];2012年

8 钱乐乐;高隽;徐小红;;非负性约束的图像稀疏编码[A];第七届全国信息获取与处理学术会议论文集[C];2009年

9 朱昊;黄源水;付梦印;;基于NMF的道路识别算法在野外环境感知中的应用[A];第九届全国光电技术学术交流会论文集(下册)[C];2010年

10 郑能恒;蔡毅;李霞;Tan Lee;;基于非负矩阵分解和向量相似测度的语音与音乐分离算法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

相关博士学位论文 前10条

1 杨士准;基于样本和特征的迁移学习方法及应用[D];国防科学技术大学;2013年

2 叶军;基于正则化方法的非负矩阵分解算法及其应用研究[D];南京理工大学;2014年

3 陆玉武;图像分类中流形回归与非负矩阵分解研究[D];哈尔滨工业大学;2015年

4 张恩德;在线社会网络分析与挖掘若干关键问题研究[D];东北大学;2014年

5 胡俐蕊;非负矩阵分解方法及其在选票图像识别中的应用[D];安徽大学;2013年

6 殷海青;图像分析中的非负矩阵分解理论及其最优化和正则化方法研究[D];西安电子科技大学;2011年

7 杨洪礼;非负矩阵与张量分解及其应用[D];山东科技大学;2011年

8 史加荣;多尺度张量逼近及应用[D];西安电子科技大学;2012年

9 方蔚涛;人脸识别特征抽取算法的研究[D];重庆大学;2012年

10 刘昱昊;基于非负矩阵分解算法的人脸识别技术的研究[D];吉林大学;2014年

相关硕士学位论文 前10条

1 谢昊;非负矩阵分解初始化及其应用[D];暨南大学;2015年

2 王一;凸与半非负矩阵分解的近点梯度方法研究[D];东北师范大学;2015年

3 项磊;基于乳腺癌计算机辅助诊断的病理图像分析[D];南京信息工程大学;2015年

4 王丹;基于非负矩阵分解的脑电信号特征提取算法研究[D];燕山大学;2015年

5 马春霞;非负矩阵分解及在基因表达数据分析中的应用研究[D];曲阜师范大学;2015年

6 崔艳荣;基于非负矩阵分解的高光谱遥感数据融合方法分析及应用[D];电子科技大学;2014年

7 赖淑珍;非负矩阵分解若干算法研究与应用[D];电子科技大学;2014年

8 赵龙;基于多流形正则化非负矩阵分解的多视图聚类[D];大连理工大学;2015年

9 黄震;基于多视角非负矩阵分解的同名区分算法研究[D];大连理工大学;2015年

10 邵强;改进的非负矩阵分解算法及其在人脸识别中的应用[D];河北工业大学;2015年



本文编号:2245774

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2245774.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b2e58***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com