当前位置:主页 > 管理论文 > 移动网络论文 >

社交网络节点分类技术研究

发布时间:2017-04-30 04:17

  本文关键词:社交网络节点分类技术研究,由笔耕文化传播整理发布。


【摘要】:随着Internet的迅速发展,使得人们通过网络进行互联的沟通方式也得了极大发展,这也形成了社交网络这一新兴的网络基本形态。社交网络是现实世界人与人之间沟通的网络虚拟化,尤其是近年来社交网络(如:Facebook、腾讯、微博)的迅猛发展,吸引了众多领域学者对社交网络中数据进行挖掘分析的广泛关注,从而促进了以广告宣传、公共服务、营销、学术交流等为目的的社交网络研究。分类问题作为数据挖掘分析的一种方式,也被应用在社交网络之中,通过对网络中节点进行分类,通过标签对节点的这些兴趣,爱好,关系或其他可能的特征进行捕获,可以得出对人口的价值观、兴趣的描述,节点的信仰以及标政治或宗教信仰。通过分类技术对社交网络中的节点进行标签标记,有利于深入分析对社交结构特征以及应用的延研究。对社交网络中的节点进行分类是文本研究方向,社交网络中节点可以是代表现实中一个人也可以是某个学校这样的一个整体,节点包含了大量的文本、图片、音频、视频等数据以及属性。节点分类主要分为单标签分类和多标签分类,由于社交网络内节点含有众多数据以及属性,单标签分类已经不满足于节点分类的要求,本文主要对节点进行多标签分类。本文结合社交网络节点特性,从两个方面进行了节点分类技术的研究,一个方向是根据节点自身属性分类节点,另一个是根据节点之间链接关系进行分类。当前根据节点属性进行分类的相关方法存在对数据样本的原始属性集进行各种不同形式的约减,但分类没有对不同的类标签或标签集使用不同的属性集来加以区分,从而更好地挖掘标签间的区别与联系。另外,由于社交节点之间存在错综复杂的关系,仅考虑节点自身属性不能够满足节点分类要求,还要考虑节点之间关系。因此,本文提出两种社交网络节点分类方法。首先,本文基于节点属性,提出了一种基于K近邻节点属性的多标签分类算法。算法主要思想是首先找出能够体现出节点类标签的强相关属性,以及不能体现节点特征的弱相关属性,保留强相关性属性,去掉弱相关属性。以此为基础计算未标签节点的K个近邻,通过未标签节点的近邻标签集,使用最大后验概率计算该未标签节点属于各个标签的概率,最终根据阙值得到未标签节点的标签集合。其次,本文结合节点关系,提出一种基于社区结构性节点多标签随机游走分类算法。算法主要思想是首先对网络进行社区划分,然后将划分社区多标签节点数据映射到图上,通过图来表示网络中的节点,节点之间的边表示节点间的关系,通过随机游走以及条件概率模型,节点与各个标签的相似性,计算出未标签节的从属各个标签的概率分布情况,从而得到节点的分类集合。最后,本文通过在两种数据集上进行实验,实验结果表明本文提出的基于K近邻的标签属性相关算法与其属性相比较能够提高分类速度,得到良好的分类结果,此外基于社区结构性节点多标签随机游走算法与其他链接性分类算法相比在分类准确程度上也得了很好的体现。
【关键词】:社交网络 多标签分类 K近邻 随机游走
【学位授予单位】:辽宁大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13;TP393.09
【目录】:
  • 摘要4-6
  • 英文摘要6-12
  • 第1章 绪论12-19
  • 1.1 研究背景及意义12-14
  • 1.2 国内外研究现状14-16
  • 1.2.1 基于属性分类的研究现状14-15
  • 1.2.2 基于链接结构的研究现状15-16
  • 1.3 本文主要工作与结构安排16-19
  • 1.3.1 主要工作16-17
  • 1.3.2 论文结构17-19
  • 第2章 相关工作19-29
  • 2.1 社交网络相关概念和定义19-21
  • 2.2 多标签分类21-24
  • 2.3 经典分类算法24-26
  • 2.3.1 决策树分类24-25
  • 2.3.2 贝叶斯分类25-26
  • 2.3.3 支持向量机26
  • 2.4 链接分类算法26-28
  • 2.4.1 迭代分类算法26-27
  • 2.4.2 马尔可夫逻辑网27-28
  • 2.5 本章小结28-29
  • 第3章 基于K近邻节点属性多标签分类算法29-40
  • 3.1 问题描述29-30
  • 3.2 基于K近邻节点属性的多标签分类算法30-38
  • 3.2.1 概念与定义30-32
  • 3.2.2 K近邻算法32-34
  • 3.2.3 算法思想34-36
  • 3.2.4 算法设计36-38
  • 3.3 算法分析38-39
  • 3.4 本章小结39-40
  • 第4章 基于社区结构性节点多标签随机游走算法40-50
  • 4.1 问题描述40-41
  • 4.2 基于社区结构性节点多标签随机游走算法41-48
  • 4.2.1 概念与定义41-42
  • 4.2.2 随机游走模型42-44
  • 4.2.3 算法思想44-46
  • 4.2.4 算法设计46-48
  • 4.3 算法分析48-49
  • 4.4 本章小结49-50
  • 第5章 实验结果与分析50-56
  • 5.1 实验数据集50-51
  • 5.2 实验方案51-52
  • 5.2.1 基于K近邻节点属性的多标签分类算法51
  • 5.2.2 基于社区结构性节点多标签随机游走算法51-52
  • 5.3 实验结果与分析52-55
  • 5.3.1 基于K近邻节点属性的多标签分类算法52-53
  • 5.3.2 基于社区结构性节点多标签随机游走算法53-55
  • 5.4 本章小结55-56
  • 第6章 总结和展望56-58
  • 6.1 本文工作内容总结56-57
  • 6.2 展望57-58
  • 致谢58-59
  • 参考文献59-62
  • 攻读学位期间发表的学术论文及参加科研情况62-63

【相似文献】

中国期刊全文数据库 前10条

1 王若愚;方芳;叶昭;;流量分类技术精细管理网络[J];中国教育网络;2012年02期

2 马明成;莫晓俊;姜洪臣;徐波;;音频分类技术在广播质量评估中的应用[J];广播与电视技术;2010年10期

3 黄树成;曲亚辉;;数据流分类技术研究综述[J];计算机应用研究;2009年10期

4 张俊,石功军,王中平;信息处理过程中的分类技术[J];声学技术;2003年04期

5 张李,涂晓东,何诚;流分类技术的研究[J];电子科技大学学报;2004年06期

6 李洋;赵骅;;基于信息熵和决策分类技术的邮件识别研究[J];计算机科学;2008年02期

7 夏雪;肖德宝;顾婷;;基于本体的报警分类技术在报警评估过程中的应用与实现(英文)[J];北京交通大学学报;2008年06期

8 黄敏;何中市;;分类技术在高职教学质量评价分析中的应用[J];计算机工程与设计;2012年03期

9 王与;刘洋;;分类技术在高校教学管理中的应用[J];滁州学院学报;2011年05期

10 段巍巍;许海滨;;基于分类技术的目标客户辅助定位方法研究[J];江苏通信;2008年03期

中国重要会议论文全文数据库 前1条

1 梁晓雯;闵友钢;;音乐情感分类技术在媒体资产管理中的应用[A];中国新闻技术工作者联合会2008年学术年会论文集(下)[C];2008年

中国博士学位论文全文数据库 前1条

1 毕夏安;高性能包分类技术及其应用研究[D];湖南大学;2012年

中国硕士学位论文全文数据库 前10条

1 周方;社交网络节点分类技术研究[D];辽宁大学;2015年

2 丛蓉;基于采样的网络流量分类技术研究[D];北京邮电大学;2012年

3 朱秋香;流分类技术研究及其原型系统的实现[D];东南大学;2004年

4 张海笑;数据挖掘分类技术在高校教学中的应用研究[D];广东工业大学;2005年

5 常慧;分类技术在税收管理中的应用[D];郑州大学;2003年

6 蒋杰;基于分类技术的电子支付平台作弊账户的识别模型研究[D];浙江工业大学;2012年

7 陈铮;基于音乐流派分类技术的音乐库分类检索系统的研究与实现[D];华东师范大学;2012年

8 代丽;DFI流量分类技术的研究和实现[D];北京邮电大学;2011年

9 杨传耀;数字图书馆及其分类技术的研究[D];福州大学;2004年

10 王国华;智能监控中目标检测与分类技术的研究[D];安徽大学;2012年


  本文关键词:社交网络节点分类技术研究,由笔耕文化传播整理发布。



本文编号:336233

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/336233.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fbc60***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com