基于通讯数据的社群分类
发布时间:2018-06-28 10:22
本文选题:马氏链 + PageRank算法 ; 参考:《华中师范大学》2017年硕士论文
【摘要】:近年来,对研究对象的分类问题已经在多个研究领域得到了广泛的应用,分类的方法也得到了巨大的发展,如聚类分析、KNN算法、决策树、支持向量机等等。本文以研究实际通讯数据的社群分类问题出发,提出了一种PageRank算法和SimRank算法相结合的新的分类方法。在两个实际案例中得到实践,并将结果分别与真实情况和传统聚类方法结果进行了比较,整体效果和结果解释均较为理想。本文提出的方法适用于研究任意对象与对象之间的关系。先将问题转化为一个简单而直观的点边结构图模型,通过PageRank算法计算状态点在整个图中的“重要性”,通过SimRank算法测量对象之间结构上的相似性,根据它们与其他对象的关系,有效地进行分类。本文的基本思想是“两个对象是相似的,则与他们相关的对象应相似。”本文的研究可以视为无监督学习(无指导学习)的实践和探索。
[Abstract]:In recent years, the classification of research objects has been widely used in many research fields, and the classification methods have been greatly developed, such as clustering analysis KNN algorithm, decision tree, support vector machine and so on. In this paper, we propose a new classification method which combines PageRank algorithm with SimRank algorithm. The results are compared with the real cases and the traditional clustering methods respectively. The overall effect and the interpretation of the results are satisfactory. The method proposed in this paper is suitable for studying the relationship between arbitrary objects and objects. Firstly, the problem is transformed into a simple and intuitionistic point-edge structure graph model. The importance of state points in the whole graph is calculated by PageRank algorithm, and the structural similarity between objects is measured by SimRank algorithm, according to their relationship with other objects. Classify effectively. The basic idea of this paper is that "if two objects are similar, the objects related to them should be similar." The research in this paper can be regarded as the practice and exploration of unsupervised learning (unsupervised learning).
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:C815
【参考文献】
相关期刊论文 前8条
1 王冲;纪仙慧;;基于用户兴趣与主题相关的PageRank算法改进研究[J];计算机科学;2016年03期
2 刘萍;黄纯万;;基于SimRank的作者相似度计算[J];情报理论与实践;2015年06期
3 魏琳;;基于SimRank的慢性胃炎相似关系挖掘的研究与分析[J];福建电脑;2014年09期
4 尹坤;尹红风;杨燕;贾真;;基于SimRank的百度百科词条语义相似度计算[J];山东大学学报(工学版);2014年03期
5 魏现辉;张绍武;杨亮;林鸿飞;;基于加权SimRank的跨领域文本情感倾向性分析[J];模式识别与人工智能;2013年11期
6 张书娟;董喜双;关毅;;基于电子商务用户行为的同义词识别[J];中文信息学报;2012年03期
7 李亚楠;许晟;王斌;;基于加权SimRank的中文查询推荐研究[J];中文信息学报;2010年03期
8 黄兰;郭志敏;习万球;;利用聚类技术对图书馆读者社群的研究分析[J];计算机工程与设计;2007年22期
,本文编号:2077670
本文链接:https://www.wllwen.com/shekelunwen/shgj/2077670.html
教材专著