基于SOM-K-means的天涯BBS水军帖的聚类分析
[Abstract]:The emergence and popularization of the Internet have brought about tremendous changes in people's lives, and various network forums have greatly expanded the channels for people to exchange and share information. However, the intermingling of network forces greatly reduces the authenticity and effectiveness of network information, interferes with the true trend of public opinion, and even leads to network trust crisis. Therefore, it is of great significance to understand the characteristics of watermen and how to identify them. This paper starts with the active BBS of the network army, grabs the characteristic attribute data of some hot posts, first carries on the data preprocessing, proposes the registration date of the user's home page through the variable correlation analysis. The number of login and the number of fans are three effective clustering variables. Then, based on the self-organizing mapping neural network (SOM) clustering, the interval value and the final clustering center of the reasonable clustering number N are found out, which is used as the clustering number and the initial clustering center of K-means clustering, and the SOM K-means two-stage clustering analysis is realized. In order to improve the accuracy of clustering. From the point of view of clustering, it is found that the registration date of water army group is obviously concentrated on individual date, the number of fans and posts is less, the similarity of variable data is obvious, the rule of user ID naming is abnormal and so on, and the centrality of registration date is put forward. The data consistency of each variable, the registration date concentration of users in the first two pages and the naming rules of user ID are four aspects to identify the waterfront posts, and an example is given to show that the rules can be effectively applied to the identification of Shuijun posts. Finally, the deficiency and future research direction of this study are put forward. In summary, according to the idea of data acquisition, processing, analysis and application, this paper organizes the content, studies the attribute characteristics of users of BBS posts from the perspective of clustering, and summarizes the characteristics of water army groups, which provides an effective method for the identification of water posts.
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:C913.4
【相似文献】
相关期刊论文 前10条
1 陶长春;李和山;;基于大学生BBS行为特征的互动式和谐高校论坛建设[J];东南传播;2010年08期
2 ;BBS武功大血拼[J];作文大王(初中版);2006年01期
3 郭达阳;;谈开发高校校园网BBS思想政治教育功能的必要性[J];现代企业教育;2012年21期
4 丁雪全;;BBS在图书馆的应用[J];学园;2013年21期
5 ;《教师博览》网上BBS(论坛)已开通[J];教师博览;2003年02期
6 ;下期BBS话题:[J];当代学生;2004年08期
7 ;上期《暑期合同》的BBS跟帖:[J];素质教育博览;2004年17期
8 张瑜,洪波;多角度看大学生BBS昵称[J];思想教育研究;2004年03期
9 刘冰;从BBS看校园网络文化对大学生学习的影响[J];现代远程教育研究;2005年02期
10 李爱民;;借助BBS营造和谐舆论[J];国际公关;2006年05期
相关会议论文 前2条
1 何冰;;BBS在大学英语写作教学中的应用[A];全国大学英语教学改革暨网络环境下外语教学学术研讨会论文集[C];2004年
2 杨国俊;朱晓东;;基于BBS挖掘的危机预测算法[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
相关重要报纸文章 前10条
1 本报记者 邹伟;“小区BBS”拉近都市邻里距离[N];南京日报;2008年
2 ;跟随BBS去旅游[N];中国旅游报;2002年
3 记者 唐茹 通讯员 张建国;“西铁改革发展论坛”成为高铁时代“BBS”[N];人民铁道;2010年
4 湖北 寂寞高手;BBS社区轻松找信息[N];电脑报;2002年
5 山东省莱州市城港中街道朱杲小学 王伟光;如何教导小学生学BBS[N];中国电脑教育报;2004年
6 ;网上自由讨论的空间——BBS[N];兵团日报(汉);2000年
7 E龙工作室 双龙一剑;将搜索进行到底BBS消息,“百晓生”包打听[N];电脑报;2003年
8 本报记者 岳纲举;网易关闭社区 BBS末日来临?[N];中国消费者报;2012年
9 本报记者 王晓雁;BBS侵犯他人商誉 搜狐被判赔偿5万[N];法制日报;2006年
10 ;清华同方高招网BBS系统建立[N];国际金融报;2000年
相关硕士学位论文 前10条
1 陈国玉;基于SOM-K-means的天涯BBS水军帖的聚类分析[D];华中科技大学;2013年
2 余兰;大学生BBS交往中的网络角色研究[D];西南大学;2007年
3 朱伟军;基于BBS的网上群体学习的答疑系统的研究[D];湘潭大学;2002年
4 陈克;基于BBS的政府舆情采集分析系统的设计和实现[D];南京邮电大学;2012年
5 高功敬;BBS虚拟社区的人际互动[D];山东大学;2005年
6 刘伟;基于数据挖掘的BBS用户评价系统研究[D];长春理工大学;2011年
7 安长俊;基于校园网的BBS开发[D];南京理工大学;2008年
8 杨国俊;基于BBS的舆情预测算法及应用研究[D];合肥工业大学;2010年
9 周君;BBS中语言使用与性别及年龄的相关性研究[D];安徽大学;2010年
10 孙洁;一项基于建构主义的BBS辅助英语写作教学的案例研究[D];山东师范大学;2010年
本文编号:2125522
本文链接:https://www.wllwen.com/shekelunwen/shgj/2125522.html