当前位置:主页 > 管理论文 > 移动网络论文 >

基于特征分析的微博炒作账户识别方法

发布时间:2018-12-14 02:28
【摘要】:近年来微博中出现一些炒作账户采用违规手段开展网络公关活动,严重扰乱了正常的互联网秩序,然而传统炒作账户识别方法主要依靠人工分析,其效率低下且不适用于对海量账户进行识别。针对上述问题,提出一种改进的微博炒作账户识别方法,从账户状态、历史微博以及账户邻居3个方面对炒作账户的特征进行分析,构建炒作账户特征集,并利用数据挖掘中的朴素贝叶斯、支持向量机及K最近邻分类等算法对正常账户和炒作账户进行自动分类。实验结果表明,该方法能有效识别微博中的炒作账户,准确率高达95%。
[Abstract]:In recent years, there have been some speculation accounts in Weibo using illegal means to carry out network public relations activities, which seriously disturbed the normal Internet order. However, the traditional methods of identifying speculation accounts mainly rely on manual analysis. It is inefficient and not suitable for identifying massive accounts. In view of the above problems, this paper puts forward an improved method of identifying speculation account by Weibo, analyzes the characteristics of speculation account from three aspects of account status, historical Weibo and account neighbor, and constructs the feature set of speculation account. The algorithms of naive Bayes, support vector machine and K-nearest neighbor classification in data mining are used to classify the normal account and the hyped account automatically. The experimental results show that the method can effectively identify the speculation account in Weibo, and the accuracy is as high as 95%.
【作者单位】: 数学工程与先进计算国家重点实验室;
【基金】:国家自然科学基金资助项目(61309007) 国家“863”计划基金资助项目(2012AA012902) 国家科技支撑计划基金资助项目(2012BAH47B01)
【分类号】:TP393.092

【参考文献】

相关期刊论文 前3条

1 方明;方意;;一种新型智能僵尸粉甄别方法[J];计算机工程;2013年04期

2 丁兆云;周斌;贾焰;汪祥;;微博中基于统计特征与双向投票的垃圾用户发现[J];计算机研究与发展;2013年11期

3 陈昱;张慧琳;;社会计算在信息安全中的应用[J];清华大学学报(自然科学版);2011年10期

【共引文献】

相关期刊论文 前10条

1 李满意;;社会计算与信息安全[J];保密科学技术;2012年03期

2 韦艳艳;李陶深;张超群;;集成分类器组合算法及其在医学诊断中的应用[J];广西大学学报(自然科学版);2013年05期

3 赵刚;王碰;王鑫;金文斌;吴晓婷;;基于决策树的二维码恶意网址检测方法[J];信息安全与技术;2014年02期

4 汤森迪;李小波;;WEKA平台在肿瘤分类研究中的应用[J];电脑知识与技术;2013年34期

5 李小波;彭司华;;多类别肿瘤分类的特征基因选择方法研究[J];复旦学报(自然科学版);2014年03期

6 徐徐;;数字证书在信息安全中的应用[J];计算机光盘软件与应用;2014年14期

7 邹目权;王丽珍;姚华传;芦俊丽;;广义关联分析的蕴涵-约束框架及其挖掘算法[J];燕山大学学报;2014年06期

8 刘勘;袁蕴英;刘萍;;基于随机森林分类的微博机器用户识别研究[J];北京大学学报(自然科学版);2015年02期

9 李贵林;杨禹琪;高星;廖明宏;;企业搜索引擎个性化表示与结果排序算法研究[J];计算机研究与发展;2014年01期

10 马磊;贾奇男;张俊;易青青;贺建峰;张琪;;一种基于计算机的单核苷酸多态性位点检测方法[J];基础医学与临床;2014年02期

相关会议论文 前1条

1 林燕珊;;Are People More Willing to Speak out in Social Network Sites by Using Alternative Accounts[A];中华新闻传播学术联盟第六届研究生学术研讨会论文集[C];2014年

相关博士学位论文 前10条

1 肖春静;在线社会网络中用户行为分析与预测[D];电子科技大学;2013年

2 VO THI THANH VAN;时间序列分析技术的研究[D];湖南大学;2013年

3 王晓锋;基于随机森林的跨膜螺旋接触预测与卷曲螺旋寡聚体状态预测[D];中国农业大学;2014年

4 陈震;基于序列信息的蛋白质功能位点预测的算法开发[D];中国农业大学;2014年

5 肖玲;无线体域网中人体动作监测与识别若干方法研究[D];湖南大学;2014年

6 刘彬;心电信号特征识别及其在心血管疾病诊断中的应用[D];吉林大学;2014年

7 杨辰雨;语音合成音库自动标注方法研究[D];中国科学技术大学;2014年

8 李文琼;基于互联网的产品质量安全风险预警研究[D];中国矿业大学(北京);2014年

9 张珑;汉语普通话发音质量自动评测方法研究[D];哈尔滨工业大学;2014年

10 李磊军;基于间隔和置信度的选择性集成学习算法研究[D];哈尔滨工业大学;2014年

相关硕士学位论文 前10条

1 徐星宇;基于模式识别和分子模拟的酶的热稳定性研究[D];江南大学;2013年

2 袁鲁峰;基于特征筛选方法预测不同离子通道活性的芋螺毒素[D];电子科技大学;2013年

3 张琪;基于HBV病毒序列的突变位点挖掘与系统进化研究[D];昆明理工大学;2013年

4 韩啸;同城经济型酒店管理系统的设计与实现[D];哈尔滨工业大学;2013年

5 金连;不完全数据中缺失值填充关键技术研究[D];哈尔滨工业大学;2013年

6 卫华;数据挖掘在电子商务推荐系统中的应用与研究[D];西安科技大学;2013年

7 张少辉;基于F-score和mRMR的蛋白质热点预测方法研究[D];武汉科技大学;2013年

8 孙玮;计算机应用基础考试系统的设计与实现[D];中山大学;2013年

9 刘艳;我国中小企业上市公司财务危机预警方法研究及实现[D];西南财经大学;2013年

10 朱江;基于金融本体库的热点分析研究[D];北京工商大学;2012年

【二级参考文献】

相关期刊论文 前10条

1 张泽明;罗文坚;王煦法;;一种基于人工免疫的多层垃圾邮件过滤算法[J];电子学报;2006年09期

2 王飞跃;人工社会、计算实验、平行系统——关于复杂社会经济系统计算研究的讨论[J];复杂系统与复杂性科学;2004年04期

3 王飞跃;;基于社会计算和平行系统的动态网民群体研究[J];上海理工大学学报;2011年01期

4 刘端阳;邱卫杰;;基于加权SVM主动学习的多标签分类[J];计算机工程;2011年08期

5 许晓东;肖银涛;朱士瑞;;微博社区的谣言传播仿真研究[J];计算机工程;2011年10期

6 赵传敏;马小虎;;基于非负矩阵分解和支持向量机的心电图分类[J];计算机工程;2012年09期

7 邱云飞;程亮;;微博突发话题检测方法研究[J];计算机工程;2012年09期

8 王飞跃;曾大军;曹志冬;;网络虚拟社会中非常规安全问题与社会计算方法[J];科技导报;2011年12期

9 王飞跃;平行系统方法与复杂系统的管理和控制[J];控制与决策;2004年05期

10 廉捷;周欣;曹伟;刘云;;新浪微博数据挖掘方案[J];清华大学学报(自然科学版);2011年10期

【相似文献】

相关期刊论文 前10条

1 陈旭,苏开娜,段娟;基于统计模式的人脸识别方法[J];计算机工程与应用;2005年31期

2 陈维克;闫新庆;张柱银;姚建民;;印鉴识别方法和技术研究[J];中国水运(学术版);2006年12期

3 李莹;李文举;宁莹莹;;基于知识的车徽识别方法[J];计算机工程与设计;2007年22期

4 周贤君;胡金演;郭凤;王圢;;基于融合子空间的人脸识别方法[J];电视技术;2009年S1期

5 张如艳;王士同;;基于重尾噪声分布特性的多分类人脸识别方法[J];电子与信息学报;2012年03期

6 陈利;张利;姚轶崭;胡卫华;;基于时序分析的木马控制行为识别方法[J];计算机科学;2013年S1期

7 杨雪蓉;洪宇;马彬;姚建民;朱巧明;;基于核心词和实体推理的事件关系识别方法[J];中文信息学报;2014年02期

8 蔡雪君;谢松云;张波;;一种改进的利用五官特征的人脸识别方法[J];计算机仿真;2009年11期

9 鲁晓丽;;煤岩识别方法技术分析[J];电子制作;2013年14期

10 于娟;尹积栋;费庶;;基于句法结构分析的同义词识别方法研究[J];现代图书情报技术;2013年09期

相关会议论文 前10条

1 郑凯;;建立多维数据异常点识别方法的尝试[A];第八届全国体育科学大会论文摘要汇编(一)[C];2007年

2 张朋柱;韩崇昭;万百五;;智能决策支持系统中的问题识别方法与实现[A];全国青年管理科学与系统科学论文集(第2卷)[C];1993年

3 刘丽兰;刘宏昭;;时间序列模型的识别方法[A];制造技术自动化学术会议论文集[C];2004年

4 苗振伟;许勇;杨军;;超声波人脸识别方法研究[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年

5 罗智勇;宋柔;荀恩东;;一种基于可信度的人名识别方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年

6 张茜;郑峥;亢一澜;王娟;仇巍;;基于海量实测数据的反演识别方法与盾构装备载荷的力学建模[A];中国力学大会——2013论文摘要集[C];2013年

7 赵锐;陈光发;;军事口令识别的Fuzzy方法探讨[A];第二届全国人机语音通讯学术会议论文集[C];1992年

8 骆玉荣;刘建丽;史晓涛;;一种自动车窗识别方法的设计与实现[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

9 崔凯华;王国庆;方剑青;李红军;贾俊波;马超;赵烨;张东辉;;基于声模态分析的材料识别方法研究[A];现代振动与噪声技术(第九卷)[C];2011年

10 李洪东;梁逸曾;张志敏;;酵母蛋白组中原生肽识别方法的探索研究[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年

相关重要报纸文章 前10条

1 陈春道;甲鱼优劣及雌雄的识别方法[N];北京科技报;2003年

2 庞席堂;假币的识别方法[N];中华合作时报;2003年

3 王修增;手机被盗号的6种识别方法[N];中国保险报;2003年

4 张侃;正品手机电池识别方法[N];通信产业报;2000年

5 潘 治;德国开发出癌症早期识别方法[N];中国中医药报;2003年

6 新华社记者 段世文;产权证识别方法[N];新华每日电讯;2001年

7 金亮;机器人的情感[N];中国医药报;2001年

8 黄璐;识别假火车票有绝招[N];山西经济日报;2004年

9 宗绍纯;如何识别是纯奶还是奶饮料?[N];国际商报;2003年

10 本报记者 邓洁 通讯员 王勇 何玲 梁利源;春运期间留个心眼识别假火车票[N];农民日报;2004年

相关博士学位论文 前10条

1 张莉莉;竞优特征的群识别方法及其应用[D];东北大学;2010年

2 陈绵书;计算机人脸识别方法研究[D];吉林大学;2004年

3 叶俊勇;人脸检测与识别方法研究[D];重庆大学;2002年

4 何光辉;四种人脸识别方法研究[D];重庆大学;2010年

5 佟丽娜;基于力学量信息获取系统的人体摔倒过程识别方法研究[D];中国科学技术大学;2011年

6 肖冰;人脸画像—照片的合成与识别方法研究[D];西安电子科技大学;2010年

7 王丹;多维多分辨仿生识别方法研究[D];吉林大学;2011年

8 俞王新;计算机人脸检测与识别方法的研究[D];上海交通大学;2009年

9 范冬梅;基于统计学习的词义识别方法研究[D];哈尔滨工程大学;2011年

10 张永梅;基于融合的人脸识别方法研究[D];中北大学;2005年

相关硕士学位论文 前10条

1 王真;贝叶斯人脸识别方法的研究[D];东北大学;2008年

2 狄远;转子裂纹基于模型的时域、频域识别方法研究[D];华东理工大学;2013年

3 邢云;基于压缩感知理论的人脸识别方法研究[D];大连理工大学;2010年

4 李怀鹏;运行模态分析中周期性激励识别方法研究[D];南京航空航天大学;2010年

5 刘文超;基于统计特征的人脸识别方法的分析改进及实现[D];汕头大学;2006年

6 胡健坤;基于齐次马尔可夫链的中文新术语识别方法研究[D];华南理工大学;2012年

7 张义;网络社区热点话题识别方法及其应用研究[D];合肥工业大学;2012年

8 吕一;基于现代优化算法的曲线识别方法[D];中北大学;2013年

9 潘静;多光谱图像人脸识别方法的性能评估[D];西安电子科技大学;2010年

10 李研;产业集聚识别方法及其应用研究[D];哈尔滨工业大学;2009年



本文编号:2377743

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2377743.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2d1a1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com