基于重用检测的微博垃圾用户过滤算法
本文关键词: 垃圾消息 微博 重用检测 出处:《南京大学学报(自然科学版)》2013年04期 论文类型:期刊论文
【摘要】:针对微博中的反垃圾处理问题,本文提出了基于重用检测模型的垃圾用户检测算法,该方法综合考虑了消息序列中文本相关性和时间相关性,对垃圾用户的发布行为进行建模.按照文本粒度不同,基于重用检测模型的检测算法分为语句级检测(SRD)和词项级检测(TRD).SRD算法侧重于用户行为方式,而TRD算法侧重于垃圾消息的主题.基于真实数据集的实验表明,SRD算法在整体性能上优于TRD算法,但TRD算法具有更高的运行效率,并且检测针对性强,可发现指定类型的垃圾用户.最后,本文运用重用检测算法在垃圾用户群体检测方面做了初步尝试,实验表明基于转发关系的重用检测算法可以发现真实有效的垃圾群体用户.
[Abstract]:For the problem of waste micro-blog in the proposed detection algorithm reuse spam detection model based on this method, considering the correlation and time correlation of text message sequence, modeling the user's garbage release behavior. According to the text of different size, detection algorithm reuse detection model is divided into a statement level detection based on SRD () and lexical entry level detection (TRD).SRD algorithm focuses on user behavior, while the TRD algorithm focuses on junk news theme. Experiments based on real data sets show that, SRD algorithm is better than TRD in the overall performance, but the TRD algorithm has higher efficiency, and the detection of targeted, can be found in the specified the type of garbage users. Finally, this paper uses the reuse detection algorithm in spam detection of user groups to do a preliminary attempt, experiments show that the reuse detection method based on the relationship of the forwarding can be issued The real and effective users of the garbage group.
【作者单位】: 南京师范大学计算机科学与技术学院;
【基金】:江苏省自然科学基金重点项目(BK2011005) 国家自然科学基金(61272221) 江苏省社科基金(12YYA002)
【分类号】:TP393.092
【正文快照】: 微博作为目前流行的网络营销媒体,为商业用户拓展市场空间、树立品牌形象和开展网络营销提供了巨大的帮助.但同时也成为了垃圾用户(Spammer)发布非法广告和垃圾消息的平台.垃圾消息的大量出现不仅影响了用户的使用体验,还妨碍了商业营销活动在微博平台上的健康发展.所以,研究
【相似文献】
相关期刊论文 前10条
1 王鼎云;;对微博的发展状况和趋势的冷思考[J];时代教育(教育教学);2011年01期
2 王艳;;Twitter技术及其在情景教育中的应用[J];中国西部科技;2010年16期
3 李士奇;;微博使用者应具备的基本素养[J];科教导刊(上旬刊);2011年03期
4 张来勇;;浅析移动互联网技术的教育应用[J];中国信息技术教育;2011年Z1期
5 崔争艳;;基于语义的微博短信息分类[J];现代计算机(专业版);2010年08期
6 刘颖录;;浅析新网络时代的微博传播[J];商业文化(上半月);2011年05期
7 申诗逸;;论“微博”的传播特点与推广[J];青年文学家;2010年14期
8 揭潇君;;浅析动漫作品在微博平台的传播[J];数字技术与应用;2010年11期
9 王传林;符易阳;;网络隐蔽通道及其识别技术研究[J];现代电子技术;2009年15期
10 陈丹伟;刘杰;孙国梓;韩俊;;一种基于概率训练的病毒检测模型[J];计算机应用研究;2010年06期
相关会议论文 前10条
1 秦首科;常建龙;谷姗姗;周傲英;;数据流上的综合性突变检测算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
2 廖鹏;;基于异常特征的DDoS检测模型[A];经济发展方式转变与自主创新——第十二届中国科学技术协会年会(第四卷)[C];2010年
3 罗浩;方滨兴;云晓春;王欣;辛毅;;一种高速实时的邮件蠕虫异常检测模型[A];全国网络与信息安全技术研讨会'2005论文集(上册)[C];2005年
4 谢毅;张俊灵;王莹;胡翠林;;一种基于SVM的信息安全入侵检测模型[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
5 李俊薇;杨青;张连发;黄宇颖;;基于贝叶斯定理的个性化体检网站的研究[A];第二十三届中国(天津)2009IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2009年
6 李千目;戚涌;严悍;张宏;刘凤玉;;基于免疫学的网络节点故障检测系统[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
7 李俊薇;杨青;张连发;黄宇颖;;基于贝叶斯定理的个性化体检网站的研究[A];第二十二届中国(天津)'2008IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2008年
8 许列;王明印;;基于隐马尔可夫模型(HMM)实时异常检测[A];中国通信学会第六届学术年会论文集(上)[C];2009年
9 刘子豪;庄毅;;一种电子邮件敏感信息检测算法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
10 帅春燕;江建慧;欧阳鑫;;基于状态机的多阶段网络攻击模型及检测算法[A];第六届中国测试学术会议论文集[C];2010年
相关重要报纸文章 前10条
1 包家庆;IDS五大发展趋势[N];网络世界;2002年
2 ;分担分析提高无线安全性[N];网络世界;2005年
3 科文;VIXD算法分析Web异常[N];中国计算机报;2008年
4 ;方兴未艾的入侵检测技术[N];人民邮电;2007年
5 陈星霖;NIDS:老树发新枝[N];网络世界;2009年
6 谷雨;入侵检测需要协同[N];网络世界;2001年
7 中联绿盟、李群;IDS的关键:解决好误报和漏报[N];中国计算机报;2002年
8 ;免费与付费IDS你选谁[N];中国计算机报;2005年
9 赵晓涛;当Web安全成为难以实现的梦想[N];网络世界;2008年
10 ;联想网御百兆防火墙[N];计算机世界;2002年
相关博士学位论文 前10条
1 王晓锋;Web应用入侵异常检测新技术研究[D];华中科技大学;2007年
2 李目海;基于流量的分布式拒绝服务攻击检测[D];华东师范大学;2010年
3 张亮;推荐系统中协同过滤算法若干问题的研究[D];北京邮电大学;2009年
4 杨晓峰;基于机器学习的Web安全检测方法研究[D];南京理工大学;2011年
5 曾剑平;基于模糊集的自适应伪装入侵检测算法及其在ASP服务安全中的应用研究[D];厦门大学;2006年
6 赵静;网络协议异常检测模型的研究与应用[D];北京交通大学;2010年
7 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
8 秦首科;数据流上的异常检测[D];复旦大学;2006年
9 吴作顺;基于免疫学的入侵检测系统研究[D];中国人民解放军国防科学技术大学;2003年
10 黎耀;IPv6环境下异常检测系统的关键技术研究[D];华中科技大学;2006年
相关硕士学位论文 前10条
1 朱少萍;微博内作弊和推广联盟的检测算法研究[D];大连理工大学;2013年
2 王翔宇;基于IP流量的僵尸网络检测模型的设计与实现[D];上海交通大学;2011年
3 陈涛;网络威胁检测模型及行为序列分析方法研究[D];西安电子科技大学;2010年
4 米金良;入侵检测技术及其应用[D];西安建筑科技大学;2003年
5 王栋;防火墙深度包检测技术研究[D];西安电子科技大学;2005年
6 吴甜甜;一种低存储消耗的超点检测算法研究[D];大连海事大学;2012年
7 李俐颖;分布式拒绝服务攻击检测技术研究[D];电子科技大学;2007年
8 何金艳;基于内容分析的Blog话题检测方法研究[D];哈尔滨工业大学;2010年
9 胡大伟;基于标签协同过滤算法在微博推荐中的研究[D];内蒙古科技大学;2012年
10 江华;基于组合聚类分析的网络异常检测模型[D];中国民航大学;2013年
,本文编号:1481617
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1481617.html