当前位置:主页 > 管理论文 > 移动网络论文 >

基于规则和相关度的微博垃圾评论检测系统及实现

发布时间:2018-08-06 22:18
【摘要】:微博的使用在生活中已经成为一个很重要的信息来源或工作或娱乐或推广或寻觅,随着微博使用量的扩大,微博评论也变得丰富多彩,甚至有时回复成为了亮点。也正因此如此,越来越多的人开始关注微博评论,甚至是一些别有用心的垃圾评论制造者。然而微博垃圾评论的出现,让评论的形象大打折扣。因此本文重点是发现并处理微博中的垃圾评论,总结垃圾评论的规则和通过相关度判断出评论的发展趋势并利用WEB开发的B/S结构构建微博评论分类系统。新浪微博是当今微博几大平台之一,技术成熟的API接口为很多第三方开发用户提供了方便。本系统从新浪微博数据平台API接口下载微博评论,并作为实验样本,导入自行开发的垃圾微博评论分类系统中,存储到指定数据库,通过参数设定设定参数的初期规则库。将数据到如分类系统经过规则库过滤形成分类,在此同时分类的评论增强了评论规则库的成熟度。在过滤过程中使用到了神经网络和数据挖掘理论。利用神经网路来联系数据与数据之间的关系,通过长期总结的规则来评判评论的分类情况。本系统的特色在系统中的产生垃圾评论的同时还会通过相关度和数据挖掘形成新的信息来强壮本系统的规则库。这个过程产生了评论规则库。当规则库趋近成熟时分类结果更趋于所需分类结果。在程序中还涉及到可以切换人工手动挑选的功能,本文认为这是必不可少的,正所谓人工智能与人工密不可分,系统日志功能为系统的正常运行保驾护航。本系统的开发语言Java,采用JSP技术实现网页界面。Java最大优点是跨平台能力强,系统运行稳定。在大的数据处理的微博评论分类系统中,一个稳定的代码平台是刚性前提。以JS和CSS完成美化页面效果o SQL Server 2000为数据存储数据库,SQL Server2000数据库技术成熟,补丁完善。系统采用BS结构原因是在网络发展迅猛的今天通过网络浏览器就可以使用系统减少了安装环境步骤同时随时随地可以使用。
[Abstract]:The use of Weibo has become a very important source of information or work or entertainment or promotion or search in life. With the expansion of Weibo usage, Weibo reviews become rich and colorful, and sometimes return to become a bright spot. As a result, more and more people are paying attention to Weibo reviews, and even to spammers with ulterior motives. However, the emergence of Weibo spam comments, so that the image of the comments greatly reduced. Therefore, the emphasis of this paper is to find and deal with the garbage comments in Weibo, summarize the rules of garbage comments, judge the development trend of comments by the correlation degree, and use the B / S structure developed by WEB to construct the Weibo comment classification system. Sina Weibo is one of the major platforms of Weibo nowadays. The mature technology of API interface provides convenience for many third party development users. This system downloads the Weibo comments from the API interface of Sina Weibo data platform, and as an experimental sample, imports the garbage Weibo comment classification system developed by itself, stores it into the designated database, and sets the parameters through the initial rule base. The data is filtered into a classification system to form a classification, and comments classified at the same time enhance the maturity of the comment rule base. Neural network and data mining theory are used in filtering process. Neural network is used to relate the relationship between data and data, and the classification of comments is judged by the rule of long-term summary. The feature of this system is that the garbage comments are generated in the system, and new information is formed by correlation and data mining to strengthen the rule base of the system. This process produces a review rule base. When the rule base approach to maturity, the classification results tend to the desired classification results. The function of manual selection is also involved in the program, which is considered essential in this paper. The so-called artificial intelligence and artificial intelligence are inseparable, and the system log function guarantees the normal operation of the system. Java, the development language of this system, has the greatest advantage of using JSP technology to realize the web interface. Java has strong ability of cross-platform and the system runs stably. In the large data processing Weibo comment classification system, a stable code platform is a rigid premise. Using JS and CSS to beautify page effect o SQL Server 2000 as data storage database, SQL Server2000 database technology is mature and patch is perfect. The reason why the system adopts BS structure is that the system can be used through the web browser today with the rapid development of the network. It reduces the steps of installation environment and can be used anywhere.
【学位授予单位】:东北大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.092;TP391.1

【相似文献】

相关期刊论文 前10条

1 李志宇;;对付垃圾短信消费者动力不足[J];通信世界;2008年23期

2 孙升芸;田萱;;产品垃圾评论检测研究综述[J];计算机科学;2011年S1期

3 周光斌;用法律、经济和技术手段围歼垃圾信息[J];现代电信科技;2004年07期

4 树子;;把一切垃圾短信拒之门外[J];数字通信;2007年12期

5 江林芯;蒋艳青;;四川成立12321网络不良与垃圾信息举报受理中心[J];通信与信息技术;2010年01期

6 杨风雷;黎建辉;;用户生成内容中的垃圾意见研究综述[J];计算机应用研究;2011年10期

7 程德杰;;互联网时代垃圾信息的预防和遏制[J];互联网天地;2012年05期

8 孙升芸;田萱;何军;;基于评论行为的商品垃圾评论的识别研究[J];计算机工程与设计;2012年11期

9 ;关于开展垃圾短信息整治专项行动工作方案的通知[J];信息安全与通信保密;2008年07期

10 徐玉;;垃圾短信的治理工作任重而道远[J];江苏通信;2009年02期

相关重要报纸文章 前10条

1 本报记者 王刘芳 实习生 王薇薇;手机垃圾信息谁打扫[N];北京日报;2001年

2 本报记者 聂晓飞;群发器成垃圾短信温床 多部门联防或成有效方式[N];通信信息报;2010年

3 ;74.54%的中国手机用户收到过欺诈类短信[N];中国计算机报;2010年

4 赵缶;学学新加坡 立法治理垃圾短信[N];深圳特区报;2012年

5 ;立法打击垃圾信息成为共识[N];网络世界;2005年

6 李韬;保卫手机[N];计算机世界;2006年

7 程蓉 记者 王春;上海:呼吁立法控制垃圾信息[N];科技日报;2006年

8 谷慧;垃圾短信重打不下[N];民营经济报;2006年

9 通讯员  周 莺;上海市人大代表呼吁制定反垃圾信息法[N];人民代表报;2006年

10 刘恒 通讯员  田源;重庆联通大力整治垃圾短信[N];人民邮电;2006年

相关博士学位论文 前1条

1 黄文良;垃圾短信过滤关键技术研究[D];浙江大学;2008年

相关硕士学位论文 前10条

1 黄兴凤;在线社会网络下的垃圾信息过滤技术的研究[D];上海师范大学;2015年

2 王凤娇;垃圾短信判定系统的设计与实现[D];电子科技大学;2013年

3 刘晶;融合多特征聚类的垃圾微博检测研究[D];重庆大学;2015年

4 刘杰;基于用户评价的垃圾评论检测[D];东南大学;2015年

5 刘晓燕;基于规则和相关度的微博垃圾评论检测系统及实现[D];东北大学;2014年

6 吉超;论垃圾短信的法律规制[D];内蒙古大学;2012年

7 石晶;一种高效垃圾短信过滤系统的实现[D];电子科技大学;2010年

8 李春野;我国垃圾信息的法律规制[D];吉林大学;2010年

9 李文龙;论垃圾短信的法律规制[D];延边大学;2009年

10 贾晓舟;中国“垃圾短信”法律治理探究[D];吉林大学;2013年



本文编号:2169162

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2169162.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8c14e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com