广告短信过滤方法研究
发布时间:2017-05-31 12:06
本文关键词:广告短信过滤方法研究,,由笔耕文化传播整理发布。
【摘要】:随着移动通信技术的飞速发展,手机普及率也随之快速增长。这就使得在短信使用量迅速增加的同时,垃圾短信也在迅速的增加。因为文本短信使用方便、便宜、可靠、快速等特点,已经成为一种主要的沟通方式。在提供低成本和便捷服务的同时,垃圾短信也成为了传播色情、商业欺诈和商业广告等其他不良信息的滋生地,严重干扰了人们的正常生活。因此研究和设计一个有效的垃圾短信过滤系统具有十分重要的现实意义。本文所做了如下的主要工作:1、研究搜索在垃圾短信过滤系统中应用关键字的算法,根据垃圾短信的特点,加快搜索速度;2、主要分析了文本分类技术,贝叶斯分类短信过滤技术的应用;3、提出用分析文本抽样过滤的方法实现垃圾短信的过滤,并提取有用的数据,更新关键词库和分类训练样本,实现系统的自我优化,使之在保证过滤精确度的前提下,提高文本过滤的效率。
【关键词】:垃圾短信 文本分类 贝叶斯 中文分词 黑白名单 抽样过滤
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1
【目录】:
- 摘要4-5
- Abstract5-9
- 第一章 引言9-16
- 1.1 课题研究背景及研究意义9-10
- 1.2 垃圾短信描述10-13
- 1.2.1 垃圾短信的定义10-11
- 1.2.2 广告短信的危害11-13
- 1.3 国内外广告短信整治现状13-15
- 1.3.1 国内广告短信整治现状13-14
- 1.3.2 国外广告短信整治现状14-15
- 1.4 本文研究的主要内容15-16
- 第二章 短信过滤的主要技术16-22
- 2.1 黑白名单过滤技术的基本原理16
- 2.2 黑白名单过滤的方法16
- 2.3 基于抽样的垃圾短信过滤技术的基本原理16-18
- 2.4 基于抽样的垃圾短信过滤的方法18
- 2.5 贝叶斯的文本过滤方法18-19
- 2.6 贝叶斯推理过滤方法的思想19
- 2.7 贝叶斯过滤算法的基本步骤及其分类器设计19-22
- 第三章 短信文本内容分类过滤技术22-29
- 3.1 过滤短信文本的内容及分类22-23
- 3.2 文本分类简介23-28
- 3.2.1 文本特征表示及分类概述23-25
- 3.2.2 文本去噪处理25
- 3.2.3 中文分词25-26
- 3.2.4 特征提取26-27
- 3.2.5 特征频度27-28
- 3.3 本章小结28-29
- 第四章 垃圾短信过滤系统的实现29-36
- 4.1 系统的总体介绍29
- 4.2 短信过滤子系统29-33
- 4.2.1 黑白名单过滤子模块29-31
- 4.2.2 抽样过滤子模块31-32
- 4.2.3 内容过滤子模块32-33
- 4.3 实验结果与分析33-34
- 4.3.1 实验环境与数据33
- 4.3.2 评价标准33-34
- 4.3.3 实验结果与分析34
- 4.4 本章小结34-36
- 第五章 总结与展望36-37
- 5.1 总结36
- 5.2 展望36-37
- 参考文献37-39
- 致谢39
【参考文献】
中国期刊全文数据库 前10条
1 倪天龙 ,张贤高 ,王培;数据库SQLite在嵌入式系统中的应用[J];单片机与嵌入式系统应用;2005年10期
2 李斗,李弼程;一种神经网络文本分类器的设计与实现[J];计算机工程与应用;2005年17期
3 何国斌;赵晶璐;;汉语文本自动分词算法的研究[J];计算机工程与应用;2010年03期
4 张宁,贾自艳,史忠植;使用KNN算法的文本分类[J];计算机工程;2005年08期
5 秦进,陈笑蓉,汪维家,陆汝占;文本分类中的特征抽取[J];计算机应用;2003年02期
6 胡于进,周小玲,凌玲,王学林;基于向量空间模型的贝叶斯文本分类方法[J];计算机与数字工程;2004年06期
7 王晓龙,王开铸,李仲荣,白小华;THE PROBLEM OF SEPARATING CHARACTERS INTO FEWEST WORDS AND ITS ALGORITHMS[J];Chinese Science Bulletin;1989年22期
8 张俊盛,陈舜德,郑萦,刘显仲,柯淑津;多语料库作法之中文姓名辨识[J];中文信息学报;1992年03期
9 鲁松,李晓黎,白硕,王实;文档中词语权重计算方法的改进[J];中文信息学报;2000年06期
10 周茜,赵明生,扈e
本文编号:409409
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/409409.html