基于增量多模型融合的垃圾短信过滤算法研究
发布时间:2021-12-23 08:26
伴随着通讯技术的不断成熟,与通讯相关的使用场景也愈加宽泛。一方面,人们享受着科技带来的丰硕成果,无线网络技术得到飞速发展,但另一方面,制度和监管的相对缺失,使得很多围绕无线通讯的“黑色产业”造成了许多负面的影响,例如手机的垃圾短信就始终困扰着人们的生活。为了对手机的垃圾短信进行检测识别与过滤,对当前基于文本分类技术的垃圾短信过滤方法进行了研究,详细介绍了文本分类过程中的预处理技术和特征提取技术,并通过实验对比分析了 K邻近算法和朴素贝叶斯算法的性能。此外,针对传统文本分类算法中存在的缺陷,即当加入新的样本后分类器会因为识别的局限性导致分类效果下降,提出了两点改进方法:(1)设计并实现了基于评分法的增量多模型融合方法。增量多模型融合方法对新增的样本依次进行训练,每个样本数据集可得到一个子分类器,不同的训练集构成多个子分类器。增量多模型融合方法通过“少数服从多数”的原则对每一条待分类短信进行分类,若多数子分类器输出的结果表示正常,则该待分类短信为正常短信,反之则为垃圾短信。这样做的优势在于避免重新对分类器进行训练,减少了文本检索算法的时间损失和资源耗费,提高了文本分类的效果;(2)设计并实...
【文章来源】:长沙理工大学湖南省
【文章页数】:46 页
【学位级别】:硕士
【部分图文】:
图4.2引入学习法后的错误率??图4.2是在分类上使用学习法的错误率曲线,横坐标1到10表示使用学习法的实验??
【参考文献】:
期刊论文
[1]A Novel Active Learning Method Using SVM for Text Classification[J]. Mohamed Goudjil,Mouloud Koudil,Mouldi Bedda,Noureddine Ghoggali. International Journal of Automation and Computing. 2018(03)
[2]基于词向量和卷积神经网络的垃圾短信识别方法[J]. 赖文辉,乔宇鹏. 计算机应用. 2018(09)
[3]基于语义理解注意力神经网络的多元特征融合中文文本分类[J]. 谢金宝,侯永进,康守强,李佰蔚,张霄. 电子与信息学报. 2018(05)
[4]多类型分类器融合的文本分类方法研究[J]. 李惠富,陆光. 计算机应用研究. 2019(03)
[5]基于类别特征改进的KNN短文本分类算法[J]. 黄贤英,熊李媛,刘英涛,李沁东. 计算机工程与科学. 2018(01)
[6]结合语义扩展和卷积神经网络的中文短文本分类方法[J]. 卢玲,杨武,杨有俊,陈梦晗. 计算机应用. 2017(12)
[7]基于特征隶属度的文本分类相似性度量方法[J]. 池云仙,赵书良,罗燕,赵骏鹏,高琳,李超. 计算机科学. 2017(11)
[8]粗糙集近似集的KNN文本分类算法研究[J]. 杨帅华,张清华. 小型微型计算机系统. 2017(10)
[9]基于中心向量的多级分类KNN算法研究[J]. 刘述昌,张忠林. 计算机工程与科学. 2017(09)
[10]基于吸引子传播聚类的改进双通道CNN短文本分类算法[J]. 王儒,刘培玉,王培培. 小型微型计算机系统. 2017(08)
博士论文
[1]垃圾短信过滤关键技术研究[D]. 黄文良.浙江大学 2008
硕士论文
[1]基于深度学习多模型融合的中文短文本情感分类算法研究与实现[D]. 何远生.华南理工大学 2018
[2]基于机器学习的文本情感分类研究[D]. 信桂龙.杭州电子科技大学 2017
[3]多模型融合学习方法与应用[D]. 马健.南京大学 2016
[4]垃圾短信过滤系统的设计与实现[D]. 吴世竞.北京邮电大学 2012
[5]垃圾短信过滤系统的设计与实现[D]. 何孝金.电子科技大学 2009
本文编号:3548142
【文章来源】:长沙理工大学湖南省
【文章页数】:46 页
【学位级别】:硕士
【部分图文】:
图4.2引入学习法后的错误率??图4.2是在分类上使用学习法的错误率曲线,横坐标1到10表示使用学习法的实验??
【参考文献】:
期刊论文
[1]A Novel Active Learning Method Using SVM for Text Classification[J]. Mohamed Goudjil,Mouloud Koudil,Mouldi Bedda,Noureddine Ghoggali. International Journal of Automation and Computing. 2018(03)
[2]基于词向量和卷积神经网络的垃圾短信识别方法[J]. 赖文辉,乔宇鹏. 计算机应用. 2018(09)
[3]基于语义理解注意力神经网络的多元特征融合中文文本分类[J]. 谢金宝,侯永进,康守强,李佰蔚,张霄. 电子与信息学报. 2018(05)
[4]多类型分类器融合的文本分类方法研究[J]. 李惠富,陆光. 计算机应用研究. 2019(03)
[5]基于类别特征改进的KNN短文本分类算法[J]. 黄贤英,熊李媛,刘英涛,李沁东. 计算机工程与科学. 2018(01)
[6]结合语义扩展和卷积神经网络的中文短文本分类方法[J]. 卢玲,杨武,杨有俊,陈梦晗. 计算机应用. 2017(12)
[7]基于特征隶属度的文本分类相似性度量方法[J]. 池云仙,赵书良,罗燕,赵骏鹏,高琳,李超. 计算机科学. 2017(11)
[8]粗糙集近似集的KNN文本分类算法研究[J]. 杨帅华,张清华. 小型微型计算机系统. 2017(10)
[9]基于中心向量的多级分类KNN算法研究[J]. 刘述昌,张忠林. 计算机工程与科学. 2017(09)
[10]基于吸引子传播聚类的改进双通道CNN短文本分类算法[J]. 王儒,刘培玉,王培培. 小型微型计算机系统. 2017(08)
博士论文
[1]垃圾短信过滤关键技术研究[D]. 黄文良.浙江大学 2008
硕士论文
[1]基于深度学习多模型融合的中文短文本情感分类算法研究与实现[D]. 何远生.华南理工大学 2018
[2]基于机器学习的文本情感分类研究[D]. 信桂龙.杭州电子科技大学 2017
[3]多模型融合学习方法与应用[D]. 马健.南京大学 2016
[4]垃圾短信过滤系统的设计与实现[D]. 吴世竞.北京邮电大学 2012
[5]垃圾短信过滤系统的设计与实现[D]. 何孝金.电子科技大学 2009
本文编号:3548142
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3548142.html
最近更新
教材专著