当前位置:主页 > 科技论文 > 网络通信论文 >

SVM算法在声音广播内容监测分类中的应用研究

发布时间:2021-12-09 19:16
  本文针对广播内容的智能监测,介绍了智能声音广播监测系统在广播内容识别监测方面的设计思路,以及采用SVM文本分类的方式进行广播违规内容识别和分类的实现方法。本文还介绍了对该方法和系统进行的测试和实验情况,经分析证明了此方法可以进一步提升对违规广播内容监测的效率和准确率。 

【文章来源】:广播电视信息. 2020,27(10)

【文章页数】:4 页

【部分图文】:

SVM算法在声音广播内容监测分类中的应用研究


文本分类过程图

数据处理流程,内容,词语,文本


TF-IDF公式是用来计算词语的权值。在一个给定的文本中,词频(TF)具体指的是某个给定的词语在该文本出现的频率。对于在某个特定文件中的词ti,它的重要性可以具体表示如图2中的公式(1)[5]。逆向文件频率(IDF)是指一个词语普遍重要性的度量,某一特定词语的IDF,是由总文件数量除以包含该词语的文件的数量,再将这个商值取以10为底的对数,具体计算如图2中的公式(2)所示。其中,|D|是语料库中的文件总数,|{j:ti∈dj}|表示包含词语ti的文本数量,即ni,j≠0的文本数目,如果文本不包含某词语,则会出现分母为零的情况。因此,一般使用1+|{j:ti∈dj}|计算。

参数,训练集,分类器,数据集


交互检验参数选取值


本文编号:3531164

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/3531164.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3a627***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com