文章内容低质量审核系统的设计与实现
发布时间:2022-01-04 12:17
随着移动互联网技术的日趋成熟,网络自媒体平台迎来发展热潮。用户对于资讯信息需求的不断提高促使网络自媒体平台呈现多样化发展,从单纯地发布新闻资讯扩展到提供生活、娱乐、社会、财经等各方面内容。相比于传统媒体,网络自媒体平台具有较高的自主性,言论尺度相对宽松。与此同时,由于自媒体平台的进入门槛较低,导致其中的文章良莠不齐。若不能对文章进行有效筛选,很可能造成错误的舆论导向。对待发布文章进行内容审核,剔除其中包含低质量信息的文章,以确保营造积极向上的阅读环境是目前各网络自媒体平台面临的关键问题。然而,在当下的信息爆炸时代,每天产生的资讯文章可达百万篇。显然,采用传统的人工审核方式不仅产生的人力资源成本较高,而且无法在保证信息时效性的同时达到较为理想的效果。因此,采用机器审核的手段对文章进行检测是解决上述问题的关键方法。本文设计的文章内容低质量审核系统采用机器学习和深度学习的相关算法对文章进行审核。从文章的文字内容和图像内容着手,去检测文章是否符合规定。作者独立设计并完成了以下三个模块:(1)政治敏感审核模块提供对文章政治敏感程度的识别。比如文章内如含有描述危害国家社会安全稳定的内容时,则会被识...
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
图2-1对数几率回归函数图??Figure?2-1?Logarithmic?Probability?Regression?Function?Diagram??
Figure?2-2?Convolution?operation?example??卷积运算通过局部感知,参数共享来帮助改善神经网络。??局部感知:从计算角度来说,相对较小的图像从整篇图像种计算特征是可行的是如果更大的图像将变得非常耗时,而解决的方法就是对隐含单元和输入单的连接加以限制:每个隐含单元仅仅只能连接输入单元的一部分,也就是说每
因为它极大的减少了需要学习的自由变量的个数。通过控制模型的规??模,卷积网络对视觉问题可以具有很好的泛化能力。??(2)池化??池化函数使用某一位置相邻输出的总体统计特征来代替网络在该位置的输出,??例如最大池化函数给出相邻矩形区域内的最大值。当不管采用什么样的池化函数,??当输入做出少量平移时,池化能够帮助输入的表示近似不变。平移的不变性就是指??我们对输入进行少量平移时,经过池化函数后大多数的输出也不会改变。使用池化??可以看作增加了一个无限强的先验:这一层学得的函数必须具有相对少量平移的??不变性,当这个假设成立时,池化可以极大地提高网络的统计效率。??通过应用卷积神经网络,可以很好的对图像进行分类。??2.2.2循环神经网络??循环神经网络(recurrent?neural?network)简称RNN,它是一■类用于处理序列??数据(例如从1到T时刻;cWxW的数据)的神经网络模型,且在序列的演进方??向进行递归,所有的循环单元是按链式连接的M。??
【参考文献】:
期刊论文
[1]大数据时代资讯类App的发展现状、问题和改进策略——以今日头条为例[J]. 张琳,史靖钰,王心怡. 新媒体研究. 2018(18)
[2]基于深度学习的文本分类研究进展[J]. 刘婷婷,朱文东,刘广一. 电力信息与通信技术. 2018(03)
[3]新一代人工智能发展规划[J]. 科技创新与生产力. 2017(08)
[4]Where Does AlphaGo Go: From Church-Turing Thesis to AlphaGo Thesis and Beyond[J]. Fei-Yue Wang,Jun Jason Zhang,Xinhu Zheng,Xiao Wang,Yong Yuan,Xiaoxiao Dai,Jie Zhang,Liuqing Yang. IEEE/CAA Journal of Automatica Sinica. 2016(02)
[5]深度学习研究进展[J]. 郭丽丽,丁世飞. 计算机科学. 2015(05)
[6]基于改进TFIDF算法的文本分类研究[J]. 郑霖,徐德华. 计算机与现代化. 2014(09)
[7]迁移学习研究进展[J]. 庄福振,罗平,何清,史忠植. 软件学报. 2015(01)
[8]TFIDF算法研究综述[J]. 施聪莺,徐朝军,杨晓江. 计算机应用. 2009(S1)
[9]浅析“自媒体”的特点[J]. 张莹. 科教文汇(中旬刊). 2008(02)
[10]基于机器学习的文本分类技术研究进展[J]. 苏金树,张博锋,徐昕. 软件学报. 2006(09)
本文编号:3568322
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
图2-1对数几率回归函数图??Figure?2-1?Logarithmic?Probability?Regression?Function?Diagram??
Figure?2-2?Convolution?operation?example??卷积运算通过局部感知,参数共享来帮助改善神经网络。??局部感知:从计算角度来说,相对较小的图像从整篇图像种计算特征是可行的是如果更大的图像将变得非常耗时,而解决的方法就是对隐含单元和输入单的连接加以限制:每个隐含单元仅仅只能连接输入单元的一部分,也就是说每
因为它极大的减少了需要学习的自由变量的个数。通过控制模型的规??模,卷积网络对视觉问题可以具有很好的泛化能力。??(2)池化??池化函数使用某一位置相邻输出的总体统计特征来代替网络在该位置的输出,??例如最大池化函数给出相邻矩形区域内的最大值。当不管采用什么样的池化函数,??当输入做出少量平移时,池化能够帮助输入的表示近似不变。平移的不变性就是指??我们对输入进行少量平移时,经过池化函数后大多数的输出也不会改变。使用池化??可以看作增加了一个无限强的先验:这一层学得的函数必须具有相对少量平移的??不变性,当这个假设成立时,池化可以极大地提高网络的统计效率。??通过应用卷积神经网络,可以很好的对图像进行分类。??2.2.2循环神经网络??循环神经网络(recurrent?neural?network)简称RNN,它是一■类用于处理序列??数据(例如从1到T时刻;cWxW的数据)的神经网络模型,且在序列的演进方??向进行递归,所有的循环单元是按链式连接的M。??
【参考文献】:
期刊论文
[1]大数据时代资讯类App的发展现状、问题和改进策略——以今日头条为例[J]. 张琳,史靖钰,王心怡. 新媒体研究. 2018(18)
[2]基于深度学习的文本分类研究进展[J]. 刘婷婷,朱文东,刘广一. 电力信息与通信技术. 2018(03)
[3]新一代人工智能发展规划[J]. 科技创新与生产力. 2017(08)
[4]Where Does AlphaGo Go: From Church-Turing Thesis to AlphaGo Thesis and Beyond[J]. Fei-Yue Wang,Jun Jason Zhang,Xinhu Zheng,Xiao Wang,Yong Yuan,Xiaoxiao Dai,Jie Zhang,Liuqing Yang. IEEE/CAA Journal of Automatica Sinica. 2016(02)
[5]深度学习研究进展[J]. 郭丽丽,丁世飞. 计算机科学. 2015(05)
[6]基于改进TFIDF算法的文本分类研究[J]. 郑霖,徐德华. 计算机与现代化. 2014(09)
[7]迁移学习研究进展[J]. 庄福振,罗平,何清,史忠植. 软件学报. 2015(01)
[8]TFIDF算法研究综述[J]. 施聪莺,徐朝军,杨晓江. 计算机应用. 2009(S1)
[9]浅析“自媒体”的特点[J]. 张莹. 科教文汇(中旬刊). 2008(02)
[10]基于机器学习的文本分类技术研究进展[J]. 苏金树,张博锋,徐昕. 软件学报. 2006(09)
本文编号:3568322
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/3568322.html