新闻媒体中标题党的分析与检测
发布时间:2023-03-22 18:39
近年来,随着新电子媒体平台的出现,人们阅读新闻的方式发生了质的改变。这给信息传播带来了一定的机遇,使得个性化、碎片化的自媒体的影响力逐渐扩大。然而,一些自媒体希望通过标题党获取高的点击率,从而增加网页中广告的阅读量,进而提高自己的收益。这给读者、社会以及社交媒体造成了极大的困扰和社会资源浪费。因此,及时鉴别该类新闻,是非常必要的。目前针对标题党的研究可分为三类:一类研究者基于标题党特有的语言风格,提取标题的引诱性特征进行判断,但此类研究较难应对网络用语变化,具有时间段敏感性;一类研究者基于标题和正文语义匹配程度,通过挖掘标题和正文的相似关系,判断标题是否是正文的合理概括,从而对标题党进行检测,但此类研究无法识别出与文本相关但存在夸张表述的标题;还有一类研究者基于社交网站的用户评论等行为特征,来判断标题党,但此类研究应用场景存在诸多限制,且对模型的提升十分有限。本文从标题引诱性文本特征和标题与正文匹配程度两个角度同时切入,缓解单独使用某种手段时存在的局限性。本文以新闻媒体平台中的标题党检测为研究场景。同时考虑标题文本特征和标题-正文匹配程度,提出一种多策略检测模型与算法,目的是更精确、全...
【文章页数】:83 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 研究现状
1.2.1 基于标题文本特征的标题研究
1.2.2 基于标题和正文匹配程度的标题研究
1.2.3 基于社交网站用户行为的标题研究
1.2.4 基于其它方法的标题研究
1.2.5 标题党研究现状总结
1.3 本文主要工作
1.3.1 研究目标
1.3.2 研究内容
1.4 本文的主要贡献
1.5 本文的组织结构
第二章 数据获取与处理分析
2.1 已有数据集分析
2.2 数据集扩充
2.2.1 循环神经网络
2.2.2 半监督式数据集标注
2.3 数据集分析
2.4 本章小结
第三章 多策略标题党检测模型
3.1 标题文本特征提取
3.1.1 研究思路
3.1.2 问题定义
3.1.3 BERT字嵌入
3.1.4 位置编码
3.1.5 卷积模块定义
3.1.6 深度全卷积残差网络
3.2 标题-正文交互匹配度计算
3.2.1 研究思路
3.2.2 问题定义
3.2.3 粗粒度摘要提取
3.2.4 多头自注意力机制
3.2.5 注意力模块定义
3.2.6 深度交互匹配网络构建
3.3 多策略标题党检测模型
3.4 本章小结
第四章 实验设计与分析
4.1 实验目的与实验环境
4.1.1 实验目的
4.1.2 实验环境
4.2 实验设计
4.2.1 评价指标
4.2.2 数据集划分
4.2.3 对比算法
4.3 实验结果及分析
4.3.1 模型参数设置
4.3.2 算法收敛情况
4.3.3 检测结果对比分析
4.3.4 模型时间段敏感度分析
4.3.5 标题-正文模型的可视化分析
4.4 本章小结
第五章 原型系统设计与实现
5.1 原型系统设计
5.2 原型系统实现
5.2.1 开发环境
5.2.2 支撑技术
5.2.3 技术细节
5.2.4 系统功能展示
5.3 原型系统特点
5.4 本章小结
第六章 总结与展望
6.1 工作总结
6.2 研究展望
致谢
参考文献
作者简介
本文编号:3767382
【文章页数】:83 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 研究现状
1.2.1 基于标题文本特征的标题研究
1.2.2 基于标题和正文匹配程度的标题研究
1.2.3 基于社交网站用户行为的标题研究
1.2.4 基于其它方法的标题研究
1.2.5 标题党研究现状总结
1.3 本文主要工作
1.3.1 研究目标
1.3.2 研究内容
1.4 本文的主要贡献
1.5 本文的组织结构
第二章 数据获取与处理分析
2.1 已有数据集分析
2.2 数据集扩充
2.2.1 循环神经网络
2.2.2 半监督式数据集标注
2.3 数据集分析
2.4 本章小结
第三章 多策略标题党检测模型
3.1 标题文本特征提取
3.1.1 研究思路
3.1.2 问题定义
3.1.3 BERT字嵌入
3.1.4 位置编码
3.1.5 卷积模块定义
3.1.6 深度全卷积残差网络
3.2 标题-正文交互匹配度计算
3.2.1 研究思路
3.2.2 问题定义
3.2.3 粗粒度摘要提取
3.2.4 多头自注意力机制
3.2.5 注意力模块定义
3.2.6 深度交互匹配网络构建
3.3 多策略标题党检测模型
3.4 本章小结
第四章 实验设计与分析
4.1 实验目的与实验环境
4.1.1 实验目的
4.1.2 实验环境
4.2 实验设计
4.2.1 评价指标
4.2.2 数据集划分
4.2.3 对比算法
4.3 实验结果及分析
4.3.1 模型参数设置
4.3.2 算法收敛情况
4.3.3 检测结果对比分析
4.3.4 模型时间段敏感度分析
4.3.5 标题-正文模型的可视化分析
4.4 本章小结
第五章 原型系统设计与实现
5.1 原型系统设计
5.2 原型系统实现
5.2.1 开发环境
5.2.2 支撑技术
5.2.3 技术细节
5.2.4 系统功能展示
5.3 原型系统特点
5.4 本章小结
第六章 总结与展望
6.1 工作总结
6.2 研究展望
致谢
参考文献
作者简介
本文编号:3767382
本文链接:https://www.wllwen.com/xinwenchuanbolunwen/3767382.html