社交网络虚假媒体内容检测研究
发布时间:2023-02-23 19:12
在互联网高度发达的今天,移动资讯高速流动,微博等社交网络媒体所涵盖的信息量正以指数级的速度增长,并逐渐成为人们分享生活、互动交友和获取信息的主要平台之一。然而,在进行信息消费时,由于媒体内容自身所拥有的便捷访问、快速传播、低成本的特点,使其成为当今我国虚假舆情泛滥的主要策源地和传播介质,影响人们的日常生活。虚假媒体内容检测技术就是一项针对社交网络中的海量信息进行挖掘、分析、识别和过滤的技术,能够及时发现和处理社交网络中的虚假媒体内容,防止人们在认识事物和生活消费时受到此种信息的误导。本文主要基于传统机器学习方法和深度学习方法对社交网络虚假媒体内容进行检测研究,并构建了性能优良的分类模型。具体研究内容如下:1)本文利用传统机器学习方法构建基于集成学习的虚假媒体内容分类模型。通过观察数据集结构特点,采集所需数据,制定对应的文本清洗方法,借助正则表达式抽取微博正文内容特征,利用人工拓建的中文情感词库提取各微博事件的评论情感倾向性特征,结合用户特征和传播特征,构建特征集,并借用常用的机器学习方法,构建基分类器,最后使用Stacking集成方法构建强分类器,实验结果显示其准确率达到93.19%,...
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 本文研究内容
1.4 论文结构安排
第二章 虚假媒体内容检测的相关技术研究
2.1 文本预处理技术
2.1.1 中文分词
2.1.2 word2vec词向量模型
2.2 基于传统机器学习的文本分类方法
2.2.1 朴素贝叶斯
2.2.2 支持向量机
2.2.3 逻辑回归
2.2.4 决策树
2.3 基于深度学习的文本分类方法
2.3.1 RNN及其变体
2.3.2 注意力机制
2.4 集成学习
2.5 模型的评价指标
2.6 本章小结
第三章 基于传统机器学习的虚假媒体内容分类方法
3.1 数据获取及预处理
3.1.1 数据获取及词库构建
3.1.2 文本清洗
3.1.3 文本切分处理
3.2 特征工程
3.2.1 特征简介
3.2.2 表层特征提取
3.2.3 评论情感倾向性特征提取
3.3 基于Stacking集成方法的虚假媒体内容检测模型
3.3.1 模型简述
3.3.2 虚假媒体内容检测算法
3.4 实验及结果分析
3.4.1 实验环境及评估指标
3.4.2 相关特征的有效性验证与结果分析
3.4.3 集成分类模型的有效性验证及结果分析
3.5 本章小结
第四章 基于深度学习的虚假媒体内容分类方法
4.1 获取微博正文和评论文本的词向量
4.2 基于集成学习的虚假媒体内容检测模型
4.2.1 模型描述
4.2.2 微博正文表示
4.2.3 评论文本表示
4.2.4 基于微博正文和评论文本的虚假媒体内容检测算法
4.3 实验及结果分析
4.3.1 实验环境及评价指标
4.3.2 对比方法介绍
4.3.3 各模型对比实验
4.4 本章小结
第五章 社交网络虚假媒体内容检测系统
5.1 需求分析
5.2 可行性分析
5.3 系统详细设计
5.4 功能模块设计
5.4.1 话题模块
5.4.2 逻辑处理模块
5.4.3 模型计算模块
5.5 功能演示
5.5.1 系统开发环境
5.5.2 话题内容的虚假性检测
5.5.3 模型训练
5.6 本章小结
第六章 总结与展望
6.1 工作总结
6.2 未来工作展望
致谢
参考文献
攻读硕士学位期间取得的成果
本文编号:3748579
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 本文研究内容
1.4 论文结构安排
第二章 虚假媒体内容检测的相关技术研究
2.1 文本预处理技术
2.1.1 中文分词
2.1.2 word2vec词向量模型
2.2 基于传统机器学习的文本分类方法
2.2.1 朴素贝叶斯
2.2.2 支持向量机
2.2.3 逻辑回归
2.2.4 决策树
2.3 基于深度学习的文本分类方法
2.3.1 RNN及其变体
2.3.2 注意力机制
2.4 集成学习
2.5 模型的评价指标
2.6 本章小结
第三章 基于传统机器学习的虚假媒体内容分类方法
3.1 数据获取及预处理
3.1.1 数据获取及词库构建
3.1.2 文本清洗
3.1.3 文本切分处理
3.2 特征工程
3.2.1 特征简介
3.2.2 表层特征提取
3.2.3 评论情感倾向性特征提取
3.3 基于Stacking集成方法的虚假媒体内容检测模型
3.3.1 模型简述
3.3.2 虚假媒体内容检测算法
3.4 实验及结果分析
3.4.1 实验环境及评估指标
3.4.2 相关特征的有效性验证与结果分析
3.4.3 集成分类模型的有效性验证及结果分析
3.5 本章小结
第四章 基于深度学习的虚假媒体内容分类方法
4.1 获取微博正文和评论文本的词向量
4.2 基于集成学习的虚假媒体内容检测模型
4.2.1 模型描述
4.2.2 微博正文表示
4.2.3 评论文本表示
4.2.4 基于微博正文和评论文本的虚假媒体内容检测算法
4.3 实验及结果分析
4.3.1 实验环境及评价指标
4.3.2 对比方法介绍
4.3.3 各模型对比实验
4.4 本章小结
第五章 社交网络虚假媒体内容检测系统
5.1 需求分析
5.2 可行性分析
5.3 系统详细设计
5.4 功能模块设计
5.4.1 话题模块
5.4.2 逻辑处理模块
5.4.3 模型计算模块
5.5 功能演示
5.5.1 系统开发环境
5.5.2 话题内容的虚假性检测
5.5.3 模型训练
5.6 本章小结
第六章 总结与展望
6.1 工作总结
6.2 未来工作展望
致谢
参考文献
攻读硕士学位期间取得的成果
本文编号:3748579
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3748579.html
最近更新
教材专著