社交媒体账号分类方法研究

发布时间:2023-01-11 06:01
  随着互联网技术的快速发展,社交媒体逐渐成为人们交流互动和信息分享的重要工具。而账号作为人们在社交媒体进行活动的主体,承担着信息发送、传播和接收的重要作用。从海量的社交媒体账号中快速高效地识别出携带特定价值信息的账号并进行分类管理,有利于建立更加完善的社交媒体信息管理体系,对构建健康、有序的社交媒体环境具有重要作用。社交媒体账号分类包含垃圾账号过滤和账号主题识别两部分,其中垃圾账号过滤目的是识别并过滤掉携带价值信息过少的无用账号,如营销账号、机器人账号等;账号主题识别目的是区分关注不同主题信息的账号,如政治、军事、新闻等。现有的账号分类方法在网络特性分析和内容特性分析上不够全面、深入、准确,导致垃圾账号过滤和账号主题识别的效果不佳,难以在实际中大规模应用。为此,本文对社交媒体账号分类方法进行研究,主要贡献概括为如下两个方面:(1)提出一种基于用户交互行为的垃圾账号过滤方法,该方法从内容特性和网络特性两个方面的交互行为进行用户特征挖掘。基于内容特性分析,将多条短文本组合成长文本作为整体账号内容信息,使用信息增益的方式选择特征词,构建内容特征向量。基于网络特性分析,利用用户社交关系构建局部网... 

【文章页数】:72 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景和意义
    1.2 国内外研究现状
        1.2.1 社交媒体垃圾账号过滤方法研究
        1.2.2 社交媒体账号主题识别方法研究
    1.3 论文主要工作与贡献
    1.4 论文组织结构安排
第二章 账号分类研究基础
    2.1 社交媒体账号表征方法
    2.2 社交媒体账号分类方法
        2.2.1 逻辑斯特回归
        2.2.2 k近邻
        2.2.3 随机森林
        2.2.4 TextCNN
    2.3 分类性能评估
    2.4 本章小结
第三章 基于用户交互行为的垃圾账号过滤方法
    3.1 研究背景及思路
    3.2 种子账号标注
    3.3 局部网络关系图构建及训练集账号标注
    3.4 基于内容特性分析的账号特征提取
        3.4.1 文本预处理
        3.4.2 基于信息增益的特征词选择
    3.5 基于网络特性分析的账号特征提取
        3.5.1 基于网络关系的有向图模型
        3.5.2 基于用户自身的网络特征提取
        3.5.3 基于用户邻居的网络特征提取
    3.6 分类器选择及性能评估
    3.7 实验结果及分析
        3.7.1 数据来源
        3.7.2 特征可视化分析
        3.7.3 测试结果
        3.7.4 结果分析
    3.8 本章小结
第四章 基于卷积神经网络的账号主题识别方法
    4.1 研究背景
    4.2 社交媒体账号的文本表征
        4.2.1 word2vec模型的原理简介
        4.2.2 基于word2vec词向量的文本表征
        4.2.3 LDA模型的原理简介
        4.2.4 基于LDA主题向量的文本表征
    4.3 基于卷积神经网络的账号主题识别
        4.3.1 卷积神经网络原理
        4.3.2 基于CNN的账号主题识别模型
    4.4 实验结果及分析
        4.4.1 数据预处理
        4.4.2 测试结果与分析
    4.5 本章小结
第五章 全文总结与展望
    5.1 全文总结
    5.2 后续工作展望
致谢
参考文献
攻硕期间取得的研究成果



本文编号:3729532

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3729532.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6fb97***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com