社交网络中的抑郁症用户语言和行为特征分析及检测
发布时间:2021-09-06 09:16
[目的/意义]通过在线工具来分析社交网络用户的语言和行为特征,对抑郁症患者进行预测性研究。[方法/过程]从推特上收集自我披露的抑郁症信息,提取抑郁症用户和正常用户在社交网络中的语言和行为特征信息。在对特征信息进行分析和验证的基础上,利用机器学习算法预测抑郁症用户。[结果/结论]研究发现,用户在社交网络上的语言和行为特征能够反映其心理状态,从中提取的各类特征可用于抑郁用户的检测。在抑郁症用户预测方法中,随机森林分类器的表现最好。基于Empath的词语类别特征在不同类型分类中具有最高的预测得分,而主题特征的得分排名较低。
【文章来源】:现代情报. 2020,40(06)CSSCI
【文章页数】:12 页
【部分图文】:
基于社交网络的抑郁症用户检测模型
从抑郁用户组和正常用户组交互特征统计结果(如图2)可以发现,抑郁用户在社交网络上不如正常用户活跃,通常他们具有较少的朋友(432<608,p<0.001)。平均每天的发帖数量明显低于正常用户(25.79<27.92,p<0.001),抑郁用户平均被关注数低于正常用户(0.330<1.362,p<0.001)。平均每天的收藏数量较低(7.73<9.73,p=0.032)。另外,他们对事物缺乏兴趣,关注或收藏的内容较少。抑郁症患者在社交网络上与其他用户之间的交互活动较少,具体表现在整体的发帖量明显低于正常用户。3.1.2 活动周期性分析
通过对抑郁症患者帖子的语言结构分析发现,抑郁用户使用人称代词的比例要显著高于正常用户,较常使用第一人称(0.023>0.022,p=0.01)和第二人称(0.020>0.019,p=0.002),较少使用第三人称(0.015<0.017,p<0.001)。从心理学的视角看,较多的第一人称使用率表明,抑郁症患者更加关注自身,自我意识或自我感知能力过强。容易产生极端化的思维方式,喜欢用表示极端的副词,如“完全”、“绝对”或“所有人”(0.0066>0.0059,p<0.001)。每个单词的平均字符数存在一定差异(4.749>4.732,p=0.048)。抑郁症用户在交流中使用较为简单的语法形式,缺乏灵活性,语言可读性(CLI)较低(11.59<11.78,p=0.046),在词性类别的选择上更加单一化,运用语言的能力要低于正常用户组。在连词(0.019>0.022,p<0.001)、数词(0.016<0.018,p<0.001)、情态助动词(0.013>0.012,p=0.01)、名词(0.176<0.179,p=0.006)、副词(0.061>0.059,p=0.004)、小品词(0.0049<0.0052,p=0.001)和动词(0.098<0.104,p<0.001)等词语使用频率整体较低。抑郁症患者语言和内容相对贫乏,倾向于使用更多的简单单词(4.73<4.74,p=0.047),每个句子平均单词数较少(17<37,p=0.002)。结果见图4。
【参考文献】:
期刊论文
[1]近三年国外图书馆学与信息科学领域研究热点与前沿分析[J]. 刘雅姝,张海涛,徐海玲,李题印. 现代情报. 2019(09)
[2]利用准私密社交网络文本数据检测抑郁用户的可行性分析[J]. 刘德喜,邱家洪,万常选,刘喜平,钟敏娟,郭海峰,邓松. 中文信息学报. 2018(09)
[3]2017年国际信息科学与图书馆学研究热点分析[J]. 田大芳,魏瑞斌. 现代情报. 2018(08)
[4]基于“用户画像”的阅读疗法模式研究——以抑郁症为例[J]. 韩梅花,赵景秀. 大学图书馆学报. 2017(06)
硕士论文
[1]基于情绪词库的抑郁症患者情绪表达分析与预测[D]. 李林坚.浙江大学 2019
[2]基于词向量的微博用户抑郁预测方法研究[D]. 方振宇.合肥工业大学 2017
[3]基于新浪微博的互联网用户心理健康状态判别[D]. 胡泉.河南大学 2015
本文编号:3387188
【文章来源】:现代情报. 2020,40(06)CSSCI
【文章页数】:12 页
【部分图文】:
基于社交网络的抑郁症用户检测模型
从抑郁用户组和正常用户组交互特征统计结果(如图2)可以发现,抑郁用户在社交网络上不如正常用户活跃,通常他们具有较少的朋友(432<608,p<0.001)。平均每天的发帖数量明显低于正常用户(25.79<27.92,p<0.001),抑郁用户平均被关注数低于正常用户(0.330<1.362,p<0.001)。平均每天的收藏数量较低(7.73<9.73,p=0.032)。另外,他们对事物缺乏兴趣,关注或收藏的内容较少。抑郁症患者在社交网络上与其他用户之间的交互活动较少,具体表现在整体的发帖量明显低于正常用户。3.1.2 活动周期性分析
通过对抑郁症患者帖子的语言结构分析发现,抑郁用户使用人称代词的比例要显著高于正常用户,较常使用第一人称(0.023>0.022,p=0.01)和第二人称(0.020>0.019,p=0.002),较少使用第三人称(0.015<0.017,p<0.001)。从心理学的视角看,较多的第一人称使用率表明,抑郁症患者更加关注自身,自我意识或自我感知能力过强。容易产生极端化的思维方式,喜欢用表示极端的副词,如“完全”、“绝对”或“所有人”(0.0066>0.0059,p<0.001)。每个单词的平均字符数存在一定差异(4.749>4.732,p=0.048)。抑郁症用户在交流中使用较为简单的语法形式,缺乏灵活性,语言可读性(CLI)较低(11.59<11.78,p=0.046),在词性类别的选择上更加单一化,运用语言的能力要低于正常用户组。在连词(0.019>0.022,p<0.001)、数词(0.016<0.018,p<0.001)、情态助动词(0.013>0.012,p=0.01)、名词(0.176<0.179,p=0.006)、副词(0.061>0.059,p=0.004)、小品词(0.0049<0.0052,p=0.001)和动词(0.098<0.104,p<0.001)等词语使用频率整体较低。抑郁症患者语言和内容相对贫乏,倾向于使用更多的简单单词(4.73<4.74,p=0.047),每个句子平均单词数较少(17<37,p=0.002)。结果见图4。
【参考文献】:
期刊论文
[1]近三年国外图书馆学与信息科学领域研究热点与前沿分析[J]. 刘雅姝,张海涛,徐海玲,李题印. 现代情报. 2019(09)
[2]利用准私密社交网络文本数据检测抑郁用户的可行性分析[J]. 刘德喜,邱家洪,万常选,刘喜平,钟敏娟,郭海峰,邓松. 中文信息学报. 2018(09)
[3]2017年国际信息科学与图书馆学研究热点分析[J]. 田大芳,魏瑞斌. 现代情报. 2018(08)
[4]基于“用户画像”的阅读疗法模式研究——以抑郁症为例[J]. 韩梅花,赵景秀. 大学图书馆学报. 2017(06)
硕士论文
[1]基于情绪词库的抑郁症患者情绪表达分析与预测[D]. 李林坚.浙江大学 2019
[2]基于词向量的微博用户抑郁预测方法研究[D]. 方振宇.合肥工业大学 2017
[3]基于新浪微博的互联网用户心理健康状态判别[D]. 胡泉.河南大学 2015
本文编号:3387188
本文链接:https://www.wllwen.com/tushudanganlunwen/3387188.html