当前位置:主页 > 医学论文 > 病理论文 >

基于中文微博语言特征的自杀意念检测

发布时间:2020-12-29 08:59
  针对自杀意念检测,建立一个可迁移性强的自杀词典,并提出词性特征,以提高基于n-gram特征的自杀意念检测模型的分类准确率.采用对比实验与控制变量的方式,以n-gram特征、语言特征(词汇特征、词性特征)为输入特征,以随机森林、支持向量机算法为驱动,重点研究语言特征对模型性能的影响,同时探究在不同特征下不同分类算法训练模型的性能表现.结果表明:语言特征对模型性能有大幅提升,通过比较发现,基于n-gram特征与语言特征的模型性能优于基于n-gram特征和词典特征的模型和基于n-gram特征的模型,其中在随机森林算法下性能提升约20%. 

【文章来源】:中北大学学报(自然科学版). 2019年04期

【文章页数】:8 页

【文章目录】:
0 引言
1 自杀诱因分析及其语言特征
    1.1 自杀诱因
    1.2 自杀诱因的语言特征
2 语言特征的选取与量化
    2.1 特征
    2.2 特征量化
3 实验与结果分析
    3.1 假设
    3.2 数据来源及预处理
        3.2.1 数据来源
        3.2.2 数据预处理
        3.2.3 数据标注
    3.3 实验方法
    3.4 自杀意念检测与模型评估
    3.5 实验结果分析
4 结论


【参考文献】:
期刊论文
[1]自杀意念与人格特征的研究进展[J]. 杨登乐,姜潮,贾树华.  医学与哲学(A). 2017(01)
[2]边缘型人格障碍患者自杀意念危险因素研究[J]. 孟艳君,孙宁.  临床医药实践. 2014(10)
[3]中国人群自杀行为的研究进展[J]. 宋剑锋,卢祖洵.  公共卫生与预防医学. 2008(04)



本文编号:2945375

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/binglixuelunwen/2945375.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e4b6e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com