基于中文微博语言特征的自杀意念检测
发布时间:2020-12-29 08:59
针对自杀意念检测,建立一个可迁移性强的自杀词典,并提出词性特征,以提高基于n-gram特征的自杀意念检测模型的分类准确率.采用对比实验与控制变量的方式,以n-gram特征、语言特征(词汇特征、词性特征)为输入特征,以随机森林、支持向量机算法为驱动,重点研究语言特征对模型性能的影响,同时探究在不同特征下不同分类算法训练模型的性能表现.结果表明:语言特征对模型性能有大幅提升,通过比较发现,基于n-gram特征与语言特征的模型性能优于基于n-gram特征和词典特征的模型和基于n-gram特征的模型,其中在随机森林算法下性能提升约20%.
【文章来源】:中北大学学报(自然科学版). 2019年04期
【文章页数】:8 页
【文章目录】:
0 引言
1 自杀诱因分析及其语言特征
1.1 自杀诱因
1.2 自杀诱因的语言特征
2 语言特征的选取与量化
2.1 特征
2.2 特征量化
3 实验与结果分析
3.1 假设
3.2 数据来源及预处理
3.2.1 数据来源
3.2.2 数据预处理
3.2.3 数据标注
3.3 实验方法
3.4 自杀意念检测与模型评估
3.5 实验结果分析
4 结论
【参考文献】:
期刊论文
[1]自杀意念与人格特征的研究进展[J]. 杨登乐,姜潮,贾树华. 医学与哲学(A). 2017(01)
[2]边缘型人格障碍患者自杀意念危险因素研究[J]. 孟艳君,孙宁. 临床医药实践. 2014(10)
[3]中国人群自杀行为的研究进展[J]. 宋剑锋,卢祖洵. 公共卫生与预防医学. 2008(04)
本文编号:2945375
【文章来源】:中北大学学报(自然科学版). 2019年04期
【文章页数】:8 页
【文章目录】:
0 引言
1 自杀诱因分析及其语言特征
1.1 自杀诱因
1.2 自杀诱因的语言特征
2 语言特征的选取与量化
2.1 特征
2.2 特征量化
3 实验与结果分析
3.1 假设
3.2 数据来源及预处理
3.2.1 数据来源
3.2.2 数据预处理
3.2.3 数据标注
3.3 实验方法
3.4 自杀意念检测与模型评估
3.5 实验结果分析
4 结论
【参考文献】:
期刊论文
[1]自杀意念与人格特征的研究进展[J]. 杨登乐,姜潮,贾树华. 医学与哲学(A). 2017(01)
[2]边缘型人格障碍患者自杀意念危险因素研究[J]. 孟艳君,孙宁. 临床医药实践. 2014(10)
[3]中国人群自杀行为的研究进展[J]. 宋剑锋,卢祖洵. 公共卫生与预防医学. 2008(04)
本文编号:2945375
本文链接:https://www.wllwen.com/yixuelunwen/binglixuelunwen/2945375.html
最近更新
教材专著