面向微博文本的自杀倾向原因识别研究

发布时间:2021-01-10 11:35
  自杀问题一直是全世界关注和待解决的心理健康问题,关系到个人健康发展和社会和谐稳定,因此在自杀前发现自杀倾向原因对预防自杀会起到关键的作用。传统的自杀倾向原因分析中,主要由心理医生或专家通过访谈、心理评估报告、临床诊断开展,这种方法存在很多不足的地方。首先是侵入方式的调查诊断对他们当前的心理状态有一定的影响。其次是自杀者出于当前心理状态和隐私的考虑,会抵触这种侵入式调查或访谈。最严重的是传统方法存在时效性和针对性差的局限。因此,传统自杀倾向原因研究的不足和局限性为自杀的诊断和预防带来干扰和延误。目前,社交网络平台如Twitter、新浪微博、微信等近年来飞速发展。用户经常通过社交网络平台来发布自己内心真实想法、心理状态等一些带有个人情感色彩的信息。其中也包括很多活跃的自杀倾向用户,这使得社交网络为研究抑郁、自杀等心理健康问题提供很好的支持。而基于社交媒体的自杀倾向原因识别研究非常少,相关的研究主要集中在心理健康评估和自杀倾向检测上面。本文提出基于条件随机场CRF的方法和基于长短期记忆网络的EAP-Bi-LSTM-CRF方法,从具有自杀倾向的社交媒体微博中识别自杀倾向原因。CRF模型依赖手动... 

【文章来源】: 刘仁强 江西财经大学

【文章页数】:63 页

【学位级别】:硕士

【部分图文】:

面向微博文本的自杀倾向原因识别研究


总体研究框架图

二维图,文档,文本,二维


面向微博文本的自杀倾向原因识别研究14图2.5二维文本表示如上图所示,其中D={d1,d2,…,dn}表示文档,di表示第i个文档。S={s1,s2,…,sm}表示文档集合D中的词集合或特征集合,sj表示第j个词或特征。Wij表示第i个文档中第j个词或特征的值。随着深度学习应用在自然语言处理中,通过训练神经网络模型获得词向量表示模型,也称为词嵌入(wordembedding)。词向量模型将文本中的词表示成一个向量,文本则由词向量组成的向量矩阵构成。词向量能有效地表示词与词的语义关系,通过将词向量映射到空间域中可以发现,语义相近的词如“伦敦”、“东京”、“北京”等表示不同国家首都城市的词在空间域中相近,甚至在一定程度上可以反映词之间的线性关系。如图2.6描述了“伦敦”、“东京”、“北京”、“购物”等词在空间域的关系。

空间域,向量,语言模型


第二章语料构建及相关理论15图2.6词向量空间域关系词向量开始出现时是神经网络训练语言模型的附带产物,如Bengio等人[36-37]在2001年训练语言模型时获得的副产物NNLM词向量,2007年Hinton等人[38]在改进Bengio的语言模型后获得了LBL词向量。而真正意义上以训练词向量为目的神经网络模型是由Collobert等人[39]在2008年提出的C&W模型,该词向量模型同样以NNLM语言模型为基础进行改进,通过将目标词放在输入层并且将输出层调整为一个节点的输出,而不像语言模型以一个词表大小作为输出。2013年Mikolov等人[40]在NNLM模型和C&W模型的基础上提出CBOW和Skip-gram模型,主要是为了借鉴和简化原有模型而快速有效得获取词向量。2014年由Pennington等人[41]结合传统的全局矩阵表示方法和神经网络训练的局部上下文词向量表示方法提出了一种全局词向量表示方法Glove模型,通过全局词共现矩阵训练词向量模型,而不是局限于局部的上下文词向量训练方法。以上词向量模型都是通过训练神经网络获得局部上下文或全局的词向量表示方法,所以相比传统基于统计的二维表示方法能较好的体现词与词之间的语义关系。CBOW和Skip-gram模型为工业界和学术界熟知的word2vec,同时word2vec在自然语言处理的各项任务中获得了较好的实验表现并得到了广泛的应用。CBOW模型是通过当前词的上下文表示预测当前的目标词,其借鉴C&W模型的思想将文本上下文的中间词作为当前目标词,同时又在NNLM模型的基础上做了两步简化:(1)去除了隐藏层直接log线性结构输出。(2)由原来的

【参考文献】:
期刊论文
[1]基于神经网络的微博情绪识别与诱因抽取联合模型[J]. 张晨,钱涛,姬东鸿.  计算机应用. 2018(09)
[2]基于支持向量机的大学生自杀倾向识别研究[J]. 张玉腾.  中国学校卫生. 2018(05)
[3]我国大学生自杀现状与对策研究[J]. 吴才智,江光荣,段文婷.  黑龙江高教研究. 2018(05)
[4]基于E-CNN的情绪原因识别方法[J]. 慕永利,李旸,王素格.  中文信息学报. 2018(02)
[5]基于向量空间模型的中文文本相似度的研究[J]. 薛苏琴,牛永洁.  电子设计工程. 2016(10)
[6]大学生自杀潜在风险的识别和预警:基于应激-易感模型[J]. 苏斌原,张卫,周梦培,林玛,孟彩.  华南师范大学学报(社会科学版). 2015(03)
[7]社交媒体和自杀预防:对相关人员的调查结果(英文)[J]. Jo ROBINSON,Maria RODRIGUES,Steve FISHER,Eleanor BAILEY,Helen HERRMAN.  上海精神医学. 2015(01)
[8]基于序列标注模型的情绪原因识别方法[J]. 李逸薇,李寿山,黄居仁,高伟.  中文信息学报. 2013(05)
[9]抑郁症患者自杀倾向的识别与护理对策[J]. 王世茹.  中外医学研究. 2013(03)
[10]思想政治教育中生命教育目标的思考与实践——从当代大学生自杀率升高谈起[J]. 葛君梅,姚红,张涛.  吉林省教育学院学报(中旬). 2012(07)

硕士论文
[1]中文微博情感倾向性分析与情感要素抽取方法[D]. 夏梦南.北京工业大学 2015
[2]基于文本的情绪自动归因方法研究[D]. 袁丽.哈尔滨工业大学 2014



本文编号:2968630

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2968630.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户62b39***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com