基于doc2vec和深度神经网络的智能客服情感分析系统研究与设计
发布时间:2020-12-11 03:36
近几年来随着深度学习和大数据技术在图像、语音、生物信息等诸多领域取得的重大突破,学者们正逐步开始将深度神经网络技术应用至自然语言处理领域。与此同时,鉴于国内快速增长的中小企业数量,国内智能客服市场也呈现出势不可挡的发展态势,且逐渐渗透到各行各业为广大企业和消费者带来便利。但目前大部分企业仍以人工客服为主从海量客户中筛选出意向用户,因而在面对与日俱增的用户量级及客服聊天记录时,这无疑极大的增加了企业运营成本,如何更好的发挥智能客服的市场价值成为智能客服企业当下最为关心的重要课题。通过对智能客服的用户聊天数据进行情感分析,可以清晰的把握每位用户对公司所推广产品的喜好程度,从而有助于针对性提升企业的营销转化率,充分发挥智能客服的市场价值;但同时目前主流的情感分类技术,难以在分类准确率及效率上达到相对可取的平衡。基于上述分析,本文研究和设计了基于doc2vec和深度神经网络(多层感知机)的智能客服情感分析系统,用户通过本系统可以与智能客服在线聊天并以相对较低的训练成本得出具有较高准确率的情感倾向。本文在基于doc2vec文本向量模型、word2vec词向量模型的基础上,改进和优化了一种更适合情...
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
智能客服情感分析系统概念图
西南大学工程硕士学位论文5征提取方法,并传递给非LSTM的另一种深度神经网络模型,并增加卷积层来作为情感分析的分类器,从而构建一个准确度高、训练成本相对较低的智能客服情感分析系统。1.4研究内容与方法1.4.1研究内容本文借助机器学习和神经网络技术,结合智能客服系统的自然语言特色和复杂的客服文本问题,围绕如何在甘如饴的基础上改进和优化基于word2vec模型生成情感词典,基于情感词典提取新特征,基于doc2vec模型提取文本的初步特征,组合新特征和初步特征以得到最终的文本特征[10],并对如何选娶优化合适的分类算法模型进行智能客服情感分析展开研究,本文整体研究与设计思路如图1-2所示。图1-2整体研究与设计思路1.进行特征组合得到更适合智能客服文本的新文本特征
凶远?⑾殖橄笾魈狻@?纾赫攵砸黄?魈馓??魅返奈恼拢?部分和该主题相似度很高的关键词语必然会高频率地显示。但是在实际的研究工作中,一篇文章往往是具有多个不一样占比的主题。针对此问题,学术界试着从统计学和概率学角度展开了深入研究[16]。吴恩达和Jordan、Michaell、DavidM、Blei在2003年提出了一般化的PLSI—隐含狄利克雷分布(LatentDirichletallocation,LDA),后来它便成了一种最普遍的概率主题模型逐渐被大众所了解,往后的绝大部分与此相关的概率主题模型都是在此模型的基础上进行改进和优化得来的[17]。图2-1LDA概率模型图
【参考文献】:
硕士论文
[1]基于卷积神经网络的跨领域情感分析[D]. 姬晨.云南大学 2018
[2]基于MapReduce和卷积神经网络的图像大数据分类研究[D]. 郝璞.河北大学 2018
[3]基于用户场景的智能客服系统分析与设计[D]. 张岩.吉林大学 2018
[4]基于Word2Vec,LSTMs和Attention机制的中文情感分析研究[D]. 胡月永.兰州大学 2018
[5]基于doc2vec和SVM的舆情情感分析系统的研究与设计[D]. 甘如饴.北京邮电大学 2017
[6]基于虚拟化的网络演练竞技平台的设计与实现[D]. 李新华.北京邮电大学 2017
[7]基于词向量和LSTM的汉语零指代消解研究[D]. 吴兵兵.哈尔滨工业大学 2016
[8]基于AUC的分类器性能评估问题研究[D]. 蒋帅.吉林大学 2016
[9]基于BBS话题评论的网络舆情分析系统设计与实现[D]. 王鹏程.湖南大学 2014
[10]网络舆情情感分析系统的设计与实现[D]. 刘红玉.电子科技大学 2013
本文编号:2909835
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
智能客服情感分析系统概念图
西南大学工程硕士学位论文5征提取方法,并传递给非LSTM的另一种深度神经网络模型,并增加卷积层来作为情感分析的分类器,从而构建一个准确度高、训练成本相对较低的智能客服情感分析系统。1.4研究内容与方法1.4.1研究内容本文借助机器学习和神经网络技术,结合智能客服系统的自然语言特色和复杂的客服文本问题,围绕如何在甘如饴的基础上改进和优化基于word2vec模型生成情感词典,基于情感词典提取新特征,基于doc2vec模型提取文本的初步特征,组合新特征和初步特征以得到最终的文本特征[10],并对如何选娶优化合适的分类算法模型进行智能客服情感分析展开研究,本文整体研究与设计思路如图1-2所示。图1-2整体研究与设计思路1.进行特征组合得到更适合智能客服文本的新文本特征
凶远?⑾殖橄笾魈狻@?纾赫攵砸黄?魈馓??魅返奈恼拢?部分和该主题相似度很高的关键词语必然会高频率地显示。但是在实际的研究工作中,一篇文章往往是具有多个不一样占比的主题。针对此问题,学术界试着从统计学和概率学角度展开了深入研究[16]。吴恩达和Jordan、Michaell、DavidM、Blei在2003年提出了一般化的PLSI—隐含狄利克雷分布(LatentDirichletallocation,LDA),后来它便成了一种最普遍的概率主题模型逐渐被大众所了解,往后的绝大部分与此相关的概率主题模型都是在此模型的基础上进行改进和优化得来的[17]。图2-1LDA概率模型图
【参考文献】:
硕士论文
[1]基于卷积神经网络的跨领域情感分析[D]. 姬晨.云南大学 2018
[2]基于MapReduce和卷积神经网络的图像大数据分类研究[D]. 郝璞.河北大学 2018
[3]基于用户场景的智能客服系统分析与设计[D]. 张岩.吉林大学 2018
[4]基于Word2Vec,LSTMs和Attention机制的中文情感分析研究[D]. 胡月永.兰州大学 2018
[5]基于doc2vec和SVM的舆情情感分析系统的研究与设计[D]. 甘如饴.北京邮电大学 2017
[6]基于虚拟化的网络演练竞技平台的设计与实现[D]. 李新华.北京邮电大学 2017
[7]基于词向量和LSTM的汉语零指代消解研究[D]. 吴兵兵.哈尔滨工业大学 2016
[8]基于AUC的分类器性能评估问题研究[D]. 蒋帅.吉林大学 2016
[9]基于BBS话题评论的网络舆情分析系统设计与实现[D]. 王鹏程.湖南大学 2014
[10]网络舆情情感分析系统的设计与实现[D]. 刘红玉.电子科技大学 2013
本文编号:2909835
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2909835.html