互联网评论文本观点挖掘策略研究
发布时间:2021-03-02 07:21
互联网时代,人们越来越多地在线购物、在线订餐、在线预定酒店等等。国内最大的电子商务网站阿里巴巴,其各款商品展示页面通常都积累有成千上万的购买者评论,国内最大的生活服务类电商,如美团,则有庞大的外卖、美食的评论数据,再者,像携程这样的线上OTA企业则有海量的酒店、旅游体验评价。如今,数据越来越成为各互联网企业最宝贵的财富,据2016年CNNIC(中国互联网络信息中心)数据显示,71.1%的用户认为产品评论是影响购买决策的最主要因素,而如此庞大的各类评论数据,正是用来分析各类商品价值、商家品质的绝好原材料。但是原始评论数据数量大、句式复杂、争议性大,需要相应方法,将其结构化成观点维度、观点词、情感类别三元组的形式,便于直观的分析。本文分别从观点抽取和评论文本情感倾向两个子方向进行研究,研究主要内容及贡献如下:(1)由硬匹配、软匹配方法构成的第一、二层观点维度词、观点词挖掘模块。“硬匹配”指的是评论句直接与种子词典中候选词进行搜索,若评论句中存在种子词典内词汇则挖掘成功;“软匹配”指的是通过word2vec的方式,扩充了种子词典,若评论文本中出现了扩充词典的词,则归一至与其对应的种子词典的词...
【文章来源】:南京大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
图2.1线性链条件随机场??
的文本序列处理为等长的表示(输出)向量,或者将表示向量合并、相加处理成??定长的表不(输出)向量。??可以使用X来表示网络输入向量序列xu....,xn。如图2.3左所示,将整个网??络看成A,每个时刻t输入向量为xt,并循环输入上个时刻历史信息,最终网络??t时刻输出ht,并在下一个时刻同样的方式输出h1+i。??ht?=?=?tanhCVK^/it,!?+?Wxhxt?+?b)?(公式?2.6)??除去网络中的循环结构,该网络很像一组全连接网络。拆开这个网络,则可??以更清除地看出RNN与全连接网络的不同之处。如图2.3右,展幵之后可以发??现该网络与序列地天然联系,对此联系可以用数学公式进行表示。??yt?=?g(Vht)?(公式?2_7)??各参数说明如下:??Xt:?t时刻的输入??St:?t时刻隐藏状态??g:激活函数,如tanh??U、V、W:网络参数(RNN共享同一批网络参数)??15??
图3.1独热向量??
【参考文献】:
期刊论文
[1]基于LSTM深度神经网络的情感分析方法[J]. 伍行素,陈锦回. 上饶师范学院学报. 2018(06)
[2]基于Logistic回归模型的微博情感分析研究[J]. 冯军军,王海沛,贺晓春. 计算机与数字工程. 2018(09)
[3]基于迁移学习的分层注意力网络情感分析算法[J]. 曲昭伟,王源,王晓茹. 计算机应用. 2018(11)
[4]基于双向LSTM语义强化的主题建模[J]. 彭敏,杨绍雄,朱佳晖. 中文信息学报. 2018(04)
[5]移动互联网对电商行业的影响分析[J]. 刘扬. 产业与科技论坛. 2017(16)
[6]全国首例淘宝恶意刷单损害竞争对手商誉被判入罪[J]. 王羽. 上海企业. 2017(02)
[7]分段卷积神经网络在文本情感分析中的应用[J]. 杜昌顺,黄磊. 计算机工程与科学. 2017(01)
[8]基于深度表示学习和高斯过程迁移学习的情感分析方法[J]. 吴冬茵,桂林,陈钊,徐睿峰. 中文信息学报. 2017(01)
[9]基于迁移学习微博情绪分类研究——以H7N9微博为例[J]. 周清清,章成志. 情报学报. 2016 (04)
[10]特征观点对购买意愿的影响:在线评论的情感分析方法[J]. 王伟,王洪伟. 系统工程理论与实践. 2016(01)
博士论文
[1]基于分布式表示学习的文本情感分析[D]. 陈涛.哈尔滨工业大学 2018
[2]网络传媒中的情感词语的强度量化研究[D]. 阿斯力别克(Assylbek Kutlumuratov).华南理工大学 2017
[3]观点挖掘中评价对象抽取方法的研究[D]. 刘倩.东南大学 2016
[4]文本情感分析中关键问题的研究[D]. 李岩.北京邮电大学 2014
[5]WEB观点挖掘中关键问题的研究[D]. 李思.北京邮电大学 2012
硕士论文
[1]基于深度学习的中文分词模型应用研究[D]. 解宇涵.重庆大学 2017
[2]面向电商评论细粒度观点挖掘的拓展主题模型研究[D]. 郑玉桂.浙江工商大学 2017
[3]基于云模型理论的LDA最大熵模型观点挖掘研究[D]. 司琪.华中师范大学 2016
[4]评论文本情感分析算法的研究[D]. 袁磊.合肥工业大学 2016
[5]基于词性与LDA主题模型的文本分类技术研究[D]. 张勇.安徽大学 2016
[6]基于字的分词方法的研究与实现[D]. 游治勇.电子科技大学 2015
[7]基于句法分析和主题建模的细粒度观点挖掘模型研究[D]. 王晓伟.浙江大学 2013
[8]基于Web的汽车产品评论观点挖掘方法研究[D]. 宋晓雷.山西大学 2010
[9]中文词性标注的研究与实现[D]. 张卫.南京师范大学 2007
本文编号:3058869
【文章来源】:南京大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
图2.1线性链条件随机场??
的文本序列处理为等长的表示(输出)向量,或者将表示向量合并、相加处理成??定长的表不(输出)向量。??可以使用X来表示网络输入向量序列xu....,xn。如图2.3左所示,将整个网??络看成A,每个时刻t输入向量为xt,并循环输入上个时刻历史信息,最终网络??t时刻输出ht,并在下一个时刻同样的方式输出h1+i。??ht?=?=?tanhCVK^/it,!?+?Wxhxt?+?b)?(公式?2.6)??除去网络中的循环结构,该网络很像一组全连接网络。拆开这个网络,则可??以更清除地看出RNN与全连接网络的不同之处。如图2.3右,展幵之后可以发??现该网络与序列地天然联系,对此联系可以用数学公式进行表示。??yt?=?g(Vht)?(公式?2_7)??各参数说明如下:??Xt:?t时刻的输入??St:?t时刻隐藏状态??g:激活函数,如tanh??U、V、W:网络参数(RNN共享同一批网络参数)??15??
图3.1独热向量??
【参考文献】:
期刊论文
[1]基于LSTM深度神经网络的情感分析方法[J]. 伍行素,陈锦回. 上饶师范学院学报. 2018(06)
[2]基于Logistic回归模型的微博情感分析研究[J]. 冯军军,王海沛,贺晓春. 计算机与数字工程. 2018(09)
[3]基于迁移学习的分层注意力网络情感分析算法[J]. 曲昭伟,王源,王晓茹. 计算机应用. 2018(11)
[4]基于双向LSTM语义强化的主题建模[J]. 彭敏,杨绍雄,朱佳晖. 中文信息学报. 2018(04)
[5]移动互联网对电商行业的影响分析[J]. 刘扬. 产业与科技论坛. 2017(16)
[6]全国首例淘宝恶意刷单损害竞争对手商誉被判入罪[J]. 王羽. 上海企业. 2017(02)
[7]分段卷积神经网络在文本情感分析中的应用[J]. 杜昌顺,黄磊. 计算机工程与科学. 2017(01)
[8]基于深度表示学习和高斯过程迁移学习的情感分析方法[J]. 吴冬茵,桂林,陈钊,徐睿峰. 中文信息学报. 2017(01)
[9]基于迁移学习微博情绪分类研究——以H7N9微博为例[J]. 周清清,章成志. 情报学报. 2016 (04)
[10]特征观点对购买意愿的影响:在线评论的情感分析方法[J]. 王伟,王洪伟. 系统工程理论与实践. 2016(01)
博士论文
[1]基于分布式表示学习的文本情感分析[D]. 陈涛.哈尔滨工业大学 2018
[2]网络传媒中的情感词语的强度量化研究[D]. 阿斯力别克(Assylbek Kutlumuratov).华南理工大学 2017
[3]观点挖掘中评价对象抽取方法的研究[D]. 刘倩.东南大学 2016
[4]文本情感分析中关键问题的研究[D]. 李岩.北京邮电大学 2014
[5]WEB观点挖掘中关键问题的研究[D]. 李思.北京邮电大学 2012
硕士论文
[1]基于深度学习的中文分词模型应用研究[D]. 解宇涵.重庆大学 2017
[2]面向电商评论细粒度观点挖掘的拓展主题模型研究[D]. 郑玉桂.浙江工商大学 2017
[3]基于云模型理论的LDA最大熵模型观点挖掘研究[D]. 司琪.华中师范大学 2016
[4]评论文本情感分析算法的研究[D]. 袁磊.合肥工业大学 2016
[5]基于词性与LDA主题模型的文本分类技术研究[D]. 张勇.安徽大学 2016
[6]基于字的分词方法的研究与实现[D]. 游治勇.电子科技大学 2015
[7]基于句法分析和主题建模的细粒度观点挖掘模型研究[D]. 王晓伟.浙江大学 2013
[8]基于Web的汽车产品评论观点挖掘方法研究[D]. 宋晓雷.山西大学 2010
[9]中文词性标注的研究与实现[D]. 张卫.南京师范大学 2007
本文编号:3058869
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3058869.html