电商评论中细粒度主题情感混合模型建构
【图文】:
了改进,在文档和主题层之间设置了超参数,解决了PLSA模型过拟合现象。(二)LDA模型文本文档的LDA模型被认为是由多个主题组成的概率分布,如图3所示,它是由文档、主题和词组成的三层模型,每个主题的概率分布由多个词组成。图3中各变量的含义如表1所示。LDA模型先确定评论文档的主题分布,再选择一个主题,接着选择一个词语,从上一步骤生成的对应主题词条分布中进行选择,反复进行上述两个过程,完成文档的编辑后过程结束。(三)细粒度观点挖掘主题模型设计细粒度观点挖掘的实现目标有以下四个方面:在众多图1个性化推荐流程图2细粒度观点挖掘流程图图3LDA模型表1LDA模型变量解释表2词条所属滑动窗口分布表市场营销
又称为细粒度观点挖掘,使用过程中评论中的被评价实体方面被这种方法细节化,实体所有方面的详细观点和情感倾向都能被分析得出。实现较深层次的任务是细粒度观点挖掘的一大优势,另一优点是向消费者或商家提供被评价实体与之相关的情感观点信息,细粒度观点挖掘获得的信息可以满足用户更高层次的需求。(四)细粒度观点挖掘承担的主要任务细粒度观点挖掘的目标定在被评价实体方面的抽取,抽取过程中注重情感分析,即从众多的评论中生成评价摘要。提取实体、提取意见词和分析情感倾向是细粒度意见挖掘的三个主要任务。图2展示了细粒度观点挖掘的流程。挖掘过程为:采集电商网上消费者的评论数据→过滤无用数据(数据预处理)→删掉停用词等→转化数据,生成可识别的格式供算法使用→抽取被评价实体方面和观点词,在此基础上从情感倾向角度进行分析→生成评价摘要且评价摘要可视化。细粒度主题情感混合模型(一)主题模型文档中常常有一些隐含的主题,对于这些主题的建模采用主题模型的方法实现,每一个文档的生成模型称为主题模型。若干个词语组成了文档,文档的形成包括以下过程:词语确定主题;在这个主题中选择词语;不断重复前两步的选择过程,从而生成文档。主题模型在上述选择主题或词的过程中均以采取相应的概率为前提,,PLSA和LDA是电商评论中被普遍采用的两种主题模型,这两种模型在应用过程中的使用情况如下:PLSA模型容易出现过拟合,应在文档层和主题层之间增加概率模型;LDA模型在PLSA模型基础上做了改进,在文档和主题层之间设置了超参数,解决了PLSA模型过拟合现象。(二)LDA模型文本文档的LDA模型被认为是由多个主题组成的概率分布,如图3所示,它是由文档、主题和词组成的三层模型,每个主题的概率分布由
【相似文献】
相关期刊论文 前10条
1 王宁;钞柯;罗嫔;;实现细粒度访问控制的元模型研究[J];大连理工大学学报;2012年03期
2 欧阳纯萍;阳小华;雷龙艳;徐强;余颖;刘志明;;多策略中文微博细粒度情绪分析研究[J];北京大学学报(自然科学版);2014年01期
3 史大伟;袁天伟;;一种粗细粒度结合的动态污点分析方法[J];计算机工程;2014年03期
4 原子;于莉莉;刘超;;引入缺陷的细粒度软件变更识别方法[J];北京航空航天大学学报;2014年09期
5 涂登彪;谭光明;孙凝晖;;无锁同步的细粒度并行介度中心算法[J];软件学报;2011年05期
6 华秀丽;徐凡;王中卿;李培峰;;细粒度科技论文摘要句子分类方法[J];计算机工程;2012年14期
7 时杰;朱虹;冯玉才;;实现数据库细粒度访问控制的一种动态查询修改算法[J];计算机科学;2010年12期
8 王志强;黄皓;夏磊;;进程内细粒度保护域模型及其实现[J];计算机应用;2007年06期
9 赵亚杰;陈龙;;面向手机取证的细粒度数据完整性检验方法[J];计算机工程与设计;2012年11期
10 王希忠;曲家兴;马春光;周长利;;一种适用于非结构化数据的改进细粒度加密方法[J];计算机应用研究;2014年09期
相关会议论文 前1条
1 盛振华;吴羽;江锦华;寿黎但;陈刚;;InfoSigs:一种面向WEB对象的细粒度聚类算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
相关博士学位论文 前3条
1 时杰;关系数据库细粒度访问控制研究[D];华中科技大学;2010年
2 朱倩;面向自由文本的细粒度关系抽取的关键技术研究[D];江苏大学;2011年
3 余a\;基于Simulink模型的细粒度多线程技术研究[D];浙江大学;2014年
相关硕士学位论文 前10条
1 赵黎光;基于依存句法的句子级细粒度情感计算[D];华南理工大学;2015年
2 姚亮;数据访问控制中基于中间代理的用户撤销方法[D];西安电子科技大学;2014年
3 占文平;面向产品评论的情感分析技术研究[D];浙江工商大学;2015年
4 廖纯;基于句法和语义的话题细粒度情感分析的研究[D];北京理工大学;2016年
5 李毅;属性层级观点挖掘技术的研究与应用[D];石家庄铁道大学;2016年
6 周志华;聊天系统文本情感细粒度分类研究与应用[D];西南交通大学;2015年
7 康海蒙;基于细粒度监控的Spark优化研究[D];哈尔滨工业大学;2016年
8 陈闯闯;中文微博细粒度情感判别研究[D];南华大学;2016年
9 付连鹏;微博客细粒度情感分析技术的研究与实现[D];东北大学;2014年
10 李凌云;基于部件对齐模型的细粒度分类方法研究[D];大连理工大学;2016年
本文编号:2554020
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2554020.html