当前位置:主页 > 科技论文 > 软件论文 >

基于语义约束LDA的商品特征和情感词提取

发布时间:2019-07-10 12:20
【摘要】:随着网络购物的发展,Web上产生了大量的商品评论文本数据,其中蕴含着丰富的评价知识.如何从这些海量评论文本中有效地提取商品特征和情感词,进而获取特征级别的情感倾向,是进行商品评论细粒度情感分析的关键.根据中文商品评论文本的特点,从句法分析、词义理解和语境相关等多角度获取词语间的语义关系,然后将其作为约束知识嵌入到主题模型,提出语义关系约束的主题模型SRC-LDA(semantic relation constrained LDA),用来实现语义指导下LDA的细粒度主题词提取.由于SRC-LDA改善了标准LDA对于主题词的语义理解和识别能力,从而提高了相同主题下主题词分配的关联度和不同主题下主题词分配的区分度,可以更多地发现细粒度特征词、情感词及其之间的语义关联性.实验结果表明,SRC-LDA对于细粒度特征和情感词的发现和提取具有较好的效果.
[Abstract]:With the development of online shopping, a large number of commodity review text data have been produced on Web, which contains rich evaluation knowledge. How to effectively extract commodity features and emotional words from these massive comment texts, and then obtain the emotional tendency at the feature level, is the key to fine-grain emotional analysis of commodity reviews. According to the characteristics of Chinese commodity review text, the semantic relationship between words is obtained from syntactic analysis, word meaning understanding and context correlation, and then embedded into the topic model as constraint knowledge. The topic model SRC-LDA (semantic relation constrained LDA), which is constrained by semantic relations, is proposed to realize the fine-granularity subject word extraction of LDA under semantic guidance. Because SRC-LDA improves the semantic understanding and recognition ability of standard LDA for subject words, thus improving the correlation degree of subject word allocation under the same topic and the discrimination degree of subject word allocation under different topics, we can find more fine-granularity feature words, emotional words and their semantic relevance. The experimental results show that SRC-LDA has a good effect on the discovery and extraction of fine-granularity features and emotional words.
【作者单位】: 江西财经大学信息管理学院;江西师范大学计算机信息工程学院;数据与知识工程江西省高校重点实验室(江西财经大学);
【基金】:国家自然科学基金(61562032,61662032,61662027,61173146,61363039,61363010,61462037,61562031) 江西省自然科学基金重大项目(20152ACB20003) 江西省高等学校科技落地计划(KJLD12022,KJLD14035)~~
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 许璐蕾;;网络评论中情感词的获取及极性判断方法比较[J];电脑与电信;2011年01期

2 肖健;徐建;朱姝;万缨;许亮;;基于翻译和语义方法的情感词挖掘研究[J];计算机工程与应用;2011年32期

3 赵鹏;赵志伟;卓景文;;一种情感词语义加权的句子倾向性识别方法[J];计算机工程与应用;2011年35期

4 代大明;李寿山;李培峰;朱巧明;;基于情绪词与情感词协作学习的情感分类方法研究[J];计算机科学;2012年12期

5 李勇敢;周学广;孙艳;张焕国;;结合依存关联分析和规则统计分析的情感词库构建方法[J];武汉大学学报(理学版);2013年05期

6 彭庆喜;钱铁云;;基于量化情感的网店垃圾评论检测[J];山东大学学报(理学版);2013年11期

7 杜嘉忠;徐健;刘颖;;网络商品评论的特征 情感词本体构建与情感分析方法研究[J];现代图书情报技术;2014年05期

8 张清亮;徐健;;网络情感词自动识别方法研究[J];现代图书情报技术;2011年10期

9 黄俊;田生伟;禹龙;冯冠军;;基于维吾尔语情感词的句子情感分析[J];计算机工程;2012年09期

10 孙劲光;马志芳;孟祥福;;基于情感词属性和云模型的文本情感分类方法[J];计算机工程;2013年12期

相关会议论文 前5条

1 陈奇哲;刘全升;姚天f ;;汉语意见型语句主题与情感关系抽取的研究[A];第五届全国信息检索学术会议论文集[C];2009年

2 孙慧;关毅;董喜双;;中文情感词倾向消歧[A];第六届全国信息检索学术会议论文集[C];2010年

3 段秀婷;何婷婷;宋乐;;基于PMI-IR算法的Blog情感分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年

4 李先斌;袁平波;俞能海;;基于局部最优的情感标签图像自动标注算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年

5 王枞;涂序彦;刘嘉;;注意-情绪协调的个性化信息推荐模型[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年

相关博士学位论文 前8条

1 刘全超;面向中文微博的观点挖掘与倾向性分析研究[D];北京理工大学;2015年

2 董喜双;基于免疫多词主体自治学习的情感分析研究[D];哈尔滨工业大学;2013年

3 寇广增;基于意见挖掘通用框架的情感极性强度模糊性研究[D];武汉大学;2010年

4 杨玉珍;基于Web评论信息的倾向性分析关键技术研究[D];山东师范大学;2014年

5 黄胜;Web评论文本的细粒度意见挖掘技术研究[D];北京理工大学;2014年

6 施寒潇;细粒度情感分析研究[D];苏州大学;2013年

7 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年

8 李芳;面向中文Web评论的观点挖掘关键技术研究[D];华中师范大学;2013年

相关硕士学位论文 前10条

1 孙博;关于情感词的意义用法[D];辽宁大学;2012年

2 王银;中文微博情感分析方法研究[D];广东技术师范学院;2015年

3 崔连超;互联网评论文本情感分析研究[D];山东大学;2015年

4 杜雪峰;藏文句子倾向性分析研究[D];中央民族大学;2015年

5 孙建超;微博舆情挖掘技术的研究与应用[D];电子科技大学;2015年

6 张圣声;基于微博平台的产品评论情感分类研究[D];广东外语外贸大学;2015年

7 何天翔;基于情感词网的短文本情感分类方法研究[D];西南科技大学;2015年

8 丁星;基于文本倾向性分析技术的微博监控系统[D];江苏科技大学;2015年

9 李茜;博客意见检索关键问题研究[D];北京理工大学;2015年

10 李瑞静;汉语情感词模糊语义的量化分析及应用研究[D];北京理工大学;2015年



本文编号:2512605

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2512605.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户437b2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com