词典与机器学习方法相结合的维吾尔语文本情感分析
本文关键词:词典与机器学习方法相结合的维吾尔语文本情感分析 出处:《中文信息学报》2017年01期 论文类型:期刊论文
【摘要】:随着互联网整体水平的提高,大量基于维吾尔文的网络信息不断建立,引起了对不同领域的信息进行情感倾向性分析的迫切需要。该文考虑到维吾尔文没有足够的情感训练语料和完整的情感词典,结合机器学习方法和词典方法的优点,构建一个分类器模型LCUSCM(Lexicon-based and Corpus-based Uyghur Text Sentiment Classification Model),先用自己构建的维吾尔文情感词典对语料进行高质量的情感分类,分类过程中对词典进行递归扩充,再根据每条句子的情感得分,从词典分类的结果中选择一部分语料来训练一个分类器并改进第一步的分类结果。此方法的正确率比单独使用机器学习方法提高了9.13%,比词典方法提高了1.82%。
[Abstract]:With the overall level of the improvement of the Internet, a large number of Uighur based on network information increases, causing the different information in the field of sentiment analysis. The urgent need to consider the Uighur not enough emotional training corpus and the integrity of the emotion dictionary, by combining the advantages of machine learning method and dictionary method, construct a classifier model LCUSCM (Lexicon-based and Corpus-based Uyghur Text Sentiment Classification Model), first of the corpus for emotion classification for high quality to build their own emotional Uyghur dictionary, recursive extension of the dictionary in the process of classification, according to each sentence scores, select a part of the corpus from the dictionary classification results to train a classifier and improved classification the results of the first step. The correct rate of this method than the use of machine learning methods alone increased 9.13%, 1.82%. is better than a dictionary method
【作者单位】: 新疆大学信息科学与工程学院新疆多语种重点实验室;伊犁师范学院电子与信息工程学院;
【基金】:国家“973”重点基础研究计划基金(2014CB340506) 国家自然科学基金(61363063) 新疆大学多语种重点实验室开放课题(XJDX0905-2013-02)
【分类号】:TP391.1;TP181
【正文快照】: 1引言随着互联网的飞速发展,广大网络用户已经从过去单纯的信息获取者变为网络内容的主要制造者。当前互联网上的信息形式多种多样,如新闻、博客文章、产品评论、论坛帖子等等。情感分析(senti-ment analysis)能够自动判断说话者对某事件、产品、人物和政策等持有的态度。随着
【参考文献】
相关期刊论文 前2条
1 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
2 李军,滕春华;现代维吾尔语否定范畴探析[J];语言与翻译;2001年02期
【共引文献】
相关期刊论文 前10条
1 何有世;王明;;基于多特征组合的在线产品评论情感挖掘研究[J];软件导刊;2017年05期
2 段旭磊;张仰森;孙yN卓;;微博文本的句向量表示及相似度计算方法研究[J];计算机工程;2017年05期
3 李建华;刘功申;林祥;;情感倾向性分析及应用研究综述[J];信息安全学报;2017年02期
4 郑丽娟;王洪伟;;基于情感本体的在线评论情感极性及强度分析:以手机为例[J];管理工程学报;2017年02期
5 王洪伟;宋媛;杜战其;郑丽娟;华瑾;张艺伟;;基于在线评论情感分析的快递服务质量评价[J];北京工业大学学报;2017年03期
6 刘梅彦;黄改娟;;面向信息内容安全的文本过滤模型研究[J];中文信息学报;2017年02期
7 李晨;朱世伟;魏墨济;于俊凤;李新天;;基于词典与规则的新闻文本情感倾向性分析[J];山东科学;2017年01期
8 刘晨晨;冯旭鹏;胡杨;刘利军;黄青松;段成香;;基于主题角色的文本情感分类方法[J];计算机应用与软件;2017年01期
9 陈志鹏;陈文亮;;基于文档发散度的作文跑题检测[J];中文信息学报;2017年01期
10 热西旦木·吐尔洪太;吾守尔·斯拉木;伊尔夏提·吐尔贡;;词典与机器学习方法相结合的维吾尔语文本情感分析[J];中文信息学报;2017年01期
【相似文献】
相关期刊论文 前10条
1 张明玉,倪志伟;基于机器学习的智能决策支持系统[J];淮南师范学院学报;2005年03期
2 杨凌霄;武建平;;机器学习方法在人脸检测中的应用[J];计算机与数字工程;2008年03期
3 ;第十一届中国机器学习会议[J];智能系统学报;2008年02期
4 ;第14届中国机器学习会议[J];智能系统学报;2012年06期
5 费宗铭;吕建;王志坚;陈道蓄;徐家福;;机器学习[J];计算机科学;1991年01期
6 赵沁平;魏华;王军玲;;机器学习技术与机器学习系统[J];计算机科学;1993年05期
7 姚敏;机器学习及其发展方向[J];计算机时代;1994年04期
8 ;第31届机器学习国际会议(英文)[J];智能系统学报;2014年01期
9 黄海滨;机器学习及其主要策略[J];河池师范高等专科学校学报(自然科学版);2000年04期
10 佘玉梅;一种协调机器学习方法研究[J];云南民族学院学报(自然科学版);2000年03期
相关会议论文 前10条
1 王珏;;归纳机器学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年
2 王昊;李银波;纪志梁;;利用机器学习方法预测严重药物不良反应-呼吸困难[A];中国化学会第28届学术年会第13分会场摘要集[C];2012年
3 吴沧浦;;智能系统与机器学习的新领域[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
4 周晴杰;徐立鸿;吴启迪;;机器学习串级结构的初步探讨[A];1998年中国控制会议论文集[C];1998年
5 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
6 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
7 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 黄金铁;李景银;周建常;;对高炉炉况评价模型参数的机器学习——一个三类线性模式分类器的实现[A];1995中国控制与决策学术年会论文集[C];1995年
9 程国建;蔡磊;潘华贤;;核向量机在大规模机器学习中的应用[A];第十一届中国青年信息与管理学者大会论文集[C];2009年
10 张钹;张铃;;统计学习理论及其应用[A];2001年中国智能自动化会议论文集(上册)[C];2001年
相关重要报纸文章 前10条
1 黎骊/文 [美] Tom M.Mitchell 著;机器学习与智能化社会[N];中国邮政报;2003年
2 IBM大数据专家 James Kobielus 范范 编译;机器学习已成为大数据基石[N];网络世界;2014年
3 本报记者 房琳琳;合久必分:分布式“机器学习”应运而生[N];科技日报;2014年
4 雨辰;机器学习类图书为什么火爆[N];中华读书报;2014年
5 百度公司技术副总监 多媒体部负责人 余凯;深度学习与多媒体搜索技术演进[N];中国信息化周报;2013年
6 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年
7 本报记者 张晔邋通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
8 记者 彭德倩;机器学习精度提升近6个百分点[N];解放日报;2006年
9 本报记者 闵杰;大数据热 高端人才缺[N];中国电子报;2013年
10 沈建苗 编译;如何成为大数据科学家[N];计算机世界;2013年
相关博士学位论文 前10条
1 董春茹;机器学习中的权重学习与差分演化[D];华南理工大学;2015年
2 姚明臣;机器学习和神经网络学习中的若干问题研究[D];大连理工大学;2016年
3 赵玉鹏;机器学习的哲学探索[D];大连理工大学;2010年
4 胡巍;面向格结构的机器学习[D];上海交通大学;2009年
5 张义荣;基于机器学习的入侵检测技术研究[D];国防科学技术大学;2005年
6 钱线;快速精确的结构化机器学习方法研究[D];复旦大学;2010年
7 梁锡军;稀疏优化在机器学习中的若干应用[D];大连理工大学;2013年
8 蒋刚;核机器学习方法若干问题研究[D];西南交通大学;2006年
9 陈慧灵;面向智能决策问题的机器学习方法研究[D];吉林大学;2012年
10 周伟达;核机器学习方法研究[D];西安电子科技大学;2003年
相关硕士学位论文 前10条
1 毛海斌;基于半监督机器学习的情感分类领域适应问题研究[D];南京理工大学;2015年
2 安军辉;基于微博数据的微博用户性别判断研究[D];华中师范大学;2015年
3 陈召阳;基于机器学习的改性麦槽吸附重金属构效关系模型研究[D];江西理工大学;2014年
4 王成;基于半监督机器学习的文本情感分析技术[D];南京理工大学;2015年
5 孙科;基于Spark的机器学习应用框架研究与实现[D];上海交通大学;2015年
6 刘江龙;基于机器学习的射频指纹定位方法研究[D];电子科技大学;2015年
7 张蕾;基于机器学习的网络舆情采集技术研究与设计[D];电子科技大学;2014年
8 施宇;基于数据挖掘和机器学习的木马检测系统设计与实现[D];电子科技大学;2014年
9 施应敏;基于机器学习的Femtocell信道频谱与功率资源分配算法的研究[D];南京邮电大学;2015年
10 张柯;基于机器学习的错误定位方法研究[D];南京航空航天大学;2015年
,本文编号:1408574
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1408574.html