航空公司微博评论的意见信息抽取研究——以国航、南航和东航为例
本文选题:意见信息 + 条件随机场 ; 参考:《系统科学与数学》2017年04期
【摘要】:如今越来越多的乘客选择乘坐舒适快捷的飞机出行,中国航空运输需求因此逐年增长,航空公司在获得更多盈利空间的同时也面临激烈的竞争.对航空公司的用户评论进行意见信息抽取,不仅可用于航空公司改进服务质量和用户体验,还可为用户选择满意的航空公司提供参考.文章首次以新浪微博平台上航空公司的用户评论为基础数据,利用条件随机场进行意见信息抽取.在有关研究中,专家学者大多凭借以往知识的了解对特征对象和特征词进行人工标注,鲜少分析用户在本评论语料中的关注点.因此,文章创新性地在人工标注前首先利用TF-IDF算法进行关键词提取,找到本评论语料中用户的关注点,最后以超过93%的F平均值证明模型的有效性,为后续的研究提供了新方向.
[Abstract]:Nowadays, more and more passengers choose to travel by comfortable and fast air. As a result, the demand for air transportation in China is increasing year by year, and airlines are facing fierce competition while gaining more profit space. It can not only be used to improve the service quality and user experience of airlines, but also provide reference for users to select satisfactory airlines. Based on the comments of airline users on Sina Weibo platform for the first time, the paper uses conditional random field to extract opinion information. In the relevant studies, most experts and scholars rely on the knowledge of the past to manually annotate feature objects and feature words, and rarely analyze the concerns of users in this review corpus. Therefore, this paper innovatively uses TF-IDF algorithm to extract keywords before manual annotation, finds the user's concerns in this review corpus, and finally proves the validity of the model with more than 93% F average. It provides a new direction for further research.
【作者单位】: 东北财经大学统计学院;辽宁大学亚澳商学院;
【基金】:国家社科基金重大项目(13&ZD171) 辽宁省教育厅科学研究项目(LN2016YB026) 东北财经大学研究生教学改革研究项目(yjyb201634)资助课题
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 罗亮;邵泽辉;;基于条件随机场进行蛋白质二级结构预测[J];计算机应用研究;2009年03期
2 宗萍;施水才;王涛;吕学强;;基于条件随机场的英文地理行政实体识别[J];现代图书情报技术;2009年02期
3 张开旭;夏云庆;宇航;;基于条件随机场的古汉语自动断句与标点方法[J];清华大学学报(自然科学版);2009年10期
4 成姣;蔡东风;季铎;;基于条件随机场的日语依存分析[J];沈阳航空工业学院学报;2010年05期
5 李玲玲;金泰松;李翠华;;基于局部特征和隐条件随机场的场景分类方法[J];北京理工大学学报;2012年07期
6 宁伟;蔡东风;张桂平;季铎;苗雪雷;;基于条件随机场的冠词选择研究[J];中文信息学报;2008年06期
7 张玉芳;莫凌琳;熊忠阳;耿晓斐;;基于条件随机场的科研论文信息分层抽取[J];计算机应用研究;2009年10期
8 王昌厚;;基于条件随机场的中文命名体识别[J];福建电脑;2012年02期
9 施水才;王锴;韩艳铧;吕学强;;基于条件随机场的领域术语识别研究[J];计算机工程与应用;2013年10期
10 王东波;陈小荷;年洪东;;基于条件随机场的有标记联合结构自动识别[J];中文信息学报;2008年06期
相关会议论文 前4条
1 王东波;陈小荷;年洪东;;基于条件随机场的有标记联合结构自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 张奇;翁富良;黄萱菁;吴立德;;英文口语中非流利区域的检测[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 魏玮;杜金华;徐波;;基于分层语块分析的统计翻译研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 王根;赵军;;基于多重冗余标记CRF的句子情感分析研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
相关重要报纸文章 前7条
1 本报记者 朱小兵;国航:信息安全180度大转弯[N];计算机世界;2009年
2 本报记者 吴玉征;国航:信息化创新竞争力[N];计算机世界;2009年
3 本报记者 汤铭;中国航信部署开放系统[N];计算机世界;2010年
4 本报记者 宋家雨;“银翼”下的IT发动机[N];网络世界;2006年
5 本报记者 宋家雨;为飞行中的飞机更换发动机[N];网络世界;2009年
6 国航信息管理部 王洪伟;近观国航IT建设四大转变[N];计算机世界;2010年
7 本报记者 程鸿;安全飞行的奥秘[N];计算机世界;2000年
相关硕士学位论文 前10条
1 赵九洋;图像中行人检测关键技术研究[D];南京大学;2015年
2 宁振;基于层叠条件随机场的情感分析[D];南昌大学;2015年
3 杨献祥;面向中文微博的产品名实体识别与规范化算法设计与实现[D];北京理工大学;2015年
4 肖s,
本文编号:1797666
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1797666.html