当前位置:主页 > 科技论文 > 软件论文 >

基于词向量聚类的中文微博产品命名实体识别

发布时间:2018-04-22 08:13

  本文选题:中文微博 + 命名实体 ; 参考:《兰州理工大学学报》2017年01期


【摘要】:随着微博等社交平台的兴起,如何针对微博数据进行产品命名实体识别成为了自然语言处理领域研究的热点之一,也是实现舆情监督和商业智能的基础.传统的命名实体识别技术没有考虑中文微博口语化、不规范等特点,且忽略了深层语义对命名实体识别的重要作用.因此,考虑中文微博的特殊性,提出一种融合全局上下文信息的词向量特征选择方法,分别采用主题模型和神经网络词向量聚类两种方法获取深层语义信息,并结合层叠条件随机场进行中文微博的命名实体识别.实验结果表明,基于词向量聚类的中文微博产品命名实体识别方法取得了较好的效果.
[Abstract]:With the rise of social platforms such as micro-blog, how to identify product named entity recognition against micro-blog data has become one of the hotspots in the field of research in the field of Natural Language Processing. It is also the basis for the realization of public opinion supervision and business intelligence. The traditional named entity recognition technology does not take into account the characteristics of the colloquial and nonstandard Chinese micro-blog, and neglects the deep level. Semantics is important for naming entity recognition. Therefore, considering the particularity of Chinese micro-blog, a word vector feature selection method is proposed, which combines the two methods of topic model and neural network word vector clustering to obtain the deep semantic information, and the name of the Chinese micro-blog is named after the cascading condition. Experimental results show that the Chinese micro-blog product named entity recognition method based on word vector clustering has achieved good results.

【作者单位】: 石家庄职业技术学院;
【基金】:国家自然科学基金(61100009) 河北省科学研究计划项目(Z2014181) 河北省科技支撑计划(13210345)
【分类号】:TP391.1

【参考文献】

相关期刊论文 前8条

1 燕杨;文敦伟;王云吉;王珂;;基于层叠条件随机场的中文病历命名实体识别[J];吉林大学学报(工学版);2014年06期

2 张朝胜;郭剑毅;线岩团;余正涛;雷春雅;王海雄;;基于条件随机场的英文产品命名实体识别[J];计算机工程与科学;2010年06期

3 梅丰;孙承杰;孙珂;程明波;林磊;;面向网络文本的中文产品命名实体识别[J];郑州大学学报(理学版);2010年01期

4 郭剑毅;薛征山;余正涛;张志坤;张宜浩;姚贤明;;基于层叠条件随机场的旅游领域命名实体识别[J];中文信息学报;2009年05期

5 冯元勇;孙乐;李文波;张大鲲;;基于单字提示特征的中文命名实体识别快速算法[J];中文信息学报;2008年01期

6 张永;陈思睿;杨志勇;贾桂霞;;特征选择方法的研究和改进[J];兰州理工大学学报;2006年05期

7 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期

8 刘非凡;赵军;吕碧波;徐波;于浩;夏迎炬;;面向商务信息抽取的产品命名实体识别研究[J];中文信息学报;2006年01期

【共引文献】

相关期刊论文 前10条

1 朱丹浩;杨蕾;王东波;;基于深度学习的中文机构名识别研究——一种汉字级别的循环神经网络方法[J];现代图书情报技术;2016年12期

2 韩戟;何成浩;苏星;施成云;刘东映;;一种基于SVM的电力行业物资需求预测方法[J];电气技术;2016年12期

3 万业号;刘利军;黄青松;;基于层叠条件随机场的中文医疗机构名识别[J];济南大学学报(自然科学版);2017年01期

4 孙丽霞;;基于查询日志的消费意图挖掘分析[J];电子制作;2016年20期

5 王艺帆;王希杰;;基于双层条件随机场的汉语词性标注方法研究[J];安阳师范学院学报;2016年05期

6 丁晟春;吴婧婵媛;李霄;;基于CRFs和领域本体的中文微博评价对象抽取研究[J];中文信息学报;2016年04期

7 包亮;张莉;许鑫;;苏州园林网络评论意见挖掘研究[J];微型机与应用;2016年13期

8 张晓勇;章成志;周清清;;基于电商产品评论的产品概念层次体系自动构建研究[J];情报理论与实践;2016年06期

9 郑秋生;刘守喜;;基于CRF的互联网文本命名实体识别研究[J];中原工学院学报;2016年01期

10 程露红;黄浩;马平;;基于条件随机场的稳健口语理解研究[J];新疆大学学报(自然科学版);2016年01期

【二级参考文献】

相关期刊论文 前10条

1 郑强;刘齐军;王正华;朱云平;;生物医学命名实体识别的研究与进展[J];计算机应用研究;2010年03期

2 赵军;;命名实体识别、排歧和跨语言关联[J];中文信息学报;2009年02期

3 宗萍;施水才;王涛;吕学强;;基于条件随机场的英文地理行政实体识别[J];现代图书情报技术;2009年02期

4 冯元勇;孙乐;李文波;张大鲲;;基于单字提示特征的中文命名实体识别快速算法[J];中文信息学报;2008年01期

5 陈锦;常致全;许军;;基于HMM的生物医学命名实体的识别与分类[J];计算机时代;2006年10期

6 李中国;刘颖;;边界模板和局部统计相结合的中国人名识别[J];中文信息学报;2006年05期

7 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期

8 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[J];通信学报;2006年02期

9 刘非凡;赵军;吕碧波;徐波;于浩;夏迎炬;;面向商务信息抽取的产品命名实体识别研究[J];中文信息学报;2006年01期

10 卢娇丽,郑家恒;基于粗糙集的文本分类方法研究[J];中文信息学报;2005年02期

【相似文献】

相关期刊论文 前10条

1 张晓艳;王挺;陈火旺;;命名实体识别研究[J];计算机科学;2005年04期

2 邱莎;;几种基于机器学习的生物命名实体识别模型比较[J];电脑知识与技术(学术交流);2007年05期

3 赵军;;命名实体识别、排歧和跨语言关联[J];中文信息学报;2009年02期

4 郑强;刘齐军;王正华;朱云平;;生物医学命名实体识别的研究与进展[J];计算机应用研究;2010年03期

5 张向U,

本文编号:1786325


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1786325.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d2f3e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com