网络用语词典的构建及问题分析
本文关键词:网络用语词典的构建及问题分析
【摘要】:随着互联网应用的快速发展,网络用语的使用越来越普遍,网络新词层出不穷。网络文本中大量的网络用语,对基于自然语言处理的情感分析、产品推荐、问答系统等应用带来了一定的挑战,而收集并构建网络用语词典及相关语料则是解决此类问题的突破点。该文以微博语料为出发点,综合多类网络资源,收集并整理了较为全面的网络用语词典及相关语料。同时,对网络用语词典构建中遇到的问题进行了分析和总结,并对其潜在应用进行了初步的探讨。
【作者单位】: 郑州大学信息工程学院;北京大学计算语言学研究所;
【关键词】: 网络用语 词典构建 标注
【基金】:国家重点基础研究发展计划973课题(2014CB340504) 国家自然科学基金(61402419) 国家社会科学基金(14BYY096) 河南省科技厅基础研究项目(142300410231;142300410308) 河南省教育厅科学技术研究重点项目(13B520381;15A520098)
【分类号】:TP391.1
【正文快照】: 1引言网络用语是互联网上信息传播和交流的一种语言[1]。伴随着互联网的快速发展,网民产生了大量的数据,其中文本数据占据了很大的比重,微博、网络媒体、贴吧、博客、论坛等应用产生的数据尤其惊人。自然语言处理技术在情感分析、产品推荐、问答系统等领域得到了广泛应用,针对
【参考文献】
中国期刊全文数据库 前10条
1 石金铭;昝红英;韩英杰;;大规模汉语词汇语义知识库的构建[J];山西大学学报(自然科学版);2015年04期
2 张坤丽;昝红英;柴玉梅;韩英杰;赵丹;;现代汉语虚词用法知识库建设综述[J];中文信息学报;2015年03期
3 王文远;王大玲;冯时;李任斐;王琳;;一种面向情感分析的微博表情情感词典构建及应用[J];计算机与数字工程;2012年11期
4 韩忠明;张玉沙;张慧;万月亮;黄今慧;;有效的中文微博短文本倾向性分类算法[J];计算机应用与软件;2012年10期
5 谢丽星;周明;孙茂松;;基于层次结构的多策略中文微博情感分析和特征抽取[J];中文信息学报;2012年01期
6 魏椺;向阳;陈千;;中文文本情感分析综述[J];计算机应用;2011年12期
7 侯敏;;2010年度新词语解读[J];语言文字应用;2011年04期
8 俞士汶;穗志方;朱学锋;;综合型语言知识库及其前景[J];中文信息学报;2011年06期
9 张曼;;微博新词新语探析[J];学理论;2011年23期
10 贾玉祥;黄德智;刘武;俞士汶;;中文语音合成中的文本正则化研究[J];中文信息学报;2008年05期
【共引文献】
中国期刊全文数据库 前10条
1 易善君;李君轶;李秀琴;刘芳菲;;基于微博大数据的空气质量与居民情感相关性对比研究——以西安市和上海市为例[J];干旱区资源与环境;2017年05期
2 张敏;夏宇;刘晓彤;;重大医疗伤害事件网络舆情能量传播过程分析——以“魏则西事件”为例[J];情报杂志;2016年12期
3 朱梦s,
本文编号:979953
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/979953.html