借重于人工知识库的词和义项的向量表示:以HowNet为例
发布时间:2017-10-31 09:33
本文关键词:借重于人工知识库的词和义项的向量表示:以HowNet为例
更多相关文章: 词向量 义项向量 义原向量 HowNet 神经网络语言模型
【摘要】:该文旨在以HowNet为例,探讨在表示学习模型中引入人工知识库的必要性和有效性。目前词向量多是通过构造神经网络模型,在大规模语料库上无监督训练得到,但这种框架面临两个问题:一是低频词的词向量质量难以保证;二是多义词的义项向量无法获得。该文提出了融合HowNet和大规模语料库的义原向量学习神经网络模型,并以义原向量为桥梁,自动得到义项向量及完善词向量。初步的实验结果表明该模型能有效提升在词相似度和词义消歧任务上的性能,有助于低频词和多义词的处理。作者指出,借重于人工知识库的神经网络语言模型应该成为今后一段时期自然语言处理的研究重点之一。
【作者单位】: 清华大学计算机科学与技术系清华信息科学技术国家实验室清华大学智能技术与系统国家重点实验室;首都师范大学北京市成像技术高精尖创新中心;
【关键词】: 词向量 义项向量 义原向量 HowNet 神经网络语言模型
【基金】:国家社会科学基金(13&ZD190) 国家自然科学基金(61133012)
【分类号】:TP391.1
【正文快照】: 1引言词向量表示旨在学习词的低维实数向量表示,是自然语言处理的重要任务之一。训练得到的词向量可直接用于计算两个词之间的语义相关性,同时可作为特征广泛应用于诸多后续的自然语言处理任务中,如信息检索、语言模型、词义消歧、词义组合和命名实体识别等。目前的词向量一般
【相似文献】
中国期刊全文数据库 前10条
1 刘亚清;于纯妍;张瑾;;改进的基于义原同现频率的汉语词义排歧方法[J];计算机工程与科学;2006年12期
2 张振幸;李金厚;;一种基于义原重合度的词语相似度计算[J];信阳师范学院学报(自然科学版);2010年02期
3 刘亚清;张瑾;于纯妍;;基于义原同现频率的汉语词义排歧系统[J];计算机技术与发展;2006年05期
4 袁晓峰;;《知网》义原相似度计算的研究[J];辽宁大学学报(自然科学版);2011年04期
5 肖志军;冯广丽;;基于《知网》义原空间的文本相似度计算[J];科学技术与工程;2013年29期
6 郭充;张仰森;;基于《知网》义原搭配的中文文本语义级自动查错研究[J];计算机工程与设计;2010年17期
7 张瑾;刘亚清;于纯妍;;汉语词义排歧的另一种方法[J];小型微型计算机系统;2006年04期
8 郭志兵;黄广君;卢朝华;;一种改进的词义排歧算法[J];计算机工程与应用;2010年19期
9 柳玉;贲可荣;马U,
本文编号:1121790
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1121790.html