基于知识库的词表示学习方法研究
发布时间:2025-01-06 06:08
自然语言处理是人工智能领域的重要研究方向,词表示作为自然语言处理工作中的基础工具也越来越成为研究的热点之一。目前流行的词表示学习的方法主要遵循分布假说。基于这项假说的分布语义模型多依赖于大规模的文本语料库,这也给词表示在准确性上造成了局限性。一方面研究表明,针对专门领域的语料库训练出来的词表示在一些特定任务中表现的效果更好,另一方面也表明语料库越大,训练出来的词表示效果越好。那么如何解决因语料库规模增大而导致领域混杂所带来的损失是本文研究的重点和难点。针对以上问题,本文提出使用知识库来增强词表示能力。鉴于知识库提供了词汇项之间精确的语义关系,利用这一特征恰好来弥补大规模语料库中目标单词上下文之间领域模糊问题。一方面,本文将知识库提供的词汇项关系作为一种“精确”的上下文加入到目前流行的分布语义模型中,另一方面,相较于前者知识库作为一个整体加入训练,针对知识库关键词之间的强弱关系特征,再次使用知识库来加权调节目标单词的词表示,进一步提升词表示质量。最后,针对知识库提供的大量词关系对,对于一词多义的目标单词,在其众多词关系对中加入聚类算法从而分类训练出一词多义的词表示。实验结果中,针对训练出的...
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
本文编号:4023909
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
图2-1神经语言网络模型??
?天津大学硕士学位论文???2.1.2基于神经网络的词表示模型的研究现状??在基于神经网络的模型中,图2-1中神经网络语會模型是具有代表性的模型,??Bengio[2Q]等人提出的该模型使用了语言模型来对目标单词和上下文进行建模,构??建了全连接的神经网络来训练模型,该网络将词的....
图2-3?WordNet实体词义Jfe联关系??
?\?part?of?a?plant?.?\?mdependftly?/??/?organism?lacking?\??the?power?of?|??^\?locomotion?/?^??(biology?that?\?-?乂?plants?grrn^??^?j.?t?A?I?....
图2-5目标单词ConceptNet部分关系7K例图m??2.2.2
?第2章相关研宄综述???withapurpose[33]”项目中抽取的常识如识零、通过这些资源的组合,ConceptNet??包含超过2100万条边和超过800万个节点。其英语词汇表包含大约1,500,000个??节点,并且有83种语言,其中包含至少10,000个节点。Conc....
图2-6词义表tk问题的实例描述??
?of?locomotion)?^?LI」」?1—L????plant?(an?actor?situated?in?the?audience?whose?acting?is?plant#3??rehearsed?but?seems?spontaneous?to?the?audie....
本文编号:4023909
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/4023909.html