基于深度学习的跨领域跨语言知识获取

发布时间:2021-03-29 19:12
  随着互联网上信息的生产与积累,如何从大量纯文本中获取高质量的结构化知识,是目前自然语言处理的研究热点。通用领域的知识注重广度,在搜索引擎的查询理解、智能问答的推理等领域已经有广泛应用。然而,由于长尾效应的影响,通用知识在特定领域的覆盖度往往严重不足,因此近年来学术界和工业界的研究兴趣逐渐转向垂直领域。领域知识获取有诸多挑战,一方面领域知识上下文的稀疏性导致传统基于模式的抽取方法准确率较低,另一方面不同领域之间的差异性导致在某个领域学到的知识无法有效迁移到其他领域上。此外,领域知识的跨语言迁移也是目前的研究热点。本文利用深度学习的技术,针对跨领域和跨语言的知识获取,做了如下三方面的工作:·单一领域的探索式关系分类 我们提出了探索式神经网络关系分类的模型,用于解决领域知识抽取中长尾关系无法被完整定义的问题。该模型一方面学习在预定义关系上的神经网络分类器,另一方面通过相似度敏感的中餐馆过程算法,在未标注数据中发现新的关系种类,持续扩充预定义的关系集。该算法在维基百科的领域知识图谱上有较高的分类准确率,同时能够发现高质量的新关系。·跨领域的知识体系抽取 针对不同领域之间的知识迁移,我们分别提出... 

【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校

【文章页数】:100 页

【学位级别】:硕士

【部分图文】:

基于深度学习的跨领域跨语言知识获取


“支持向量机”在维基百科中的主页分信息对于判断两者之间的依赖关系有很的帮助

【参考文献】:
期刊论文
[1]基于非平行语料的双语词典构建[J]. 张檬,刘洋,孙茂松.  中国科学:信息科学. 2018(05)
[2]基于词向量与可比语料库的双语词典提取研究[J]. 柳路芳,李波,陈鹏,周凌寒,王兵.  计算机工程与科学. 2018(02)
[3]基于点关联测度矩阵分解的中英跨语言词嵌入方法[J]. 于东,赵艳,韦林煊,荀恩东.  中文信息学报. 2017(01)
[4]知识图谱构建技术综述[J]. 刘峤,李杨,段宏,刘瑶,秦志光.  计算机研究与发展. 2016(03)
[5]迁移学习研究进展[J]. 庄福振,罗平,何清,史忠植.  软件学报. 2015(01)
[6]基于核函数中文关系自动抽取系统的实现[J]. 刘克彬,李芳,刘磊,韩颖.  计算机研究与发展. 2007(08)
[7]中文实体关系抽取中的特征选择研究[J]. 董静,孙乐,冯元勇,黄瑞红.  中文信息学报. 2007(04)
[8]实体关系自动抽取[J]. 车万翔,刘挺,李生.  中文信息学报. 2005(02)



本文编号:3108045

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3108045.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户70825***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com