跨语言商品知识图谱的构建与对齐研究

发布时间:2021-05-20 09:57
  随着电子商务在全球市场不断进行开拓,其中商品知识图谱承担了重要的角色,被广泛应用于平台治理、品牌运营、前端导购等核心业务。由于电商领域存在商品类型繁多、属性体系庞大等特性,商品知识图谱与通用知识图谱存在一定的差异。因此,本文主要研究基于商品属性的商品图谱构建,以及不同语言的商品图谱进行对齐与融合。基于属性的商品图谱主要描述了商品的属性及属性值信息。早期的研究工作采用基于规则的方法,由专家设计领域相关的词汇表来提取商品的属性信息,或者将属性值提取任务视为一种特殊的命名实体识别,但都无法应用于属性体系庞大的真实电商环境。因此,本文的第一个研究工作提出基于属性增强的属性值抽取模型,不仅将属性视作标签类型,同时建模其语义信息,从而能够处理上万级别的属性,甚至是模型从未见过的新属性。同时,本文构建了真实的大规模英文商品数据集,并基于此构建了英文商品知识图谱。电商全球化的版图中包含了很多小语种,这些小语种由于使用人数少、商品数量有限等原因,缺乏相应的标注数据来训练有效的属性值抽取模型,难以构建低资源语言商品图谱。因此,本文的第二个研究工作提出对抗多任务学习模型,利用高资源语言丰富的标注数据来帮助低... 

【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校

【文章页数】:80 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 研究背景与意义
    1.2 相关研究工作
        1.2.1 商品图谱的构建
        1.2.2 多任务学习
        1.2.3 实体对齐
    1.3 本文研究内容
    1.4 本文组织结构
第二章 相关概念
    2.1 多语言商品数据集
    2.2 深度学习知识
        2.2.1 词向量
        2.2.2 最新的语言模型BERT
        2.2.3 跨语言词向量
        2.2.4 循环神经网络
        2.2.5 图神经网络
    2.3 系统评估指标
    2.4 本章小结
第三章 基于属性抽取的商品图谱构建
    3.1 研究动机
    3.2 基于属性增强的属性值抽取模型
    3.3 数据集及实验设置
        3.3.1 数据集
        3.3.2 评估标准
        3.3.3 基准系统
        3.3.4 参数设置
    3.4 实验结果及分析
        3.4.1 在高频属性上的结果
        3.4.2 在所有属性上的结果
        3.4.3 针对新属性的结果
        3.4.4 可视化分析
    3.5 在真实电商领域中的应用
        3.5.1 属性分类模型
        3.5.2 数据集与实验设置
        3.5.3 实验结果及分析
    3.6 本章小结
第四章 低资源语言商品图谱构建
    4.1 研究动机
    4.2 对抗多任务模型
    4.3 数据集及实验设置
        4.3.1 数据集
        4.3.2 实验设置
        4.3.3 基准系统
    4.4 实验结果和分析
        4.4.1 和基准系统的比较
        4.4.2 超参数的影响
    4.5 本章小结
第五章 跨语言商品图谱对齐
    5.1 研究动机
    5.2 属性信息强化的实体对齐模型
    5.3 数据集及实验设置
        5.3.1 数据集
        5.3.2 实验设置
        5.3.3 基准系统
    5.4 实验结果及分析
        5.4.1 与基准系统的性能比较
        5.4.2 不同模块的性能比较
    5.5 本章小结
第六章 总结与展望
    6.1 本文总结
    6.2 未来的工作
攻读学位期间发表的学术论文以及学术成果
参考文献
致谢


【参考文献】:
期刊论文
[1]基于电商数据的产品知识图谱构建研究[J]. 丁晟春,侯琳琳,王颖.  数据分析与知识发现. 2019(03)
[2]基于Choquet积分的HMM商品信息抽取方法[J]. 邓斌,邵培基,夏国恩.  系统工程. 2008(12)

硕士论文
[1]多语言文本语义相似度的计算及其应用研究[D]. 田俊峰.华东师范大学 2018



本文编号:3197559

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3197559.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3db02***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com