有说服力的产品描述生成

发布时间:2024-06-05 23:45
  随着计算机技术的快速发展,人们在努力使机器变得更加人性化,因此,本文研究如何让机器智能地生成有说服力的自然语言描述的问题,该描述既要传达产品信息,又要提供与用户需求相关的解释。这个问题可能会受益于当前大量关于端到端深度神经网络的研究工作。然而,深度神经网络的成功归功于海量训练数据的支撑,我们无法获取大规模的具有说服力的文本描述,因此,缺乏标记数据和主观判断对训练这样一个模型提出了严峻挑战。针对以上问题,我们将系统分为两部分,第一部分是弱监督框架,通过分析外部数据源中有说服力文本包含的修辞手法,词汇特征与语法特征,我们编写了一组具有高覆盖率和低准确度的规则,弱监督框架依据这些规则给未标注数据进行自动标注,生成带概率标签的训练数据,从而取得后续深度模型的训练数据,这是数据层面的解决方案。第二部分是生成模型框架,为了加强用户消费场景与产品属性之间的关联,我们探索基于知识图谱的表征方式,以整合从异质信息源获得的知识,这是知识层面的解决方案。在模型层面,我们设计了编码器-解码器的框架,在编码层,我们提出了 Global-Local模块来克服弱监督问题和场景和商品之间的依赖性,在解码层,我们增加了...

【文章页数】:74 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景和研究目的
    1.2 国内外研究动态
    1.3 本文工作
    1.4 本文组织架构
第二章 相关理论和技术
    2.1 神经网络模型
        2.1.1 深度神经网络
        2.1.2 循环神经网络
        2.1.3 卷积神经网络
    2.2 Sequence-to-sequence模型
        2.2.1 Encoder-Decoder模型
        2.2.2 注意力机制
        2.2.3 Transformer模型
    2.3 弱监督学习
        2.3.1 不完全监督
        2.3.2 不确切监督
        2.3.3 不准确监督
        2.3.4 Snorkel系统
    2.4 文本生成评估指标
        2.4.1 Edmundson指标
        2.4.2 ROUGE指标
        2.4.3 BLEU指标
    2.5 本章小结
第三章 弱监督框架
    3.1 问题定义
    3.2 数据获取
    3.3 启发式
    3.4 标注数据过程
    3.5 本章小结
第四章 通过兴趣相关性加载描述
    4.1 问题定义
    4.2 系统结构
    4.3 知识图谱表示
    4.4 Global-Local机制
    4.5 Copy机制
        4.5.1 生成模式
        4.5.2 复制模式
    4.6 本章小结
第五章 实验部分
    5.1 弱监督实验
        5.1.1 实验数据
        5.1.2 标注数据过程
        5.1.3 训练语料库
    5.2 产品描述生成实验
        5.2.1 实验设置
        5.2.2 比较方法
        5.2.3 评估指标
        5.2.4 弱监督效果
        5.2.5 文本生成质量
    5.3 本章小结
第六章 总结与展望
    6.1 总结
    6.2 展望
参考文献
攻读硕士学位期间发表的论文
致谢



本文编号:3989983

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3989983.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2ccef***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com