基于深度学习的汉语复句层次结构分析方法的应用研究

发布时间:2023-01-25 19:07
  自然语言处理的一个重要分支——中文信息处理,在语义理解、文本生成等众多方面作用突出,而复句又作为汉语语法的重要实体单位,其在语义表达上复杂多样,因此,具有很高的研究价值和意义。一方面,它由单句构成能表达出非常丰富的语义信息;另一方面,也包含了单句间的逻辑语义层次结构关系,对于段落篇章分析意义重大。复句研究目前主要包括分句划分,关系词识别,关系类别判断,以及层次结构分析等。鉴于关系词对复句层次结构识别存在直接影响,因此能够有效准确地识别出关系词十分重要,但由于关系词本身离析度不同,及存在大量缺标或无标复句,使得提取准确率不超过76.3%[1]。因此,就需要从句法、语义、及交叉特征等多角度来综合分析复句层次结构关系。本文主要围绕基于改进的卷积神经网络方法并采用多维度特征融合的策略对复句层次结构进行分析识别。研究工作主要包括三部分,首先,对复句进行准确分句划分,通过分析复句依存句法,提取出基于谓词核心的句法特征,包括句内谓核依存复现分布和句间依存关系分布;然后,鉴于分句间语义关联程度是决定层次结构划分的重要因素,利用中文维基百科语料训练句向量Doc2Vec模型,提取基于句向量的语义特征,及句... 

【文章页数】:72 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 论文目标与内容
    1.4 研究难点与创新
    1.5 论文组织与结构
第二章 汉语复句及神经网络的相关概述
    2.1 依存句法与语义角色标注
        2.1.1 依存句法
        2.1.2 语义角色标注
    2.2 复句内分句划分及层次结构概述
    2.3 神经网络模型与常用深度学习框架
        2.3.1 神经元
        2.3.2 激活函数
    2.4 常用深度学习框架
    2.5 本章小结
第三章 基于依存句法的浅层特征提取
    3.1 基于标点符号和依存句法的复句内分句的划分
        3.1.1 标点符号对分句划分的影响
        3.1.2 句法依存关系对分句划分的影响
        3.1.3 基于规则的伪分句过滤
    3.2 浅层句法特征提取
        3.2.1 基于谓词核心的关联特征提取
        3.2.2 关联特征提取算法
    3.3 本章小结
第四章 复句内基于语义的深层特征挖掘
    4.1 词语及句子的分布式表示
        4.1.1 离散独热编码
        4.1.2 关键词提取与词向量
        4.1.3 文档向量Doc2Vec
    4.2 深层语义特征提取
        4.2.1 基于句向量的语义特征提取
        4.2.2 语义计算特征提取算法
    4.3 交叉抽象特征提取
        4.3.1 基于Word2Vec与TextRank的关键词计算
        4.3.2 交叉特征提取算法
    4.4 本章小结
第五章 基于改进的卷积神经网络的复句层次结构分析
    5.1 基于机器学习与深度学习的复句层次结构分析
        5.1.1 机器学习算法介绍
        5.1.2 卷积神经网络算法介绍
    5.2 三句式复句层次结构分析的自动化框架
    5.3 实验数据与结果分析
    5.4 本章小结
第六章 总结与展望
    6.1 总结
    6.2 展望
参考文献
攻读硕士期间参加的科研项目和发表的论文
致谢


【参考文献】:
期刊论文
[1]汉语复句三分法与对外汉语教学浅谈[J]. 赵舸.  邢台学院学报. 2014(02)
[2]中文篇章级句间语义关系识别[J]. 张牧宇,宋原,秦兵,刘挺.  中文信息学报. 2013(06)
[3]现代汉语语义角色研究述评[J]. 段潇雪.  文教资料. 2012(27)
[4]汉语句法分析研究综述[J]. 郑伟发.  信息技术. 2012(07)
[5]面向移进—归约句法分析器的单模型系统整合算法[J]. 马骥,朱慕华,肖桐,朱靖波.  中文信息学报. 2012(03)
[6]关联词搭配的自动发现[J]. 姚双云,胡金柱,肖升,沈威.  计算机应用研究. 2011(12)
[7]基于主谓语知识挖掘的分句语义关联研究[J]. 吴锋文.  语言文字应用. 2011(04)
[8]基于关系标记的汉语复句分类研究[J]. 吴锋文.  汉语学报. 2011(03)
[9]基于规则的汉语复句层次关系自动识别研究[J]. 吴锋文,胡金柱,肖明,肖升,舒江波.  华文教学与研究. 2010(01)
[10]汉语复句关系词库的建设及其利用[J]. 胡金柱,吴锋文,李琼,舒江波.  语言科学. 2010(02)

博士论文
[1]面向中文信息处理的复句关系词自动标识研究[D]. 舒江波.华中师范大学 2011

硕士论文
[1]面向中文信息处理的汉语复句中书读短语的自动识别研究[D]. 俞小娟.华中师范大学 2008



本文编号:3731691

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3731691.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9c1da***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com