面向音乐领域的信息抽取技术研究
发布时间:2021-11-07 01:21
近年来,网络上音乐数量不断增加,相应的音乐信息也飞速增长,人们对于快速准确的获取音乐信息的需求越来越迫切。因此,面向音乐领域的信息抽取具有一定研究意义,其主要研究内容是从自然语言文本描述的音乐信息中进行命名实体识别和关系抽取。音乐领域的信息抽取是音乐知识图谱自动构建的首要步骤,可广泛应用于音乐领域的信息检索、推荐系统、问答系统和对话系统等研究。本文首先定义了需要抽取的音乐实体类型和关系类别,构建了音乐领域的标注语料,然后在此基础上,对音乐实体识别和关系抽取相关技术进行了深入研究。针对音乐领域的命名实体识别任务,本文首先设计实现了基于字符特征的BLSTM-CRF模型作为基准,然后分别采用三种预训练的字符向量改进基准模型的嵌入层:1.使用Word2vec模型训练静态字向量2.使用Flair框架的双向循环神经网络语言模型训练动态字向量3.使用Google官方提供的中文动态字向量BERT-Base-Chinese前两种字向量均由本文使用对应模型在音乐领域的未标注语料上训练得到,第三种字向量为Google使用BERT模型训练的中文字向量。实验结果表明,三种改进后的模型相比基准模型的识别效果在宏平...
【文章来源】: 华南理工大学广东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:77 页
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 国内外相关研究现状
1.2.1 实体识别
1.2.2 关系抽取
1.2.3 实体关系联合抽取
1.2.4 音乐领域的信息抽取
1.3 研究内容
1.4 论文的组织结构
第二章 相关理论和技术
2.1 词向量
2.1.1 语言模型
2.1.2 静态词向量
2.1.3 动态词向量
2.2 条件随机场
2.3 循环神经网络
2.3.1 RNN
2.3.2 长短时记忆单元
2.4 注意力机制
2.4.1 基本的注意力机制
2.4.2 自注意力机制
2.4.3 多头注意力机制
2.5 本章小结
第三章 语料说明
3.1 语料来源
3.2 实体识别数据集说明
3.2.1 实体类型及数据集分布
3.2.2 实体识别的标签体系
3.3 关系抽取数据集说明
3.4 评价指标
3.5 本章小结
第四章 音乐命名实体识别
4.1 BLSTM-CRF基准模型
4.1.1 输入层
4.1.2 嵌入层
4.1.3 BLSTM编码层
4.1.4 CRF输出层
4.2 改进的嵌入层
4.3 实验对比分析
4.3.1 参数设置
4.3.2 WORD2VEC词向量维度的选择
4.3.3 模型的效果对比
4.3.4 模型的时间对比
4.3.5 动态字向量模型的具体对比
4.4 本章小结
第五章 音乐实体间关系抽取
5.1 模型整体框架
5.2 模型的具体实现
5.2.1 输入层
5.2.2 嵌入层
5.2.3 注意力层
5.2.4 特征融合与输出层
5.3 误差函数
5.4 实验与结果分析
5.4.1 数据预处理
5.4.2 模型的细节与参数
5.4.3 循环神经网络结构选择
5.4.4 特征的比较与选择
5.4.5 注意力机制的比较
5.4.6 整体模型的对比
5.4.7 误差函数的对比
5.5 本章小结
总结与展望
参考文献
攻读硕士学位期间取得的研究成果
致谢
附件
【参考文献】:
期刊论文
[1]基于句法语义特征的中文实体关系抽取 [J]. 郭喜跃,何婷婷,胡小华,陈前军. 中文信息学报. 2014(06)
[2]基于多层条件随机场的中文命名实体识别 [J]. 胡文博,都云程,吕学强,施水才. 计算机工程与应用. 2009(01)
[3]实体关系自动抽取 [J]. 车万翔,刘挺,李生. 中文信息学报. 2005(02)
硕士论文
[1]基于多代理策略的中文实体关系抽取[D]. 王敏.大连理工大学 2011
[2]基于多模板HMM的中文命名实体识别[D]. 蓝雁玲.华南理工大学 2011
[3]音乐领域全局实体关系抽取研究[D]. 刘龙.哈尔滨工业大学 2010
[4]规则与统计相结合的音乐领域命名实体识别[D]. 张学清.电子科技大学 2010
[5]音乐命名实体识别技术研究[D]. 付瑞吉.哈尔滨工业大学 2009
[6]音乐领域中文实体关系抽取研究[D]. 周蓝珺.哈尔滨工业大学 2009
本文编号:3480889
【文章来源】: 华南理工大学广东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:77 页
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 国内外相关研究现状
1.2.1 实体识别
1.2.2 关系抽取
1.2.3 实体关系联合抽取
1.2.4 音乐领域的信息抽取
1.3 研究内容
1.4 论文的组织结构
第二章 相关理论和技术
2.1 词向量
2.1.1 语言模型
2.1.2 静态词向量
2.1.3 动态词向量
2.2 条件随机场
2.3 循环神经网络
2.3.1 RNN
2.3.2 长短时记忆单元
2.4 注意力机制
2.4.1 基本的注意力机制
2.4.2 自注意力机制
2.4.3 多头注意力机制
2.5 本章小结
第三章 语料说明
3.1 语料来源
3.2 实体识别数据集说明
3.2.1 实体类型及数据集分布
3.2.2 实体识别的标签体系
3.3 关系抽取数据集说明
3.4 评价指标
3.5 本章小结
第四章 音乐命名实体识别
4.1 BLSTM-CRF基准模型
4.1.1 输入层
4.1.2 嵌入层
4.1.3 BLSTM编码层
4.1.4 CRF输出层
4.2 改进的嵌入层
4.3 实验对比分析
4.3.1 参数设置
4.3.2 WORD2VEC词向量维度的选择
4.3.3 模型的效果对比
4.3.4 模型的时间对比
4.3.5 动态字向量模型的具体对比
4.4 本章小结
第五章 音乐实体间关系抽取
5.1 模型整体框架
5.2 模型的具体实现
5.2.1 输入层
5.2.2 嵌入层
5.2.3 注意力层
5.2.4 特征融合与输出层
5.3 误差函数
5.4 实验与结果分析
5.4.1 数据预处理
5.4.2 模型的细节与参数
5.4.3 循环神经网络结构选择
5.4.4 特征的比较与选择
5.4.5 注意力机制的比较
5.4.6 整体模型的对比
5.4.7 误差函数的对比
5.5 本章小结
总结与展望
参考文献
攻读硕士学位期间取得的研究成果
致谢
附件
【参考文献】:
期刊论文
[1]基于句法语义特征的中文实体关系抽取 [J]. 郭喜跃,何婷婷,胡小华,陈前军. 中文信息学报. 2014(06)
[2]基于多层条件随机场的中文命名实体识别 [J]. 胡文博,都云程,吕学强,施水才. 计算机工程与应用. 2009(01)
[3]实体关系自动抽取 [J]. 车万翔,刘挺,李生. 中文信息学报. 2005(02)
硕士论文
[1]基于多代理策略的中文实体关系抽取[D]. 王敏.大连理工大学 2011
[2]基于多模板HMM的中文命名实体识别[D]. 蓝雁玲.华南理工大学 2011
[3]音乐领域全局实体关系抽取研究[D]. 刘龙.哈尔滨工业大学 2010
[4]规则与统计相结合的音乐领域命名实体识别[D]. 张学清.电子科技大学 2010
[5]音乐命名实体识别技术研究[D]. 付瑞吉.哈尔滨工业大学 2009
[6]音乐领域中文实体关系抽取研究[D]. 周蓝珺.哈尔滨工业大学 2009
本文编号:3480889
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3480889.html
最近更新
教材专著