深度学习在简历解析中的应用研究
发布时间:2023-10-14 07:02
随着文本数据在互联网上的快速增长,海量格式自由的文本简历虽然在工作中给人们带来了便利,但也产生了信息过载的困扰。为了提升非结构化文本简历的解析性能,本文将深度学习技术应用于简历解析中。主要工作如下:1.基于字序列的中文简历解析方法研究。针对浅层神经网络生成词表示的缺陷,构建双向长短时记忆模型(Bidirectional Long Short-Term Memory,BLSTM)对字序列进行建模,获得包含词内部信息的词表示;然后结合BLSTM和条件随机场(Conditional Random Fields,CRF)(BLSTM-CRF)对生成的词表示进行建模并对模型调优;最后使用训练好的模型对非结构化文本简历进行解析。实验结果显示,与传统词向量方案的简历解析模型相比,该方法的F1-score提升了2.31%。2.基于特征融合的中文简历解析方法研究。针对简历解析模型使用单一特征难以提高模型性能的局限性,提出融合多种有效特征来提升简历解析模型性能的方案。本文融合的是传统浅层神经网络生成的语义特征和BLSTM对字序列建模生成的特征。(1)采用concat的方式对这两种特征进行融合,然后使用BL...
【文章页数】:85 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景和意义
1.1.1 研究背景
1.1.2 研究意义
1.2 简历解析的发展与现状
1.3 中文简历解析的技术难点
1.4 研究内容与论文结构
第2章 简历解析相关理论基础
2.1 基于规则的简历解析方法
2.2 基于条件随机场的简历解析方法
2.3 深度学习理论基础
2.3.1 深度学习概述
2.3.2 深度神经网络基础理论
2.4 评价方法
2.5 本章小结
第3章 基于字序列的中文简历解析方法
3.1 命名实体识别技术概述
3.2 基于CBLSTMs-CRF的中文简历解析方法
3.2.1 字序列信息的词表示
3.2.2 基于BLSTM-CRF的中文简历解析
3.2.3 算法流程总结
3.3 实验结果与分析
3.3.1 数据集与实验环境
3.3.2 数据预处理
3.3.3 实验设置
3.3.4 CBLSTMs-CRF模型有效性验证
3.3.5 字序列词表示在不同模型中的有效性验证
3.4 本章小结
第4章 基于多特征融合的中文简历解析方法
4.1 引言
4.2 基于CWBLSTMs-CRF的中文简历解析方法
4.2.1 词向量模型
4.2.2 联合字序列信息的词表示
4.2.3 算法流程总结
4.2.4 实验设置
4.2.5 CWBLSTMs-CRF方法有效性验证
4.2.6 融合字序列特征方法在不同模型中的有效性验证
4.3 基于注意力机制的中文简历解析方法
4.3.1 注意力机制概述
4.3.2 基于Att-BLSTMs-CRF的中文简历解析方法
4.3.3 算法流程总结
4.3.4 实验设置
4.3.5 注意力机制有效性验证
4.4 本章小结
第5章 基于深度学习的简历解析系统设计
5.1 系统需求分析
5.2 基于深度学习的简历解析系统设计
5.2.1 获取文本简历模块
5.2.2 实体标注抽取模块
5.2.3 数据存储模块
5.2.4 前端输出模块
5.3 本章小结
第6章 总结与展望
6.1 工作总结
6.2 工作展望
参考文献
致谢
附录 攻读硕士学位期间从事的科研工作及取得的成果
本文编号:3853829
【文章页数】:85 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景和意义
1.1.1 研究背景
1.1.2 研究意义
1.2 简历解析的发展与现状
1.3 中文简历解析的技术难点
1.4 研究内容与论文结构
第2章 简历解析相关理论基础
2.1 基于规则的简历解析方法
2.2 基于条件随机场的简历解析方法
2.3 深度学习理论基础
2.3.1 深度学习概述
2.3.2 深度神经网络基础理论
2.4 评价方法
2.5 本章小结
第3章 基于字序列的中文简历解析方法
3.1 命名实体识别技术概述
3.2 基于CBLSTMs-CRF的中文简历解析方法
3.2.1 字序列信息的词表示
3.2.2 基于BLSTM-CRF的中文简历解析
3.2.3 算法流程总结
3.3 实验结果与分析
3.3.1 数据集与实验环境
3.3.2 数据预处理
3.3.3 实验设置
3.3.4 CBLSTMs-CRF模型有效性验证
3.3.5 字序列词表示在不同模型中的有效性验证
3.4 本章小结
第4章 基于多特征融合的中文简历解析方法
4.1 引言
4.2 基于CWBLSTMs-CRF的中文简历解析方法
4.2.1 词向量模型
4.2.2 联合字序列信息的词表示
4.2.3 算法流程总结
4.2.4 实验设置
4.2.5 CWBLSTMs-CRF方法有效性验证
4.2.6 融合字序列特征方法在不同模型中的有效性验证
4.3 基于注意力机制的中文简历解析方法
4.3.1 注意力机制概述
4.3.2 基于Att-BLSTMs-CRF的中文简历解析方法
4.3.3 算法流程总结
4.3.4 实验设置
4.3.5 注意力机制有效性验证
4.4 本章小结
第5章 基于深度学习的简历解析系统设计
5.1 系统需求分析
5.2 基于深度学习的简历解析系统设计
5.2.1 获取文本简历模块
5.2.2 实体标注抽取模块
5.2.3 数据存储模块
5.2.4 前端输出模块
5.3 本章小结
第6章 总结与展望
6.1 工作总结
6.2 工作展望
参考文献
致谢
附录 攻读硕士学位期间从事的科研工作及取得的成果
本文编号:3853829
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3853829.html