科学论文语步自动识别与应用研究
发布时间:2023-04-22 13:46
科学论文作为研究人员对自身研究领域进行科学的分析、研究、阐述的媒介,是分享科技成果的重要形式。但近年来随着新时代科学技术的飞速发展,科学论文数量骤增。论文质量差距、海量的论文加上不同期刊之间差异的论文组织模式给论文使用者带来了一定的困难,与此同时,论文阅读者的信息需求也在变得越发多元化,精准化:特定的研究方法、实验过程、研究的创新点都可能会是科学研究者查询的对象,文献供需矛盾日益尖锐。近年来各大出版商使用的Rich HTML格式论文通过在论文页面中添加指向各个章节的导航及相似论文推荐信息,改善了读者的阅读体验,但现有的导航与推荐功能仍然不能满足读者更加精细的信息需求。语言学研究者使用语步分析方法从论文作者的角度对文章进行解释,得到的语步标签蕴含作者修辞策略和交际目的,对文献使用者理解论文、选择论文都有重要的参考价值。然而传统的语步分析过程费时费力,现有的对论文文本语步自动或半自动的识别的相关研究还相对较少,识别范围也局限在论文的摘要或引言上。基于此,本文的研究目的是探索论文正文语步自动识别的可能性,以及如何利用识别的语步提供更为精细的文献信息服务。首先,笔者以化学领域的英文论文为例,在...
【文章页数】:94 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景
1.2 研究目的与意义
1.3 相关概念与理论
1.4 研究内容与研究方法
1.5 主要创新点
1.6 论文组织结构
2 相关研究综述
2.1 科学论文内容结构划分
2.2 基于语步分析的科学论文内容结构
2.3 科学论文内容结构自动识别
2.4 科学论文语步自动识别
2.5 本章小结
3 语步分类框架的构建
3.1 化学领域科学论文的内容结构划分
3.2 化学领域科学论文语步分类框架
3.3 语步标注训练集的构建
3.4 化学领域科学论文语步分布统计分析
3.4.1 语步总体数量分布分析
3.4.2 语步在单篇论文中的数量分布分析
3.4.3 语步位置分布分析
3.4.4 语步转移概率分析
3.5 本章小结
4 语步自动识别方法
4.1 基于传统机器学习技术的语步自动识别
4.1.1 数据预处理
4.1.2 特征工程
4.1.3 特征选择
4.1.4 分类器训练与测试
4.2 基于深度学习技术的语步自动识别
4.2.1 基于词向量的文本表示方法
4.2.2 深度学习文本分类模型的训练与测试
4.2.3 深度学习序列标注模型的训练与测试
4.3 基于融合模型的语步自动识别
4.3.1 融合模型设计
4.3.2 结果比较
4.4 细粒度步骤自动识别
4.5 本章小结
5 基于语步识别的文献信息服务
5.1 阅读导航界面
5.2 相似论文推荐
5.3 论文写作指导
5.4 本章小结
6 总结与展望
6.1 结语
6.2 研究不足与展望
参考文献
硕士期间学术成果
致谢
本文编号:3797759
【文章页数】:94 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景
1.2 研究目的与意义
1.3 相关概念与理论
1.4 研究内容与研究方法
1.5 主要创新点
1.6 论文组织结构
2 相关研究综述
2.1 科学论文内容结构划分
2.2 基于语步分析的科学论文内容结构
2.3 科学论文内容结构自动识别
2.4 科学论文语步自动识别
2.5 本章小结
3 语步分类框架的构建
3.1 化学领域科学论文的内容结构划分
3.2 化学领域科学论文语步分类框架
3.3 语步标注训练集的构建
3.4 化学领域科学论文语步分布统计分析
3.4.1 语步总体数量分布分析
3.4.2 语步在单篇论文中的数量分布分析
3.4.3 语步位置分布分析
3.4.4 语步转移概率分析
3.5 本章小结
4 语步自动识别方法
4.1 基于传统机器学习技术的语步自动识别
4.1.1 数据预处理
4.1.2 特征工程
4.1.3 特征选择
4.1.4 分类器训练与测试
4.2 基于深度学习技术的语步自动识别
4.2.1 基于词向量的文本表示方法
4.2.2 深度学习文本分类模型的训练与测试
4.2.3 深度学习序列标注模型的训练与测试
4.3 基于融合模型的语步自动识别
4.3.1 融合模型设计
4.3.2 结果比较
4.4 细粒度步骤自动识别
4.5 本章小结
5 基于语步识别的文献信息服务
5.1 阅读导航界面
5.2 相似论文推荐
5.3 论文写作指导
5.4 本章小结
6 总结与展望
6.1 结语
6.2 研究不足与展望
参考文献
硕士期间学术成果
致谢
本文编号:3797759
本文链接:https://www.wllwen.com/tushudanganlunwen/3797759.html