当前位置:主页 > 社科论文 > 图书档案论文 >

基于学术论文全文的研究方法实体自动识别研究

发布时间:2024-04-19 02:23
  研究方法的规范程度标志着一门学科发展的成熟程度。在情报学学科中,关于研究方法的理论分析和规范性研究逐渐引起重视,而使用量化方法进行实证分析的研究相对较少。另外,当一个研究方法实体出现在学术文本中,则表示该研究方法实体被该学术论文使用或该学术论文引用该研究方法实体用于分析或比较。梳理学术论文使用的研究方法实体,可以帮助学者快速了解学术论文的主旨内容。总结学术论文引用的研究方法实体,有助于理清学科领域中研究方法的演变和发展模式。因此,本文将研究方法分为论文使用研究方法和论文引用研究方法。本文比较双向长短时记忆网络等8种神经网络研究方法实体自动抽取模型,从中选择最优的模型进行研究方法实体的识别。实验结果表明,基于字向量的、结合条件随机场的双向长短时记忆网络联合训练模型在研究方法识别任务中表现出最高的性能。以《情报学报》近10年的论文全文为依据,分析抽取出的研究方法实体的使用情况。统计分析结果发现,情报学学科中与实验法相关的研究方法使用频次和引用频次均最高。

【文章页数】:12 页

【部分图文】:

图2神经网络模型框架

图2神经网络模型框架

本文使用神经网络序列标注模型进行实验,并选择性能最优的模型进行研究方法实体识别。在神经网络序列标注模型中,本文选择使用三种不同的词向量表示层和两种不同的特征选择层。词向量表示层主要将输入的词语转化为模型能够理解的向量表示。如图2所示,假设需要的词序列为{pi,s,1,pi,s,2....


图1研究方法实体识别研究框架

图1研究方法实体识别研究框架

为此,本文设计如图1所示的研究方法实体识别研究框架。该框架分为3个部分。首先是研究方法实体识别模型选择。本文使用人工标注的研究方法实体识别训练集进行神经网络模型训练,然后根据测试集上的实体识别性能选择最优的研究方法实体识别模型。其次是研究方法实体识别。本文使用性能最高的方法识别模....



本文编号:3958087

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3958087.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9bbff***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com