当前位置:主页 > 社科论文 > 图书档案论文 >

基于学术论文全文的研究方法句自动抽取研究

发布时间:2021-09-06 14:20
  研究方法是科技文献中的重要内容,是解决学科领域问题的方法、工具、手段或技术。研究方法的描述通常以句子为单位。将分散在科技文献中的研究方法句进行汇总,可以辅助科研工作者快速地搜寻合适的研究方法。根据方法使用主体,将研究方法句进一步分为论文使用方法句和论文引用方法句。论文使用方法句是指论文中使用的研究方法的描述句。论文引用方法句是指论文对前人使用过的研究方法的描述句。本文使用多种基于神经网络的句子分类模型从科技文献全文本中进行研究方法句抽取。在模型词向量表示层,论文使用BERT和word2vec两种词向量模型。在模型的特征选择层,本文选用三种不同的网络,分别为卷积神经网络、双向长短时记忆网络和注意力机制网络。另外,论文使用两种模型训练方式,分别为单层次结构和两层次结构。实验结果表明,基于BERT的单层次结构的双向长短时记忆网络模型取得了较优的性能。本文从《情报学报》已发表论文中进行研究方法句的抽取并分析研究方法句的分布情况。分析发现,《情报学报》逐渐重视情报学中理论的发展并关注建设情报学学科的理论体系。 

【文章来源】:情报学报. 2020,39(06)北大核心CSSCICSCD

【文章页数】:11 页

【部分图文】:

基于学术论文全文的研究方法句自动抽取研究


研究方法句抽取模型框架

分布情况,年份,分布情况,论文


论文引用方法句是论文中对先前工作的引用。引用包括多种情况,如与已有方法进行比较或使用已有研究工作中的方法的情况都需要引用对应的文献。论文引用方法句占比是指论文引用方法句和本文句子总数量的比例。本文取每一年份下所有论文的论文引用方法句占比的平均数。论文引用方法句占比越高,则表示论文中较倾向于使用已有方法或与已有方法进行比较研究。具体分布如图3b所示。从图3b中可以发现,论文引用方法句的分布分为3个阶段。第一阶段,2009—2010年,呈现急速上升的趋势。在这个阶段,论文引用方法句比例上升。这一现象表明,在这一阶段《情报学报》中的论文较倾向于使用已有研究工作中的方法或是提出新方法与已有方法进行比较。第二阶段,2010—2014年,呈现波动上升的趋势。在这个阶段,论文引用方法句比例缓慢上升。这一现象表明,在这一阶段,《情报学报》中的论文中仍习惯于使用已有研究工作中的方法或与已有方法相比较。第三阶段,2014—2018年,呈现波动下降的趋势。在这个阶段,论文引用方法句比例波动下降。这一现象与图3a中这一阶段论文使用方法句比例下降的趋势相同。因此,可以看出在这一时期,《情报学报》中有关研究型和实验型的论文占比下降,理论研究型论文数量上升,从而使论文引用方法句的数量也随之下降。5 结论与展望

框架图,神经网络,序列,向量


本文使用神经网络序列标注模型进行实验,并选择性能最优的模型进行研究方法句抽取。在神经网络序列标注模型中,本文选择使用两种不同的词向量表示层和三种不同的特征选择层。词向量表示层主要将输入的词语转化为模型能够理解的向量表示。如图2所示,假设需要词序列为{pi,s,1,pi,s,2,,pi,s,w,?,pi,s,w}。该词序列输入到词向量层后转变为词向量表示{vi,s,1,vi,s,2,?,vi,s,w,?,vi,s,w}。经过特征选择层后经过softmax以得到最终的句子标签yi,s。在词向量表示层,本文使用两种预训练词向量模型,分别是word2vec领域词向量[15]和BERT(bidirectional encoder representations from transformers)开源语言模型[16]。特征选择层主要从输入中自动学习有用的特征。如图2所示,特征选择层的输入为词序列的词向量表示{vi,s,1,vi,s,2,?,vi,s,w,?,vi,s,w}。特征选择层从词向量中学习到对分类任务有用的特征。在该层中,本文使用卷积神经网络、双向长短时记忆网络和结合注意力机制的双向长短时记忆网络。另外,在模型结构方面,本文使用两种结构的模型,分别是单层次模型和两层次模型。下面分别对不同的词向量表示层、特征选择层和模型结构进行介绍。3.3.1 词向量表示层选择

【参考文献】:
期刊论文
[1]我国情报学理论的来源、应用及学科专属度研究[J]. 王芳,陈锋,祝娜,杨京.  情报学报. 2016 (11)
[2]细粒度科技论文摘要句子分类方法[J]. 华秀丽,徐凡,王中卿,李培峰.  计算机工程. 2012(14)

博士论文
[1]学科领域本体学习及学术资源语义标注研究[D]. 蒋婷.南京大学 2017



本文编号:3387617

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3387617.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b05aa***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com