当前位置:主页 > 论文百科 > 科研论文 >

基于条件随机场的科研论文信息分层抽取

发布时间:2017-09-13 02:38

  本文关键词:基于条件随机场的科研论文信息分层抽取


  更多相关文章: 信息抽取 条件随机场 分层


【摘要】:在利用条件随机场进行信息抽取时,单纯基于词或基于块的方法,不能充分利用上下文信息在恰当粒度上进行切分和抽取,因此提出了一种基于条件随机场的科研论文信息分层抽取方法,利用分隔符、换行符、行首字符等格式信息,结合条件随机场的特征函数,将文本切分成文本行、块或单个的词等恰当的层次,再采用L-BFGS算法学习模型参数并进行特定文本域的抽取。实验结果表明,该方法的抽取性能优于基于词或块的条件随机场模型的信息抽取方法。
【作者单位】: 重庆大学计算机学院;
【关键词】信息抽取 条件随机场 分层
【基金】:重庆市科委自然科学基金计划资助项目(2007BB2372) 中国博士后科学基金资助项目(20070420711)
【分类号】:TP391.1
【正文快照】: 随着大量科研论文的出现,从中精确地抽取论文头部信息和引文信息显得十分重要。科研论文头部和引文信息包括论文标题、作者、单位、摘要、关键字、期刊名和页码等域的信息。通过获取科研论文的这些信息,不仅可以有效地组织和管理这些论文,提高用户检索论文的效率,而且还能够

【参考文献】

中国期刊全文数据库 前2条

1 李朝光,张铭,邓志鸿,杨冬青,唐世渭;论文元数据信息的自动抽取[J];计算机工程与应用;2002年21期

2 郭志鑫;;基于本体的文档引文元数据信息抽取[J];微计算机信息;2006年18期

【共引文献】

中国期刊全文数据库 前8条

1 李小斌;;一种从HTML页面到RDF文档的转化方法[J];电脑与信息技术;2006年04期

2 郭志鑫;金海;陈汉华;;SemreX中基于语义的文档参考文献元数据信息提取[J];计算机研究与发展;2006年08期

3 孙哲,张铭,唐世渭;基于Berkeley DB的文献检索设计与实现[J];计算机工程与应用;2003年13期

4 周明建,高济,李飞;基于本体论的Web信息抽取[J];计算机辅助设计与图形学学报;2004年04期

5 王雷;陈治平;李志成;;基于文本分块的多模板隐马尔可夫模型的文本信息抽取[J];山东大学学报(理学版);2006年03期

6 严s,

本文编号:841042


资料下载
论文发表

本文链接:https://www.wllwen.com/wenshubaike/gxjt/841042.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dc650***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com