当前位置:主页 > 社科论文 > 图书档案论文 >

基于条件随机场的法言法语实体自动识别模型研究

发布时间:2018-07-03 10:29

  本文选题:裁判文书 + 条件随机场模型 ; 参考:《数据分析与知识发现》2017年11期


【摘要】:【目的】法言法语实体的自动识别是实现裁判文书文本挖掘的重要的基础性工作。【方法】采用爬虫方法获取数据,人工方式进行语料标注,利用NLPIR加载法律领域词典对语料进行分词,结合法言法语的内部和外部特征构建基于条件随机场的特征模板,自动识别语料中的法言法语。【结果】融入法言法语内部和外部特征的条件随机场模型,自动识别法言法语的实验效果良好,模型的调和平均值达到90%以上。【局限】法言法语实体自动识别模型在领域的扩展上有一定的局限性。【结论】基于条件随机场对法言法语实体实现自动抽取是可行的。
[Abstract]:[objective] automatic recognition of French-speaking entities is an important basic work to realize the text mining of adjudicative documents. [methods] the crawler method is used to obtain the data, and the language corpus is annotated manually. Using NLPIR to load the legal domain dictionary to segment the corpus, combining the internal and external features of French, the feature template based on conditional random field is constructed. [results] the condition random field model incorporating the internal and external features of French in French is a good experimental result for automatic recognition of French in French. The mean harmonic value of the model is more than 90%. The extension of French entity recognition model is limited. [conclusion] it is feasible to automatically extract French entities based on conditional random field.
【作者单位】: 南京农业大学信息科学技术学院;南京师范大学法学院;
【基金】:国家社会科学基金项目“转型期公众道德需求的司法应对研究”(项目编号:13BFX006)的研究成果之一
【分类号】:G254

【相似文献】

相关期刊论文 前5条

1 徐焕章;;言语自动识别浅谈[J];中国邮政;1981年06期

2 李海华;;三种自动识别技术在图书馆中的应用对比分析[J];情报探索;2014年02期

3 章成志;苏新宁;;基于条件随机场的自动标引模型研究[J];中国图书馆学报;2008年05期

4 李海华;;彩色比特码自动识别技术在图书馆中的应用研究[J];农业图书情报学刊;2012年12期

5 逯万辉;马建霞;;基于CRFs的领域爆发词识别的研究与实现[J];情报科学;2014年01期

相关硕士学位论文 前1条

1 侯娜;基于条件随机场的元数据自动提取技术研究[D];燕山大学;2009年



本文编号:2093338

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2093338.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1a158***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com