基于触发词优先级的事件抽取研究
发布时间:2017-10-19 21:28
本文关键词:基于触发词优先级的事件抽取研究
【摘要】:本文将触发词分为时间类和非时间类,对触发词提取算法进行改进,以一定量导电塑料行业新闻为基础语料构建两类触发词词表,并采取时间类触发词优先的事件句识别策略。基于该触发词词表对导电塑料和太阳能行业新闻语料进行事件句识别算法有效性实验,开放测试的召回率和准确率分别超过98%和95%。该结果表明:将触发词进行基于时间特性的分类,并优先使用时间类触发词提取事件句,能取得显著的效果。
【作者单位】: 华东理工大学科技信息研究所;
【关键词】: 事件句 抽取 触发词优先
【基金】:国家社会科学基金项目“面向知识服务的学科领域术语语义分析及应用研究”(项目编号:13BTQ053) 教育部人文社会科学研究青年基金项目“面向语义出版的富语义模型构建与应用研究”(项目编号:15YJC870014)研究成果之一
【分类号】:TP391.1
【正文快照】: 当前有关事件抽取研究中主要以特定行业新闻事件抽取研究为主,包括金融、军事、法律、交通等行业,所采用的方法包括模式匹配、触发词和本体方法,触发词方法的使用频率最高,且综合效果(微平均)较优于单纯的模式匹配算法[1]。触发词也称事件关键词,通过对事件句的统计分析后发现,
本文编号:1063414
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1063414.html