基于BiLSTM-CRF的体育新闻主题词抽取方法
发布时间:2021-07-23 01:25
针对典型的循环神经网络方法在抽取主题词时因缺少上下文相关的句子级信息而导致识别准确率较低的问题,提出了一种基于双向长短期记忆网络条件随机场(BiLSTM-CRF)模型联合TextRank的主题词抽取方法。首先,利用TextRank对新闻文本进行主题句抽取,再使用双向长短期记忆(BiLSTM)模型获取文本的前后特征,最后使用条件随机场(CRF)完成句子级序列标注,得到主题词。在多组体育类新闻数据集上进行实验,该方法较对照组BiLSTM方法F1值提高约0.8%~5.1%,且用时更短。因此,改进的BiLSTM-CRF方法可显著提升主题词的抽取准确率和效率。
【文章来源】:武汉工程大学学报. 2020,42(01)
【文章页数】:6 页
【文章目录】:
1 体育新闻主题词抽取方法
1.1 抽取流程
1.2 TextRank提取新闻主题句
1.3 BiLSTM模型
1.4 BiLSTM-CRF模型
2 实验部分
2.1 数据集
2.2 评价标准
2.3 结果及分析
3 结论
本文编号:3298304
【文章来源】:武汉工程大学学报. 2020,42(01)
【文章页数】:6 页
【文章目录】:
1 体育新闻主题词抽取方法
1.1 抽取流程
1.2 TextRank提取新闻主题句
1.3 BiLSTM模型
1.4 BiLSTM-CRF模型
2 实验部分
2.1 数据集
2.2 评价标准
2.3 结果及分析
3 结论
本文编号:3298304
本文链接:https://www.wllwen.com/jiaoyulunwen/tylw/3298304.html