基于密度优先策略的答案源搜索方法研究
发布时间:2023-06-01 00:52
针对特定自然问题,答案源搜索的目标是检索蕴含答案的相关短文本。在大规模数据集中高效精准地获取答案源,能够有效辅助现有的阅读理解技术实现开放域的答案抽取。以统计和语义编码策略为基础的相关度计算模型,已在获取相关短文本方面取得了显著成果。然而,前者虽具有较高时效性,却往往精度偏低;后者虽精度较高,但却消耗较大计算成本与时空代价。针对这一问题,文章提出一种密度优先策略,旨在利用问题关键词在短文本中的最大分布密度,实现问题与候选答案源的相关性度量。利用SQuAD数据集进行测试,并与现有方法进行对比。实验结果显示,密度优先策略对比其他方法取得了较为明显的性能优势,并体现了较高的计算效率。
【文章页数】:11 页
【文章目录】:
0 引言
1 答案源搜索的任务定义
2 密度优先策略的动机与原理
3 密度优先相关度计算
3.1 无向图边长测量
3.2 统一的分布面积计算
4 实验及分析
4.1 数据来源
4.2 对比模型
4.3 评价指标
4.4 实验结果
4.5 性能分析
5 结论
本文编号:3826339
【文章页数】:11 页
【文章目录】:
0 引言
1 答案源搜索的任务定义
2 密度优先策略的动机与原理
3 密度优先相关度计算
3.1 无向图边长测量
3.2 统一的分布面积计算
4 实验及分析
4.1 数据来源
4.2 对比模型
4.3 评价指标
4.4 实验结果
4.5 性能分析
5 结论
本文编号:3826339
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3826339.html