地震科普问答中的语义相似度研究
发布时间:2023-09-29 02:25
在当前信息快速发展的时代,公众运用网络,通过输入关键字搜索、自动问答等方式,可快速获取科普知识等各种信息。网络也成为各类科普宣传的重要渠道。其中,中文句子相似度算法在基于实例的搜索、自动问答等自然语言处理领域,具有非常广泛的应用背景。该文以地震科普问题为语料,结合防震减灾术语,研究三种中文句子相似度算法的有效性。
【文章页数】:4 页
【文章目录】:
0 引言
1 相似句检索的原理及方法
1.1 相似句子候选集选择
1.2 句子相似度计算
(1) 词频-逆向文档频率(Term Frequency-inverse Document Frequency,TF-IDF)向量方法。
(2) 余弦相似度算法。
(3) 基于编辑距离的算法。
2 实验结果与分析
2.1 实验语料与评价标准
2.2 实验结果对比
2.3 自定义词典对算法的影响
2.4 实验结果分析
3 结语
本文编号:3849099
【文章页数】:4 页
【文章目录】:
0 引言
1 相似句检索的原理及方法
1.1 相似句子候选集选择
1.2 句子相似度计算
(1) 词频-逆向文档频率(Term Frequency-inverse Document Frequency,TF-IDF)向量方法。
(2) 余弦相似度算法。
(3) 基于编辑距离的算法。
2 实验结果与分析
2.1 实验语料与评价标准
2.2 实验结果对比
2.3 自定义词典对算法的影响
2.4 实验结果分析
3 结语
本文编号:3849099
本文链接:https://www.wllwen.com/kejilunwen/diqiudizhi/3849099.html