搜索日志中命名实体识别
发布时间:2023-04-12 01:23
【目的】搜索日志中命名实体识别对于优化搜索意图,提高搜索引擎服务质量存在重要意义。【方法】利用种子命名实体和模板匹配原则抽取候选命名实体并聚类,聚类后进行候选命名实体识别特征抽取,包括频次、不同模板数、模板权重特征。融合这些特征构造命名实体识别权重计算公式,并合理调整特征影响参数。【结果】对根据权重提取的命名实体进行标注和统计,发现P@500值平均达到75%左右,比Pa@ca方法高出7%。【局限】对模板敏感性弱的命名实体不能精确抽取。【结论】通过计算该方法抽取结果指标P@N值,并和其他方法抽取结果指标进行比较,证明该方法的有效性。
【文章页数】:8 页
【文章目录】:
1引言
2相关工作
3命名实体抽取框架
3.1类别框架
3.2抽取过程
(1) 种子命名实体搜集
(2) 命名实体模板抽取和模板过滤
(3) 特征和命名实体抽取
4候选命名实体识别和特征抽取
4.1特征提取
(1) 命名实体识别模板权重计算
(2) 候选命名实体聚类及特征提取
4.2权重计算
(1) 命名实体权重计算与抽取
5实验结果评价与分析
5.1P@N结果统计和对比
5结语
本文编号:3790140
【文章页数】:8 页
【文章目录】:
1引言
2相关工作
3命名实体抽取框架
3.1类别框架
3.2抽取过程
(1) 种子命名实体搜集
(2) 命名实体模板抽取和模板过滤
(3) 特征和命名实体抽取
4候选命名实体识别和特征抽取
4.1特征提取
(1) 命名实体识别模板权重计算
(2) 候选命名实体聚类及特征提取
4.2权重计算
(1) 命名实体权重计算与抽取
5实验结果评价与分析
5.1P@N结果统计和对比
5结语
本文编号:3790140
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3790140.html