基于同义实体识别的Web信息集成
发布时间:2024-01-29 11:08
准确有效地集成海量Web信息,是Web信息动态聚合、市场情报分析、舆情分析、商业智能等分析型应用的重要基础.针对数据集成过程中不同实体指代同一实体的问题,利用搜索引擎返回的页面摘要信息,设计并实现了一种基于搜索引擎的同义实体识别算法FSE,并提出了一种基于同义实体识别的Web信息集成框架.在医院信息集成测试数据集上的实验结果表明,FSE算法效果优于基于Varient Dice、Varient Cosine、Varient Jaccard、Varient Overlap相似度计算的同义实体识别算法.
【文章页数】:8 页
【文章目录】:
1 引言
2 基于搜索引擎的同义实体识别
2.1 基于搜索引擎的相似度计算
2.2 基于搜索引擎的同义实体发现
3 基于同义实体识别的Web信息集成系统
3.1 设计架构
3.2 资源层:
3.3 融合层
3.4 服务层
4 实验与评估
4.1 实验数据集
4.2 评价标准
4.3 实验结果
4.4 讨论
5 总结与展望
本文编号:3888070
【文章页数】:8 页
【文章目录】:
1 引言
2 基于搜索引擎的同义实体识别
2.1 基于搜索引擎的相似度计算
2.2 基于搜索引擎的同义实体发现
3 基于同义实体识别的Web信息集成系统
3.1 设计架构
3.2 资源层:
3.3 融合层
3.4 服务层
4 实验与评估
4.1 实验数据集
4.2 评价标准
4.3 实验结果
4.4 讨论
5 总结与展望
本文编号:3888070
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3888070.html