结合语义结构特征的区域村名解析
发布时间:2024-12-21 23:14
地址解析是影响地址匹配精度十分重要的一部分。但中文地址结构复杂、表达方式多样,使得解析效果不理想,因此提出一种基于语义结构特征的地名解析方法。统计并分析山东村名的结构组成和语义特点,确定村名主要由核心成分、修饰成分和村名特征词组成。核心成分包括表示地形地貌、水文、植物动物、建筑工程等特征的10类字词,用这种结构分析俗称,可以总结出俗称与官方村名的对应关系。为了展现解析效果,设计一套标注体系,采用一般地址要素解析和地名解析的方法对比实验。结果表明,基于语义和结构特征的地名解析效果较好,能更准确和直观地体现村名中的区别特征,为解决地址解析中非规范地名的错误打好基础。
【文章页数】:6 页
【文章目录】:
1 研究数据说明
2 村名语义结构解析
2.1 以单个姓氏为核心
2.2 以多个姓氏为核心
2.3 以姓氏和地理特征为核心
2.4 以人名为核心
2.5 以地理特征为核心
3 俗称与官方名称
3.1 删除
1) 删除村名特征词。
2) 删除修饰成分。
3) 删除核心成分。
3.2 修改
1) 修改村名特征词。
2) 修改核心成分。
3.3 增加
1) 增加修饰成分。
2) 增加核心成分。
4 对比验证
5 结论
本文编号:4019060
【文章页数】:6 页
【文章目录】:
1 研究数据说明
2 村名语义结构解析
2.1 以单个姓氏为核心
2.2 以多个姓氏为核心
2.3 以姓氏和地理特征为核心
2.4 以人名为核心
2.5 以地理特征为核心
3 俗称与官方名称
3.1 删除
1) 删除村名特征词。
2) 删除修饰成分。
3) 删除核心成分。
3.2 修改
1) 修改村名特征词。
2) 修改核心成分。
3.3 增加
1) 增加修饰成分。
2) 增加核心成分。
4 对比验证
5 结论
本文编号:4019060
本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/4019060.html