中文村名俗称与规范名称的匹配算法
发布时间:2022-11-06 17:25
随着数字化的发展,越来越多的应用要求通过采用自然语言文字描述直接找到对应的详细的地址信息,并能够在空间位置上进行显示,即地名地址匹配空间化过程。然而,现今在地名的规范化角度还存在着很多问题,在乡镇或街道办及以上的行政等级的命名中都已基本规范统一,但是在村庄级的命名中还有待进一步的完善。所以本文通过对国内外文献研究,规范村名命名规律,匹配算法研究进一步加深中文村名俗称与规范名称的匹配算法的研究。
【文章页数】:5 页
【文章目录】:
0 引言
1 国内外研究现状
2 规范村名命名规律
(1)姓氏加通名特征词:
(2)姓名加通名特征词:
(3)姓氏加职业加通名特征词:
(4)姓氏加其他限定词加通名特征词:
3 规范村名与通俗村名映射关系
3.1 特征词的替换
3.1.1 村→家
3.1.2 村→庄、头、屯、楼、桥等
3.2 省略特征词
3.2.1 省略后缀特征词
3.2.2 省略位于中间的特征词
3.3 规范村名与通俗村名空间范围不符
3.3.1 通俗村名空间范围大于规范村名空间范围
3.3.2 通俗村名空间范围小于规范村名空间范围
3.4 形容词、方位名词限定
3.4.1 添加或去除形容词
3.4.2 添加或省略方位名词
3.5 方言发音、同音异字
4 匹配算法研究
4.1 专名提取
4.2 基于规则的判识
4.3 基于拼音索引的中文模糊匹配
4.4 归类加权相似度匹配
5 分词及匹配流程
6 实例推演
6.1 子类完全相同
6.2 只规则相同
7 结束语
【参考文献】:
期刊论文
[1]归类识别地名匹配算法[J]. 占斌斌,赵英,赵婷婷,朱峰. 北京测绘. 2018(04)
[2]基于规则与词典的地址匹配算法[J]. 赵英,占斌斌,贾沛哲,李华英. 北京测绘. 2017(05)
[3]顾及通名语义的汉语地名相似度匹配算法[J]. 程钢,卢小平. 测绘学报. 2014(04)
[4]基于统计的中文地名自动识别研究[J]. 邱莎,阿圆,王付艳,丁海燕. 计算机技术与发展. 2011(11)
[5]浅析地名的地域性[J]. 任建兰,公平. 世界地理研究. 2011(03)
[6]中国地名文化的姓氏元素及其符号形态[J]. 孙和平. 成都大学学报(社会科学版). 2010(04)
[7]基于拼音索引的中文模糊匹配算法[J]. 曹犟,邬晓钧,夏云庆,郑方. 清华大学学报(自然科学版). 2009(S1)
[8]基于统计的中文地名识别[J]. 黄德根,岳广玲,杨元生. 中文信息学报. 2003(02)
[9]中国城市地名命名方式及其区域差异[J]. 张力仁. 中国地名. 1997(05)
硕士论文
[1]山东省临沂村名的语言文化研究[D]. 颜廷花.山东师范大学 2014
[2]沂蒙山区自然村村名语言分析与文化分析[D]. 刘宗棠.广西大学 2003
[3]中国地名和文化关系的研究[D]. 邓慧蓉.黑龙江大学 2001
本文编号:3703913
【文章页数】:5 页
【文章目录】:
0 引言
1 国内外研究现状
2 规范村名命名规律
(1)姓氏加通名特征词:
(2)姓名加通名特征词:
(3)姓氏加职业加通名特征词:
(4)姓氏加其他限定词加通名特征词:
3 规范村名与通俗村名映射关系
3.1 特征词的替换
3.1.1 村→家
3.1.2 村→庄、头、屯、楼、桥等
3.2 省略特征词
3.2.1 省略后缀特征词
3.2.2 省略位于中间的特征词
3.3 规范村名与通俗村名空间范围不符
3.3.1 通俗村名空间范围大于规范村名空间范围
3.3.2 通俗村名空间范围小于规范村名空间范围
3.4 形容词、方位名词限定
3.4.1 添加或去除形容词
3.4.2 添加或省略方位名词
3.5 方言发音、同音异字
4 匹配算法研究
4.1 专名提取
4.2 基于规则的判识
4.3 基于拼音索引的中文模糊匹配
4.4 归类加权相似度匹配
5 分词及匹配流程
6 实例推演
6.1 子类完全相同
6.2 只规则相同
7 结束语
【参考文献】:
期刊论文
[1]归类识别地名匹配算法[J]. 占斌斌,赵英,赵婷婷,朱峰. 北京测绘. 2018(04)
[2]基于规则与词典的地址匹配算法[J]. 赵英,占斌斌,贾沛哲,李华英. 北京测绘. 2017(05)
[3]顾及通名语义的汉语地名相似度匹配算法[J]. 程钢,卢小平. 测绘学报. 2014(04)
[4]基于统计的中文地名自动识别研究[J]. 邱莎,阿圆,王付艳,丁海燕. 计算机技术与发展. 2011(11)
[5]浅析地名的地域性[J]. 任建兰,公平. 世界地理研究. 2011(03)
[6]中国地名文化的姓氏元素及其符号形态[J]. 孙和平. 成都大学学报(社会科学版). 2010(04)
[7]基于拼音索引的中文模糊匹配算法[J]. 曹犟,邬晓钧,夏云庆,郑方. 清华大学学报(自然科学版). 2009(S1)
[8]基于统计的中文地名识别[J]. 黄德根,岳广玲,杨元生. 中文信息学报. 2003(02)
[9]中国城市地名命名方式及其区域差异[J]. 张力仁. 中国地名. 1997(05)
硕士论文
[1]山东省临沂村名的语言文化研究[D]. 颜廷花.山东师范大学 2014
[2]沂蒙山区自然村村名语言分析与文化分析[D]. 刘宗棠.广西大学 2003
[3]中国地名和文化关系的研究[D]. 邓慧蓉.黑龙江大学 2001
本文编号:3703913
本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/3703913.html