基于朝鲜语语料库的人名自动识别方法研究
发布时间:2020-12-19 22:18
中,英文信息处理经历了半个世纪的发展,在基础资源的建设,词性标注,信息检索,文体分类,机器翻译,语言识别与合成,人机对话等领域都取得非常大的发展,中,英文信息处理的现代化发展,对国内少数民族语言信息处理的理论与技术发展也起到了深刻的促进作用。与中,英文信息处理相比,朝鲜语信息处理虽然起步稍晚,但也取得了一定成果。朝鲜语信息处理已初步完成了字,词处理阶段,现已进入句处理阶段,朝鲜语信息处理已完成短语结构关系识别,短语边界界定等浅层句法分析任务,正向深层句法分析迈进,朝鲜语信息检索,自动文摘,文体分类,机器翻译的研究也方兴未艾。本文首先分析了人名识别的困难,并对现有的人名识别方法进行了简单介绍和比较;其次,以2016年5月~2017年5月间《延边日报》中出现的人名作为主要样本;最后建立了人名样本库,姓氏库,人名语料库等在人名识别前所需要语料资源,并对这些资源进行统计分析的基础上,建立了各种人名用字表,姓氏概率表,人名上下文信息表,姓氏用作普通单字时的上下文信息表,人名前缀,后缀表等人名识别过程中所需的数据资源。本文基于人名驱动和上下文信息,利用从真实姓名样本库和文本语料库中得到的大量统计数...
【文章来源】:延边大学吉林省 211工程院校
【文章页数】:45 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
目录
正文
参考文献
附件
【参考文献】:
期刊论文
[1]面向人名消歧任务的人名识别系统[J]. 时迎超,王会珍,肖桐,胡明涵. 中文信息学报. 2011(03)
[2]基于可信度模型的中文人名识别研究[J]. 倪吉,孔芳,朱巧明,李培峰. 中文信息学报. 2011(03)
[3]一种基于本体论和规则匹配的中文人名识别方法[J]. 周昆,胡学钢. 微计算机信息. 2010(31)
[4]基于混合模型的中国人名自动识别[J]. 毛婷婷,李丽双,黄德根. 中文信息学报. 2007(02)
[5]边界模板和局部统计相结合的中国人名识别[J]. 李中国,刘颖. 中文信息学报. 2006(05)
[6]一种基于可信度的人名识别方法[J]. 罗智勇,宋柔. 中文信息学报. 2005(03)
[7]基于角色标注的中国人名自动识别研究[J]. 张华平,刘群. 计算机学报. 2004(01)
博士论文
[1]基于蒙古文语料库的人名自动识别[D]. 通拉嘎.中央民族大学 2013
硕士论文
[1]中文姓名自动识别系统的设计与实现[D]. 余祖波.大连理工大学 2008
[2]基于类比学习的人名识别方法研究[D]. 朱丽丽.山西大学 2007
本文编号:2926669
【文章来源】:延边大学吉林省 211工程院校
【文章页数】:45 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
目录
正文
参考文献
附件
【参考文献】:
期刊论文
[1]面向人名消歧任务的人名识别系统[J]. 时迎超,王会珍,肖桐,胡明涵. 中文信息学报. 2011(03)
[2]基于可信度模型的中文人名识别研究[J]. 倪吉,孔芳,朱巧明,李培峰. 中文信息学报. 2011(03)
[3]一种基于本体论和规则匹配的中文人名识别方法[J]. 周昆,胡学钢. 微计算机信息. 2010(31)
[4]基于混合模型的中国人名自动识别[J]. 毛婷婷,李丽双,黄德根. 中文信息学报. 2007(02)
[5]边界模板和局部统计相结合的中国人名识别[J]. 李中国,刘颖. 中文信息学报. 2006(05)
[6]一种基于可信度的人名识别方法[J]. 罗智勇,宋柔. 中文信息学报. 2005(03)
[7]基于角色标注的中国人名自动识别研究[J]. 张华平,刘群. 计算机学报. 2004(01)
博士论文
[1]基于蒙古文语料库的人名自动识别[D]. 通拉嘎.中央民族大学 2013
硕士论文
[1]中文姓名自动识别系统的设计与实现[D]. 余祖波.大连理工大学 2008
[2]基于类比学习的人名识别方法研究[D]. 朱丽丽.山西大学 2007
本文编号:2926669
本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/2926669.html