AIS拼音船名到汉字的智能翻译技术
发布时间:2021-12-11 15:15
针对航海领域中船舶自动识别系统(AIS)无法利用中文给我国使用者带来的识别障碍问题,研究了AIS拼音信息到汉字的智能翻译技术.在建立标准化汉字和拼音船名语料库的基础上,分别搭建了基于Seq2Seq和Transformer框架的智能船名翻译的深度学习模型.通过在同一数据集上的性能对比分析发现,Transformer模型具有更好的效果.为弥补Transformer模型受语料库规模限制而带来的翻译损失,进一步研究了其与隐马尔科夫链(HMM)的联合翻译模型,最终,在测试集上达到了98.92%的准确率,实现了对AIS拼音船名的精准匹配和合理翻译.该模型同样适用于AIS中目的港等拼音信息到汉字的翻译,对于提升AIS信息使用者的体验具有实际应用价值.
【文章来源】:大连海事大学学报. 2020,46(02)北大核心CSCD
【文章页数】:8 页
【部分图文】:
语料库构建过程
图2中,每个encoder单元首先对船名拼音在嵌入层进行one-hot编码,然后输入隐藏层(这里为2个LSTM层)进行计算后输出状态向量h(t).非初始encoder单元除接收拼音的输入,同时,还接收上一个拼音encoder单元输出的状态向量h(t-1),其隐藏层经计算后输出h(t),作为下一个拼音encoder单元的一项输入.
利用船名语料库的训练集(16万余条数据)和测试集(4万余条数据)对Seq2Seq模型进行训练和测试,训练的主要参数设置如表3所示,训练过程如图4所示.由图4可见,训练在50步迭代后准确率趋于稳定,船名100%正确的准确率大概为28%左右. 表4为从测试集中随机抽取的几条翻译结果.
【参考文献】:
期刊论文
[1]基于LSTM的蒙汉机器翻译的研究[J]. 刘婉婉,苏依拉,乌尼尔,仁庆道尔吉. 计算机工程与科学. 2018(10)
[2]基于统计的汉英机器翻译技术的研究[J]. 赵静. 电子设计工程. 2016(21)
[3]船载AIS信息采集与解码技术研究[J]. 于光峰. 电子技术与软件工程. 2013(21)
[4]一般拓扑结构的非齐次隐含马尔科夫模型及其在中、英文语种辨识中的应用[J]. 王作英,孙健. 电子与信息学报. 2007(04)
[5]机器学习在汉字智能拼音输入中的应用[J]. 巨同升. 山东理工大学学报(自然科学版). 2005(03)
硕士论文
[1]基于神经网络的维汉机器翻译研究[D]. 张胜刚.新疆大学 2018
[2]船舶自动识别系统(AIS)接口数据的研究与应用[D]. 张颖.大连海事大学 2009
[3]基于统计的汉英机器翻译技术的研究[D]. 魏瑾.国防科学技术大学 2006
本文编号:3534905
【文章来源】:大连海事大学学报. 2020,46(02)北大核心CSCD
【文章页数】:8 页
【部分图文】:
语料库构建过程
图2中,每个encoder单元首先对船名拼音在嵌入层进行one-hot编码,然后输入隐藏层(这里为2个LSTM层)进行计算后输出状态向量h(t).非初始encoder单元除接收拼音的输入,同时,还接收上一个拼音encoder单元输出的状态向量h(t-1),其隐藏层经计算后输出h(t),作为下一个拼音encoder单元的一项输入.
利用船名语料库的训练集(16万余条数据)和测试集(4万余条数据)对Seq2Seq模型进行训练和测试,训练的主要参数设置如表3所示,训练过程如图4所示.由图4可见,训练在50步迭代后准确率趋于稳定,船名100%正确的准确率大概为28%左右. 表4为从测试集中随机抽取的几条翻译结果.
【参考文献】:
期刊论文
[1]基于LSTM的蒙汉机器翻译的研究[J]. 刘婉婉,苏依拉,乌尼尔,仁庆道尔吉. 计算机工程与科学. 2018(10)
[2]基于统计的汉英机器翻译技术的研究[J]. 赵静. 电子设计工程. 2016(21)
[3]船载AIS信息采集与解码技术研究[J]. 于光峰. 电子技术与软件工程. 2013(21)
[4]一般拓扑结构的非齐次隐含马尔科夫模型及其在中、英文语种辨识中的应用[J]. 王作英,孙健. 电子与信息学报. 2007(04)
[5]机器学习在汉字智能拼音输入中的应用[J]. 巨同升. 山东理工大学学报(自然科学版). 2005(03)
硕士论文
[1]基于神经网络的维汉机器翻译研究[D]. 张胜刚.新疆大学 2018
[2]船舶自动识别系统(AIS)接口数据的研究与应用[D]. 张颖.大连海事大学 2009
[3]基于统计的汉英机器翻译技术的研究[D]. 魏瑾.国防科学技术大学 2006
本文编号:3534905
本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/3534905.html