基于Agent协商的智能拼音输入法研究
发布时间:2021-09-28 15:20
随着对协商理论研究的不断深入,基于Agent的自动协商技术被运用到各类领域中,解决实际问题。文字,作为人与计算机交互的主要信息载体,对用户与计算机的交互体验有着直接影响。中文输入法是大多数中文用户使用计算机的必备程序。在类型众多的中文输入法中,拼音输入法具有简单易学、多场景适用等诸多优点,因此,拼音输入法成为了当前中文输入法领域的主流。在机器翻译领域,近年来,计算机辅助人类译员进行翻译逐渐成为该领域的研究热点。辅助翻译的研究专注于如何有效地利用计算机帮助人类译员高效地完成翻译任务、提高翻译质量。受Agent协商的启发,本文将辅助翻译中文拼音输入法的应用场景,抽象为协商域,利用Agent协商,完成拼音向汉字的解码任务。本文提出了一种基于Agent协商的智能拼音输入法(以下称智能输入法)。该输入法面向英译中的翻译环境,专注于译员在对原文进行翻译的过程中,如何通过已输入的拼音序列有效地预测译员实际想要输入的中文片段。实验结果证明,该输入法能够有效地利用Agent协商技术将机器翻译上下文信息融合到中文拼音输入法中,在译员专注于翻译任务的过程中,准确地预测译员想要输入的中文片段,减少译员击键次数...
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
统计机器翻译的典型翻译模型
架有如下的特点:l 完全开源,使用 JAVA 语言开发,平台无关;l 简单、易用,用户只用通过了解一些少量的配置文件,便可定制化自己训练方案;l 可配置性,所有的参数均通过配置文件传递,方便管理;l 高度解耦的训练流程,解码器以及解码过程用户可以完全自定义,并运于外部进程中;自定义解码结果的评价指标或者使用 Z-MERT 内置的通用评价标;l 高度优化的执行过程,时间、空间等资源占用少。使用 Z-MERT 进行参数训练时,用户需要实现自己的解码器,训练过程中将解码结果保存为文件,传递给 Z-MERT。解码器对于 Z-MERT 框架是一个“盒”,Z-MERT 不关注解码器的执行过程。Z-MERT 内部提供了丰富的评价指标以供用户使用,用户也可以实现平台的接口自定义评价指标。参数训练过程是码、评价和调参的不断迭代过程。这三个过程均可以执行在各自独立的进程中通过进程结束信号和文件相互传递信息。其基本过程可以描述为如下图 2-2:
西南大学硕士学位论文不重不漏的拼音序列。一般切分的方式是基于已有的汉语拼音表进行查找,在拼音序列首尾分别设置一个指针,利用贪心算法搜索最长的拼音序列,直到首尾指针重合,停止搜索。本文将这种搜索方式称为“最长拼音序列搜索算法”,算法过程的形式化描述见算法 1。2)音字、音词表查询基于第一步切分后的拼音序列列表,查找列表中每个拼音序列对应的汉字列表,会得到一个汉字列表的列表。如图 3-1 所示。
【参考文献】:
期刊论文
[1]拼音输入法经验对汉字字形和语音加工的影响[J]. 朱朝霞,刘丽,丁国盛,彭聃龄. 心理学报. 2009(09)
[2]基于多AGENT系统的电力合约市场协商平台框架研究[J]. 余顺坤,袁家海. 中国管理科学. 2006(02)
[3]多Agent系统研究综述[J]. 李海刚,吴启迪. 同济大学学报(自然科学版). 2003(06)
[4]基于Agent的金融市场模型研究进展综述[J]. 刘文财,刘豹,王启文,张维. 系统工程学报. 2003(02)
[5]Linux下的汉字输入法设计技术[J]. 李培峰,朱巧明,钱培德. 计算机应用. 2002(06)
[6]拼写纠正在拼音输入法中的应用[J]. 陈正,李开复. 计算机学报. 2001(07)
[7]面向Agent编程——编程技术的一次飞跃[J]. 程显毅. 计算机科学. 2000(07)
[8]文字和通信[J]. 钱文浩. 科学通报. 1956(10)
博士论文
[1]基于自治与协商机制的柔性制造车间智能调度技术研究[D]. 王世进.上海交通大学 2008
[2]多Agent协商研究[D]. 姜丽.吉林大学 2007
硕士论文
[1]基于移动Agent的B2C电子商务协商模型研究[D]. 周赟.大连工业大学 2013
[2]常用汉字的结构编码与识别系统[D]. 黄书锦.复旦大学 2013
[3]中文输入法若干相关问题研究[D]. 杨少华.上海交通大学 2013
[4]一种具有英汉辅助翻译功能的拼音输入法[D]. 李栋.厦门大学 2006
[5]汉字编码输入法研究[D]. 戴石麟.重庆大学 2005
本文编号:3412160
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
统计机器翻译的典型翻译模型
架有如下的特点:l 完全开源,使用 JAVA 语言开发,平台无关;l 简单、易用,用户只用通过了解一些少量的配置文件,便可定制化自己训练方案;l 可配置性,所有的参数均通过配置文件传递,方便管理;l 高度解耦的训练流程,解码器以及解码过程用户可以完全自定义,并运于外部进程中;自定义解码结果的评价指标或者使用 Z-MERT 内置的通用评价标;l 高度优化的执行过程,时间、空间等资源占用少。使用 Z-MERT 进行参数训练时,用户需要实现自己的解码器,训练过程中将解码结果保存为文件,传递给 Z-MERT。解码器对于 Z-MERT 框架是一个“盒”,Z-MERT 不关注解码器的执行过程。Z-MERT 内部提供了丰富的评价指标以供用户使用,用户也可以实现平台的接口自定义评价指标。参数训练过程是码、评价和调参的不断迭代过程。这三个过程均可以执行在各自独立的进程中通过进程结束信号和文件相互传递信息。其基本过程可以描述为如下图 2-2:
西南大学硕士学位论文不重不漏的拼音序列。一般切分的方式是基于已有的汉语拼音表进行查找,在拼音序列首尾分别设置一个指针,利用贪心算法搜索最长的拼音序列,直到首尾指针重合,停止搜索。本文将这种搜索方式称为“最长拼音序列搜索算法”,算法过程的形式化描述见算法 1。2)音字、音词表查询基于第一步切分后的拼音序列列表,查找列表中每个拼音序列对应的汉字列表,会得到一个汉字列表的列表。如图 3-1 所示。
【参考文献】:
期刊论文
[1]拼音输入法经验对汉字字形和语音加工的影响[J]. 朱朝霞,刘丽,丁国盛,彭聃龄. 心理学报. 2009(09)
[2]基于多AGENT系统的电力合约市场协商平台框架研究[J]. 余顺坤,袁家海. 中国管理科学. 2006(02)
[3]多Agent系统研究综述[J]. 李海刚,吴启迪. 同济大学学报(自然科学版). 2003(06)
[4]基于Agent的金融市场模型研究进展综述[J]. 刘文财,刘豹,王启文,张维. 系统工程学报. 2003(02)
[5]Linux下的汉字输入法设计技术[J]. 李培峰,朱巧明,钱培德. 计算机应用. 2002(06)
[6]拼写纠正在拼音输入法中的应用[J]. 陈正,李开复. 计算机学报. 2001(07)
[7]面向Agent编程——编程技术的一次飞跃[J]. 程显毅. 计算机科学. 2000(07)
[8]文字和通信[J]. 钱文浩. 科学通报. 1956(10)
博士论文
[1]基于自治与协商机制的柔性制造车间智能调度技术研究[D]. 王世进.上海交通大学 2008
[2]多Agent协商研究[D]. 姜丽.吉林大学 2007
硕士论文
[1]基于移动Agent的B2C电子商务协商模型研究[D]. 周赟.大连工业大学 2013
[2]常用汉字的结构编码与识别系统[D]. 黄书锦.复旦大学 2013
[3]中文输入法若干相关问题研究[D]. 杨少华.上海交通大学 2013
[4]一种具有英汉辅助翻译功能的拼音输入法[D]. 李栋.厦门大学 2006
[5]汉字编码输入法研究[D]. 戴石麟.重庆大学 2005
本文编号:3412160
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3412160.html