当前位置:主页 > 外语论文 > 小语种论文 >

乌兹别克语词干提取算法的比较研究

发布时间:2021-12-23 22:15
  黏着语的自然语言处理中,词干提取作为一项基础的预处理任务,对其他任务的性能影响较大。现有的乌兹别克语词干提取任务仍依赖基于规则的方法,且实验效果不太理想。该文将乌兹别克语词干提取任务视为序列标注问题进行处理,以字符为最小单位进行切分,分别构建了基于条件随机场(CRF)和门控循环单元网络(Bi-GRU)的乌兹别克语词干提取模型。实验结果表明,基于序列标注的乌兹别克语词干提取模型与基于规则的方法相比不仅降低了人工成本,而且在性能方面有较为显著的提升。

【文章来源】: 中文信息学报. 2020,34(01)北大核心CSCD

【文章页数】:6 页

【文章目录】:
0 引言
1 相关工作
2 几种典型的词干提取方法
    2.1 Lovins算法
    2.2 CRF模型
    2.3 GRU模型
3 标记集
4 实验
    4.1 实验数据
    4.2 实验设计和结果
        4.2.1 不同标注方法的对比实验
        4.2.2 不同模型和不同数据集的对比实验
            1) 模型对比实验中的发现
            2) 数据集对比实验中的发现
5 结论


【参考文献】:
期刊论文
[1]基于Bi-LSTM-CRF模型的维吾尔语词干提取的研究 [J]. 古丽尼格尔·阿不都外力,吐尔根·依布拉音,卡哈尔江·阿比的热西提,王路路.  中文信息学报. 2019(08)
[2]基于多策略的乌孜别克语名词词干识别研究 [J]. 艾孜海尔江,祖力克尔江,艾孜尔古丽,玉素甫·艾白都拉.  中文信息学报. 2018(09)
[3]基于统计的蒙汉机器翻译中词对齐方法研究 [J]. 苏依拉,赵亚平,牛向华.  中文信息学报. 2018(06)
[4]基于双向门限递归单元神经网络的维吾尔语形态切分 [J]. 哈里旦木·阿布都克里木,程勇,刘洋,孙茂松.  清华大学学报(自然科学版). 2017(01)
[5]基于机器翻译的维吾尔语形态分析研究 [J]. 徐春,杨勇,蒋同海.  计算机工程与应用. 2017(14)
[6]基于CRF模型的蒙古文分词及词性标注的研究 [J]. 那日松,淑琴,齐力格尔.  内蒙古大学学报(哲学社会科学版). 2016(02)
[7]融合多策略的维吾尔语词干提取方法 [J]. 赛迪亚古丽·艾尼瓦尔,向露,宗成庆,艾克白尔·帕塔尔,艾斯卡尔·艾木都拉.  中文信息学报. 2015(05)
[8]现代哈萨克语词干提取研究 [J]. 李婧,刘海峰.  信息通信. 2015(07)
[9]词干提取方法及工具的对比分析研究 [J]. 吴思竹,钱庆,胡铁军,李丹亚,李军莲,洪娜.  图书情报工作. 2012(15)



本文编号:3549290

资料下载
论文发表

本文链接:https://www.wllwen.com/waiyulunwen/zhichangyingyu/3549290.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户67a78***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com