基于神经网络的中文语法纠错关键技术研究
发布时间:2021-11-14 13:32
现阶段中文文本分类研究重点主要集中两方面,一方面是文本情感分析,一方面是中文计算机辅助学习,其中中文计算机辅助学习的研究热点主要是中文语法纠错和中文错别字订正。但目前现有模型面临泛化能力差,需要大量人工标注特征,本地词语库词语较少,模型复杂等问题。所以设计可靠可用的中文辅助学习工具仍然是一项具有挑战的工作。针对上述问题,本文基于门控递归单元与条件随机场,研究整合字,词,词性在中文中的特点,分析句子成分,主要内容包括以下两个方面:(1)针对判定中文语法错误,本文提出了一种基于门控递归单元与条件随机场的组合模型(GRUCRF),该模型使用字向量表示句子特征,通过GRU整合句子特征来分类语法错误,最终使用CRF判定错误发生的位置。解决了中文句子由于分词导致歧义,文本特征不好拟合,以及单独使用CRF模型需要大量人工标注特征的问题。对比实验结果表明该模型优于现有机器学习模型以及其他神经网络模型。(2)针对错别字订正,本文使用词性标注句子,利用CRF模型拟合中文句子词语搭配特征。解决了现有模型需要制定大量规则,泛化能力较差的问题,同时在实验中引入网络词语库,改进了本地词语库词...
【文章来源】:云南大学云南省 211工程院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
不同维度下CNN分类器与LSTM分类器在探测级中F1的变化曲线
本文编号:3494727
【文章来源】:云南大学云南省 211工程院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
不同维度下CNN分类器与LSTM分类器在探测级中F1的变化曲线
本文编号:3494727
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3494727.html