当前位置:主页 > 文艺论文 > 语言学论文 >

面向信息处理的共现序列“把X”单位性质的辨认分析

发布时间:2017-11-29 08:12

  本文关键词:面向信息处理的共现序列“把X”单位性质的辨认分析


  更多相关文章: “把X”词 信息处理 词汇化 词表 规则库


【摘要】:本文以信息处理为方向,以“把X”为研究对象,基于大规模的语料分析和统计来探索“把X”字串的自动识别问题,以提高目前“把X”的识别精度为目标,望有助于今后的中文信息处理方面的应用研究。全文共分七章:第一章是绪论。本章明确研究对象,论述选题的目的和意义,概述“把X”的研究现状,简要说明本文的研究思路和采用的理论方法,最后对语料的来源进行简单说明。第二章是“把X”的类别及特征分析。本章逐条考察语料,考察每个词的词频来分类,分析各词频段的词的特征,明确词频是0%-100%的“把X”是本文重点研究的对象。第三章是“把X名”的辨认分析。本章重点考察“X”为名词性成分的“把X”字串,先依据语料库考察非句法结构和短语结构的“把X名”来探讨辨认规则,然后依据语料库文本并参考词典来考察“把X名”词。第四章是“把X动”的辨认分析。本章重点考察“X”为动词性成分的“把X”字串,先依据语料库考察非句法结构和短语结构的“把X动”来探讨辨认规则,然后依据语料库文本并参考词典来考察“把X动”词。第五章是“把X形”的辨认分析。本章重点考察“X”为形容词性成分的“把X”字串,依据语料库探讨非句法结构和短语结构的“把X形”来探讨辨认规则,然后依据语料库文本并参考词典来考察“把X形”词。第六章是“把X”辨认规则梳理。本章对全文的辨认规则做个梳理,总结辨认所用的词表和规则库,从总体上更好的把握本文的辨认规则。第七章是结语。本章对本文进行总体的概括和总结,分析本文存在的局限性和尚需解决的不足,并简单说明希望后续努力的方向。
【学位授予单位】:上海师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:H146

【参考文献】

中国期刊全文数据库 前10条

1 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期

2 周蕾;;基于碎片分词的未登录词识别方法[J];常熟理工学院学报;2007年02期

3 唐依力;;“把+O+VR+L”构式的构件特点[J];湘南学院学报;2012年03期

4 高云龙;;“把”的多义性认知分析[J];辽东学院学报(社会科学版);2011年03期

5 王灿龙;词汇化二例——兼谈词汇化和语法化的关系[J];当代语言学;2005年03期

6 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期

7 袁颖芬 ,张sソ,

本文编号:1236767


资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/1236767.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c1b62***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com