面向信息处理的共现序列“把X”单位性质的辨认分析

发布时间：2017-11-29 08:12

本文关键词：面向信息处理的共现序列“把X”单位性质的辨认分析

【摘要】：本文以信息处理为方向,以“把X”为研究对象,基于大规模的语料分析和统计来探索“把X”字串的自动识别问题,以提高目前“把X”的识别精度为目标,望有助于今后的中文信息处理方面的应用研究。全文共分七章:第一章是绪论。本章明确研究对象,论述选题的目的和意义,概述“把X”的研究现状,简要说明本文的研究思路和采用的理论方法,最后对语料的来源进行简单说明。第二章是“把X”的类别及特征分析。本章逐条考察语料,考察每个词的词频来分类,分析各词频段的词的特征,明确词频是0%-100%的“把X”是本文重点研究的对象。第三章是“把X名”的辨认分析。本章重点考察“X”为名词性成分的“把X”字串,先依据语料库考察非句法结构和短语结构的“把X名”来探讨辨认规则,然后依据语料库文本并参考词典来考察“把X名”词。第四章是“把X动”的辨认分析。本章重点考察“X”为动词性成分的“把X”字串,先依据语料库考察非句法结构和短语结构的“把X动”来探讨辨认规则,然后依据语料库文本并参考词典来考察“把X动”词。第五章是“把X形”的辨认分析。本章重点考察“X”为形容词性成分的“把X”字串,依据语料库探讨非句法结构和短语结构的“把X形”来探讨辨认规则,然后依据语料库文本并参考词典来考察“把X形”词。第六章是“把X”辨认规则梳理。本章对全文的辨认规则做个梳理,总结辨认所用的词表和规则库,从总体上更好的把握本文的辨认规则。第七章是结语。本章对本文进行总体的概括和总结,分析本文存在的局限性和尚需解决的不足,并简单说明希望后续努力的方向。
【学位授予单位】：上海师范大学
【学位级别】：硕士
【学位授予年份】：2015
【分类号】：H146

【参考文献】

中国期刊全文数据库前10条

1 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期

2 周蕾;;基于碎片分词的未登录词识别方法[J];常熟理工学院学报;2007年02期

3 唐依力;;“把+O+VR+L”构式的构件特点[J];湘南学院学报;2012年03期

4 高云龙;;“把”的多义性认知分析[J];辽东学院学报(社会科学版);2011年03期

5 王灿龙;词汇化二例——兼谈词汇化和语法化的关系[J];当代语言学;2005年03期

6 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期

7 袁颖芬 ,张sソ，

本文编号：1236767

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/wenyilunwen/yuyanxuelw/1236767.html

上一篇：消失的部首字——从《说文》到现代汉字记号化进程的研究
下一篇：《后汉书》副词研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|