面向信息处理的共现序列“要X”单位性质的辨认分析
发布时间:2017-09-30 10:31
本文关键词:面向信息处理的共现序列“要X”单位性质的辨认分析
更多相关文章: 共现序列“要X” 信息处理 特征说明 词表 规则库
【摘要】:本文以语言学本体理论知识为基础,以信息处理为目标,在考察大规模语料的基础上,对共现序列“要X”在实际文本中出现的各种形式、概率进行了分类统计,提取“要X”各单位形式的特征,设想构建面向计算机处理的检测规则,解决“要X”单位性质的自动识别和歧义消解问题。本文分为绪论和正文共七章。绪论部分。绪论介绍了论文的研究对象,选题意义,前人的研究成果及现状,说明本文的研究思路与拟采用的理论方法。第一章,“要”及“要X”的语料处理与分类。本章在语料考察的基础上,结合《现代汉语词典(第6版)》,确定研究对象“要X”,并针对“要X”的整体分布格局,将其分为四类并构建词表。第二章,非句法结构“要X”的考察。非句法结构“要X”分为两种情况:左右边界及语素组、词串形式。对左右边界及语素组,本章整理出了每一个“要X”的左边界、右边界和语素组;对词串形式,根据“要”是否为助动词分两类研究,对每一类中的“要X”做了详细的单位特征说明。第三章,短语结构“要X”的考察。本章根据短语“要X”中“要”是否为助动词,将短语结构“要X”分为两类研究,对每一个“要X”短语给出了信息处理所需的单位识别特征。第四章,“要X”词的用法考察。本章按照“要X”词的词性进行分类,依据语料的数据统计情况,对“要X”词的词频和句中位置、左右搭配等特征情况进行了考察说明。第五章,“要X”辨认规则构建。本章从信息处理的角度,构建“要X”单位识别所需的词表,并设想构建了识别规则以及说明了辨识步骤。第六章,结语。本章对本文做了整体的概括和总结,分析了研究成果和存在的不足,提出后续研究需努力的方向。
【关键词】:共现序列“要X” 信息处理 特征说明 词表 规则库
【学位授予单位】:上海师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:H146
【目录】:
- 摘要3-4
- abstract4-7
- 零 绪论7-14
- 0.1 研究对象7-8
- 0.2 选题意义8
- 0.3 研究方法及语料来源8-9
- 0.4“要”及“要X”的研究现状9-11
- 0.4.1“要”的研究9-10
- 0.4.2“要X”的研究10-11
- 0.5 信息处理中中文单位性质辨认研究现状11-14
- 0.5.1 中文自动识别及歧义消解研究11-13
- 0.5.2 有关中文自动分词的规范研究13-14
- 第一章 兼类词“要”及“要X”的语料处理与分类14-22
- 1.1 兼类词“要”14-16
- 1.1.1“要”的原义14
- 1.1.2“要”在古汉语中的使用情况14-15
- 1.1.3 现代汉语中“要”的含义和用法15-16
- 1.2 共现序列“要X”及语料处理16-19
- 1.2.1 双音节共现序列“要X”16
- 1.2.2 双音节“要X”的单位情况16-19
- 1.3“要X”的分类及词表建立19-21
- 1.4 小结21-22
- 第二章 非句法结构“要X”的考察22-47
- 2.1“要X”左右边界及语素组考察23-27
- 2.1.1“要X”左边界23-25
- 2.1.2“要X”右边界25-27
- 2.1.3 语素组“要X”27
- 2.2 词串形式“要X”考察27-45
- 2.2.1“要”非助动词的词串形式考察28-34
- 2.2.2“要”为助动词的词串形式考察34-45
- 2.3 小结45-47
- 第三章 短语形式“要X”的考察47-55
- 3.1 存在短语形式的“要X”47-48
- 3.2 短语形式“要X”的分类研究48-54
- 3.2.1“要”非助动词的短语“要X”48-51
- 3.2.2“要”为助动词的短语“要X”51-54
- 3.3 小结54-55
- 第四章“要X”词的用法考察55-89
- 4.1 单一词性“要X”的用法考察55-84
- 4.1.1 连词“要X”55-60
- 4.1.2 动词“要X”60-67
- 4.1.3 形容词“要X”67-70
- 4.1.4 名词“要X”70-84
- 4.2 多词性“要X”的用法考察84-88
- 4.3 小结88-89
- 第五章“要X”辨认规则构建89-97
- 5.1 词表构建89-91
- 5.1.1 目标词表89-90
- 5.1.2 排歧词表90-91
- 5.2 规则构建91-95
- 5.2.1 规则说明91-92
- 5.2.2 检测步骤92-95
- 5.3 小结95-97
- 第六章 结语97-98
- 6.1 本文研究总结97
- 6.2 后续研究展望97-98
- 参考文献98-104
- 致谢104
【相似文献】
中国硕士学位论文全文数据库 前1条
1 吴婷;面向信息处理的共现序列“要X”单位性质的辨认分析[D];上海师范大学;2016年
,本文编号:947724
本文链接:https://www.wllwen.com/wenyilunwen/yuyanyishu/947724.html