对联的认知研究及其计算机实现
发布时间:2017-08-31 19:26
本文关键词:对联的认知研究及其计算机实现
更多相关文章: 对称性 汉语 对联 认知语言学 自然语言处理
【摘要】:对称性是一种普遍的自然现象,广泛存在于人类社会生活中。对称性思想是人类熟知和常用的认知方法,深深影响着人类生活的方方面面,在众多的学科领域有着极高的地位。语言作为思维的载体,人类交流的工具,也受到对称性的影响。由于古人利用矛盾对立的哲学思想认识世界,非常崇尚具有对称性的事物,并将对称性思想应用在诸多领域,汉语也深受其影响,在多个语言层面上表现出对称特征。同时,由于汉语的单音节语素灵活自由,容易组合成对的特征更是使汉语的这种对称特征得到广泛的传播。我们实验室重点探索的是由陈寅恪先生的《与刘叔雅论国文试题书》中关于中文文法的问题,指出了汉语中的对称特征,并进行深入的研究,结合自然语言处理技术,试图为中文文法的确立提供帮助,为汉语的自然语言处理提供理论支持。本文较为详细地描述了汉语中存在的对称性现象,并对字、词语和语句三个不同语言结构单位中的对称性现象进行分析,指出它们各自的表现形式、特点以及形成原因。并描述了汉语中极具对称性特征的对联,指出了对联的上下联之间字数相等,对应的语言单位词性和类别都应相同,注重用字的平仄,音韵相对,声调和谐。依据写作方法的不同将对联进行分类,指出各类别的特点。使用认知语言学的理论,分析对联的认知过程和认知特点。依据概念合成理论原理,将对联的上下两联作为两个输入空间,在空间内部和空间之间形成复杂的映射网络,并利用类属空间的特性在两空间合成时进行检验,完成对联的认识过程。此外,分析了对联在认知过程中所表现出的特点,表现对象在形式和意义上的双重突显,分析对联时需要与语境建立最大关联,在不同的认知阶段表现出的不同的美学效应,实现对联更全面深入的研究。通过完成对联的认知过程的分析,并结合对联的对称性特点,本文采用格律严谨的《笠翁对韵》作为建立语料库的语料,并在此基础上进行相关程序实现。由于中文的独有特点,只存在字的界线而没有词的界线,分词就成为中文自然语言处理的一个难点。本文对现在使用较为广泛且成熟的三种分词方法进行了介绍和比较,并结合对联与《笠翁对韵》中存在相当多的对称词的特征,选择了正向最大匹配分词方法来实现对联的分词。语料库为分词结果中的词语提供多种对称词以供选择,结合上联语义及语境,可以选择最佳的对称词组合,来实现自然语言理解和生成。这是研究汉语中的对称性特征,并利用对称性的原理来进行程序实现的一次探索,还存在着巨大的理论和技术空间需要进一步展开。
【关键词】:对称性 汉语 对联 认知语言学 自然语言处理
【学位授予单位】:成都理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:H0-05;TP391.1
【目录】:
- 摘要4-6
- Abstract6-10
- 第1章 绪论10-17
- 1.1 研究的意义10-11
- 1.2 研究的技术背景11-14
- 1.2.1 自然语言处理11-12
- 1.2.2 中文自然语言处理研究的难点12
- 1.2.3 自然语言处理研究的发展趋势12-13
- 1.2.4 中文的自然语言处理13-14
- 1.3 对联生成系统研究现状14-15
- 1.4 研究内容15-17
- 第2章 对联的认知研究17-32
- 2.1 中文的对称性17-19
- 2.2 中文的不对称19
- 2.3 对联的简介与分类19-20
- 2.4 陈寅恪阐述对对联的意义20-22
- 2.5 认知语言学22-25
- 2.5.1 认知语言学的介绍22
- 2.5.2 概念合成理论22-25
- 2.6 对联的认知过程分析25-29
- 2.7 对联的规律29-30
- 2.8 对联生成系统的比较和面临的问题30-31
- 2.9 本章小结31-32
- 第3章 语料库的设计及实现32-37
- 3.1 语料库的研究32-33
- 3.2 《笠翁对韵》的语料库建构33-36
- 3.3 本章小结36-37
- 第4章 对联自动生成实现37-49
- 4.1 什么是中文分词37
- 4.2 中文分词方法的分类37-40
- 4.2.1 基于统计的分词方法37-38
- 4.2.2 基于理解的分词方法38
- 4.2.3 基于字符串匹配分词方法38
- 4.2.4 三种分词方法的比较38-39
- 4.2.5 中文分词的难点39-40
- 4.3 正向最大匹配分词方法40-41
- 4.4 系统设计及实现41-47
- 4.5 实验及结果分析47-48
- 4.6 本章小结48-49
- 总结与展望49-51
- 致谢51-52
- 参考文献52-54
- 攻读学位期间取得学术成果54
【参考文献】
中国期刊全文数据库 前1条
1 胡增益;语言结构中的对称[J];民族语文;1996年05期
中国博士学位论文全文数据库 前1条
1 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
,本文编号:767463
本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/767463.html