当前位置:主页 > 文艺论文 > 语言学论文 >

基于语料库多维特征聚类关联的成都话语气词研究

发布时间:2020-08-09 16:39
【摘要】:语气涉及结构、意义、语境多个方面因素,语气成分的功能有很强的模糊性,多个语气成分的功能不是排他的而是相容/不相容的,这导致语气和语气词研究的困难:争议很大,单纯的自省法很容易被预设的理论框架局限,定性式的确切定义往往难以说明一个语气词的复杂情况。因此本文用真实文本组建的语料库为基础来研究成都话语气词系统,用11个维度42个特征的多维特征对语料进行标注,用基于博弈的权重计算来确定关联(相似性),在此基础上按偏向性策略进行层次聚类,得到各语气词的功能聚类关联情况,总结出每个语气词的核心功能,并研究各功能关联形成的有机整体。语气系统是一个多维的分层结构,本文考察的层次从低到高为:形式(附着性、分布、句类)、言语行为(具体言行为、信/疑)、判断(预期性)、判断(情感极性、立场)、力度(情绪强中弱)。成都话语气词由高层的预期性、立场和力度驱动:强意外+反问“嗦”、强意外+反问和弱意外+求证“哇”、强意外+强调陈述“哦、啊”、强调询问+强意外“喃”、强调确认听者错误预期+同盟“噻”、较强确认听者错误预期+同盟“哈”、强同盟“嘎”、直陈+确认+无同盟“V”、强调+同盟“嘛”、缓和+同盟“吧”。各语气词的核心功能能够区别开来,各司其职,具有定量区别、对比区别和定性区别3种不同的功能辨识性。各维度还是互相关联的:独立成句、句首、句中、多句中趋于人际语篇功能;没有专门的疑问语气词,疑问句类最活跃,一半以上表示无疑的反问式告知/要求或强求认同,然后才用于询问;反问告知/要求是隐性的否定,力度最强,强求认同次之,之后为祈使要求,直陈可趋向中弱情绪,求证问特别是求证式要求最容易趋弱;强情绪也来自有极性的预期性,反说者预期的意外最容易引发强情绪,其次是指出听者预期错误的确认,再次是顺应听者预期,然后是确认/顺应第三方预期;中弱情绪来自顺应说者预期和无预期;同盟立场在语气词中是无标记的,情感和情绪分布比较复杂;反同盟立场是有标记的,情感负面的,情绪强;无同盟对语气词也是有标记的,出现在没有真正听者的叙述语篇和自言自语中,趋向中性;负面情感最容易引发强情绪,正面情感次之,中性情感趋向非强情绪。关联让各语气词的功能又具有“模糊性”,在历时自我演变、语言接触影响和个人用语习惯等共同作用下,使得各语气词在许多功能中或多或少有所“交叠”,交叠时依靠核心功能显示出来的定量区别可能有微妙的语感差异。
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:H172.3
【图文】:

地图,语义,地图


逑想算法的本质是要通过所有共现的情况减少空地图。逡逑当然,尽管图1.5是各点两两相连的空地图,但各边权重“粗细”不一,Cysouw逡逑就可“删粗留细”,得到化简后的图1.6,认为这是人称语义的“主流规律”。逡逑pc逡逑图1.5邋:邋Cysouw人称语义地图逡逑这样我们可以看出第一人称单复数之间关联、第二人称单复数之间关联、第逡逑三人称单复数之间关联强。同时这一关联也得出了人称在世界语言的主流就是按逡逑第一、第二、第三人称聚成了邋3类。不过图1.5和图1.6有一个问题,就是12-13逡逑间的连线明明很粗为什么也被删除了?这实际上来自于研究者的“专家直觉”。逡逑需要考虑的是这后面的“专家直觉”到底是怎样的一种思路和计算模式。逡逑?逦<^>逡逑?逦?逡逑?逦?逡逑?逦?逡逑图1.6:逦Cysouw人称语义地图简图逡逑另外,郭锐(2012:邋115-116)引入了“关联度”的概念对语义地图的算法进逡逑行了改进,两个概念间关联度的计算公式为公式1.1:逡逑公式邋l.l9邋A邋=邋S1邋?邋S2邋/邋(W1邋+W2-S1邋?邋S2)邋X邋100逡逑简单地说“关联度”是将完全加权按一定比例缩放,也是把每一个记录局部逡逑视作完全图,计算的是一种“完全关联度”,同样很容易出现空地图,和理想算逡逑法矛盾。逡逑9邋“S1.S2”指基元1和基元2在数据中“任意”共现的频次,W1指具有义项1的总频次,

地图,语义,地图


逑想算法的本质是要通过所有共现的情况减少空地图。逡逑当然,尽管图1.5是各点两两相连的空地图,但各边权重“粗细”不一,Cysouw逡逑就可“删粗留细”,得到化简后的图1.6,认为这是人称语义的“主流规律”。逡逑pc逡逑图1.5邋:邋Cysouw人称语义地图逡逑这样我们可以看出第一人称单复数之间关联、第二人称单复数之间关联、第逡逑三人称单复数之间关联强。同时这一关联也得出了人称在世界语言的主流就是按逡逑第一、第二、第三人称聚成了邋3类。不过图1.5和图1.6有一个问题,就是12-13逡逑间的连线明明很粗为什么也被删除了?这实际上来自于研究者的“专家直觉”。逡逑需要考虑的是这后面的“专家直觉”到底是怎样的一种思路和计算模式。逡逑?逦<^>逡逑?逦?逡逑?逦?逡逑?逦?逡逑图1.6:逦Cysouw人称语义地图简图逡逑另外,郭锐(2012:邋115-116)引入了“关联度”的概念对语义地图的算法进逡逑行了改进,两个概念间关联度的计算公式为公式1.1:逡逑公式邋l.l9邋A邋=邋S1邋?邋S2邋/邋(W1邋+W2-S1邋?邋S2)邋X邋100逡逑简单地说“关联度”是将完全加权按一定比例缩放,也是把每一个记录局部逡逑视作完全图,计算的是一种“完全关联度”,同样很容易出现空地图,和理想算逡逑法矛盾。逡逑9邋“S1.S2”指基元1和基元2在数据中“任意”共现的频次,W1指具有义项1的总频次,

树状图,聚类,层次聚类,共现


“删除非必需边”的过程。所谓“非必需边”,就是看边所连接的两点能否“独逡逑立”地只在两点共现中出现。如果有是“必需边”,如果无就是“非必需边”。但逡逑是即使如此,图1.5中12-13还是无法自动删除必须靠“专家直觉”来处理。另逡逑外,本文研究语气词所设置的特征系统中,各例句都由10个左右特征标注,根逡逑本不存在只有两个点独立共现的情况,根本没有“非必需边”。逡逑0逦¥逦IS逦ts逦20逦25逡逑}逦1逦;逦t逦i逡逑-4邋一逡逑:;r逦14逦逡逑5—丨丨邋1逡逑A邋?逦'邋—l逡逑货黎逦逦逡逑╁澹保ⅲ卞义希掊危В取义希洌危玻插濉掊危ⅲ㈠澹А鲥澹㈠澹薄诲义希″义希浚兑唬ⅲ邋五义希停翦危跺五义希渝逡唬义希颍翦五五义蟦逦—?逦逦逡逑裰碑邋23逡逑20邋—逡逑R#:逦26邋一逡逑g摩逦27邋一"逡逑煖.擺逦30逡逑"::n—逡逑15邋—*逦"…■■■■■■邋邋逦逡逑r.:f.逦逦逡逑r逦,逦逦逦邋逦邋逦逦逡逑一逡逑—痛一-*逦逦—逡逑_邋逦逡逑逦i逡逑M逦9邋J..—邋邋邋邋邋邋邋邋邋邋邋邋逡逑图1.7:中国各省距离层次聚类图1()逡逑上述关联聚类和的结果是一次聚类。因为我们挖掘的知识往往是结构化的,逡逑可能需要的层次聚类(HierarchicalClustering):多次而非一次聚类,聚出来的类逡逑别具有多层级结构。最常见的层次聚类是两两聚类形成的“树状图(Dendrogram)”逡逑层级:计算各项目之间的绝对相似性

本文编号:2787386

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/2787386.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户89285***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com