当前位置:主页 > 外语论文 > 外语文化论文 >

英汉多义词模体的计量特征

发布时间:2021-10-15 06:57
  词的多义性是人类语言基本且普遍的特征。基于语言模体框架对英汉多义词模体进行基本的数据统计,探索两种语言多义词模体的计量特征,讨论英汉语中与多义词相关的语言个性特征,表明,英汉多义词模体符合齐普夫—曼德布洛特分布,英汉多义词高阶长度模体遵从混合负二项分布;语言模体框架下的多义词对比分析能揭示英汉语的诸多个性特征;英语多义词在意义上比汉语多义词具有更高的灵活度,在理解上具有更大的上下文依赖度。 

【文章来源】:湖南科技大学学报(社会科学版). 2020,23(01)北大核心CSSCI

【文章页数】:8 页

【部分图文】:

英汉多义词模体的计量特征


齐普夫—曼德尔布罗特分布拟合英语多义词模体的双对数坐标图

多义词,罗特,汉语,拟合


图1 齐普夫—曼德尔布罗特分布拟合英语多义词模体的双对数坐标图需要说明的是,由于英汉语多义词数据集都是大样本,导致卡方检验(chi-square test)的失效。拒绝卡方检验的原因出于以下两个事实:(1)卡方检验值随着样本数据量的增长而呈线性增长;(2)语言研究中的样本数据往往是非常大的(1)。因此,上述结果数据中的X2以及P(X2)的值在这里没有统计价值,评价拟合优度(goodness-of-fit)的指标应采用差异系数C(coefficient of discrepancy)。在现代语言学研究中,差异系数具有广泛的接受度,有不依赖于自由度的优点。通常而言,差异系数越小,拟合优度则越好;当C<0.02时,可以认为是一个良好的拟合,而当C<0.01时,则是一个非常好的拟合(2)。此外,在假设检验中,决定系数R2(coefficient of determination)也是一个可供参考的指标。决定系数用来表示数据与统计模型在多大程度上是一个好的拟合,但参考这一指标的前提是差异系数在拟合优度上具有良好的表现。据此,观察上述检验结果数据可知,对于汉语多义词的rank-frequency分布而言,根据C和R2统计量,我们判断这是一个良好的拟合结果。对于英语而言,其拟合的结果可以接受,因为其差异系数(C=0.042)与0.02相距很近,差异较小,其决定系数(R2=0.958 6)则表明这是一个较优的拟合。综合上述情况,我们认为英语多义词模体的rank-frequency数据符合齐普夫—曼德尔布罗特分布,观察图1的拟合结果对数坐标图也能获得直觉上的认识,证明了上述判断的合理性。

负二项分布,多义词,拟合,高阶


拟合结果表明(根据C和R2值),英汉语多义词模体的长度模体分布均符合混合负二项分布(mixed negative binomial distribution)。拟合结果的详细数据见表7,两种语言的分布拟合双对数坐标图分别见图3和图4。图4 混合负二项分布拟合汉语多义词的高阶长度模体双对数坐标图

【参考文献】:
期刊论文
[1]用计量方法研究语言[J]. 冯志伟.  外语教学与研究. 2012(02)
[2]计量语言学的现状、理论与方法[J]. 刘海涛,黄伟.  浙江大学学报(人文社会科学版). 2012(02)



本文编号:3437624

资料下载
论文发表

本文链接:https://www.wllwen.com/waiyulunwen/waiguoyuyanwenhua/3437624.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1dd7a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com