藏文词同现网络的构建及特征分析
发布时间:2024-03-14 05:30
语言同现网络用复杂网络技术对语言进行研究,揭示语言的内部结构。文章收集和整理了6个不同载体的藏语语料,包括诗歌、散文、政治、佛教、教材及口语共计64篇文章,在此基础上构建了藏文词同现网络,并从最短路径、聚类系数、度分布等方面分析了藏文词同现网络的统计特征,实验表明藏文词同现网络具有小世界效应和无标度特性。
【文章页数】:6 页
【部分图文】:
本文编号:3928132
【文章页数】:6 页
【部分图文】:
图2小语料集上藏文词同现网络的L、C和γ平均值分布图
为了从各个方面准确地分析藏文词同现网络的特征,本文将语料按体裁分为诗歌、散文、政治、佛教、教材、口语六大类,诗歌10篇、散文15篇、政治8篇、佛教2篇(因佛教类语料规模较小,故比较时不做考虑)、教材15篇及口语14篇共计64篇大小基本相同的文章。在建立的藏语语料库的基础上,依据藏....
图1藏文词同现网络示意图
二阶马尔科夫同现模型构建的词同现网络为G=(V,E),V是节点的集合,E为边的集合。构建规则为词表示同现网络中的节点,同一个句子中两个词之间存在同现关系,则网络中对应的两个节点相连。例3词同现网络特征分析
图3表示大语料集上藏文词同现网络的L、C和γ分布图
图2小语料集上藏文词同现网络的L、C和γ平均值分布图3.2词同现网络小世界效应和无标度特性
图4双对数坐标下全集语料的度分布图
复杂网络的度分布P(k)是刻画网络统计性质的另一个重要参数,定义为网络中随机选取一个节点其度恰好为k的概率。若P(k)满足幂律分布:P(k)∝k-γ(γ为正常数),则该网络具备无标度特性。由以上分析可知构建的71个藏文词同现网络的度分布情况,发现该藏文词同现网络与其它语言网络的度....
本文编号:3928132
本文链接:https://www.wllwen.com/kejilunwen/yysx/3928132.html