基于70年报刊语料的现代汉语历时稳态词抽取与考察
发布时间:2017-09-10 18:24
本文关键词:基于70年报刊语料的现代汉语历时稳态词抽取与考察
【摘要】:该文基于70年跨度的历时报刊语料库,使用九种统计方法计算了词语历年的使用情况,并通过对稳定性、覆盖度和时间区分性能的考察筛选获得了规模为3 013词的历时稳态词候选词集。该词集中动词与名词各占约三分之一(其余为形容词、副词与虚词),平均词长约1.7字,前密后疏地分布于历时语料库总频序表的前7 609位,覆盖了总语料的近九成。该部分词语中包含大量构造句子结构的核心词语。它们塑造了稳态词在词长和词类上的特性。稳态词的提取可以加深对语言生活底层与基础词汇的认识,对汉语教学、中文信息处理和语言规划都具有重要意义。
【作者单位】: 北京语言大学对外汉语研究中心;北京语言大学语言政策与标准研究所;
【关键词】: 稳态词 历时语料库 语言监测
【基金】:国家社科基金(12&ZD173);国家社科基金(16AYY007) 国家语委科研项目(YB125-42;ZDI135-3) 863计划重点项目(SQ2015AA0100074) 教育部人文社科重点研究基地重大项目(16JJD740004)
【分类号】:TP391.1
【正文快照】: 1引言汉语演变的历程中,词语使用受时间影响的程度不一,表现为词语在时间维度上的分布不同。词汇系统中很多词语使用稳定、受时间影响小、更新和变异缓慢,构成了现代汉语词汇系统的底层,起到基础和主干的作用。张普[1]先生的研究中将这部分词语被称作稳态词。稳态词在自然语言,
本文编号:825915
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/825915.html