当前位置:主页 > 文艺论文 > 汉语言论文 >

词汇长度与词汇频数关系的计量语言学研究

发布时间:2018-05-07 14:31

  本文选题:词长 + 词频 ; 参考:《外国语(上海外国语大学学报)》2013年03期


【摘要】:本文以语料库为基础,以协同语言学理论为指导,对汉语词汇长度与词汇在语篇中的使用频数之间的关系进行计量语言学分析。研究结果表明,词汇的使用频数和词汇长度之间存在明显的依存关系。词汇越长,在语篇中的使用频数越低,二者成反比关系。幂函数模型y=axb能够准确地描述汉语词汇的这种规律性特征。研究结果同时表明,模型参数a具有较强的文本语体区分功能。本研究结果不仅完善了词长和词频之间关系的相关理论,为二者之间关系的语言共性提供了新证据,而且为语体识别和文本分类提供了新的方法和思路。
[Abstract]:Based on the corpus and guided by the theory of cooperative linguistics, this paper makes an econometric analysis of the relationship between the length of Chinese words and the frequency of their use in discourse. The results show that there is a significant dependency between the frequency of vocabulary use and the length of vocabulary. The longer the vocabulary, the lower the frequency of use in the text, which is inversely proportional to each other. Power function model y=axb can accurately describe the regularity of Chinese vocabulary. The results also show that the model parameter a has a strong text style differentiation function. The results of this study not only improve the relevant theory of the relationship between word length and word frequency, but also provide new evidence for the common language between them, and provide new methods and ideas for style recognition and text classification.
【作者单位】: 大连海事大学外国语学院;杭州师范大学外国语学院;
【基金】:国家社科基金项目“基于平行语料库的术语自动抽取及双语术语词典编撰研究”(11BYY053) 国家留学基金委公派访问学者(含博士后研究)项目
【分类号】:H03

【参考文献】

相关期刊论文 前3条

1 周绍珩;;马丁内的语言功能观和语言经济原则[J];国外语言学;1980年04期

2 吴旭东;;学习任务能影响词汇附带习得吗?——“投入量假设”再探[J];外语教学与研究;2010年02期

3 冯志伟;;用计量方法研究语言[J];外语教学与研究;2012年02期

【共引文献】

相关期刊论文 前10条

1 刘珊;;阅读附带习得词汇国外研究之初探[J];办公自动化;2010年24期

2 褚群武;;俗字应用与汉字规范化分析[J];巢湖学院学报;2012年02期

3 梁端俊;;国内英语词汇习得研究综述[J];滁州学院学报;2010年06期

4 舒世德;;正确对待初中学生英语学习中的错误[J];德阳教育学院学报;2004年04期

5 廖道政;论商品包装中商用名称的缩略[J];湖南包装;1997年04期

6 钟志英;;影响听力语篇二语词汇附带习得的因素探析[J];福建论坛(社科教育版);2011年06期

7 杨蕾;;离合词的成因和离析理据[J];桂林师范高等专科学校学报;2011年04期

8 徐浩;;阅读任务中词汇附带习得注意过程的探索性研究[J];外语教学理论与实践;2012年02期

9 马志刚;;语法表征的齐整模式与语言运用的家族相似[J];广州大学学报(社会科学版);2007年12期

10 王超;;基于阅读强化理念的大学英语词汇教学设计[J];中国科教创新导刊;2012年22期

相关博士学位论文 前5条

1 赵宏;英汉词汇理据对比研究[D];华东师范大学;2011年

2 张慧丽;汉语方言变韵的语音格局[D];北京大学;2011年

3 张龙;现代汉语习用语法构式句法分析及演变研究[D];浙江大学;2011年

4 刘泽民;客赣方言历史层次研究[D];上海师范大学;2004年

5 王岩;功能视角下的普通话儿童3岁前语言发展个案研究[D];吉林大学;2013年

相关硕士学位论文 前10条

1 李晓;语言符号与货币的通约性初探[D];山东农业大学;2010年

2 刘艳娇;基于读写任务的高中英语词汇附带习得实证性研究[D];沈阳师范大学;2011年

3 赵红艳;转折类关联词语在口语和书面语中使用情况之比较[D];华中师范大学;2011年

4 张贝贝;不同投入量的阅读任务对中国大学生英语习语附带习得的影响[D];兰州大学;2011年

5 王婧雯;三种词汇习得方法对中国大学生二语词汇附带习得效果的作用和影响[D];兰州大学;2011年

6 王娅霞;不同的学习任务对英语词汇附带习得的影响[D];兰州大学;2011年

7 任丽;高中生英语阅读中不同任务投入量对词汇附带习得的影响[D];辽宁师范大学;2011年

8 安娜;主题熟悉度对通过阅读附带习得词汇的影响[D];重庆大学;2011年

9 孙华春;任务诱发投入量对阅读中词汇附带习得成效研究[D];南京师范大学;2011年

10 边砚昕;约喻的衔接手段和衔接功能[D];延边大学;2011年

【二级参考文献】

相关期刊论文 前10条

1 吴宗济;;什么叫“区别特征”[J];国外语言学;1980年01期

2 李燕;;不同投入量的任务对产出性词汇知识附带习得的作用[J];外语教学理论与实践;2008年02期

3 周勤;;不同投入量的任务对语块习得的影响[J];湖南医科大学学报(社会科学版);2009年01期

4 齐丽珍;;关于阅读任务对词汇附带习得影响的实证研究[J];牡丹江师范学院学报(哲学社会科学版);2009年01期

5 武卫,许洪;附带性学习环境中基于语篇的不同任务对词汇习得产生的影响[J];山东外语教学;2004年06期

6 李雅娟;郑书云;;有关附带性习语习得的实证研究[J];四川教育学院学报;2008年11期

7 侯冬梅;Involvement Load Hypothesis and Senior Middle School Students' Vocabulary Retention[J];陕西师范大学学报(哲学社会科学版);2004年S2期

8 吴建设;郎建国;党群;;词汇附带习得与“投入量假设”[J];外语教学与研究;2007年05期

9 冯志伟;;计算语言学的历史回顾与现状分析[J];外国语(上海外国语大学学报);2011年01期

10 黄海燕;;对投入量假设的一次实证研究[J];外语艺术教育研究;2007年02期

【相似文献】

相关期刊论文 前10条

1 倪传斌,郭鸿杰,赵勇;论利用互联网搜索引擎协助翻译的科学性和可行性——兼与朱明炬先生商榷[J];上海科技翻译;2003年04期

2 何九盈;读《汉语词汇计量研究》[J];语言文字应用;2003年01期

3 苏新春;杨尔弘;;2005年度汉语词汇统计的分析与思考[J];厦门大学学报(哲学社会科学版);2006年06期

4 刘明阳;;基本词汇的前景展望[J];语文学刊;2010年17期

5 冀文辉;;基于语料库的距离象似性研究[J];内江科技;2010年04期

6 刘中富;;论《现代汉语常用词表(草案)》处理异形词的得失[J];中国海洋大学学报(社会科学版);2011年04期

7 王惠;;词义·词长·词频——《现代汉语词典》(第5版)多义词计量分析[J];中国语文;2009年02期

8 刘珊;吴志杰;;基于语料库的虚化动词搭配错误分析[J];中国电力教育;2009年08期

9 崔刚,盛永梅;语料库中语料的标注[J];清华大学学报(哲学社会科学版);2000年01期

10 马永腾;;基于语料库的《红楼梦》中“V个VP”结构分析[J];现代语文(语言研究版);2007年02期

相关会议论文 前10条

1 乔维;孙茂松;;基于生语料、最大匹配切分语料以及熟语料的中文词频估计方法[A];第三届学生计算语言学研讨会论文集[C];2006年

2 郭曙纶;;基于语料库的HSK多功能例解字典:设想与样例[A];2004年辞书与数字化研讨会论文集[C];2004年

3 宋鸿彦;刘军;姚天f ;刘全升;黄高辉;;汉语意见型主观性文本标注语料库的构建[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

4 黄玉;李生;孟遥;丁华福;;基于大规模语料库的英语从句识别[A];第一届学生计算语言学研讨会论文集[C];2002年

5 李明;;语料库·蓝本·双语词典[A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集[C];2003年

6 孙述学;;新词语语料库建设的一些构想[A];2004年辞书与数字化研讨会论文集[C];2004年

7 张建梅;赵玉荣;包晓荣;高娃;哈斯图雅;;构建“尹湛纳希辞典”的设想[A];第三届学生计算语言学研讨会论文集[C];2006年

8 安娜;侯敏;;基于传媒语言语料库的话语标记自动识别与消歧研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

9 陈国华;梁茂成;Adam Kilgarriff;;语料库与词典编纂的接口——词典编纂辅助工具Sketch Engine剖析[A];中国辞书学会双语词典专业委员会第6届年会暨学术研讨会论文专辑[C];2005年

10 马永腾;亢世勇;;非典型成员的语义标注策略和问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

相关重要报纸文章 前10条

1 记者 朱文琴;加强规范汉语词汇应用[N];光明日报;2002年

2 周有光;异形词的整理和汉语词汇的奇异现象[N];中国教育报;2002年

3 顾曰国;语料库语言学的发展[N];中国社会科学院院报;2003年

4 周锦国 大理学院文学院暨对外汉语教育学院;新意来自司空见惯的语言现象[N];中国社会科学报;2011年

5 ;探索普通话自然连续语音之规律[N];光明日报;2001年

6 文枫;打开语言的窗口[N];中国社会科学院报;2009年

7 周光庆 华中师范大学文学院;开拓词汇研究须“高调”[N];中国社会科学报;2011年

8 黄行 赵明鸣;我国少数民族语言在型学研究[N];中国社会科学院院报;2004年

9 彭英安;语言事实的搜集比什么都重要[N];中华读书报;2003年

10 临颍一高 张艳;新词入文需谨慎,切莫弄“新”而成拙[N];学知报;2010年

相关博士学位论文 前10条

1 张廷香;基于语料库的3-6岁汉语儿童词汇研究[D];山东大学;2010年

2 黄红娟;汉语词汇负面义研究[D];暨南大学;2010年

3 吴恩锋;基于经济报道标题语料库的概念隐喻研究[D];浙江大学;2008年

4 刘建鹏;语料库支撑的系统功能语法研究[D];西南大学;2012年

5 李斌;用ELAN自建汉语方言多媒体语料库及其应用研究[D];湖南师范大学;2013年

6 曹起;新时期现代汉语变异研究[D];吉林大学;2013年

7 何婷婷;语料库研究[D];华中师范大学;2003年

8 杨霞;初期现代汉语新词语研究[D];河北大学;2011年

9 李毅;基于语料库的隐喻普遍性与变异性研究[D];山东大学;2012年

10 唐斌;《人民日报》中(1987-2007)农民工的话语再现[D];上海外国语大学;2010年

相关硕士学位论文 前10条

1 吕艳辉;基于语料库的现代汉语准口语计量研究[D];山东大学;2005年

2 刘露露;汉语衍名的双事件隐喻分析[D];四川外语学院;2011年

3 杜雪玲;基于语料库的科技论文摘要体裁分析[D];大连理工大学;2008年

4 张艳;政治演讲中立场性状语的情态研究[D];大连海事大学;2011年

5 洪丹凤;基于语料库的名转动词现象研究[D];北京交通大学;2011年

6 樊小玲;基于“时间”、“频率”概念和“新词语发现软件”的报刊新词语研究[D];华东师范大学;2005年

7 邹清华;学术论文中第一人称代词的使用研究[D];吉林大学;2008年

8 徐芳;个性化语料库在语文教学中的应用研究[D];湖南师范大学;2008年

9 陈忠;现代汉语惯用语研究及在对外汉语教学中的应用[D];山东大学;2008年

10 刘慧丽;基于语料库的《红楼梦》“就是”探究[D];曲阜师范大学;2009年



本文编号:1857297

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/1857297.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户51983***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com