当前位置:主页 > 文艺论文 > 语言学论文 >

英汉词汇量与篇章长度关系比较研究

发布时间:2019-07-31 19:58
【摘要】:本文基于《中英句子级对齐双语语料库》,分析英汉语篇的总体词汇增长及一次词增长与篇章长度的关系,利用Brunet模型检验两种语言的词汇增长率曲线。研究结果发现英汉词汇与篇章的关系呈现出语言共性。总体词汇呈类似增长趋势:先是急剧上升,然后趋向平缓;但汉语词汇的最初增长速度要比英语更加急剧。Brunet模型对英汉词汇增长的拟合度都很好。此外,汉语和英语一次词数量起初都随着词数的增加而急剧增长,随后增幅变缓。
【图文】:

英汉词汇量与篇章长度关系比较研究


+.-+.*,:@A9=;?>6?;D6;9B6?8C<9=AC967<=?;GEFGLKHMNKGJIM53+,**+***0**/**.**,***,***-*.***/*/***

英汉词汇量与篇章长度关系比较研究


+.-+.*,:@A9=;?>6?;D6;9B6?8C<9=AC967<=?;GEFGLKHMNKGJIM55,***+,*0***,.+****0*.***+1*1***-*+,***>5:2;7:31**0**.**,***E@???BGCBDHAF,***+*0***,.+****/.***+/1***>5:2;7:30**/**.**-**,**+***E@???BGCBDHAF图7左图为净增一次词递减曲线图。实线为英语净增一次词递减曲线,虚线为汉语净增一次词递减曲线。右图为前250000词次时净增一次词递减曲线图。实线为英语净增一次词递减曲线,虚线为汉语净增一次词递减曲线。观察图6(右)则发现汉语的一次词数/词汇量比下降曲线呈抛物线状。其变化幅度远远大于英语,降幅为0.4716,而英语则为0.2849。汉语一次词数/词汇量比在交叉点(形符大约达到200000词次时,如图8(左)所示)之后的值远低于英语。且英语在1600000词次之后,出现较大的波动,如图8(右)所示。,*4,*3,*2,*1,*0,*/.,,,.02,,,-.0,,,/24,,,@8=5>:=6HDCGACEFB,*01,,*001,*00,,*0/1,*0/,4,,,,,@8=5>:=6HDCGACEFB.,,0,,,/.,4,,,-0,.,,,.2,2,,,图8左图为前400000词时一次词数/词汇量比的下降曲线。实线为英语变化曲线,虚线为汉语变化曲线。右图为800000词后英语一次词数/词汇量比变化曲线。以上研究结果与Popescu&Altmann(2008)的研究结果基本一致,,像英语这样综合性语言中一次词总数要多于汉语这样的分析性语言。但本研究发现汉语的净增一次词数在前12万词次左右一直大于英语;语篇长度必须达到250万词次以上时,汉语一次词总数才会低于英语。4.应用举例与讨论分析结果表明,虽然汉语的平?
【作者单位】: 大连海事大学外国语学院;
【分类号】:H315;H15

【相似文献】

相关期刊论文 前10条

1 王海静;;俗语语料库与语典编纂相关问题的思考[J];辞书研究;2011年04期

2 谢盛良;;用语料库研究翻译的问题及局限性分析[J];惠州学院学报(社会科学版);2011年04期

3 陈昌来;雍茜;;基于网络语料库的“给力”研究[J];当代修辞学;2011年03期

4 李海燕;邵怀领;;基于语料库的隋唐五代石刻楷书新增字形调查研究[J];中国文字研究;2010年00期

5 朱英毅;海继红;;政论文中模糊限制语的语用学研究[J];柳州职业技术学院学报;2011年04期

6 金花漫;;奥巴马就职演说辞的隐喻特色解读[J];西南科技大学学报(哲学社会科学版);2011年04期

7 张统宣;;高等师范学校古代汉语教学语料库建设[J];价值工程;2011年22期

8 陈晋秋;;应用语言学及教师教育理论与实践研究[J];教育文化论坛;2011年03期

9 余承法;;基于辞书和语料库的“哲”的语义考察[J];江汉论坛;2011年09期

10 沈敏;范开泰;;基于语料库的“赶紧、赶快、赶忙、连忙”的多角度辨析[J];语言研究;2011年03期

相关会议论文 前10条

1 郭曙纶;;基于语料库的HSK多功能例解字典:设想与样例[A];2004年辞书与数字化研讨会论文集[C];2004年

2 宋鸿彦;刘军;姚天f ;刘全升;黄高辉;;汉语意见型主观性文本标注语料库的构建[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

3 黄玉;李生;孟遥;丁华福;;基于大规模语料库的英语从句识别[A];第一届学生计算语言学研讨会论文集[C];2002年

4 李明;;语料库·蓝本·双语词典[A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集[C];2003年

5 孙述学;;新词语语料库建设的一些构想[A];2004年辞书与数字化研讨会论文集[C];2004年

6 张建梅;赵玉荣;包晓荣;高娃;哈斯图雅;;构建“尹湛纳希辞典”的设想[A];第三届学生计算语言学研讨会论文集[C];2006年

7 安娜;侯敏;;基于传媒语言语料库的话语标记自动识别与消歧研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

8 陈国华;梁茂成;Adam Kilgarriff;;语料库与词典编纂的接口——词典编纂辅助工具Sketch Engine剖析[A];中国辞书学会双语词典专业委员会第6届年会暨学术研讨会论文专辑[C];2005年

9 马永腾;亢世勇;;非典型成员的语义标注策略和问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

10 亢世勇;李毅;孙道功;张楠;;汉语系统语料库的建设与词典编纂[A];2004年辞书与数字化研讨会论文集[C];2004年

相关重要报纸文章 前10条

1 顾曰国;语料库语言学的发展[N];中国社会科学院院报;2003年

2 ;探索普通话自然连续语音之规律[N];光明日报;2001年

3 文枫;打开语言的窗口[N];中国社会科学院报;2009年

4 本报记者 王继晟 张然;流行语多少财富在流行[N];市场报;2003年

5 记者 宋晖;语言研究创新源于问题意识[N];中国社会科学报;2011年

6 周诺;让语言学“热”起来[N];中国教育报;2004年

7 吴晶 董豆豆;“释放”部分异体字,政策体现人文关怀[N];新华每日电讯;2009年

8 国家语委副主任、教育部语信司司长 李宇明;《通用规范汉字表》的研制情况[N];语言文字周报;2009年

9 高泽友 邹煜;尽快建立羌族语言基因库[N];中国文物报;2010年

10 教育部语言文字信息管理司司长李宇明;语言文字工作应当与时俱进[N];中国教育报;2001年

相关博士学位论文 前10条

1 张廷香;基于语料库的3-6岁汉语儿童词汇研究[D];山东大学;2010年

2 何婷婷;语料库研究[D];华中师范大学;2003年

3 唐斌;《人民日报》中(1987-2007)农民工的话语再现[D];上海外国语大学;2010年

4 徐欣;基于语料库的英汉小说语篇中话语标记功能研究[D];山东大学;2011年

5 张建梅;基于语料库的现代蒙古语简单陈述句句型分析研究[D];内蒙古大学;2010年

6 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年

7 付宁;语法化视角下的现代汉语单音方位词研究[D];山东大学;2009年

8 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年

9 明宏;基于与汉语介词短语“在……上”之比较的英语介词on的认知语义研究[D];上海外国语大学;2011年

10 尹海良;现代汉语类词缀研究[D];山东大学;2007年

相关硕士学位论文 前10条

1 刘露露;汉语衍名的双事件隐喻分析[D];四川外语学院;2011年

2 杜雪玲;基于语料库的科技论文摘要体裁分析[D];大连理工大学;2008年

3 张艳;政治演讲中立场性状语的情态研究[D];大连海事大学;2011年

4 吕艳辉;基于语料库的现代汉语准口语计量研究[D];山东大学;2005年

5 洪丹凤;基于语料库的名转动词现象研究[D];北京交通大学;2011年

6 王玲;[D];西安外国语大学;2011年

7 樊小玲;基于“时间”、“频率”概念和“新词语发现软件”的报刊新词语研究[D];华东师范大学;2005年

8 赵玉荣;《青史演义电子词典》形容词分库构建[D];内蒙古大学;2009年

9 邹清华;学术论文中第一人称代词的使用研究[D];吉林大学;2008年

10 徐芳;个性化语料库在语文教学中的应用研究[D];湖南师范大学;2008年



本文编号:2521536

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/2521536.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e370e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com