英汉词汇量与篇章长度关系比较研究
【图文】:
+.-+.*,:@A9=;?>6?;D6;9B6?8C<9=AC967<=?;GEFGLKHMNKGJIM53+,**+***0**/**.**,***,***-*.***/*/***
+.-+.*,:@A9=;?>6?;D6;9B6?8C<9=AC967<=?;GEFGLKHMNKGJIM55,***+,*0***,.+****0*.***+1*1***-*+,***>5:2;7:31**0**.**,***E@???BGCBDHAF,***+*0***,.+****/.***+/1***>5:2;7:30**/**.**-**,**+***E@???BGCBDHAF图7左图为净增一次词递减曲线图。实线为英语净增一次词递减曲线,虚线为汉语净增一次词递减曲线。右图为前250000词次时净增一次词递减曲线图。实线为英语净增一次词递减曲线,虚线为汉语净增一次词递减曲线。观察图6(右)则发现汉语的一次词数/词汇量比下降曲线呈抛物线状。其变化幅度远远大于英语,降幅为0.4716,而英语则为0.2849。汉语一次词数/词汇量比在交叉点(形符大约达到200000词次时,如图8(左)所示)之后的值远低于英语。且英语在1600000词次之后,出现较大的波动,如图8(右)所示。,*4,*3,*2,*1,*0,*/.,,,.02,,,-.0,,,/24,,,@8=5>:=6HDCGACEFB,*01,,*001,*00,,*0/1,*0/,4,,,,,@8=5>:=6HDCGACEFB.,,0,,,/.,4,,,-0,.,,,.2,2,,,图8左图为前400000词时一次词数/词汇量比的下降曲线。实线为英语变化曲线,虚线为汉语变化曲线。右图为800000词后英语一次词数/词汇量比变化曲线。以上研究结果与Popescu&Altmann(2008)的研究结果基本一致,,像英语这样综合性语言中一次词总数要多于汉语这样的分析性语言。但本研究发现汉语的净增一次词数在前12万词次左右一直大于英语;语篇长度必须达到250万词次以上时,汉语一次词总数才会低于英语。4.应用举例与讨论分析结果表明,虽然汉语的平?
【作者单位】: 大连海事大学外国语学院;
【分类号】:H315;H15
【相似文献】
相关期刊论文 前10条
1 王海静;;俗语语料库与语典编纂相关问题的思考[J];辞书研究;2011年04期
2 谢盛良;;用语料库研究翻译的问题及局限性分析[J];惠州学院学报(社会科学版);2011年04期
3 陈昌来;雍茜;;基于网络语料库的“给力”研究[J];当代修辞学;2011年03期
4 李海燕;邵怀领;;基于语料库的隋唐五代石刻楷书新增字形调查研究[J];中国文字研究;2010年00期
5 朱英毅;海继红;;政论文中模糊限制语的语用学研究[J];柳州职业技术学院学报;2011年04期
6 金花漫;;奥巴马就职演说辞的隐喻特色解读[J];西南科技大学学报(哲学社会科学版);2011年04期
7 张统宣;;高等师范学校古代汉语教学语料库建设[J];价值工程;2011年22期
8 陈晋秋;;应用语言学及教师教育理论与实践研究[J];教育文化论坛;2011年03期
9 余承法;;基于辞书和语料库的“哲”的语义考察[J];江汉论坛;2011年09期
10 沈敏;范开泰;;基于语料库的“赶紧、赶快、赶忙、连忙”的多角度辨析[J];语言研究;2011年03期
相关会议论文 前10条
1 郭曙纶;;基于语料库的HSK多功能例解字典:设想与样例[A];2004年辞书与数字化研讨会论文集[C];2004年
2 宋鸿彦;刘军;姚天f ;刘全升;黄高辉;;汉语意见型主观性文本标注语料库的构建[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
3 黄玉;李生;孟遥;丁华福;;基于大规模语料库的英语从句识别[A];第一届学生计算语言学研讨会论文集[C];2002年
4 李明;;语料库·蓝本·双语词典[A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集[C];2003年
5 孙述学;;新词语语料库建设的一些构想[A];2004年辞书与数字化研讨会论文集[C];2004年
6 张建梅;赵玉荣;包晓荣;高娃;哈斯图雅;;构建“尹湛纳希辞典”的设想[A];第三届学生计算语言学研讨会论文集[C];2006年
7 安娜;侯敏;;基于传媒语言语料库的话语标记自动识别与消歧研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 陈国华;梁茂成;Adam Kilgarriff;;语料库与词典编纂的接口——词典编纂辅助工具Sketch Engine剖析[A];中国辞书学会双语词典专业委员会第6届年会暨学术研讨会论文专辑[C];2005年
9 马永腾;亢世勇;;非典型成员的语义标注策略和问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 亢世勇;李毅;孙道功;张楠;;汉语系统语料库的建设与词典编纂[A];2004年辞书与数字化研讨会论文集[C];2004年
相关重要报纸文章 前10条
1 顾曰国;语料库语言学的发展[N];中国社会科学院院报;2003年
2 ;探索普通话自然连续语音之规律[N];光明日报;2001年
3 文枫;打开语言的窗口[N];中国社会科学院报;2009年
4 本报记者 王继晟 张然;流行语多少财富在流行[N];市场报;2003年
5 记者 宋晖;语言研究创新源于问题意识[N];中国社会科学报;2011年
6 周诺;让语言学“热”起来[N];中国教育报;2004年
7 吴晶 董豆豆;“释放”部分异体字,政策体现人文关怀[N];新华每日电讯;2009年
8 国家语委副主任、教育部语信司司长 李宇明;《通用规范汉字表》的研制情况[N];语言文字周报;2009年
9 高泽友 邹煜;尽快建立羌族语言基因库[N];中国文物报;2010年
10 教育部语言文字信息管理司司长李宇明;语言文字工作应当与时俱进[N];中国教育报;2001年
相关博士学位论文 前10条
1 张廷香;基于语料库的3-6岁汉语儿童词汇研究[D];山东大学;2010年
2 何婷婷;语料库研究[D];华中师范大学;2003年
3 唐斌;《人民日报》中(1987-2007)农民工的话语再现[D];上海外国语大学;2010年
4 徐欣;基于语料库的英汉小说语篇中话语标记功能研究[D];山东大学;2011年
5 张建梅;基于语料库的现代蒙古语简单陈述句句型分析研究[D];内蒙古大学;2010年
6 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
7 付宁;语法化视角下的现代汉语单音方位词研究[D];山东大学;2009年
8 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
9 明宏;基于与汉语介词短语“在……上”之比较的英语介词on的认知语义研究[D];上海外国语大学;2011年
10 尹海良;现代汉语类词缀研究[D];山东大学;2007年
相关硕士学位论文 前10条
1 刘露露;汉语衍名的双事件隐喻分析[D];四川外语学院;2011年
2 杜雪玲;基于语料库的科技论文摘要体裁分析[D];大连理工大学;2008年
3 张艳;政治演讲中立场性状语的情态研究[D];大连海事大学;2011年
4 吕艳辉;基于语料库的现代汉语准口语计量研究[D];山东大学;2005年
5 洪丹凤;基于语料库的名转动词现象研究[D];北京交通大学;2011年
6 王玲;[D];西安外国语大学;2011年
7 樊小玲;基于“时间”、“频率”概念和“新词语发现软件”的报刊新词语研究[D];华东师范大学;2005年
8 赵玉荣;《青史演义电子词典》形容词分库构建[D];内蒙古大学;2009年
9 邹清华;学术论文中第一人称代词的使用研究[D];吉林大学;2008年
10 徐芳;个性化语料库在语文教学中的应用研究[D];湖南师范大学;2008年
本文编号:2521536
本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/2521536.html