句子长度的分布规律及其制约因素
本文关键词:句子长度的分布规律及其制约因素
【摘要】:句长统计是一种针对句子在语用方面分析研究的统计方法,即通过统计定量的语料库中长度相同的句子出现的次数,再根据得到的数据绘制成表格,从句长的分布规律从而分析人们在句子使用方面的规律,从而分析出造成这种情况的原因。而且对于句长的研究在语言学——特别是第二语言教学中发挥着重要的作用,另外,在信息学、文献计量学及情报学方面也有所涉及。本文的研究工作,主要是从历时角度建立不同时间段的语料库,通过统计各个时间段的句长及其分布规律,再进行对比分析从而了解汉语的发展规律;最后,通过共时角度的汉英句长的对比分析异同点,从而证明语言具有共同性。文章一共分为六章:第一章是绪论,主要介绍了本文的选题背景以及国内外关于句法学、统计语言学及句长的研究现状,简要介绍了本文的研究目的与意义、研究思路和研究方法以及本文的结构组成。第二章是主要是针对本文在句长统计的过程中所要涉及到的相关实验软件进行的分析,主要分四个部分:第一,对已有的句长及句频的相关概念作了简单的说明;第二,介绍了统计语言学中三种主要的中文分词算法及中文分词算法的难点——未登录词识别和歧义识别;第三,介绍了一般情况下检测实验软件的标准——正确率和召回率及F指标,在这三个检测标准的基础上,利用汉语及英语句长、句频的样本统计实验对本文所要使用的软件进行检测,从而确认本文实验软件的可行性;第四,大致介绍了本文语料的收集与整理的过程,为了确保数据的可靠性,本文语料库中汉语的语料上溯先秦,下及现当代,以及两汉、魏晋南北朝、隋唐、宋元、明清等时期,英语语料收集的主要是中世纪文艺复兴后的,文章篇幅也涉及了短篇、中篇及长篇,包括经、史、子、集各种典籍。第三章是本文为下文作准备的基础部分,主要介绍了统计句长及句频的实验设备、程序代码的编写及实验步骤。本文所使用的软件是在Java软件的基础上完成的,由于本文所采用的语料涉及古今中外,既有纵向的从先秦到现当代,又有横向的中英文对比,并且是从字本位和词本位两个角度来统计分析的,因此本文所要进行的实验也是具有针对性的,这种"针对性"就要通过不同的程序代码来实现的。在实验设备和程序代码都具备的情况下,就可以进行句长及句频统计的实验了。第四章主要是对句长及句频实验数据的整理分析。根据上文的实验得出的数据绘制成Excel表格,再绘制成各个时期的散点图,从而通过每个时期高频句的句长及平均句长发现语言发展是比较稳定的。然后通过对汉语句长、句频在不同时间段的分析及同时间段汉英句长、句频的对比分析,从而得出句子长度的分布规律:一篇文章的句长是呈现抛物线的分布趋势的。即在理论上语言本身的递归性使得句子的长度是无限长的,但在语言的实际运用中,因为受到各种因素的影响,使得语言的长度是有限的,从而为下文分析句长制约的因素作了基础。第五章是本文的重点部分,先说明因为语言的递归性及重写规则使得句子可以无限长的,然而上文的实验数据表明每个时期无论是平均句长还是高频句的句长都是有限的,因此本章从信息加工的处理方式、语体、语调、强制性表达方式、语言的经济规则及个人的语言风格等六个方面来结合实验数据详细分析了它们对句长产生的作用。然后通过对复句及独立成分的分析证明句法是无法制约句长的。第六章是本文的结语,在总结了本文主要内容的基础上,指出本文还存在的一些不足之处,最后对将来在句长方面的研究作了一些展望。
【学位授予单位】:安徽大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:H195.3
【相似文献】
中国期刊全文数据库 前6条
1 唐亦功;;佛罗伦萨城古建筑分布规律及特点研究[J];西北大学学报(自然科学版);2010年01期
2 ;出版消息[J];读书;1960年07期
3 ;论点摘登[J];外语教学与研究;1994年03期
4 贾俊侠;《史记》中辩士的分布规律及其成因[J];唐都学刊;1996年02期
5 范玲;;常用字部件中的点笔画分布研究[J];学行堂语言文字论丛;2012年00期
6 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 汪红燕;;常山站风的分布规律分析[A];首届长三角气象科技论坛论文集[C];2004年
2 汪红燕;;常山站风的分布规律分析[A];首届长三角科技论坛——气象科技发展论坛论文集[C];2004年
3 魏晓;;从我国西北景观带的分布规律探讨宁夏的水土保持[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(上)[C];2003年
4 董联合;周元岐;马玉生;程琼;田保权;;胡庆油田最大地应力方向分布规律[A];中国石油石化工程技术和物装手册(第一分册)[C];2003年
5 陈之禄;;粘土地基中“后生软土”产生的条件和分布规律[A];全国第三次工程地质大会论文选集(上卷)[C];1988年
6 张家祥;;运用地球动力作用原理推断黄金埋藏分布规律[A];中国地质科学院文集(22)[C];1991年
7 陆松;;广东厚婆坳多金属矿床银的分布规律[A];地球科学与资源环境——华南青年地学学术研讨会论文集[C];2003年
8 朱金善;章文俊;孙立成;;海上光污染的致因及其分布规律的研究[A];2010年船舶防污染学术年会论文集[C];2010年
9 刘洪福;白春明;舒祥泽;;煤炭自燃区上部地气氡分布规律的实验研究[A];1994年中国地球物理学会第十届学术年会论文集[C];1994年
10 张彩绯;王盼盼;李建粮;;天台县温度降水分布规律分析[A];第31届中国气象学会年会S6 大气成分与天气、气候变化[C];2014年
中国重要报纸全文数据库 前1条
1 河北魏县第一中学 常静静;简析煤炭分布规律的成因[N];学知报;2011年
中国博士学位论文全文数据库 前1条
1 徐明钻;北山地区典型Cu矿中元素地球化学分布规律及成矿预测方法技术研究[D];中国地质科学院;2011年
中国硕士学位论文全文数据库 前6条
1 杨秀;幽门螺杆菌感染者的证候特点及其证型分布规律的研究[D];南京中医药大学;2017年
2 邱小燕;句子长度的分布规律及其制约因素[D];安徽大学;2017年
3 李莹;裂缝间距分布规律对导流能力的影响研究[D];成都理工大学;2013年
4 赵善定;荒漠戈壁区地表覆盖层中元素的分布规律与存在形式[D];长安大学;2005年
5 樊新昱;重症肺炎中医证素分布规律及与预后影响因素相关性研究[D];中国中医科学院;2014年
6 李东辰;陶一煤矿地应力测试及其变化分布规律的研究[D];河北工程大学;2014年
,本文编号:1261206
本文链接:https://www.wllwen.com/shoufeilunwen/zaizhiboshi/1261206.html