基于格语法的藏语句法语义一体化研究
发布时间:2020-04-22 14:27
【摘要】:藏语自然语言的句法、语义分析不仅是藏文信息处理技术向智能化发展的前提和基础,还可以为目前藏语词法领域所遇到分词单位不一致,词性标记不统一等问题及相关技术瓶颈提供理论支撑与技术方案,在藏语自然语言处理中起到承前启后的作用。藏语语言学有着悠久的历史,也已经形成了比较完整的文法体系,但是藏语传统语法注重虚词的语音形式和语法功能,不太考究概念之间的语义关系及句子成分之间的结构问题。所以,从信息处理的角度来说,藏语传统语法难以实现形式化。面向自然语言处理的藏语句法、语义分析研究正处于起步阶段。因为藏语传统语法中缺少语法结构方面的描述,所以目前有些研究机构和专家学者借鉴和采用汉语句法理论和语义分析方法对藏语进行句法语义分析。而这种研究方法有以下几个问题值得思考:首先,语言是通过形式表达意义,在意义对形式的依赖方面,汉、藏两种语言选择了截然不同的方式,使之表现出各自的特点。汉语和藏语虽被认为同属一个语系,这种“同属”尚处于假设当中。从句子的结构来看,藏汉两种语言异大于同,现代汉语句子结构主要是靠词的“次序”,而藏语更多地依靠“格标记”或“格助词”。所以,这两种语言所遵循的语法规则是不同的。其次,现代汉语句子的语义层要经过主语化才能与句法结构相联系,其表层句法和深层语义分析是两个不同的语言学研究层面,因而采取了“先句法后语义”的研究策略。藏语句子的深层语义是通过“格标记”或“格助词”直接体现在句子的外层结构中,所以其句法、语义应该“一体化”,不分先后。最后,词汇的词性划分主要取决于其语法功能。采用现代汉语的基于短语结构的标准语法去描述藏语句子结构,不仅额外增加了一项研究内容,还会大大缩小藏语语法的句子生成能力,也导致了藏语分词单位划分及其词性标记的不统一。所以,“什么样的语法体系既能体现藏语自身的语法特点,又能便于形式化”这是一个具有理论高度的研究课题。为此,本文通过Fillmore格语法与藏语传统语法之间的比较研究,借鉴现代语言学相关理论知识,在继承藏语传统语法的同时,扩展、延伸和深化藏语传统语法。论文将把“格”发展成为一个新的藏语语法单位,即“格结构体”,继而提出并证明“格结构体是藏语句子最直接的组成成分”的观点,认为藏语句子的底层语义关系是通过“格结构体”直接体现在表层句法结构中,所以藏语句法、语义研究是不分先后次序,属于同一个研究层面,需要进行一体化研究。并通过“格结构体”,将现代语言学的“动词中心论”引入到藏语传统语法中,建构一款面向藏语自然语言处理的,能够描述藏语自身语法特点的语法理论,即藏语格语法框架。并讨论了基于此语法的藏语词法分析、句法分析和语义分析方法,并初步讨论该语法的形式化问题。本文主要对以下几个方面展开了研究:第一、藏语与其他语言之间的差异个体语言之间存在着结构上的差异,这种差异是表层的、个性的;然而语义关系是深层的、共性的,是一切语言中普遍存在的现象。句子所表达的深层语义关系,在不同的个体语言中,以不同的方式体现在句子表层的句法结构中。本文通过实例分析藏语与汉语、英语之间的结构差异,进一步证明“汉语是靠语序来组织句子,而藏语是通过“虚词”组织句法”的观点。也就是认为,对于某个句子来讲,汉语将其深层的语义关系通过语序来表达,而藏语是通过某种虚词来表达出来,所以,在藏语自然语言处理中,照搬汉语句法分析方法是不太可取的,从而提出构建“藏语格语法”的必要性。第二、继承并扩展藏语传统语法《文法三十颂》及历代学者对其所做的大量注释之作,虽然形成了藏语传统文法的体系,但从“语法”的严格意义来讲,藏语传统文法中尚缺少词法、句法和语义分析部分。然而,藏语传统文法中所提到部分“特殊虚词”(??????),与Fillmore格语法理论中的深层格有着极为相似的认知框架。通过Fillmore格语法理论和藏语传统语法的比较发现,藏语传统文法中所描述的“格”不具有统一的结构形式,其内容比较宽泛,不仅涉及到Fillmore提出的“格”的概念,也包括了词和名词短语。跟现代语言学中“格”相比较,藏语传统语法中的“格”可以解读成不同的语法单位。所以,面向藏语自然语言处理,藏语传统语法中的“格”就失去了作为一个独立的语法单位的可能性。但是,如果我们把藏语传统语法中的“格”进行重新定义,并从形式上统一藏语传统文法中的“格”,将其作为一个新的语法单位(即“格结构体”)引入到藏语语法中,那么藏语中所有的“格”具有了统一的结构形式,不同“格”之间只有语义上的区别,没有形式上差异。而且能发现:同一个谓词的多个不同格结构体相结合就能构成以该谓词为中心的藏语句子,也就是说,任何一个藏语句子都可以分解成多个格结构体。从而能实现通过格结构体分析藏语句子结构的可能,且从“格结构体”之间的语义关联能对藏语传统文法中的“八大格”之间的排序进行适当的描述,也能很好的解释藏语传统语法所遗留的一些语法问题。第三、藏语语法单位的扩展不论从藏语言教学,还是从藏语自然语言处理的角度考虑,应该将“格结构体”作为一个独立的语法单位加以描述,并把藏语语法单位扩充为字、词、短语、格结构体和句子等五种。本文通过格语法框架,对目前藏文信息处理在分词、词性、短语结构、句子边界等领域遇到的一些问题进行比较深入的探讨,并且利用“格结构体”的概念,分析了虚词和“格助词”之间区别,解释了藏语称述形式的名词化现象,提出了解决藏语嵌套格结构体的方法,等等。第四、藏语格语法的形式化描述本文从文学、新闻、历史、自然科学、工程技术等多种领域筛选出2500左右的藏语句子,对每个句子进行分词、词性标注、句法语义标注,形成藏语格语法树库。统计语法树库中的各个语法单位及其结构,归纳出藏语的常用词法规则、短语规则、语义分类等,并将藏语格语法进行形式化描述,并尝试让计算机自动分析藏语句子的结构。此外,还推导出了基于格语法框架下的藏语语言概率模型的统计计算方法。第五、“藏语格语法”存在的问题及展望本文的最后一个章节里,简要介绍了因时间、精力所限,本文尚未讨论的藏语个别语法的问题及其展望。本文尚未研究的藏语语法问题包括,藏语“副词”的结构及其语法功能;藏语第一格结构体的自动识别;多重格结构体的优先选择问题;藏语复合语句中的语法空缺现象以及藏语格语法的评测等。
【图文】:
5.1 基于格语法的藏语树图Fillmore 格语法为完善藏语格语法理论提供了很好的依据。藏语有着其独的句子组织方式,藏语不同于其他语言的特殊之处在于以下两个方面:第一,语句子中的所有体词性成分都在谓词成分之前,所以不论从形式上,还是从语上讲,每个句子都可以拆分为一个或多个格结构体;第二,藏语句子中应用到所有表示情态的部分一定会出现在谓词成分之后,所以本文不采纳把谓词和情部分加以区分的方法,将认为情态是谓词的一部分。为了体现藏语自身的语法特点,课题组对 Fillmore 格语法的原树形图作了下调整:1、去掉情态部分与命题部分,认为藏语句子直接由格结构体来组成;2、为了能直观地了解藏语句子的结构,课题组将把 Fillmore 树图中的格动词互换位置;3、为了遵从藏语语法特点,,将 Fillmore 树图中的格与格标记互换位置,将 C 的下标和 K 的下标同步。通过以上这些形式上的调整和改变,藏语自身句法树图可以简化为图 5-1 形式。
论文-《基于格语法的藏语句法、语义分析方法可以分为:自上而下的分。器个简单的自上而下分析方法。本siveDescentParser( ))对以上8个递归下降分析不能处理左递归产的句子。 )))(k (kq )))(VP (v ) ))形图(tree.draw( ))为:
【学位授予单位】:西藏大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:H214;TP391.1
本文编号:2636618
【图文】:
5.1 基于格语法的藏语树图Fillmore 格语法为完善藏语格语法理论提供了很好的依据。藏语有着其独的句子组织方式,藏语不同于其他语言的特殊之处在于以下两个方面:第一,语句子中的所有体词性成分都在谓词成分之前,所以不论从形式上,还是从语上讲,每个句子都可以拆分为一个或多个格结构体;第二,藏语句子中应用到所有表示情态的部分一定会出现在谓词成分之后,所以本文不采纳把谓词和情部分加以区分的方法,将认为情态是谓词的一部分。为了体现藏语自身的语法特点,课题组对 Fillmore 格语法的原树形图作了下调整:1、去掉情态部分与命题部分,认为藏语句子直接由格结构体来组成;2、为了能直观地了解藏语句子的结构,课题组将把 Fillmore 树图中的格动词互换位置;3、为了遵从藏语语法特点,,将 Fillmore 树图中的格与格标记互换位置,将 C 的下标和 K 的下标同步。通过以上这些形式上的调整和改变,藏语自身句法树图可以简化为图 5-1 形式。
论文-《基于格语法的藏语句法、语义分析方法可以分为:自上而下的分。器个简单的自上而下分析方法。本siveDescentParser( ))对以上8个递归下降分析不能处理左递归产的句子。 )))(k (kq )))(VP (v ) ))形图(tree.draw( ))为:
【学位授予单位】:西藏大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:H214;TP391.1
【参考文献】
相关期刊论文 前5条
1 高定国;扎西加;;藏语单句的基本句型研究[J];中国藏学;2014年04期
2 马伟珍;完么扎西;尼玛扎西;;藏语句子边界识别方法[J];西藏大学学报(自然科学版);2012年02期
3 王诗文;;汉、藏语句子结构对比研究[J];西南民族大学学报(人文社科版);2007年04期
4 鲁川;缑瑞隆;董丽萍;;现代汉语基本句模[J];世界汉语教学;2000年04期
5 ;现代汉语基本句型[J];世界汉语教学;1989年01期
相关硕士学位论文 前1条
1 土太加;藏语副词研究[D];青海师范大学;2016年
本文编号:2636618
本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/2636618.html