基于成分共享的英汉小句对齐语料库标注体系研究
发布时间:2021-03-08 21:07
英汉小句对齐语料库服务于英语和汉语小句的语法结构对应关系研究和应用,对于语言理论和语言翻译(包括人的翻译和机器翻译)有重要意义。前人的语法理论和相关语料库的工作对于小句复合体和小句的界定缺乏充分研究,在理论上有缺陷,难以支持自然语言处理的应用。该文首先为英汉小句对齐语料库的建设做理论准备。从近年提出的汉语小句复合体的理论出发,该文界定了成分共享的概念,基于话头共享和引语共享来界定英语的小句和小句复合体,使小句和小句复合体具有功能的完整性和单一性。在此基础上,该文设计了英汉小句对齐的标注体系,包括英语NT小句标注和汉语译文生成及组合。语料库的标注表明,在小句复合体层面上英汉翻译涉及到的结构变换,其部件可以限制为英语小句和话头、话体,无须涉及话头和话体内部的结构。基于这些工作的英汉小句对齐语料库为语言本体研究和英汉语言对比、英汉机器翻译等应用提供了结构化的标注样本。
【文章来源】:中文信息学报. 2020,34(06)北大核心
【文章页数】:9 页
【部分图文】:
例4的另一种整句译文
第1行中主语it是话头,其谓语did not distinguish fundamentally between the private and the public sector是话体。这个主谓结构合成一个NT小句,也是合规的小句。第2行是一个定语从句,其先行语是第1行的末尾的名词短语the private and the public sector,它与这个定语从句是一对话头和话体,或者说定语从句共享第1个小句中的这个名词短语用作话头。这对话头话体组合成一个NT小句:
例3小句复合体的话头共享结构
【参考文献】:
期刊论文
[1]基于医学领域的汉英子句对齐语料库检索系统的设计与实现[J]. 王全蕊,李艳翠. 河南科技学院学报(自然科学版). 2016(06)
本文编号:3071674
【文章来源】:中文信息学报. 2020,34(06)北大核心
【文章页数】:9 页
【部分图文】:
例4的另一种整句译文
第1行中主语it是话头,其谓语did not distinguish fundamentally between the private and the public sector是话体。这个主谓结构合成一个NT小句,也是合规的小句。第2行是一个定语从句,其先行语是第1行的末尾的名词短语the private and the public sector,它与这个定语从句是一对话头和话体,或者说定语从句共享第1个小句中的这个名词短语用作话头。这对话头话体组合成一个NT小句:
例3小句复合体的话头共享结构
【参考文献】:
期刊论文
[1]基于医学领域的汉英子句对齐语料库检索系统的设计与实现[J]. 王全蕊,李艳翠. 河南科技学院学报(自然科学版). 2016(06)
本文编号:3071674
本文链接:https://www.wllwen.com/waiyulunwen/yingyulunwen/3071674.html
最近更新
教材专著