当前位置:主页 > 文艺论文 > 语言学论文 >

汉语篇章依存结构的标注难点与处理

发布时间:2021-08-18 06:11
  篇章依存结构一般表示为最小篇章单位(小句)间的支配与被支配关系,相比修辞结构等,其可以有效刻画最小篇章单位间的直接关系及其向心性。篇章依存结构的理论内涵及具体实践有待深入。该文结合汉语篇章依存结构语料库的标注实践,重点分析标注难点问题并给出处理方案,包括小句切分、小句关联、依存中心等重要分析任务。事实上,这些难点不仅是人工标注的难点,也是自动标注的难点,其处理不仅有利于指导构建高质量语料库,也有利于指导进一步的自动标注研究。 

【文章来源】:中文信息学报. 2020,34(10)北大核心CSCD

【文章页数】:8 页

【部分图文】:

汉语篇章依存结构的标注难点与处理


篇章依存结构[例1]

对象,总值,语段,外商投资企业


例15 1海关统计表明,“八五”期间(一九九○年—一九九五年),中国外商投资企业的进出口呈直线上升之势,/2出口年均增长百分之四十三点二,/3进口年均增长百分之三十八点六。/4去年实现进出口总值达一千零九十八点二亿美元,/5占全国进出口总值的比重由上年的百分之三十七提高到百分之三十九。【002】语段内并列项没有共同关联对象,则直接建立并列项间的小句关联。如例16的小句1、2、3并列,小句4、5并列,但它们均无共同关联项,则直接建立并列项间的关联。并列项间关联一般是就近关联,由此有1-2、2-3关联,进一步又有3-4、5-7并列关联。

对象,对外开放,试验区


例16 1在开放开发布局上,广西以北海、钦州、防城为对外开放重点,/2充分发挥首府南宁对外开放城市的作用,/3促进沿海、沿边、沿江进一步开放;/4办好柳州市城市综合改革试验区、玉林地区城乡综合改革试验区、桂林旅游开发试验区,/5建设右江河谷扶贫经济开发带、红水河水电为主的扶贫综合开发带。/6并投资一千三百多个亿,/7加强基础设施和基础产业建设,/8为扩大对外开放创造良好环境。【008】3.1.2 “并列”的层级范围

【参考文献】:
期刊论文
[1]汉语篇章小句关联结构的表示与识别[J]. 冯文贺,陈伊琳,任亚峰,任函.  北京大学学报(自然科学版). 2020(01)
[2]基于逗号的汉语子句识别研究[J]. 李艳翠,冯文贺,周国栋,朱坤华.  北京大学学报(自然科学版). 2013(01)



本文编号:3349354

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/3349354.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b2d71***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com