当前位置:主页 > 文艺论文 > 汉语言论文 >

数据科学视角下的评价话语分析——以冲突话语中会话者评价风格识别为例

发布时间:2021-02-16 08:29
  评价意义是语篇语义层的人际意义资源,评价话语分析是以评价理论为分析框架对文本中的评价意义模式进行研究。由于评价意义与词汇语法形式之间没有一对一的体现关系,现有的评价话语分析一般需要在标注精密度和文本规模之间进行取舍。数据科学的介入有助于解决该困境。基于数据科学的基本原则阐释了话语分析中的数据处理流程,提出在人工精密语义标注的基础上使用数据处理语言辅助进行模式识别,从而提高研究的系统性和可重复性。以使用R语言辅助冲突话语中会话者评价风格识别为例,探讨数据科学在话语分析研究中的应用价值。该方法不仅可用于评价话语分析,也可应用于其他理论的话语分析,是后定性研究在话语分析领域的一次尝试。 

【文章来源】:天津外国语大学学报. 2020,27(06)

【文章页数】:17 页

【部分图文】:

数据科学视角下的评价话语分析——以冲突话语中会话者评价风格识别为例


变量类型及其在评价话语分析中的实例

分析框架,资源,语法


语料准备完成后需进行基于评价理论的文本标注和数据整理。Halliday(1994)明确指出,功能语法是朝向语义的语法。当把评价作为人际意义的资源来讨论时,我们需要注重的是语义而非语法本身(胡壮麟等,2008:316)。由于评价意义在本质上与价值观密切相关,对于评价的研究不应该也无法仅限于体现显性评价意义的词汇或语法结构,而需要研究者代入某种阅读定位,对语料中的评价资源进行挖掘和解读。因此,本案例采用从语篇语义层出发的人工标注策略,以评价理论为基础,建立自定义分析框架。如图3所示,该框架在维度上涉及评价者、受话人、评价对象、态度类别、效价、显度、该态度例示是否有介入资源或级差资源修饰,同时在语义特征的精密度上也可以由左至右逐阶追踪。本案例采用文外电子表单标注方法(1),将非结构化数据的文本转化为可机读的结构化数据,即评价语义标注。如表2所示,标注表单以语步为行,以各种会话现象和评价意义资源为列,包括每个语步的话轮、会话者和受话人等会话分析资源以及评价对象、态度、显度、效价、介入、级差等评价意义资源。数据整理包括删除标注没有评价资源例示的语步行,添加其他相关信息或变量列,合并不同数据框,如会话者的社会角色信息等。

模型图,话语分析,视角,数据


基于评价话语分析困境和数据科学的基本原则本文提出数据科学视角下的评价话语分析模型。该模型(见图2)采用从语篇语义层标注方式,将评价话语分析分为六个环节,分别是语料准备、文本标注、数据整理、模式识别、模式解读和汇报成果,其中文本标注、数据整理和模式识别属于数据科学的数据分析模块。在模式识别过程中可能发现预料之外的语言现象,驱动研究者修正研究问题,甚至更新分析框架,对文本进行重新标注。因此,数据分析模块中的三个环节是一个问题驱动的过程,需循环进行。数据整理和模式识别可以使用数据处理语言辅助实现,编写的程序可在本研究中无限次运行,也可共享给其他研究者。该模型在本质上是基于评价理论的语言学分析,通过数据科学工具辅助提高评价话语分析的系统性和可重复性。下文将以冲突话语中评价风格识别为案例展示如何应用该模型。本案例在数据分析环节采用R语言作为实现手段。R语言拥有众多集成各类函数的包,在扩展性和灵活性方面有其他商业软件(如Matlab,SPSS)无法比拟的优势。R语言在基于文本数据的语料库语言学研究中也有一定应用(Desagulier,2017;Gries,2017;Jockers,2014;雷蕾、潘璠,2012)。目前使用R语言辅助进行以语义为关注点的话语分析,特别是评价话语分析的研究尚属罕见。本案例使用R语言辅助进行基于语义标注数据的话语分析对于数据科学和话语分析研究都是一次有益的尝试。

【参考文献】:
期刊论文
[1]《定量语料库语言学与R编程:实用导论》述评[J]. 雷蕾,潘璠.  外语教学理论与实践. 2012(04)
[2]基于语料库的情感评价意义构型研究[J]. 刘世铸.  外语教学. 2009(02)



本文编号:3036497

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/3036497.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户eea8c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com