自我重复与东亚文学现代性,1900—1930
发布时间:2020-12-28 04:15
数字人文研究将为东亚文学现代性发展中的白话写作与心理内在性之间的关系带来新启示。测量涵盖中国新文化时期浪漫主义小说和日本私小说、通俗历史小说和侦探故事等类型文本的熵后发现,中国和日本的现代文学都有显著增强的词汇重复倾向,在叙述心理内在性的篇章中尤其普遍。这促使我们思考重复在文学风格中的作用,以及它作为一种文学风格的作用。一方面,我们认为重复指明了与浪漫主义小说和私小说都相关的具体的形式转化:写作的白话化和对西式语法结构的采纳。另一方面,我们认为重复也与内容层面上的变化有关,尤其和重视叙述心理现实主义和精神失常有关。作为风格的重复是一种表面现象,辨识了在自我的智识成形和确定的语言战略之间发生的一组更深刻复杂的相互作用。无论这种新的重复风格在中国和日本的文学史上激发了愉悦还是焦虑,它对于构建从心理角度解释的叙事自我都起到了重要作用,而这在此之前很大程度上被文学评论家所忽略。
【文章来源】:山东社会科学. 2018年07期 北大核心CSSCI
【文章页数】:15 页
【部分图文】:
平均熵按类型分布的小提琴图
社会科学2018·7数字人文:观其大较确认重复是私小说和浪漫主义小说明确倾向的最后一步是将所有个体特征合为一个单独模型,以评估它们在区分这部小说和通俗作品时的相对权重。我们想知道,这样的模型,只靠熵、TTR、“思想/感情”词等测量方法,能多好地预测文本类型。使用有最佳子集选择(subsetselec-tion)的逻辑回归分类符(classifier),我们确认了我们在个体特征上看到的情况。①在日本的情况里,分类符猜到文本指定类型的准确率为样本的80%。事实上,它只需要孔托伊阿尼斯熵的测量法和思想/动作词比图2比照日本和中国的平均熵绘制的“思想/感情”词比率图。线性回归线按类型适配。两种情况下我们都能观察到,随着“思想/感情”词比率增加(横轴),文本平均熵下降(纵轴),表明更多词汇重复率、停用词和句号就实现了这一精确性。这不是说其他特征就没有辨别力,只是说明没有它们分类符也能表现得一样好。在中国这边,模型几乎每次都猜到正确类型(表1),只需要平均熵和尤尔的K就可做到。这里,只需词汇的冗余和一致性就足以分开两个语料库。不幸的是,和日本的情况不同,我们无法为语言差异做控制,这就很难确定重复性主要是语言效应,还是心理叙述的影响也起了作用。不过,两个结果都支持这个观点,即重复对于私小说和浪漫主义小说作家所做的实验而言至关重要。作为自我重复的冲动,汇集起来产生了自我指涉写作类型的审美潮流看起来明显跨越了不同文化和语言语境。日语语料库通俗小说私小说通俗小说5.11.9私小说0.95.0汉语语料库通俗小说浪漫主义小说通俗小说12.30.1浪漫主义小说0.15.6表1我们的逻辑回归分类符的混淆矩阵。这些矩阵用10倍交叉验证作出,表示分类符平均多久预测一次?
数字人文:观其大较山东社会科学2018·7图3基于我们分类模型的最像“私小说”的标题。右侧文本原本标签为“私小说”。左侧文本是“通俗”作品。标题越接近1.0,根据之前从语料库学到的内容,模型就越会认为这是一部私小说象,但只有通过察看个体文本,我们才能理解它们如何跨越不同文化和语言语境同特定的文学主体性模型互动。这一步很关键,还因为像我们测量的那样,如果只有重复,那么几乎不能捕捉到将自我指涉小说与其他写作模式分隔开的那些差异。我们的测量结果表明,有些私小说和浪漫主义小说相对而言不重复,而少数通俗作品(在日本,这大多是侦探小说)重复性接近最自我冗余的作品。探索这些例外对未来的研究很重要,但这里我们将考虑推动重复趋势至极端的文本,它们有助于加强比较分析的焦点,即作为风格的重复规定了重复置于其上的具体美学用法,并让我们通过测量得以观察这些方法。三、作为风格的重复(RepetitionasStyle)在这更窄的透镜里,图3顶端的作品被认为最像“私小说”,原因是对重复和某些词汇和比喻条目(即思考词、停用词、句号)的倾向。其中几个证实了将重复视为文学语言转变和尝试叙述心理内在性和精神错乱相结合后的表面效应。例如,葛西善藏(KasaiZenzō)的后期作品《柯树叶》(椎の若葉,1924)就值得注意,因为这是在12小时内口授给书记员的。①爱德华·富勒评论道,这赋予作品一种口述性,“断然而重复地表明了自己”,尤其因为葛西拒绝审阅自己口授的内容,这让他如同一个漫谈的讲故事的人,不断通过选择性记忆重提自己之前的话语,导致“越来越冗余的概括……(和)狂乱而近乎公式化的对精神错乱的冥想”②。结果是高度“不连贯的”叙事风格不规则地从一桩轶事转换至下一桩,即使是在相同的精神场地猛烈
本文编号:2943107
【文章来源】:山东社会科学. 2018年07期 北大核心CSSCI
【文章页数】:15 页
【部分图文】:
平均熵按类型分布的小提琴图
社会科学2018·7数字人文:观其大较确认重复是私小说和浪漫主义小说明确倾向的最后一步是将所有个体特征合为一个单独模型,以评估它们在区分这部小说和通俗作品时的相对权重。我们想知道,这样的模型,只靠熵、TTR、“思想/感情”词等测量方法,能多好地预测文本类型。使用有最佳子集选择(subsetselec-tion)的逻辑回归分类符(classifier),我们确认了我们在个体特征上看到的情况。①在日本的情况里,分类符猜到文本指定类型的准确率为样本的80%。事实上,它只需要孔托伊阿尼斯熵的测量法和思想/动作词比图2比照日本和中国的平均熵绘制的“思想/感情”词比率图。线性回归线按类型适配。两种情况下我们都能观察到,随着“思想/感情”词比率增加(横轴),文本平均熵下降(纵轴),表明更多词汇重复率、停用词和句号就实现了这一精确性。这不是说其他特征就没有辨别力,只是说明没有它们分类符也能表现得一样好。在中国这边,模型几乎每次都猜到正确类型(表1),只需要平均熵和尤尔的K就可做到。这里,只需词汇的冗余和一致性就足以分开两个语料库。不幸的是,和日本的情况不同,我们无法为语言差异做控制,这就很难确定重复性主要是语言效应,还是心理叙述的影响也起了作用。不过,两个结果都支持这个观点,即重复对于私小说和浪漫主义小说作家所做的实验而言至关重要。作为自我重复的冲动,汇集起来产生了自我指涉写作类型的审美潮流看起来明显跨越了不同文化和语言语境。日语语料库通俗小说私小说通俗小说5.11.9私小说0.95.0汉语语料库通俗小说浪漫主义小说通俗小说12.30.1浪漫主义小说0.15.6表1我们的逻辑回归分类符的混淆矩阵。这些矩阵用10倍交叉验证作出,表示分类符平均多久预测一次?
数字人文:观其大较山东社会科学2018·7图3基于我们分类模型的最像“私小说”的标题。右侧文本原本标签为“私小说”。左侧文本是“通俗”作品。标题越接近1.0,根据之前从语料库学到的内容,模型就越会认为这是一部私小说象,但只有通过察看个体文本,我们才能理解它们如何跨越不同文化和语言语境同特定的文学主体性模型互动。这一步很关键,还因为像我们测量的那样,如果只有重复,那么几乎不能捕捉到将自我指涉小说与其他写作模式分隔开的那些差异。我们的测量结果表明,有些私小说和浪漫主义小说相对而言不重复,而少数通俗作品(在日本,这大多是侦探小说)重复性接近最自我冗余的作品。探索这些例外对未来的研究很重要,但这里我们将考虑推动重复趋势至极端的文本,它们有助于加强比较分析的焦点,即作为风格的重复规定了重复置于其上的具体美学用法,并让我们通过测量得以观察这些方法。三、作为风格的重复(RepetitionasStyle)在这更窄的透镜里,图3顶端的作品被认为最像“私小说”,原因是对重复和某些词汇和比喻条目(即思考词、停用词、句号)的倾向。其中几个证实了将重复视为文学语言转变和尝试叙述心理内在性和精神错乱相结合后的表面效应。例如,葛西善藏(KasaiZenzō)的后期作品《柯树叶》(椎の若葉,1924)就值得注意,因为这是在12小时内口授给书记员的。①爱德华·富勒评论道,这赋予作品一种口述性,“断然而重复地表明了自己”,尤其因为葛西拒绝审阅自己口授的内容,这让他如同一个漫谈的讲故事的人,不断通过选择性记忆重提自己之前的话语,导致“越来越冗余的概括……(和)狂乱而近乎公式化的对精神错乱的冥想”②。结果是高度“不连贯的”叙事风格不规则地从一桩轶事转换至下一桩,即使是在相同的精神场地猛烈
本文编号:2943107
本文链接:https://www.wllwen.com/wenyilunwen/wxchuangz/2943107.html