基于改进的主题分割模型在教师话语文本分析中的应用研究
发布时间:2021-05-28 10:21
课堂话语作为课堂教学的重要媒介和主要手段,也是判断教师自身专业素质、教学理念和教学效果的重要指标之一。采用图式化和量化的方法对课堂教学话语内容进行结构化、系统化地剖析,能够科学并且客观地呈现课堂教学的内在层次逻辑,从微观角度分析课堂教学的结构。现阶段的教学话语分析大多采用人工观察、访谈、问卷调查等费时费力的方法,如何改善传统教学分析方法,辅助教育工作者高效掌握和分析教师授课特征是亟需解决的问题。针对目前该领域内缺乏中文教育文本的智能化分析方法的问题,本文提出了一种基于改进的主题分割模型的教师话语分析方法,利用该模型对教师话语文本进行主题分割,并且对各子主题段落进行内容结构分析及可视化呈现。实验结果表明,该方法在面向授课话语文本的主题分割任务中相较于其他传统方法更具有效性,并且实现了课堂话语文本主题分割及结构分析的智能化处理,可以有效应用于课堂教学文本的分析任务中。在本文面向课堂话语文本分析的技术研究中,主要包含以下三个方面的研究内容:首先,鉴于传统的LDA主题模型对于词语相关性的表达不够准确的问题,本文提出利用word2vec词嵌入模型获取词语上下文信息,将全局的主题分布特征和局部上下...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
图3.1教师话语文本分析模型架构图??3.2主题分割??主题分割算法的核心内容是判断各文本单元之间的主题相关度,按照一定规??则确定分割边界,文本单元之间相似性度量的准确度很大程度上受到文本内容表??
?硕士学位论文??MASTER'S?THESIS??Similarity?between?adjacent?sentences??095?—??:??i:?\rWj\fri??0.70-??0?20?40?60?80??Split?gap??图3.2相似度曲线图??(3)边界识别和文本分割??图3.2显示了在相邻文本单元之间余弦相似度的变化,由于局部极小值能够??表明相似性得分显著降低,这意味着主题分布也在这些间隔点处发生了实质性的??变化,因此我们使用这些来标识子主题的边界。图中较大相似度的值代表相邻文??本单元非常相似,相反,局部极小值表明两个相邻片段的文本关系明显不同,如??图中红色分隔竖线所示,第41行和第42行中的间隙出现了明显的语义转换现象,??于是我们将此间隔点识别为边界,即最终分割点。??3.3内容结构特征可视化??将划分好子主题的语义段落集合分别进行topK个主题词提取,这里本研宄应??用的方法是TFIDF算法,其基本原理及应用优势在2.5节中进行了详细介绍。在??获取到topK个主题词之后,分别进行主题词的位置分布信息统计,得到一个主题??词分布序列,例如对于主题词集合,其位置分布序列可表示??为Seq?=?{w;,Wy,?WZ,W;,?该序列表示在主题词Wi后紧跟出现的是主题词Wy。??通过这种方法我们可以获取各主题词之间的位置分布特征,进而分析词与词之间??的关联关系。??本文提出采用滞后序列分析法来进行主题词的关联分析。滞后序列分析法??(Lag?sequential?analysis,简称LSA)是由Sackett等人于1789年提出的算法,主??34??
住事建.is笸纪初期英匡对中3的茶叶、生丝等商品的差求不飫堵长...'???作品,寒又”:?费了,不K琴尽3L?贫春、胥夜婷、杨囯呈、徐兴堂在香淹狖赶了_b王:十多年的芙国朱字旗最后一次在这呈降茗后...",??”结检内容”:”(一)#语这篇通语的导语菡分有三:.个重点?一个是点垤,点明了荚国匡续降落后??”写作技巧":"a)以时闾闪叵的方式钽织封料■第一s在写港备两告梨&式中的隽三a,如注对港苫翁思史的迻述...?”,??■获奖":”第八浥中匡费闻奖评选中荣获一等奖?"??>r??图4.1百科文本格式??由于并不是所有的课文在百科内都有录入,并且有些标题对应多个义项,例??如“口技”?一词,包含四个义项,默认搜索“口技”一词对应着“民间表演技艺”义??项,而我们需要的是“清代林嗣环文章”义项,因此需要经过人工的反复整理筛选,??按照这种方法我们最终获得972篇百科文本。??统计整理出这些百科文本正文中涉及的所有小标题,根据语料库所需要的文??本特征进行人工筛选,最终确定需要的小标题共有301个,举例如表4.1所示:??表4_?1??叙述角度意象运用情节结构主旨感悟内涵精神思想内容写作特征叙事艺术??本文中心语言风格形式自由课文感受修辞手法思想主题文章属性写作技巧??表现手法课文结构中心思想艺术特色中心论点文章启示文章思路学习目标??表达技巧分析质疑层次结构课文结构内容赏析特殊句式文章小结主题归纳??层次大意文章脉络教学难点段落层次篇章研究拓展升华文章主题?...??>根据这些子标题从己获取的文本中摘取出对应文本项,一个子标题所包含的??内容作为一行,例如上文举例的《别了,不列颠尼亚》一文,我们将摘取出“结构??
【参考文献】:
期刊论文
[1]结合语义相似度改进LDA的文本主题分析[J]. 赵林静. 计算机工程与设计. 2019(12)
[2]基于深度学习的主题模型研究[J]. 黄佳佳,李鹏伟,彭敏,谢倩倩,徐超. 计算机学报. 2020(05)
[3]基于动态权重的LDA算法[J]. 居亚亚,杨璐,严建峰. 计算机科学. 2019(08)
[4]基于学科核心素养的初中生物学“主线教学”——以苏科版“植物的生殖(第一课时)”教学为例[J]. 张桂梅. 基础教育课程. 2019(Z1)
[5]怎样利用语言知识资源进行语义理解和常识推理[J]. 袁毓林,卢达威. 中文信息学报. 2018(12)
[6]基于词语相关性的对话系统话题分割[J]. 何天文,王红,刘海燕. 计算机应用研究. 2019(04)
[7]基于领域本体的文本分割方法研究[J]. 刘耀,帅远华,龚幸伟,黄毅. 计算机科学. 2018(01)
[8]基于核心素养的初中生物课堂教学改进探讨[J]. 胡玉华. 课程.教材.教法. 2017(08)
[9]长度分布约束下的摘要文本无监督分割算法[J]. 骆俊帆,陈黎,于中华,丁革建,罗谦. 中文信息学报. 2017(04)
[10]主题模型中的参数估计方法综述[J]. 杜慧,陈云芳,张伟. 计算机科学. 2017(S1)
硕士论文
[1]文本分割关键技术研究[D]. 邓一平.哈尔滨工业大学 2019
[2]高中物理课堂教学结构研究[D]. 付馨媛.南京师范大学 2018
[3]基于在线主题模型的追踪与检测技术[D]. 杜慧.南京邮电大学 2017
[4]面向对话文本的主题分割技术研究[D]. 王炳浩.哈尔滨工业大学 2016
[5]基于统计模型的文本分割方法及其改进[D]. 李效晋.山东大学 2014
本文编号:3208083
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
图3.1教师话语文本分析模型架构图??3.2主题分割??主题分割算法的核心内容是判断各文本单元之间的主题相关度,按照一定规??则确定分割边界,文本单元之间相似性度量的准确度很大程度上受到文本内容表??
?硕士学位论文??MASTER'S?THESIS??Similarity?between?adjacent?sentences??095?—??:??i:?\rWj\fri??0.70-??0?20?40?60?80??Split?gap??图3.2相似度曲线图??(3)边界识别和文本分割??图3.2显示了在相邻文本单元之间余弦相似度的变化,由于局部极小值能够??表明相似性得分显著降低,这意味着主题分布也在这些间隔点处发生了实质性的??变化,因此我们使用这些来标识子主题的边界。图中较大相似度的值代表相邻文??本单元非常相似,相反,局部极小值表明两个相邻片段的文本关系明显不同,如??图中红色分隔竖线所示,第41行和第42行中的间隙出现了明显的语义转换现象,??于是我们将此间隔点识别为边界,即最终分割点。??3.3内容结构特征可视化??将划分好子主题的语义段落集合分别进行topK个主题词提取,这里本研宄应??用的方法是TFIDF算法,其基本原理及应用优势在2.5节中进行了详细介绍。在??获取到topK个主题词之后,分别进行主题词的位置分布信息统计,得到一个主题??词分布序列,例如对于主题词集合,其位置分布序列可表示??为Seq?=?{w;,Wy,?WZ,W;,?该序列表示在主题词Wi后紧跟出现的是主题词Wy。??通过这种方法我们可以获取各主题词之间的位置分布特征,进而分析词与词之间??的关联关系。??本文提出采用滞后序列分析法来进行主题词的关联分析。滞后序列分析法??(Lag?sequential?analysis,简称LSA)是由Sackett等人于1789年提出的算法,主??34??
住事建.is笸纪初期英匡对中3的茶叶、生丝等商品的差求不飫堵长...'???作品,寒又”:?费了,不K琴尽3L?贫春、胥夜婷、杨囯呈、徐兴堂在香淹狖赶了_b王:十多年的芙国朱字旗最后一次在这呈降茗后...",??”结检内容”:”(一)#语这篇通语的导语菡分有三:.个重点?一个是点垤,点明了荚国匡续降落后??”写作技巧":"a)以时闾闪叵的方式钽织封料■第一s在写港备两告梨&式中的隽三a,如注对港苫翁思史的迻述...?”,??■获奖":”第八浥中匡费闻奖评选中荣获一等奖?"??>r??图4.1百科文本格式??由于并不是所有的课文在百科内都有录入,并且有些标题对应多个义项,例??如“口技”?一词,包含四个义项,默认搜索“口技”一词对应着“民间表演技艺”义??项,而我们需要的是“清代林嗣环文章”义项,因此需要经过人工的反复整理筛选,??按照这种方法我们最终获得972篇百科文本。??统计整理出这些百科文本正文中涉及的所有小标题,根据语料库所需要的文??本特征进行人工筛选,最终确定需要的小标题共有301个,举例如表4.1所示:??表4_?1??叙述角度意象运用情节结构主旨感悟内涵精神思想内容写作特征叙事艺术??本文中心语言风格形式自由课文感受修辞手法思想主题文章属性写作技巧??表现手法课文结构中心思想艺术特色中心论点文章启示文章思路学习目标??表达技巧分析质疑层次结构课文结构内容赏析特殊句式文章小结主题归纳??层次大意文章脉络教学难点段落层次篇章研究拓展升华文章主题?...??>根据这些子标题从己获取的文本中摘取出对应文本项,一个子标题所包含的??内容作为一行,例如上文举例的《别了,不列颠尼亚》一文,我们将摘取出“结构??
【参考文献】:
期刊论文
[1]结合语义相似度改进LDA的文本主题分析[J]. 赵林静. 计算机工程与设计. 2019(12)
[2]基于深度学习的主题模型研究[J]. 黄佳佳,李鹏伟,彭敏,谢倩倩,徐超. 计算机学报. 2020(05)
[3]基于动态权重的LDA算法[J]. 居亚亚,杨璐,严建峰. 计算机科学. 2019(08)
[4]基于学科核心素养的初中生物学“主线教学”——以苏科版“植物的生殖(第一课时)”教学为例[J]. 张桂梅. 基础教育课程. 2019(Z1)
[5]怎样利用语言知识资源进行语义理解和常识推理[J]. 袁毓林,卢达威. 中文信息学报. 2018(12)
[6]基于词语相关性的对话系统话题分割[J]. 何天文,王红,刘海燕. 计算机应用研究. 2019(04)
[7]基于领域本体的文本分割方法研究[J]. 刘耀,帅远华,龚幸伟,黄毅. 计算机科学. 2018(01)
[8]基于核心素养的初中生物课堂教学改进探讨[J]. 胡玉华. 课程.教材.教法. 2017(08)
[9]长度分布约束下的摘要文本无监督分割算法[J]. 骆俊帆,陈黎,于中华,丁革建,罗谦. 中文信息学报. 2017(04)
[10]主题模型中的参数估计方法综述[J]. 杜慧,陈云芳,张伟. 计算机科学. 2017(S1)
硕士论文
[1]文本分割关键技术研究[D]. 邓一平.哈尔滨工业大学 2019
[2]高中物理课堂教学结构研究[D]. 付馨媛.南京师范大学 2018
[3]基于在线主题模型的追踪与检测技术[D]. 杜慧.南京邮电大学 2017
[4]面向对话文本的主题分割技术研究[D]. 王炳浩.哈尔滨工业大学 2016
[5]基于统计模型的文本分割方法及其改进[D]. 李效晋.山东大学 2014
本文编号:3208083
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3208083.html
最近更新
教材专著