英语作文主题观点跑题分析模型的研究
发布时间:2022-12-07 18:20
随着计算机和自然语言处理技术的不断发展,英语作文自动评分系统愈发成熟,已逐渐应用到高校的练习及考试中。跑题分析功能是英语作文自动评分系统中的重要组成部分,关系到评分的鲁棒性和可信度。国内现存的英语作文自动评分系统并不具备有效的作文跑题分析算法,而国外的相关技术大多基于有监督算法,需要大量与待测作文同主题的语料进行训练,存在着较大局限性。因此,研究出一种无监督的英语作文跑题分析模型具有重要的意义。本课题以中国学习者的英语作文为研究对象,针对英语作文自动评分系统,设计了一种英语作文主题观点跑题分析模型。该模型无需参考范文,仅需待测作文和作文题目即可自动分析出待测作文的跑题程度,并能抽取出作文中与主题无关的句子。为了实现这一目标,本文的主要研究内容如下:(1)结合了分布式语义空间和结构化语义空间,构造了一个名为混合语义空间的语义表示模型,通过该模型可以准确得到英语单词和短语间的语义相似度。(2)结合混合语义空间模型和改进的光滑逆频率算法实现了一种句子级的英语作文表示方法。(3)根据我国英语写作的实际情况,确定了两种完全跑题的作文类型:恶意作文和与待测主题无关的作文,并结合英语作文表示方法分别...
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
§1.1 研究意义
§1.2 研究现状
§1.2.1 英语作文跑题分析研究现状
§1.2.2 语义相似度计算研究现状
§1.3 研究目标及内容
§1.4 论文组织结构
§1.5 本章小结
第二章 相关的理论与方法
§2.1 文本预处理相关的基础技术
§2.1.1 分句分词技术
§2.1.2 词性标注技术
§2.1.3 短语切分技术
§2.1.4 共指消解技术
§2.2 分布式的语义空间
§2.2.1 神经概率语言模型
§2.2.2 Word2Vec分布式语义空间
§2.2.3 GloVe分布式语义空间
§2.3 结构化的语义空间
§2.3.1 WordNet
§2.3.2 ConceptNet
§2.4 混合语义空间构建的理论基础
§2.4.1 分布式语义空间的改进
§2.4.2 奇异值分解
§2.4.3 L1标准化
§2.4.4 L2标准化
§2.5 作文表示方法相关理论基础
§2.5.1 词频-逆文档频率
§2.5.2 主成分分析方法
§2.5.3 光滑的逆频率算法
§2.6 本章小结
第三章 英语作文主题观点跑题分析模型
§3.1 模型的总体结构
§3.2 英语作文预处理
§3.2.1 共指消解和共指替换
§3.2.2 分句分词和单词小写化
§3.2.3 词性标注和短语切分
§3.2.4 去停用词和词干化
§3.3 混合语义空间的构建
§3.3.1 分布式语义空间的训练
§3.3.2 词汇表对齐处理
§3.3.3 分布式语义空间的融合
§3.3.4 同义词集改进分布式语义空间
§3.3.5 扩展改进
§3.4 英语作文的表示
§3.4.1 改进的光滑逆频率算法
§3.4.2 待测作文和题目的表示
§3.5 英语作文跑题分析
§3.5.1 跑题作文检测
§3.5.2 跑题句子抽取与评分
§3.6 本章小结
第四章 模型的实验与分析
§4.1 模型的实验环境
§4.2 模型的实验数据和评估标准
§4.2.1 模型的实验数据
§4.2.2 模型的评估标准
§4.3 模型的实验分析
§4.4 模型的实现
§4.5 本章小结
第五章 总结与展望
§5.1 论文总结
§5.2 研究展望
参考文献
致谢
作者在攻读硕士期间主要研究成果
本文编号:3712613
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
§1.1 研究意义
§1.2 研究现状
§1.2.1 英语作文跑题分析研究现状
§1.2.2 语义相似度计算研究现状
§1.3 研究目标及内容
§1.4 论文组织结构
§1.5 本章小结
第二章 相关的理论与方法
§2.1 文本预处理相关的基础技术
§2.1.1 分句分词技术
§2.1.2 词性标注技术
§2.1.3 短语切分技术
§2.1.4 共指消解技术
§2.2 分布式的语义空间
§2.2.1 神经概率语言模型
§2.2.2 Word2Vec分布式语义空间
§2.2.3 GloVe分布式语义空间
§2.3 结构化的语义空间
§2.3.1 WordNet
§2.3.2 ConceptNet
§2.4 混合语义空间构建的理论基础
§2.4.1 分布式语义空间的改进
§2.4.2 奇异值分解
§2.4.3 L1标准化
§2.4.4 L2标准化
§2.5 作文表示方法相关理论基础
§2.5.1 词频-逆文档频率
§2.5.2 主成分分析方法
§2.5.3 光滑的逆频率算法
§2.6 本章小结
第三章 英语作文主题观点跑题分析模型
§3.1 模型的总体结构
§3.2 英语作文预处理
§3.2.1 共指消解和共指替换
§3.2.2 分句分词和单词小写化
§3.2.3 词性标注和短语切分
§3.2.4 去停用词和词干化
§3.3 混合语义空间的构建
§3.3.1 分布式语义空间的训练
§3.3.2 词汇表对齐处理
§3.3.3 分布式语义空间的融合
§3.3.4 同义词集改进分布式语义空间
§3.3.5 扩展改进
§3.4 英语作文的表示
§3.4.1 改进的光滑逆频率算法
§3.4.2 待测作文和题目的表示
§3.5 英语作文跑题分析
§3.5.1 跑题作文检测
§3.5.2 跑题句子抽取与评分
§3.6 本章小结
第四章 模型的实验与分析
§4.1 模型的实验环境
§4.2 模型的实验数据和评估标准
§4.2.1 模型的实验数据
§4.2.2 模型的评估标准
§4.3 模型的实验分析
§4.4 模型的实现
§4.5 本章小结
第五章 总结与展望
§5.1 论文总结
§5.2 研究展望
参考文献
致谢
作者在攻读硕士期间主要研究成果
本文编号:3712613
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3712613.html
最近更新
教材专著