基于序列生成对抗网络的综合素质评价系统文本生成研究
发布时间:2021-01-10 07:07
综合素质评价是素质教育的一项规范,开发针对综合素质评价的管理系统非常有必要,不仅可以方便管理在读学生的学习状态,归档后的数据也是将来进一步提高素质教育水平的重要参考。但目前的素质评测存在很强的主观性,主要体现在控制权集中在班主任手中,以及某些学校的评测过程往往不透明、不公开,导致社会上对于综合素质评价仍然存在质疑。本文使用江西省普通高中毕业生往年的综合素质评价数据,通过基于大数据的文本生成方法,以及完全的线上管理,在一定程度上降低参评者的主观影响,提高评语填写的公正性;同时减少教师在撰写评语上所花费的时间,提高工作效率。本文针对素质教育评语内容的生成,对计算机自动文本生成进行了深入的研究分析。首先分类和总结了文本生成领域的研究成果,对几种相关的神经网络的基本概念、具体结构以及训练方法进行了介绍说明。在此基础上,根据调研提出的下游任务在序列生成对抗网络模型上进行改进,分别在判别器和生成器中加入关联语义对特征及隐变量的影响,实现了基于抽象的关联语义控制的评语生成方法,使得网络能够根据输入的评价等级生成符合预期效果的文本。并且采用了自动评测和人工评测两种方式互补建立评价系统。实验结果表明,该...
【文章来源】:南昌大学江西省 211工程院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
图2.1循环神经网络按序列展开??
?第2章文本生成相关理论与技术???Q?Q????A?+???/* ̄?TT?Z"?"7?p\??YYcehei?¥?x?lip?f?V?op]?:?v!iy??「+9?r.-.^?\?I?—?’甲?r-^>?:?|?ri?r ̄>6?I???m?c±3?usei?w?.?i±i?m?siiD?m?i?cfa?m?國?m?厂、??-寸-L?丄一.」一」吻二二?J?丄丨―i—?L-^|■.个》?????????图2.2?LSTM单元结构??相比RNN只有一个传递状态,引入门限机制的LSTM记忆单元在每个时??间步t接收的输出有三个,一是当前步输入值,另外两个传输状态,一个是细??胞状态Cg?(cell?state),和一个隐藏状态(hidden?state),经过处理后输出??变为当前步的隐状态Zit和当前步的传输状态ct,实际上LSTM的&对应着RNN??中的这两个变量在传递过程中的对比,^的改变过程较慢,一般是由上一个??时间步的ct_i加上一些其他数值,保存着节点的信息;心主要是为了和当前输入??组合来获得门控信号,所以在不同时间步的变化相差较大。??门的结构可以看作一个全连接层,以某隐状态和输入;^拼接进行计算,??门的输出是一个值域为[0,?1]的实数向量。??遗忘门根据隐状态和输入的拼接计算结果选择性地剔除传输状态信息控制??长期单元状态:??ft?=?(r(Wf?■?[ht^.Xt]?+?bf)?(2.2)??输入门则是选择性地记忆输入信息以控制添加到传输状态:??it?=?a(Wi?■?[/it_i,xt]?+?bt)?(2.3)??输出门决定将传输状态中的哪
?第2章文本生成相关理论与技术???生成方法通常会假设数据总是服从某一分布的,使用极大似然估计尽可能地使??模型生成的数据逼近这一分布,而生成对抗网络的训练是两个主体在对抗博弈??的状态当中无监督地进行自我更新。??生成对抗网络是一种结构框架,结构如图2.4,而并不代指某一特定网络模??型。这种结构并不复杂,主要包含“生成器(Generator?)?”和“判别器(Discriminator)?”??两部分。在这个结构中,生成器只需要满足符合最终目标是生成拟合真实样本分??布数据的要求,在形式上并没有任何约束。实际上在没有判别器的情况下生成??器也能够运作,只是训练目标不一样,生成器单独运作时,需要人工定义损失函??数,然而实际情况下人工定义的表征能力非常有限,损失函数的定义通常是片面??的,因而导致模型收敛之后生成结果并不一定能够达到预期,尤其是在文本处理??的任务上。生成对抗网络可以在一定程度上解决这一问题,判别器在这个结构当??中的角色相当于一个不断自我更新的目标函数,其最终目的是最小化生成样本??被判断为真的概率,同时最小化真实样本被判定为假的概率,对抗训练中生成器??的更新总是以判别器结果作为依据的,目标是最小化生成样本与真实样本之间??的分布差异。??生成?更动??f?生成文本?j??f?真实文本?J????判劄器网络一判断-??图2.4生成对抗网络框架总体结构图??在生成对抗网络框架中,将生成器抽象为G(_)函数,G(〇所生成的样本分布??记为ps(x),真实样本的分布相应记为pdata(x);判别器则抽象为D(〇函数,/)(???)的输出是一个标量,代表一个二分类结果,在数据采样足够充
本文编号:2968288
【文章来源】:南昌大学江西省 211工程院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
图2.1循环神经网络按序列展开??
?第2章文本生成相关理论与技术???Q?Q????A?+???/* ̄?TT?Z"?"7?p\??YYcehei?¥?x?lip?f?V?op]?:?v!iy??「+9?r.-.^?\?I?—?’甲?r-^>?:?|?ri?r ̄>6?I???m?c±3?usei?w?.?i±i?m?siiD?m?i?cfa?m?國?m?厂、??-寸-L?丄一.」一」吻二二?J?丄丨―i—?L-^|■.个》?????????图2.2?LSTM单元结构??相比RNN只有一个传递状态,引入门限机制的LSTM记忆单元在每个时??间步t接收的输出有三个,一是当前步输入值,另外两个传输状态,一个是细??胞状态Cg?(cell?state),和一个隐藏状态(hidden?state),经过处理后输出??变为当前步的隐状态Zit和当前步的传输状态ct,实际上LSTM的&对应着RNN??中的这两个变量在传递过程中的对比,^的改变过程较慢,一般是由上一个??时间步的ct_i加上一些其他数值,保存着节点的信息;心主要是为了和当前输入??组合来获得门控信号,所以在不同时间步的变化相差较大。??门的结构可以看作一个全连接层,以某隐状态和输入;^拼接进行计算,??门的输出是一个值域为[0,?1]的实数向量。??遗忘门根据隐状态和输入的拼接计算结果选择性地剔除传输状态信息控制??长期单元状态:??ft?=?(r(Wf?■?[ht^.Xt]?+?bf)?(2.2)??输入门则是选择性地记忆输入信息以控制添加到传输状态:??it?=?a(Wi?■?[/it_i,xt]?+?bt)?(2.3)??输出门决定将传输状态中的哪
?第2章文本生成相关理论与技术???生成方法通常会假设数据总是服从某一分布的,使用极大似然估计尽可能地使??模型生成的数据逼近这一分布,而生成对抗网络的训练是两个主体在对抗博弈??的状态当中无监督地进行自我更新。??生成对抗网络是一种结构框架,结构如图2.4,而并不代指某一特定网络模??型。这种结构并不复杂,主要包含“生成器(Generator?)?”和“判别器(Discriminator)?”??两部分。在这个结构中,生成器只需要满足符合最终目标是生成拟合真实样本分??布数据的要求,在形式上并没有任何约束。实际上在没有判别器的情况下生成??器也能够运作,只是训练目标不一样,生成器单独运作时,需要人工定义损失函??数,然而实际情况下人工定义的表征能力非常有限,损失函数的定义通常是片面??的,因而导致模型收敛之后生成结果并不一定能够达到预期,尤其是在文本处理??的任务上。生成对抗网络可以在一定程度上解决这一问题,判别器在这个结构当??中的角色相当于一个不断自我更新的目标函数,其最终目的是最小化生成样本??被判断为真的概率,同时最小化真实样本被判定为假的概率,对抗训练中生成器??的更新总是以判别器结果作为依据的,目标是最小化生成样本与真实样本之间??的分布差异。??生成?更动??f?生成文本?j??f?真实文本?J????判劄器网络一判断-??图2.4生成对抗网络框架总体结构图??在生成对抗网络框架中,将生成器抽象为G(_)函数,G(〇所生成的样本分布??记为ps(x),真实样本的分布相应记为pdata(x);判别器则抽象为D(〇函数,/)(???)的输出是一个标量,代表一个二分类结果,在数据采样足够充
本文编号:2968288
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2968288.html