可教代理型游戏的设计与开发
发布时间:2020-06-05 08:51
【摘要】:学习者在游戏过程中普遍扮演着知识接收者的角色,但随着时间的推移容易产生厌烦情绪,降低学习兴趣,这一现象成为游戏化学习面临的重要难题。为打破这一僵局,研究者结合教学实践,尝试在游戏世界中转变学习者与游戏代理的角色定位,由学习者的“学”变为学习者的“教”,游戏代理负责接收学习者传递的知识成为可教代理,从而提高学习者兴趣,巩固所学知识,促进学习者积极的学习行为。鉴于此,本研究采用文献研究法、评价研究法等系列研究方法,在教中学理论、强化学习理论的指导下,利用游戏开发工具,设计开发面向化学实验操作的知识学习型可教代理游戏。本研究主要进行以下三方面的工作:(1)基础理论研究。在查阅大量文献的基础上展开分析,针对可教代理内涵、教中学理论、强化学习理论进行详细阐述,确定可教代理学习技术,明确可教代理型游戏设计策略。(2)可教代理型游戏设计模型建构。在对建构主义教学设计模型分析的基础上结合问题解决视角,构建可教代理型游戏的教学设计模型。借鉴现有相关系统、游戏元素、模型设计,结合可教代理运行机制,构建可教代理型游戏的功能结构模型。(3)可教代理型游戏实例开发。在教学设计模型和功能结构模型的基础上,选取初中化学实验操作知识,以强化学习算法为技术支持,在Unity平台下借助C#语言开发可教代理型游戏实例,并进行效果验证。系列相关文献的分析有效地推动研究工作的逐步开展,共取得以下三点研究成果:(1)从本研究的视角出发,详细论述可教代理内涵和游戏设计开发相关理论,明确游戏实例开发的关键点,并为后续可教代理型游戏的开发提供了理论支持。(2)本研究构建了可教代理型游戏的设计框架。借鉴现有成功案例,将可教代理的思想融入游戏环节设计中,强调学习者的主体地位和可教代理的学习机制,构建可教代理型游戏的教学设计模型、功能结构模型。(3)本研究设计开发面向初中化学实验操作的知识学习型可教代理游戏。以鲁教版初中化学课本中三个实验操作为内容来源,利用强化学习算法实现教学交互中可教代理的智能学习行为,呈现教中学环境,并使用后台数据分析和问卷调查的方式验证游戏效果。由于研究者研究时间、能力有限,所开发游戏实例虽实现可教代理的基本功能,提供教中学体验,但仍存在不足之处,未来的研究工作将围绕可教代理与其他学科知识的融合以及可教代理环境的丰富来展开。
【图文】:
者认知能力的计算机代理。此定义一经提出便获得研究者的一致认可,指导着一系列研宄的开逡逑展。在现有教学代理丰富研宄的基础上,从功能结构角度出发将可教代理以元组的形式进行表逡逑示:TA=邋(E,P,Rt.A)。[5i]具体关系如图2-1所示,其中E代表与可教代理进行交互的环境状逡逑态的集合,P代表可教代理所感知的环境中认知对象的集合,Rt代表可教代理向学习者学习并逡逑反过来提高学习者学习的推理机制,,A则代表可教代理可以采取的原始行动的集合。研究者所逡逑提出的可教代理的定义和模型为后续可教代理的发展打下坚实的基础。逡逑|逦J逡逑I邋p逦LJ邋Rt邋L.邋A逡逑I事件追踪器逦决策者逦执彳了器逡逑:逦逦|逡逑图2-1邋—般可教代理模型逡逑可教代理与教育需求直接相关,其设计的最终目的是促进学习者学习,激发学习者兴趣,逡逑设计需满足教中学的三个基本教育要求。首先,可教代理有能力学习来自学习者的新知识,以逡逑鼓励学习者反思学习材料。其次,可教代理有能力应用所学知识,并为学习者提供反馈,帮助逡逑学习者验证和重新思考他们的教学。最后,可教代理有能力与学习者建立良好的关系,以鼓励逡逑学习者更好地教学,从而促进学习者承担起学习的责任。为满足相应的教育需求,研究者将其逡逑所应具备的能力分为三种:可教性、实践性、情感性
逑图2-2强化学习模型逡逑强化学习的模型如图2-2所示。主体通过与环境的交互进行学习,主体与环境的交互接口逡逑包括动作回报和状态。交互过程可以表述为如下的形式:每一步主体都根据策略选择一个动作逡逑执行,然后感知下一步的状态和回报,通过经验再修改自己的策略。主体的目的就是获取最大逡逑化的累积回报。假设主体生存的环境被描述为某个可能的状态集S,它可以执行的动作集合A,逡逑强化学习系统接受环境状态的输入s,根据内部的推理机制,系统输出相应的动作行为a,环逡逑境在系统动作a下,变迁到新的状态s1。系统接收环境新状态的输入,同时得到环境对系统的逡逑立即回报r?。每次在某状态St下执行新动作at,主体会收到一个立即的回报rt,然后环境变迁逡逑到新的状态s't,如此产生了一系列的状态Sl,动作a,和立即回报n的集合。逡逑强化学习技术的基本原理是:如果系统某个动作导致环境正的回报,那么系统以后产生这逡逑17逡逑
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:G434;G633.8
本文编号:2697800
【图文】:
者认知能力的计算机代理。此定义一经提出便获得研究者的一致认可,指导着一系列研宄的开逡逑展。在现有教学代理丰富研宄的基础上,从功能结构角度出发将可教代理以元组的形式进行表逡逑示:TA=邋(E,P,Rt.A)。[5i]具体关系如图2-1所示,其中E代表与可教代理进行交互的环境状逡逑态的集合,P代表可教代理所感知的环境中认知对象的集合,Rt代表可教代理向学习者学习并逡逑反过来提高学习者学习的推理机制,,A则代表可教代理可以采取的原始行动的集合。研究者所逡逑提出的可教代理的定义和模型为后续可教代理的发展打下坚实的基础。逡逑|逦J逡逑I邋p逦LJ邋Rt邋L.邋A逡逑I事件追踪器逦决策者逦执彳了器逡逑:逦逦|逡逑图2-1邋—般可教代理模型逡逑可教代理与教育需求直接相关,其设计的最终目的是促进学习者学习,激发学习者兴趣,逡逑设计需满足教中学的三个基本教育要求。首先,可教代理有能力学习来自学习者的新知识,以逡逑鼓励学习者反思学习材料。其次,可教代理有能力应用所学知识,并为学习者提供反馈,帮助逡逑学习者验证和重新思考他们的教学。最后,可教代理有能力与学习者建立良好的关系,以鼓励逡逑学习者更好地教学,从而促进学习者承担起学习的责任。为满足相应的教育需求,研究者将其逡逑所应具备的能力分为三种:可教性、实践性、情感性
逑图2-2强化学习模型逡逑强化学习的模型如图2-2所示。主体通过与环境的交互进行学习,主体与环境的交互接口逡逑包括动作回报和状态。交互过程可以表述为如下的形式:每一步主体都根据策略选择一个动作逡逑执行,然后感知下一步的状态和回报,通过经验再修改自己的策略。主体的目的就是获取最大逡逑化的累积回报。假设主体生存的环境被描述为某个可能的状态集S,它可以执行的动作集合A,逡逑强化学习系统接受环境状态的输入s,根据内部的推理机制,系统输出相应的动作行为a,环逡逑境在系统动作a下,变迁到新的状态s1。系统接收环境新状态的输入,同时得到环境对系统的逡逑立即回报r?。每次在某状态St下执行新动作at,主体会收到一个立即的回报rt,然后环境变迁逡逑到新的状态s't,如此产生了一系列的状态Sl,动作a,和立即回报n的集合。逡逑强化学习技术的基本原理是:如果系统某个动作导致环境正的回报,那么系统以后产生这逡逑17逡逑
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:G434;G633.8
【参考文献】
相关期刊论文 前7条
1 李馨;;融入“适应性”的教育游戏结构设计模型及实验研究[J];远程教育杂志;2015年02期
2 郭雷;;计算机游戏中的智能角色研究[J];计算机与数字工程;2013年01期
3 马颖峰;隋志华;;教育网络游戏中NPC与学习者置入感的关系研究——由Games-to-Teach项目想到的[J];电化教育研究;2009年06期
4 陈仕品;张剑平;;智能教学系统的研究热点与发展趋势[J];电化教育研究;2007年10期
5 张汝波,顾国昌,刘照德,王醒策;强化学习理论、算法及应用[J];控制理论与应用;2000年05期
6 蒋国飞,吴沧浦;基于Q学习算法和BP神经网络的倒立摆控制[J];自动化学报;1998年05期
7 周国韬;问卷调查法刍议[J];心理发展与教育;1990年01期
相关硕士学位论文 前1条
1 褚建华;Q-learning强化学习算法改进及其应用研究[D];北京化工大学;2009年
本文编号:2697800
本文链接:https://www.wllwen.com/zhongdengjiaoyulunwen/2697800.html