面向时态规划的动作模型学习方法研究
发布时间:2020-12-31 02:50
时态动作模型是从逻辑关系、时间关系和资源关系上对智能体改变环境的行为能力刻画。手工建立动作模型的方式需要建模专家的大量知识和细致观察,耗时耗力。近年来,以自动化方式构建动作模型的建模辅助的方法成为智能规划领域的研究热点。在总结国内外以STRIPS为表示语言进行自动化动作模型构建的基础上,本文致力于设计以PDDL2.1为表示语言的自动化动作模型构建方法。相对于STRIPS能表示的“经典规划”问题,PDDL2.1语言能表示建模能力更强的“时态规划”问题,因而本文的工作有助于将动作模型自动构建技术应用于更复杂的现实环境。围绕以PDDL2.1为表示语言的“时态动作模型”自动化构建问题,本文将其分解为“状态分割”、“逻辑关系学习”、“动作持续时间学习”、“时态关系学习”等阶段,通过综合各阶段结果实现时态动作模型的构建。具体完成了以下四方面工作。(1)在“状态分割”阶段,分析了前人相关方法,运用自然语言处理领域的“词向量”技术提出了基于词向量的状态分割新方法,实现了状态分割错误率的降低。(2)在“动作持续时间学习”阶段,设计了“两阶段线性回归”方法,实现了具有较低计算代价的动作持续时间表达式拟合方...
【文章来源】:武汉工程大学湖北省
【文章页数】:91 页
【学位级别】:硕士
【部分图文】:
操作move的逻辑结构和时态结构
并且假设在动作ia 之前的状态是isj l ∈o,并且对 k ( j<k<i)有l o = 10(1kjmiSTRIPS 动作模型学习框架如图首先对原始 STRIPS 规划迹样本分割,得到命题文字所属状态。然构建操作效果。接着提取动作对应前最后输出完整的 STRIPS 动作模型,
次提出了两个模型 CBOW(Continuous Bag-of-Words Model)和 Skip-gram(Continuous Skip-gram Model),如图 2.7。这两个模型都只有三层,即,输入层、映射层和输出层。该文的实验结果显示 Skip-gram 在语义(Semantic)上的性能要优于 CBOW,但其计算速度要低于 CBOW。TomasMikolov 用递归神经网络击败了语言模型的世界纪录,在一定程度上,词向量模型揭示了单词之间某些非线性的关系。例如,用“国王”减去“男人”加上“女人”,能得到“王后”。Word2vec 是在 2013 年由 Google 开发的一款将词表征为实数值向量的高效工具。使用的是 Distributed Representation 的词向量表示方式。利用深度学习思想,通过训练,将文本内容简化为 k 维向量空间中的向量运算。向量空间上的相似度可用来表示文本语义上的相似度。其中一个核心技术是根据词频用 Huffman 编码,使得所有词频相似的词隐藏层激活的内容基本一致。出现频率越高的词语,其激活的隐藏层数目越少,这样有效降低了计算的复杂度。
本文编号:2948806
【文章来源】:武汉工程大学湖北省
【文章页数】:91 页
【学位级别】:硕士
【部分图文】:
操作move的逻辑结构和时态结构
并且假设在动作ia 之前的状态是isj l ∈o,并且对 k ( j<k<i)有l o = 10(1kjmiSTRIPS 动作模型学习框架如图首先对原始 STRIPS 规划迹样本分割,得到命题文字所属状态。然构建操作效果。接着提取动作对应前最后输出完整的 STRIPS 动作模型,
次提出了两个模型 CBOW(Continuous Bag-of-Words Model)和 Skip-gram(Continuous Skip-gram Model),如图 2.7。这两个模型都只有三层,即,输入层、映射层和输出层。该文的实验结果显示 Skip-gram 在语义(Semantic)上的性能要优于 CBOW,但其计算速度要低于 CBOW。TomasMikolov 用递归神经网络击败了语言模型的世界纪录,在一定程度上,词向量模型揭示了单词之间某些非线性的关系。例如,用“国王”减去“男人”加上“女人”,能得到“王后”。Word2vec 是在 2013 年由 Google 开发的一款将词表征为实数值向量的高效工具。使用的是 Distributed Representation 的词向量表示方式。利用深度学习思想,通过训练,将文本内容简化为 k 维向量空间中的向量运算。向量空间上的相似度可用来表示文本语义上的相似度。其中一个核心技术是根据词频用 Huffman 编码,使得所有词频相似的词隐藏层激活的内容基本一致。出现频率越高的词语,其激活的隐藏层数目越少,这样有效降低了计算的复杂度。
本文编号:2948806
本文链接:https://www.wllwen.com/kejilunwen/yysx/2948806.html