5.2_Unity ML_Agents怎样工作

在训练我们的智能体前 ,我们需要理解 什么是 ML-Agents 并且他是怎么工作的

什么是 Unity ML-Agents?

Unity ML-Agents 是游戏引擎 Unity 的一个工具包,这个工具包允许我们使用 Unity 创建环境或者用预置环境来训练我们的智能体

ML-Agents 是 Unity Technologies, Unity 的开发者们, 研发的。该引擎是 Firewatch, Cuphead, 和 Cities: Skylines 等游戏创作者使用的最著名的游戏引擎之一。

Firewatch
Unity 制作的 Firewatch

六个组成部分

在 Unity ML-Agents 中, 你有六个非常重要的部分:

MLAgents
来源:Unity ML-Agents 文档

学习组件内部

在学习组件中,我们有两个重要元素

为了更好地理解它的作用,让我们记住 RL 过程。这可以建模为一个循环,其工作方式如下:

The RL process
RL 过程:状态、动作、奖励和下一个状态的循环
来源: 强化学习:简介,Richard Sutton 和 Andrew G. BartoSource:

现在,让我们想象一个智能体学习玩平台游戏。RL 过程如下所示:

The RL process

这个 RL 循环输出一系列 状态、动作、奖励和下一个状态。智能体的目标是最大化预期的累积奖励

学院将向我们的智能体发送命令并确保智能体的同步

The MLAgents Academy

既然我们了解了 ML-Agents 的工作原理,我们就可以训练我们的智能体了