7.1_介绍

Thumbnail

自从课程开始以来,我们学习了在一个单智能体系统中训练智能体,其中我们的智能体在其环境中是独自存在的:它不与其他智能体合作或协作

这种方法非常有效,并且单智能体系统在许多应用中非常有用。

Patchwork
自从课程开始以来,你训练智能体的所有环境的集合如下:

但是,作为人类,我们生活在一个多智能体的世界中。我们的智能来自与其他智能体的互动。因此,我们的目标是创建可以与其他人类和智能体互动的智能体

因此,我们必须研究如何在多智能体系统中训练深度强化学习智能体,以构建能够适应、合作或竞争的强大智能体。

因此,今天我们将学习这个引人入胜的多智能体强化学习(MARL)的基础知识

最令人兴奋的部分是,在本单元期间,你将在多智能体系统中训练你的第一个智能体:一个需要击败对方团队的2对2足球队

并且您将参与 AI 对 AI 的挑战,在这个挑战中,你训练的智能体将每天与其他同学的智能体进行竞争,并在一个新的排行榜上排名:新的排行榜

SoccerTwos
这个环境由 Unity MLAgents 团队创建

让我们开始吧!