7.1_介绍
自从课程开始以来,我们学习了在一个单智能体系统中训练智能体,其中我们的智能体在其环境中是独自存在的:它不与其他智能体合作或协作。
这种方法非常有效,并且单智能体系统在许多应用中非常有用。
但是,作为人类,我们生活在一个多智能体的世界中。我们的智能来自与其他智能体的互动。因此,我们的目标是创建可以与其他人类和智能体互动的智能体。
因此,我们必须研究如何在多智能体系统中训练深度强化学习智能体,以构建能够适应、合作或竞争的强大智能体。
因此,今天我们将学习这个引人入胜的多智能体强化学习(MARL)的基础知识。
最令人兴奋的部分是,在本单元期间,你将在多智能体系统中训练你的第一个智能体:一个需要击败对方团队的2对2足球队。
并且您将参与 AI 对 AI 的挑战,在这个挑战中,你训练的智能体将每天与其他同学的智能体进行竞争,并在一个新的排行榜上排名:新的排行榜。
让我们开始吧!