1.7_深度

强化学习中的“深度”

迄今为止的讨论主要集中在强化学习本身。但是,何为‘深度’强化学习?

深度强化学习引入了深度神经网络来解决强化学习问题——因此得名“深度”。

例如,在下一个单元中,我们将学习两种基于价值的算法:Q-learning(经典强化学习)和深度 Q-learning。

你会发现不同之处在于,在第一种方法中,我们使用传统算法创建一个 Q 表格,帮助我们找到每个状态可采取的动作。

在第二种方法中,我们将使用神经网络(近似 Q 值)。

如果你不熟悉深度学习,非常推荐观看 面向程序员的 FastAI 实用深度学习这门课程(免费)。