1.4_两种任务类型

任务类型

一个任务是一个强化学习问题的实例。我们可以有两种类型的任务:偶发性持续性

回合制任务

在这种情况下,我们有一个起点和一个终点 (终止状态)。这会创建一个回合:状态、动作、奖励和新状态的列表。

例如,想一想《超级马里奥》:一个回合从新马里奥的启动开始,到你被杀或到达关卡终点时结束。

Mario
新回合的开始。

持续性任务

这些是永远持续的任务(没有终止状态)。在这种情况下,智能体必须学习如何选择最佳动作并同时与环境交互。

例如,进行自动股票交易的代理。对于这个任务,没有起点和终点状态。 智能体一直运行,直到我们决定停止它。

Stock Market

回顾一下:
Tasks recap