1.4_两种任务类型

任务类型

一个任务是一个强化学习问题的实例。我们可以有两种类型的任务：偶发性和持续性。

在这种情况下，我们有一个起点和一个终点 （终止状态）。这会创建一个回合：状态、动作、奖励和新状态的列表。

例如，想一想《超级马里奥》：一个回合从新马里奥的启动开始，到你被杀或到达关卡终点时结束。

这些是永远持续的任务（没有终止状态）。在这种情况下，智能体必须学习如何选择最佳动作并同时与环境交互。

例如，进行自动股票交易的代理。对于这个任务，没有起点和终点状态。 智能体一直运行，直到我们决定停止它。

回顾一下：