1.4_两种任务类型
任务类型
一个任务是一个强化学习问题的实例。我们可以有两种类型的任务:偶发性和持续性。
回合制任务
在这种情况下,我们有一个起点和一个终点 (终止状态)。这会创建一个回合:状态、动作、奖励和新状态的列表。
例如,想一想《超级马里奥》:一个回合从新马里奥的启动开始,到你被杀或到达关卡终点时结束。
持续性任务
这些是永远持续的任务(没有终止状态)。在这种情况下,智能体必须学习如何选择最佳动作并同时与环境交互。
例如,进行自动股票交易的代理。对于这个任务,没有起点和终点状态。 智能体一直运行,直到我们决定停止它。
回顾一下:
