合聚咖

合聚咖

强化学习中mdp模型包括哪些类

admin

强化学习中的mdp模型包括:

环境状态的集合;

动作的集合;

在状态之间转换的规则;

规定转换后“即时奖励”的规则;

描述主体能够观察到什么的规则。