所有栏目

ppo算法与ddpg算法区别

已输入 0 字
优质回答
  • PPO是目前非常流行的增强学习算法。

    DDPG也是解决连续控制型问题的的一个算法,不过和PPO不一样,PPO输出的是一个策略,也就是一个概率分布,而DDPG输出的直接是一个动作。DDPG是一种入门算法,效果远不及PPO。

    2024-01-09 21:33:01
最新问题 全部问题