#

1、基于策略的方法

2、 为何要使用基于策略的方法?

3、策略函数逼近

4、 随机性策略搜索

5、策略梯度

6、 蒙特卡洛策略梯度

7、受限策略梯度

8、 总结

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!


hetaodie

Mobile development

简单,深入的研究移动客户端开发技术"