#

1、深度 Q 学习简介

2、神经网络作为值函数

3、蒙特卡洛学习

4、时间差分学习

5、Q 学习

6、深度 Q 网络

7、经验回放

阅读延伸

8、固定 Q 目标

9、深度 Q 学习算法

阅读延伸

10、DQN 改进

阅读延伸

11、实现深度Q学习

img

实现深度 Q 学习

下个部分,你将探索一个深度 Q 学习算法 TensorFlow 实现的 Jupyter notebook。

要在 GPU 上运行代码,请在弹出式窗口中选择“YES”。这样就可以在 GPU 上运行 notebook。

img

如果你想了解如何在其他 Python 框架中编写实现,请参阅:

  • (Keras) https://keon.io/deep-q-learning/
  • (PyTorch) http://pytorch.org/tutorials/intermediate/reinforcement_q_learning.html

12、备注:

系统默认打开的会首先是英文 “Q-learning-cart.ipynb“ 文件。 如需要中文版本,请直接点击左上角 ”Jupter“, 选择 “ Q-learning-cart-zh.ipynb” 即可加载出中文文件。如未出现,请点击Workspace左下角的Menu上的红色三角,选择‘reset data’即能更新到最新的directory,但是该更新会还原所有的文件内容,请预先保存,谢谢。

13、总结

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!


hetaodie

Mobile development

简单,深入的研究移动客户端开发技术"