CFOnHeart / ReforceLearning

主要利用QLearning,DQN,ImprovedDQN(Ddouble DQN) 解决gym框架下的三个问题CartPole-v0,MountainCar-v0,Acrobot-v1

ReforceLearning

环境

Python 2.7
Tensorflow
Keras
numpy
pandas
matplot
h5py

目录介绍

4个主要目录

QLearning 目录包含了QLearning算法的模板，以及运用QLearning算法实现的三个gym程序。
DQN 目录包含了DQN算法的模板，以及运用DQN算法实现的三个gym程序。
Improved DQN 目录包含了Improved DQN算法的模板，以及运用Improved DQN算法实现的三个gym程序。
monitor目录保存的是三种算法训练好的模型得到的视频。

每个目录下的子目录：

graph：存储程序运行出来的可视化图片保存的目录，包括均值，loss值的统计，以及不同算法的对比分析
model：保存对应训练的模型，QLearning下的model就是普通的文件，保存的是Q表，直接文件读写即可，文件读写的函数我写在MyQLearning.py。其余两个用的是内置的接口保存的神经网络的权值model.save_weights(model_name)，需要用内置的接口model.load_weights(model_name)

运行方式

QLearning 算法相关实现在QLearning 目录中

这个目录下的MyQLearning.py是设计的QLearning算法

另外三个文件分别对应了gym的三种环境，直接运行即可，代码里包含了对程序的三种离散化模式的训练和测试。

Example command：
- python CartPole_learning.py
- python Mountaincar_learning.py
- python Acrobot_learning.py
对应两个MountainCar_compare_three_method.py，Acrobot_compare_three_method.py文件，是我对MountainCar-v0 和 Acrobot-v1这两个环境在三种离散方式下测试后的对比图像绘制，用于分析效果好坏的。

Example command：
- Python MountainCar_compare_three_method.py
- python Acrobot_compare_three_method.py
DQN算法相关是现在DQN目录中

这个目录下的MyDQN.py是设计的DQN算法

对应的文件意思和QLearning一致

Example command：
- python CartPole_DQN.py
- python MountainCar_DQN.py
- python Acrobot_DQN.py
ImprovedDQN算法相关是现在ImprovedDQN目录中

这个目录下的MyImprovedDQN.py是设计的DQN算法

对应的文件意思和DQN一致

Example command：
- python CartPole_ImprovedDQN.py
- python MountainCar_ImprovedDQN.py
- python Acrobot_ImprovedDQN.py

About

主要利用QLearning,DQN,ImprovedDQN(Ddouble DQN) 解决gym框架下的三个问题CartPole-v0,MountainCar-v0,Acrobot-v1

Languages

Language:Python 100.0%