DDPG

Implementing Deep Deterministic Policy Gradient Algorithm

http://proceedings.mlr.press/v32/silver14.pdf

Pendulum-v0

Agent parameters

noise_init = {'mu': 0.0, 'sigma': 0.2, 'action_dim': action_shape}

replay_buffer_init = {'max_len': 100000, 'batch_size': 128}

actor_init = {'action_high': action_high, 
              'action_low': action_low, 
              'network_init': {'i_shape': state_shape, 
                               'l1_shape': 400, 
                               'l2_shape': 300,
                               'o_shape': action_shape
                              },
              'optimizer': {'lr': 1e-3}
             }

critic_init = {'network_init': {'i_shape': state_shape, 
                               'l1_shape': 400, 
                               'l2_shape': 300,
                               'action_shape': action_shape
                              },
              'optimizer': {'lr': 1e-3}
             }


ddpg_init = {
    'seed': seed,
    'action_shape': action_shape,
    'discount_factor': .99,
    'update_target_rate': .995,
    'update_after': 20000,
    'update_every': 50,
    'noise': noise_init,
    'replay_buffer': replay_buffer_init,
    'actor': actor_init,
    'critic': critic_init
}

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.idea		.idea
.images		.images
.gitignore		.gitignore
MountainCarContinuous-v0.ipynb		MountainCarContinuous-v0.ipynb
Pendulum-v0.ipynb		Pendulum-v0.ipynb
README.md		README.md
agent.py		agent.py
train_session.py		train_session.py
utils.py		utils.py
variable.py		variable.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

DDPG

Pendulum-v0

Agent parameters

About

Uh oh!

Releases

Packages

Languages

BenoitLeguay/DDPG

Folders and files

Latest commit

History

Repository files navigation

DDPG

Pendulum-v0

Agent parameters

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages