i2a-k / Reinforcement-Learning

Multi-Armed Bandit Simulation, MDP GridWorld Example, Random Walk Problem by TD and MC

gridworld incremental-monte-carlo markov-decision-processes monte-carlo multi-armed-bandit n-armed-bandit-problem random-walk reinforcement-learning rl temporal-difference

This repository is not active

About

Multi-Armed Bandit Simulation, MDP GridWorld Example, Random Walk Problem by TD and MC

gridworld incremental-monte-carlo markov-decision-processes monte-carlo multi-armed-bandit n-armed-bandit-problem random-walk reinforcement-learning rl temporal-difference

Languages

Language:Jupyter Notebook 100.0%