Reinforcement-Learning2018

The sample code in the book

Packages:

Needed Package:
numpy
python = 3.6
pytorch = 1.0.1

Chapter2 action-value bandit epsilon-greedy Time:2019/03/07

Part One:MCTS-Gobang
Part Two:Mountain-Car
Time:2019/04/04

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
a2c_gridworld		a2c_gridworld
a2c_gridworld_		a2c_gridworld_
base		base
car_rental		car_rental
dqn_gridworld		dqn_gridworld
gridworld		gridworld
gym-gw		gym-gw
k_arm		k_arm
mcts_gobang		mcts_gobang
mountain_car		mountain_car
racetrack		racetrack
README.md		README.md