OpenAI Gym の CartPole 問題が Q-Learning で解けたぞ

CartPole 問題は、今までこのブログでもなんども取り上げてきた。 CartPole 問題は、今までこのブログでもなんども取り上げてきた。 [[https://futurismo.biz/archives/6481][OpenAI Gym の CartPole-v0 を試したメモ | Futurismo]] [[https://futurismo.biz/archives/6549][CEM で CartPole-v0 を...

June 26, 2017 · 2 min · tsu-nera

三目並べ(tic-tac-toe) にモンテカルロ法を試した

三目並べ(tic-tac-toe) をモンテカルロ法をつかって学習させました。 元ネタは、これ。 Amazon.co.jp: 強くなるロボティック・...

June 14, 2017 · 2 min · tsu-nera

実践的な強化学習のオンライン学習教材、Practical RL をはじめた

実践的な強化学習の教材、Practical RL をやりはじめた。 https://github.com/yandexdataschool/Practical_RL これはなに HSE と Yandex SDA というロシアの大学?で教えられている強化学習のコースが、 オン...

June 10, 2017 · 5 min · tsu-nera

OpenAI Gym FrozenLake-v0 に 遺伝的アルゴリズム(deap)を試す

タイトルのとおり、OpenAI Gym FrozenLake-v0 に遺伝的アルゴリズムを試しました。 https://gym.openai.com/envs/FrozenLake-v0 遺伝的アルゴリズム 遺伝的アルゴリズムとは 遺伝的アルゴリズム(genet...

June 9, 2017 · 2 min · tsu-nera

OpenAI Gym の CartPole-v0 を試したメモ

OpenAI Gym を試してみたメモです。 CartPole-v0 というゲームを動かしてみました。 OpenAI Gym OpenAI Gym OpenAI Gym とは OpenAI Gym is a toolkit for developing and comparing reinforcement learning algorithms. OpenAI Gym は、強化学習アルゴリズムを開発し評価...

June 9, 2017 · 5 min · tsu-nera