三目並べ(tic-tac-toe) にモンテカルロ法を試した

三目並べ(tic-tac-toe) をモンテカルロ法をつかって学習させました。 元ネタは、これ。 Amazon.co.jp: 強くなるロボティック・...

June 14, 2017 · 2 min · tsu-nera

実践的な強化学習のオンライン学習教材、Practical RL をはじめた

実践的な強化学習の教材、Practical RL をやりはじめた。 https://github.com/yandexdataschool/Practical_RL これはなに HSE と Yandex SDA というロシアの大学?で教えられている強化学習のコースが、 オン...

June 10, 2017 · 5 min · tsu-nera

OpenAI Gym の CartPole-v0 を試したメモ

OpenAI Gym を試してみたメモです。 CartPole-v0 というゲームを動かしてみました。 OpenAI Gym OpenAI Gym OpenAI Gym とは OpenAI Gym is a toolkit for developing and comparing reinforcement learning algorithms. OpenAI Gym は、強化学習アルゴリズムを開発し評価...

June 9, 2017 · 5 min · tsu-nera