強化学習 | Futurismo

三目並べ（tic-tac-toe）にモンテカルロ法を試した

三目並べ（tic-tac-toe）をモンテカルロ法をつかって学習させました。元ネタは、これ。 Amazon.co.jp：強くなるロボティック・...

実践的な強化学習のオンライン学習教材、Practical RL をはじめた

実践的な強化学習の教材、Practical RL をやりはじめた。 https://github.com/yandexdataschool/Practical_RL これはなに HSE と Yandex SDA というロシアの大学？で教えられている強化学習のコースが、オン...

OpenAI Gym の CartPole-v0 を試したメモ

OpenAI Gym を試してみたメモです。 CartPole-v0 というゲームを動かしてみました。 OpenAI Gym OpenAI Gym OpenAI Gym とは OpenAI Gym is a toolkit for developing and comparing reinforcement learning algorithms. OpenAI Gym は、強化学習アルゴリズムを開発し評価...