三目並べ(tic-tac-toe) にモンテカルロ法を試した
三目並べ(tic-tac-toe) をモンテカルロ法をつかって学習させました。 元ネタは、これ。 Amazon.co.jp: 強くなるロボティック・...
三目並べ(tic-tac-toe) をモンテカルロ法をつかって学習させました。 元ネタは、これ。 Amazon.co.jp: 強くなるロボティック・...
実践的な強化学習の教材、Practical RL をやりはじめた。 https://github.com/yandexdataschool/Practical_RL これはなに HSE と Yandex SDA というロシアの大学?で教えられている強化学習のコースが、 オン...
OpenAI Gym を試してみたメモです。 CartPole-v0 というゲームを動かしてみました。 OpenAI Gym OpenAI Gym OpenAI Gym とは OpenAI Gym is a toolkit for developing and comparing reinforcement learning algorithms. OpenAI Gym は、強化学習アルゴリズムを開発し評価...