OpenAI

🖊Hello, シンギュラリティ World! OpenAIのChat APIをClojureで叩いてみた

はじめに: ハッカー未来派もシンギュラリティ戦争に宣戦布告する本日GPT-4が発表された. 同時にGoogleがPaLMという生成系AIのAPI...

OpenAI Gym の CartPole 問題が Q-Learning で解けたぞ

CartPole 問題は、今までこのブログでもなんども取り上げてきた。 CartPole 問題は、今までこのブログでもなんども取り上げてきた。 OpenAI Gym の CartPole-v0 を試したメモ | Futurismo CEM で CartPole-v0 を...

CEM で CartPole-v0 を試したメモ

はじめに前回の続き。前回はなんの戦略もなく、ただ試した。 OpenAI Gym の CartPole-v0 を試したメモ | Futurismo 今回は、CrossEntropy Method(CEM)をつか...

三目並べ（tic-tac-toe）にモンテカルロ法を試した

三目並べ（tic-tac-toe）をモンテカルロ法をつかって学習させました。元ネタは、これ。 Amazon.co.jp：強くなるロボティック・...

実践的な強化学習のオンライン学習教材、Practical RL をはじめた

実践的な強化学習の教材、Practical RL をやりはじめた。 https://github.com/yandexdataschool/Practical_RL これはなに HSE と Yandex SDA というロシアの大学？で教えられている強化学習のコースが、オン...

OpenAI Gym FrozenLake-v0 に遺伝的アルゴリズム（deap)を試す

タイトルのとおり、OpenAI Gym FrozenLake-v0 に遺伝的アルゴリズムを試しました。 https://gym.openai.com/envs/FrozenLake-v0 遺伝的アルゴリズム遺伝的アルゴリズムとは遺伝的アルゴリズム(genet...

OpenAI Gym の CartPole-v0 を試したメモ

OpenAI Gym を試してみたメモです。 CartPole-v0 というゲームを動かしてみました。 OpenAI Gym OpenAI Gym OpenAI Gym とは OpenAI Gym is a toolkit for developing and comparing reinforcement learning algorithms. OpenAI Gym は、強化学習アルゴリズムを開発し評価...