CartPole問題にDQN(numpy only)で挑戦したけど解けなかった

前回の続き。 OpenAI Gymの CartPole問題をDQNで解いた | Futurismo 前回は、Kerasを利用したのだが、今回は numpyだけで実装してみた。ゼロか...

July 9, 2017 · 1 min · tsu-nera

OpenAI Gymの CartPole問題をDQNで解いた

また、CartPole問題なのだが、今回はDeep Q-Network(DQN)で解いた。 OpenAI Gym の CartPole-v0 を試したメモ | Futurismo CEM で CartPole-v0 を試したメモ | Futurismo OpenAI Gym の...

July 8, 2017 · 2 min · tsu-nera

Deep Q-Network(DQN)リンク集

日本語 DQN (コンピュータ) - Wikipedia DQNの生い立ち + Deep Q-NetworkをChainerで書いた - Qiita DQNをKerasとTensorFlowとOp...

July 5, 2017 · 1 min · tsu-nera

TD法による tic-tac-toe

前回の続き。 三目並べ(tic-tac-toe) にモンテカルロ法を試した | Futurismo 以下の本のoctaveでかかれたコードをpythonで書き直した。...

July 3, 2017 · 1 min · tsu-nera

LEGO Mindstormsの crawler を強化学習で前に進むことを学習させた

LEGO x 強化学習の初の成果が出た。 強化学習の古典的問題、crawler に Q-Learningを適用して前に進むことを学習させたのだ. まずは見るの...

June 30, 2017 · 1 min · tsu-nera

AtomでMarkdownを快適に執筆するための環境構築

AtomでMarkdownを快適に執筆するための設定を調べた。 自分はEmacs派なのだけれども、最近EmacsはWordPressの執筆用に...

June 28, 2017 · 3 min · tsu-nera

LEGO Mindstorms教育版で作成可能なロボット

LEGO Mindstormsの教育版(#45544)を購入したので、ネットで手に入る設計図を調べた。 結論からいうと、以下のページにまとまっている。...

June 28, 2017 · 1 min · tsu-nera

3000 回転んでも立ち上がれなかったロボット

前回、CartPole 問題が Q-Learning でやっと解けたので、 CartPole 問題を応用して、レゴマインドストームの GyroBoy で倒立振子を試みた。 結果 3000 回転んでも立ち上がらな...

June 27, 2017 · 1 min · tsu-nera

OpenAI Gym の CartPole 問題が Q-Learning で解けたぞ

CartPole 問題は、今までこのブログでもなんども取り上げてきた。 CartPole 問題は、今までこのブログでもなんども取り上げてきた。 OpenAI Gym の CartPole-v0 を試したメモ | Futurismo CEM で CartPole-v0 を...

June 26, 2017 · 2 min · tsu-nera

LEGO Mindstorms で GyroBoy を組み立てた

LEGO MindStorms EV3 を買ったので、まずは GyroBoy を組み立ててみた。 動かしてみる 早速、動かしてみたい! 倒立振子をするロポットの作り方は以下のチュートリアルに乗って...

June 25, 2017 · 1 min · tsu-nera