強化学習 | Futurismo

USDJPYのヒストリカルデータをダウンロードしてDQN Agentを動かしてみた

前回の続き。正弦曲線にしたがう為替の値動きについてDQNでバックテストをしてみた | Futurismo USDJPYでバックテスト今回は、Dukascopyから...

正弦曲線にしたがう為替の値動きについてDQNでバックテストをしてみた

DQNを勉強しているので、以下の記事に触発されて自分もFXでDQNをしてみたくなった。 https://github.com/dogwood008/DeepFX https://recruit.gmo.jp/engineer/jisedai/blog/deep-q-learning/ https://www.slideshare.net/JunichiroKatsuta/deep-qlearningfx 2年前、OANDAでのシステムトレードで5万円を...

CartPole問題にDQN(numpy only)で挑戦したけど解けなかった

前回の続き。 OpenAI Gymの CartPole問題をDQNで解いた | Futurismo 前回は、Kerasを利用したのだが、今回は numpyだけで実装してみた。ゼロか...

OpenAI Gymの CartPole問題をDQNで解いた

また、CartPole問題なのだが、今回はDeep Q-Network(DQN)で解いた。 OpenAI Gym の CartPole-v0 を試したメモ | Futurismo CEM で CartPole-v0 を試したメモ | Futurismo OpenAI Gym の...

Deep Q-Network(DQN)リンク集

日本語 DQN (コンピュータ) - Wikipedia DQNの生い立ち＋ Deep Q-NetworkをChainerで書いた - Qiita DQNをKerasとTensorFlowとOp...

TD法による tic-tac-toe

前回の続き。三目並べ（tic-tac-toe）にモンテカルロ法を試した | Futurismo 以下の本のoctaveでかかれたコードをpythonで書き直した。...

LEGO Mindstormsの crawler を強化学習で前に進むことを学習させた

LEGO x 強化学習の初の成果が出た。強化学習の古典的問題、crawler に Q-Learningを適用して前に進むことを学習させたのだ．まずは見るの...

3000 回転んでも立ち上がれなかったロボット

前回、CartPole 問題が Q-Learning でやっと解けたので、 CartPole 問題を応用して、レゴマインドストームの GyroBoy で倒立振子を試みた。結果 3000 回転んでも立ち上がらな...

OpenAI Gym の CartPole 問題が Q-Learning で解けたぞ

CartPole 問題は、今までこのブログでもなんども取り上げてきた。 CartPole 問題は、今までこのブログでもなんども取り上げてきた。 OpenAI Gym の CartPole-v0 を試したメモ | Futurismo CEM で CartPole-v0 を...

CEM で CartPole-v0 を試したメモ

はじめに前回の続き。前回はなんの戦略もなく、ただ試した。 OpenAI Gym の CartPole-v0 を試したメモ | Futurismo 今回は、CrossEntropy Method(CEM)をつか...