USDJPYのヒストリカルデータをダウンロードしてDQN Agentを動かしてみた

前回の続き。 正弦曲線にしたがう為替の値動きについてDQNでバックテストをしてみた | Futurismo USDJPYでバックテスト 今回は、Dukascopyから...

July 12, 2017 · 1 min · tsu-nera

正弦曲線にしたがう為替の値動きについてDQNでバックテストをしてみた

DQNを勉強しているので、以下の記事に触発されて自分もFXでDQNをしてみたくなった。 https://github.com/dogwood008/DeepFX https://recruit.gmo.jp/engineer/jisedai/blog/deep-q-learning/ https://www.slideshare.net/JunichiroKatsuta/deep-qlearningfx 2年前、OANDAでのシステムトレードで5万円を...

July 11, 2017 · 3 min · tsu-nera

CartPole問題にDQN(numpy only)で挑戦したけど解けなかった

前回の続き。 OpenAI Gymの CartPole問題をDQNで解いた | Futurismo 前回は、Kerasを利用したのだが、今回は numpyだけで実装してみた。ゼロか...

July 9, 2017 · 1 min · tsu-nera

OpenAI Gymの CartPole問題をDQNで解いた

また、CartPole問題なのだが、今回はDeep Q-Network(DQN)で解いた。 OpenAI Gym の CartPole-v0 を試したメモ | Futurismo CEM で CartPole-v0 を試したメモ | Futurismo OpenAI Gym の...

July 8, 2017 · 2 min · tsu-nera

Deep Q-Network(DQN)リンク集

日本語 DQN (コンピュータ) - Wikipedia DQNの生い立ち + Deep Q-NetworkをChainerで書いた - Qiita DQNをKerasとTensorFlowとOp...

July 5, 2017 · 1 min · tsu-nera

TD法による tic-tac-toe

前回の続き。 三目並べ(tic-tac-toe) にモンテカルロ法を試した | Futurismo 以下の本のoctaveでかかれたコードをpythonで書き直した。...

July 3, 2017 · 1 min · tsu-nera

LEGO Mindstormsの crawler を強化学習で前に進むことを学習させた

LEGO x 強化学習の初の成果が出た。 強化学習の古典的問題、crawler に Q-Learningを適用して前に進むことを学習させたのだ 。 まずは見るの...

June 30, 2017 · 1 min · tsu-nera

3000 回転んでも立ち上がれなかったロボット

前回、CartPole 問題が Q-Learning でやっと解けたので、 CartPole 問題を応用して、レゴマインドストームの GyroBoy で倒立振子を試みた。 結果 3000 回転んでも立ち上がらな...

June 27, 2017 · 1 min · tsu-nera

OpenAI Gym の CartPole 問題が Q-Learning で解けたぞ

CartPole 問題は、今までこのブログでもなんども取り上げてきた。 CartPole 問題は、今までこのブログでもなんども取り上げてきた。 [[https://futurismo.biz/archives/6481][OpenAI Gym の CartPole-v0 を試したメモ | Futurismo]] [[https://futurismo.biz/archives/6549][CEM で CartPole-v0 を...

June 26, 2017 · 2 min · tsu-nera

三目並べ(tic-tac-toe) にモンテカルロ法を試した

三目並べ(tic-tac-toe) をモンテカルロ法をつかって学習させました。 元ネタは、これ。 Amazon.co.jp: 強くなるロボティック・...

June 14, 2017 · 2 min · tsu-nera