TD法による tic-tac-toe
前回の続き。 三目並べ(tic-tac-toe) にモンテカルロ法を試した | Futurismo 以下の本のoctaveでかかれたコードをpythonで書き直した。...
前回の続き。 三目並べ(tic-tac-toe) にモンテカルロ法を試した | Futurismo 以下の本のoctaveでかかれたコードをpythonで書き直した。...
LEGO x 強化学習の初の成果が出た。 強化学習の古典的問題、crawler に Q-Learningを適用して前に進むことを学習させたのだ. まずは見るの...
CartPole 問題は、今までこのブログでもなんども取り上げてきた。 CartPole 問題は、今までこのブログでもなんども取り上げてきた。 OpenAI Gym の CartPole-v0 を試したメモ | Futurismo CEM で CartPole-v0 を...
LEGO MindStorms EV3 を買ったので、まずは GyroBoy を組み立ててみた。 動かしてみる 早速、動かしてみたい! 倒立振子をするロポットの作り方は以下のチュートリアルに乗って...
ev3dev で Python の開発をするには、Visual Studio COde をローカル PC でつかうのがよさそう。 サーバ上でコーディングすると、サーバからのレスポンスが遅くてイライ...
レゴマインドストーム EV3 を Python で制御するためのセットアップ作業メモです。 Environment LEGO MindStorms EV3 Ubuntu 16.04(途中 micro SD カードのところは Windows10) ev3dev (2017-06-09) Python 3.4.2 ev3dev Getting Started with ev3dev ev3dev の OS...
Python の統合開発環境 PyCharm, デフォルトでは英語ですが日本語化できるようだ。 Eclipse で有名な Pleiades が日本語化のプラグインを配布している。 Pleiades - 日本語化プラグイン Ec...
はじめに 前回の続き。前回はなんの戦略もなく、ただ試した。 OpenAI Gym の CartPole-v0 を試したメモ | Futurismo 今回は、CrossEntropy Method(CEM)をつか...
Python で勾配降下法を使って線形の単回帰分析をしてみた。 はじめに Siraj Ravel さんの新しい動画シリーズ, “The Math of Intelligence"が始まった...
三目並べ(tic-tac-toe) をモンテカルロ法をつかって学習させました。 元ネタは、これ。 Amazon.co.jp: 強くなるロボティック・...