TD法による tic-tac-toe

前回の続き。 三目並べ(tic-tac-toe) にモンテカルロ法を試した | Futurismo 以下の本のoctaveでかかれたコードをpythonで書き直した。...

July 3, 2017 · 1 min · tsu-nera

LEGO Mindstormsの crawler を強化学習で前に進むことを学習させた

LEGO x 強化学習の初の成果が出た。 強化学習の古典的問題、crawler に Q-Learningを適用して前に進むことを学習させたのだ. まずは見るの...

June 30, 2017 · 1 min · tsu-nera

OpenAI Gym の CartPole 問題が Q-Learning で解けたぞ

CartPole 問題は、今までこのブログでもなんども取り上げてきた。 CartPole 問題は、今までこのブログでもなんども取り上げてきた。 OpenAI Gym の CartPole-v0 を試したメモ | Futurismo CEM で CartPole-v0 を...

June 26, 2017 · 2 min · tsu-nera

LEGO Mindstorms で GyroBoy を組み立てた

LEGO MindStorms EV3 を買ったので、まずは GyroBoy を組み立ててみた。 動かしてみる 早速、動かしてみたい! 倒立振子をするロポットの作り方は以下のチュートリアルに乗って...

June 25, 2017 · 1 min · tsu-nera

ev3dev-lang-python 開発環境(Visual Studio Code)

ev3dev で Python の開発をするには、Visual Studio COde をローカル PC でつかうのがよさそう。 サーバ上でコーディングすると、サーバからのレスポンスが遅くてイライ...

June 25, 2017 · 2 min · tsu-nera

LEGO Mindstorms EV3 を Python から制御するためのメモ

レゴマインドストーム EV3 を Python で制御するためのセットアップ作業メモです。 Environment LEGO MindStorms EV3 Ubuntu 16.04(途中 micro SD カードのところは Windows10) ev3dev (2017-06-09) Python 3.4.2 ev3dev Getting Started with ev3dev ev3dev の OS...

June 23, 2017 · 5 min · tsu-nera

Ubuntu での PyCharm 日本語化設定

Python の統合開発環境 PyCharm, デフォルトでは英語ですが日本語化できるようだ。 Eclipse で有名な Pleiades が日本語化のプラグインを配布している。 Pleiades - 日本語化プラグイン Ec...

June 21, 2017 · 2 min · tsu-nera

CEM で CartPole-v0 を試したメモ

はじめに 前回の続き。前回はなんの戦略もなく、ただ試した。 OpenAI Gym の CartPole-v0 を試したメモ | Futurismo 今回は、CrossEntropy Method(CEM)をつか...

June 18, 2017 · 2 min · tsu-nera

Python で勾配降下法を使って線形の単回帰分析をしてみた

Python で勾配降下法を使って線形の単回帰分析をしてみた。 はじめに Siraj Ravel さんの新しい動画シリーズ, “The Math of Intelligence"が始まった...

June 18, 2017 · 3 min · tsu-nera

三目並べ(tic-tac-toe) にモンテカルロ法を試した

三目並べ(tic-tac-toe) をモンテカルロ法をつかって学習させました。 元ネタは、これ。 Amazon.co.jp: 強くなるロボティック・...

June 14, 2017 · 2 min · tsu-nera