30 Jun 2017, 20:15

LEGO Mindstormsの crawler を強化学習で前に進むことを学習させた

LEGO x 強化学習の初の成果が出た。

強化学習の古典的問題、crawler に Q-Learningを適用して前に進むことを学習させたのだ

まずは見るのが早い。一つ目の動画は学習を開始して間もない動画。ランダムに尾をうごかして、運良く前にすすんでいることがわかる。

[https://www.youtube.com/embed/UD0_tK9DToc?ecver=1]

次に、10分ほど学習させた結果が以下。明らかに、意図して前にすすんでいることが分かる。

[https://www.youtube.com/embed/El13ZG2m_wY?ecver=1]

今回利用したアルゴリズムはQ-Learning。

赤外線センサで壁との位置を計測して、壁に塚づいたら報酬を与える。

以下が今回のソースコードです。