自ら成長し、どんどん賢くなる独自の制御AI「Smart MPC」でロボットアームの制御に成功。強化学習より数百倍高速だから実機でも学習可能に。 - PR TIMES|RBB TODAY

自ら成長し、どんどん賢くなる独自の制御AI「Smart MPC」でロボットアームの制御に成功。強化学習より数百倍高速だから実機でも学習可能に。

Smart MPCは体験から学習し、自発的に操作法を憶えます。PID制御より賢く、強化学習より実用的なアルゴリズムです。

製造業を中心に様々なAIシステム開発を手掛ける、株式会社 Proxima Technology(東京都荒川区南千住8-5-7 白鬚西R&Dセンター 303)は、非常に少ないデータ(体験)から操作法を学習できる制御AI「Smart MPC」を提供しています。




この動画は弊社独自の制御AI「Smart MPC」を用いたロボットアーム制御の様子で、スタート地点(黄色のボール)からゴール地点(白いボール)まで指先を移動させる動作を学習しています。強化学習(DQN)では最低でも数百エピソードを必要としますがSmart MPCなら一桁エピソードで収束します。


【背景】
現在多くのプラントや機械の制御にはPID制御と呼ばれる方法が使われています。PIDは比較的直観的で現場の作業者にとっても調整が可能である一方で、いくつかの欠点を持ちます。
・むだ時間に弱くオーバーシュートやハンチングが起きやすい
・SISO(一入力一出力)系しか扱えない
・拘束条件が扱えない
・最適化できない
これらはものによっては致命的な問題で、制御システムの開発を著しく難しており、PIDのパラメータの調整だけでも多くの時間を浪費してしまうといった状況が各所で見られます。

一方で、強化学習はAlphaGoやDQN(Deep Q-Network)などに代表されるように、一部では人間の能力を超えた成績を出せるようになってきてはいますが、その学習には膨大なデータが必要であり、学習自体も非常に不安定で再現性に乏しく、少なくとも現時点では産業利用にはとても向かないといった欠点をもっています。


弊社が開発したSmart MPC (Model Predictive Control)はモデル予測制御と呼ばれる制御法と機械学習を組み合わせることにより、上記の2つの手法の欠点をすべて解決することが出来ました。

【Smart MPCの特徴】
1. むだ時間に強い
未来の状態(予測)に基づいた適切なフィードバック制御ができます。

2. 学習が早く、安定している
少数データでも学習が可能であり、学習結果も安定しています。
学習も簡単で、パラメータの調整の手間も非常に少ないです。

3. 計算量が小さい
制御対象によってはRaspberry PiのCPUでも動くほど軽量です。

〈その他3つの特徴〉
・ MIMO(多入力多出力)系が扱える
・ 拘束条件が扱える
・ 最適化ができる

詳細は以下のURLより
https://proxima-ai-tech.com/tech_smartmpc

【お問い合わせについて】
Smart MPCにご関心をお持ちいただけましたら、下記の連絡先までご連絡下さい。

社名 : 株式会社 Proxima Technology
住所 : 〒116-0003 東京都荒川区南千住8-5-7 白鬚西R&Dセンター 303
代表者 : 代表取締役 深津 卓弥
URL : https://proxima-ai-tech.com
連絡先 : contact@proxima-ai-tech.com

企業プレスリリース詳細へ
PRTIMESトップへ
page top