H2O 予測モデルの作り方 GRID機能を使って最適なパラメーターを得る方法

まだ試作段階ですが、H２O　の　ウェブヴァージョン　において簡単に予測モデルのパラメーターを最適化する手法について書きます。統計解析ソフトの　R　とか、　PYTHON　を使う方法もあるのですが、現状でもっとも簡単な方法は以下です。

gridを使えば一番良い予測モデルを示してくれる
1. グリッドサーチ機能を使うとモデル構築に時間がかかります。

gridを使えば一番良い予測モデルを示してくれる

grid　とは何か？

下の画像を見てください。

これは　モデルにディープラーニングを選択したものです。赤枠で囲われたところに　grid？　とあります。最初はこれが何なのか？　分かりませんでした。結局のところ　これは下にずらーっと並んでいるチェックボックスのことを意味していて、ここにチェックを入れると自動的にサーチをしてくれる　という意味だったんですね。

モデル構築のヘルプには書いてなかったような気がするのですが、おそらくそういうことです。

試しに何でもかんでもチェックしてモデル構築を試してみたのですが、やはりエラーが出て止まってしまいます。何らかの規則というか制限があるようですが現状では理解できていません。

このパラメーター調整には　ランク　みたいなものがあります。具体的には　Advanced　、Expert　というように付けられています。そこで、そういう高度な調整はひとまず置いておいて、もっとも基本的な箇所だけチェックを入れてモデルを作ってみました。具体的には以下の箇所です。

具体的にモデルを作成してみます。やり方は通常と同じで、モデルを選び、データを選択します。そして上のようにチェックマークを入れて・・・最後にある　ビルドモデル　をクリックするだけです。

すると上のように　予測モデル　がずらっと表示されました。このケースでは　全部で１１個のモデルが作成されたようです。一番上に表示されるモデルが一番ピッタリくるモデルというわけですね。とりあえず全部のモデルについて詳細を見てみます。黄色枠で囲まれた　INSPECT GRID SUMMARY　をクリックします。