第903回 トトくじ予想 あきらめずに H2O で予測するよ
これといって目新しい予測方法は考えていません。これまで通り H2O を使った予測をやります。新春第一弾はプレミアリーグですね。まあ ミニ だけなので、あんまり面白くはないですけどとにかくやる。以下がいつもの一覧です。
上段が ミニA、下段5枠は B です。ほぼリーグ順位通りというか、まあ安定志向の予想ですね。B の方がややドローが多くて ? といった感じでしょうか?
次は ゴール3 です。
これも上と同じく H2O のGBMで予測しています。通常、数値は回帰分析しかできませんが、ちょっと工夫するだけで 名義属性 として扱えるようになります。以下にその方法を書きますね。
H2O ai で、数値を名義属性として認識させる方法
これは読み込ませる元データを書き換える方法ではありません。元となるデータには一切手を加えることなく、簡単に数値を名義に変えることができます。
通常通り、対象となるデータ、CSVファイルを読み込ませます。読み込ませた直後の画像が以下です。
黄色で囲われた箇所、ここを Enum に変更するだけで ゴール数 という数値が 名義属性 として扱われるようになります。
変更してから下のパースボタンを押します。
これで準備完了です。とにかくパースをした後のデータが問題となるので、データをアップロードしたあとにまず属性を確認して、必要に応じて変更してパースすれば別データとして扱えるようになります。
追記 結果確認
遅くなりましたが、予測結果についてのまとめです。
全10試合中、正解枠は 5個 です。あまり良くはないですね。むしろ悪い。GBM による予測はこれぐらいが限界でしょう。いや、GBM というアルゴリズムに問題があるわけではなく、あくまでデータとの相性という意味で限界だと思います。
アルゴリズムを複数使って予測すれば、マルチ予測にはなるけれどももう少し良い結果にはなる。しかしそれでは意味がありません。シングルでできるだけ正確に予測することが目標ですから。
どうして上手く予測できないか?
これについてはまたページを改めて書きます。個人的な感触ですけど、ある程度理由ははっきり掴めているつもり。
コメント