clew

気になるモノ 気になる人 気になる言葉

*

第903回 トトくじ 予想 今年もやります。

      2017/01/17

第903回 トトくじ予想 あきらめずに H2O で予測するよ

これといって目新しい予測方法は考えていません。これまで通り H2O を使った予測をやります。新春第一弾はプレミアリーグですね。まあ ミニ だけなので、あんまり面白くはないですけどとにかくやる。以下がいつもの一覧です。

903%e4%ba%88%e6%83%b3

上段が ミニA、下段5枠は B です。ほぼリーグ順位通りというか、まあ安定志向の予想ですね。B の方がややドローが多くて ? といった感じでしょうか?

次は ゴール3 です。

903%e3%82%b4%e3%83%bc%e3%83%ab

これも上と同じく H2O のGBMで予測しています。通常、数値は回帰分析しかできませんが、ちょっと工夫するだけで 名義属性 として扱えるようになります。以下にその方法を書きますね。

H2O ai  で、数値を名義属性として認識させる方法

これは読み込ませる元データを書き換える方法ではありません。元となるデータには一切手を加えることなく、簡単に数値を名義に変えることができます。

通常通り、対象となるデータ、CSVファイルを読み込ませます。読み込ませた直後の画像が以下です。

%e5%b1%9e%e6%80%a7%e5%a4%89%e6%8f%9b

黄色で囲われた箇所、ここを Enum に変更するだけで ゴール数 という数値が 名義属性 として扱われるようになります。

変更してから下のパースボタンを押します。

これで準備完了です。とにかくパースをした後のデータが問題となるので、データをアップロードしたあとにまず属性を確認して、必要に応じて変更してパースすれば別データとして扱えるようになります。

追記 結果確認

遅くなりましたが、予測結果についてのまとめです。

全10試合中、正解枠は 5個 です。あまり良くはないですね。むしろ悪い。GBM による予測はこれぐらいが限界でしょう。いや、GBM というアルゴリズムに問題があるわけではなく、あくまでデータとの相性という意味で限界だと思います。

アルゴリズムを複数使って予測すれば、マルチ予測にはなるけれどももう少し良い結果にはなる。しかしそれでは意味がありません。シングルでできるだけ正確に予測することが目標ですから。

どうして上手く予測できないか?

これについてはまたページを改めて書きます。個人的な感触ですけど、ある程度理由ははっきり掴めているつもり。

 - トト予想