機械学習でトトくじの予想 H2O-3 でやってみた
久しぶりのトト予想です。大ハズレかもしれないです。
使ったデータは2016 今シーズンのリーグ戦だけ。まだ3回分しかデータがありません。過去シーズンデータの使用も考えましたが、あんまり気が乗らなくてヤメにしました。とにかくやるだけやって結果を見てからまた考えたい。
予想方法については過去記事でいろいろ書いてます。機械学習カテゴリなどで。結果については追記します。
アルゴリズムは悪くない。問題設定と解決策が最初から間違ってるんだ。
3/19 の初日は J1 7試合 ありました。そのうち正解したのは 1試合 のみ。鹿島の勝ちだけでした。ヒドイ有様です。原因について考えていたのですが、ひとつだけ確実なのは アルゴリズムには間違いがない ということ。
適切なデータと適切にチューニングされたアルゴリズムがあれば、かなり精度の高い予測はできるはずです。では何が間違ってるのか?
まず問題設定。
目的変数の設定と、説明変数の取り方。ここが上手くいっていないのかもしれません。基本的なことだけどじっくり考えなくてはなりません。。つぎに解決策。ここも間違っています。たぶん。
流行りのディープラーニングとか飛びついていますけど、もっと問題の性質に適したやり方を考えるべきじゃないかと思います。このあたりはデータの作り方と密接に関係してくる部分かもしれません。
問題の解決に一番適したアルゴリズムと、そのアルゴリズムに一番フィットするデータの形を用意できれば必ず結果を残せると思います。分かりやすい基本的なテキストがあったので貼っておきます。
コメント