clew

気になるモノ 気になる人 気になる言葉

*

第932回 トト予想

      2017/05/25

第932回 トト予想 属性を増やして予想。

いつもはカットしている属性をすべて使っての予想です。アルゴリズムはナイーブベイズ。計算が早いのが良い点ですね。経験上、予測精度も比較的高い印象があります。

ディープラーニングはとにかく時間がかかるのでイヤ。そんなにポンコツじゃないPCでもけっこう時間がかかる。

932

今回も大スベリか? 今回の予想方法 結果を見て週末の933回の予想に反映するかどうか考えたい。

 追加予想 GBM

もうひとつ、予想を出しておきます。トレーニングデータはそのままで、アルゴリズムだけGBMに変化させたヤツ。

932-gbm

どちらが良いかとか、そういう評価はなんともしづらい。統計的に成功率などを調べるのも手間がかかるのでやっていませんし。。

結果を見て、どちらか良い方を今後も採用するとかするんじゃないかなぁ。

感想 こりゃダメですねえ。。

いやーもうびっくりです。あまりのダメっぷりにびっくらこいた。

まったく当たらないという予想。「なにやってんですか?」って言われそう。属性増やせばいいってもんじゃないことは分かっていたけど、ここまでヒドイとは思わなかった。

かといって元に戻せばもっと良い予想ができたのか? うーん、たぶんダメだったと思う。やっぱりメンバー次第なのかなぁという感じ。ムズイ。

追記 悔しいのでもう一回予想を検証するよ。

あまりにもヒドかったので、もう一回 パターンを変えて検証してみました。

まずトレーニングデータをソートします。基準はカテゴリというか、まあステージですね。1部とか2部、あるいはルヴァン杯というように分けます。他のカテゴリーを混ぜてトレーニングデータとしないようにモデルを作ります。

あと属性については不要と思われるものをあらかじめカットします。こうして予測された結果が以下です。アルゴリズムはディープラーニングです。

932-dl

向かって左から、ホームスコア、アウェイスコア、右側の細かい数値は優劣比較。甲府の勝ち以外はおおむね正解ですね。

これまでごちゃまぜデータを使って予想していましたが、やっぱり分けた方が良いのかなぁ。。ひとつの方法に固執して安定した結果を得ることは難しいんですよね。たまたま良かっただけなのか、あるいは逆に悪かったのか? 判断ができない。

とりあえずカテゴリーを分けて予測してみるべきか。

 

 - トト予想