チーム名を使わずに数値のみで予測する
第722回トトくじの予想です。
今回はスタジアム名とかチーム名をいっさい使わずに、得失点パターンのゴール数、および失点数を説明変数として機械予測してみました。結果は以下です。
表の説明
いちばん右側が予想結果です。チーム名やスタジアムとの混合パターンも試したのですが、マルチが増えてもしょうがないので削除しました。
注意点
今回、使用したアルゴリズムはひとつだけです。
Multi-layer perceptron
もう、おなじみのヤツ。これを初期設定のまま使用。
いろいろ試せるのですが、比較データがないため1種類のみとしました。
試した後で思ったこと
得失点パターンの数値化について
使う属性群はパーセント数値のほうが良いかもしれない。
理由は ゴール数、失点数では累積していくと比較ができない。→ 関係性を比率としてみることが困難。
パーセントを数値属性としておけば、累積データとなっても、ゴール数と失点の関係性は比率で保たれる。
支持率との比較
トト公式サイトでざっと支持率をチェックしてみました。
その結果、かなり違う予想が出力されていると感じます。すこし不安はあるんですが、順当結果なんて4枠ぐらいしかないときも結構あります。
これまでの機械的予測での経験では ”順当予想、支持率に沿う形での予想” が非常に多く、
予想外の結果を出力させるにはどうすればいいのか?といった問題がありました。
もしかして、この手法が突破口を開いてくれるかもしれません。
うすく期待して結果を待ちたいと思います。
おわり。
2014,9.19 追記
パーセントの数値で同じ条件で予測させてみました。
ピンクカラーが変化した枠です。
属性を ”実際のゴール数、失点” から ”占める割合” に変えただけでけっこう変わるものですね。
んー、もう少しさかのぼってバックテストできたらいいのですが、これだけでは判断できません。
現状ではこんな感じです。
おわり。
コメント