clew

気になるモノ 気になる人 気になる言葉

*

第838回トトくじ予想 J1-7節 J2-8節 合わせて予測しました。

      2016/04/18

J1-7節 J2-8節 の予測

今回もリーグ戦が対象となっています。予測方法について簡単に解説します。

機会学習による予測は H2O-3 というJAVAで書かれたプログラムを使用しています。スキームはディープラーニングです。活性化関数は MaxoutWithDropout です。データ量は制限しています。今季の累積データではなくて、直近のデータのみ使用しています。なおクロスバリデーションによる検証および、その結果を使ってのモデル構築はしていません。理由については 第836回トトくじ予想  にて、後半のほうで述べていますのでよろしかったらお読みください。

では、一覧表にて確率とともに予測結果を挙げます。

j1-7,j2-8predict

まず、先に行われた ガンバ大阪ー柏、広島ー新潟 の答え合わせから。

表の一番上にグレーで色付けされた枠がそれです。決して答えを見てから予測結果を選んでいるわけではありませんので誤解しないでください。

予測(predict) のほうは両者とも draw という判定でハズレとなっています。しかし確率の方を見てみると黄色でマーキングしてあるとおり 柏レイソル、そして 広島 のほうが確率としては上まっていることが確認できます。すべての枠で このような結果になるとは断言できませんが、ある程度は信頼できると考えています。 是非、 確率 にも注目して活用していただきたいと思います。

なお、予測データには 欠場や故障者リストなどの情報は一切反映されておりません。予想の際は、これらの情報も加味されたほうが良いかと思います。あと、確率の表示順が逆となっていますので注意してください。ドローを挟んで 左側が AWAY ですので間違わないように。これは H2O による確率表示をそのままコピペしているためです。

この予想についての検証、および評価は、後ほどこのページで追記で行います。

結果と検証

地震と悪天候の影響で、まともに開催できなかった今回。メンタルの部分でも影響がなかったといえばウソになるだろうと考えています。しかしながら私自身の予想時点においてはまったく影響などありませんでしたから今回のスベリ具合は反省しなきゃいけません。地震のことは置いといて、簡単に振り返ってみます。

J1 はまだ良いとして、J2 がひどい有様です。どちらとも全体としては悪い予想ですが、J2 は本当にダメ。なぜこういう予測が出力されるのか? なぜか今回は引き分けが非常に多かったのですが、そういう傾向がまったく予測結果に現れていません。逆に決着がつく試合ばかりという予想になっています。ぱっと見比べてみてもJ1とJ2の確率の現れ方が極端に違うのが分かります。

予測手法としては特別に今回だけ変わったことをしているわけではありません。理由はまったく分からないです。

データ内容 構成を変える。現状のデータ構成では正しく予測することは不可能です。

いろいろテストして考えた結果、今使っている(自作している)データの内容を大幅に変更することにしました。基本は 数値データから分類する というもので、これまでと形の上ではほとんど同じです。チーム名などの固有IDは使わないのもまったく同じです。数値データが意味するパターンがぴったり一致すれば、高い確率で分類できるはず。今回、作成しているデータ構成はできるだけランダム性を排除して、再現性の高い予測モデルとなるように考えています。

今回のトレーニングデータは 過去データ (過去試合の数値データ)をそのまま使用しているのでクロスバリデーションなどのテストでも良い数値が出るはずです。問題は未知のテストデータに対してどれだけ正確に予測できるか?

これはテストデータに与える数値そのものに大きく左右されます。まだ行われていない試合の 未知の数値 をどうやって与えるのか? これはいろいろと試行中なのですが、これがぴったり合えばおそらく正確に分類予測できるはずです。逆に 間違った数値を与えればデタラメな結果が出力される。

ひとつの考え方として 予測対象となるチームの 平均スタッツ を入力する という考えもありますが どうでしょうか? おそらく順当な予想結果しか得られない気がします。なぜなら支持率というのは、そういった情報が形となって表れているものだと考えれるからです。

 

 

 

 

 

 - トト予想