clew

気になるモノ 気になる人 気になる言葉

*

トト予想 スタッツ研究 1部リーグ 広島―鹿島 第2節を例に考えてみる。 クロス成功率

      2016/07/13

シュート成功率の他に、何が分類判別の基準となっているのか?

おそらく この記事だけを見て、何について書いているのか? 分からない方もいると思われます。 一応、トト予想について考えたことを時系列で記事に挙げていますので、興味がある方は前回、前々回と記事をさかのぼって調べていただきたいと思います。

J1 第2節 の予測は、シュート成功率を除外して予測させました。しかし、パーフェクトとはいかず、若干不満の残る結果となっています。今回は 広島―鹿島 を例にとって実際のスタッツと予測に使用したスタッツを見比べて、何がどう違うのか 目視で確認してみます。以下に対照表を載せます。

J1-2 広島―鹿島

やはり、シュート関係が一番目を引きます。成功率はすでに除外してありますが、シュート数、そして 枠内シュート数が予測用の方で 広島が鹿島を上回っている。おそらくこれが間違った判断を下した一番大きな要因ではないかと思われます。

まだテストは行っていませんが、上で述べた要素、つまりシュート数と枠内シュート数を除外すると、また違った予測結果が吐き出されてくるのではないかと思います。

その他の属性に関してはどうでしょうか。

目視で確認したところでは、クロス・・クロスの数ではなくて、やっぱりその成功率が大きなウェイトを占めているように感じます。ここで言う 成功率 とは、おそらくフィニッシュに持ち込む選手へのボールが上手く渡ったかどうか ということだろうと思います。あるいはシュートが打てなくてもフリーになってる選手へのパスとかも含まれてるんじゃないかと。そう考えると、これの成功率が高いということはゴールに直結する要素ですので納得がいきます。

このデータでは、予測用、実戦データ 共にクロス成功率の高い方を 勝ち と判断しています。くどいですが 数 ではなくて 成功率 ですからね。予想の際に、どれくらいクロス成功率に差があるのか 調べて予想してみるのもよいかもしれません。


 

 

次節もリーグ戦がミニトト対象となっていますが、予想はナシです。データ更新して予測するには時間が足りませんので。もしかしたら週末の13枠もデータ更新が間に合わないかもしれません。また気付きがありましたら追記します。

データの属性、説明変数をいくつか削除してテストしてみた。

さて、闇雲に予想を続けても進展がありませんので、ここはじっくりと 私流やり方 についてテスト結果を踏まえて考えていきます。

シュートに関する変数、そしてクロスに関する変数などを除外して予測テストをしてみました。分類メソッドは H2O の GBM や、ディープラーニングなどです。ざっくりした印象としては、それほど変化はありませんでした。意外ですけどほんとに大きな変化というのはありません。

シュート関連の変数に関しては、はっきりと変化はある。これは間違いないです。しかし、その他の変数に関しては大きな影響力というのはない・・というのが私の印象。

何をどうやっても 広島ー鹿島 に関しては予測結果に変化はなく、鹿島の勝ち という結果を示唆するような予測結果は示されませんでした。。ここから導かれる答えは、トレーニングデータに原因があるのではないか という見方。トレーニングデータというのは、ある意味 教師 ですので、こういうパターンならコレ というように機械的にテストデータに対して答えを与えます。んで、示されたデータは明らかに広島有利と判断されてるわけで、何をどうしたって判断が覆されることはない。

この判断を変えるには、教師そのものを変える必要があるわけで、そうするとトレーニングデータの量・・つまり質を変えるわけにはいかないので、その量、与えるデータの分量、もっと言えば、どの期間のデータを与えればいいのか? ということになると考えます。いわゆる経時変化というものを捉えたデータを考える必要がある。

「昔は強かったけど・・」 みたいな感覚をデータに取り入れるということ。何度もいうけどサッカーはチーム状況がある程度変化していきますから。

 

 - トト予想