ピタゴラスの確率から勝敗を予測できるのか?
僕はサッカーのトトくじをやっています。WEKAというフリーソフトを使い機械的に結果を予測させて楽しんでいるんですね。今回は主に野球の勝敗予測に使われているらしい ”ピタゴラスの確率” について。
ピタゴラスの確率という考え方、数式 は、けっこう以前からあったようでアメリカが発祥のようですね。
情報は検索ですぐに入りますが、リンク貼っておきます。
記事においては、直接的に ”サッカーにも応用されている” とは書いてありません。アメフト とか バスケ には応用されてるみたいですけどね。
やってみなければ何もわからないので、ちょっと試してみようかな。
どうやって応用すればいいんだろ?
とりあえず思いついたのは以下。
機械学習の ”からみ” から言えば、まず過去の任意の時点での得失点状況から勝率を計算する。それらを累積したものを元データの属性値として追加。(これまでに蓄積したデータに追加する)
そして、いつもと同じように機械学習させて予測してみるというアイデア。
その勝率が実際の勝敗と相関が高ければ、おそらく予測精度はあがる。
リーグ順位が高いチームほど勝率が高いのは当たり前なんだけど、もしかして ”当然すぎるだろ?コレ・・” みたいな結果、知見しか得られない可能性も高いです。
とにかく、ある程度 ”過去の試合結果をさかのぼって” 検証してみないと何も言えないです。では717回トトくじでもっとも波乱だったと思われる試合について計算してみます。(これは主観ですからね)
第717回における 新潟ー徳島 の検証
第717回 トトくじにおいての結果は・・ 新潟-徳島 1-2 で徳島の勝ち でした。支持率は圧倒的に新潟寄りで、およそ76%の支持を集めていました。
対戦前のゴール数と失点数について
新潟 は 総ゴール数17、失点17
徳島は 9、43 でした。これらから計算式にのっとって出した数値は以下です。
新潟の勝率 50% 徳島は? 0.042%
んー・・どうでしょうね?
徳島の勝率が極端に低いのは失点が多すぎるからだと思います。しかし新潟の勝率は支持率ほど高くはないですね。この数値からは徳島勝利を導き出すのは正直いってむずかしいと感じますが、新潟が圧勝するとも思えなくなってきます。(人間の判断では)
ちょっと面白いかもしれないですね。
時間と手間はかかりそうですが、過去にさかのぼって検証してみる価値はありそうです。支持率とのズレ具合とか、あと機械予測による結果とのズレですね。そういうデータをあつめて、もう一度 ”俯瞰” っていうのかな、全体を把握することを試みると、あらたな知見?が得られるかもしれません。
以上、興味のない人にはまったくどうでもいい話でした。おわり。
コメント