第721回トトくじ J1正解率 4/9
これは悪すぎます。ダメです。
グリーンマークが累積得失点によるピタゴラス勝率での正解枠です。
わずか4枠。あとは逆目、もしくは引き分けです。直近1節分による判定では2枠のみ正解。
考え方は良いと思いましたが、直近1節だけではうまく反映されていません。累積の方がまだマシです。
基本的なピタゴラス勝率計算方法は 得失点の2乗 を使います。しかし、この掛け率を実際の結果にあわせて調整しているケースもあるようです。
ピタゴラス勝率は機械学習手法ではありませんが、これで得られた結果をデータ化して機械学習させてみるのもいいかもしれません。
過去の予測手法をざっと振り返る
機械学習による予測を始めて、もうずいぶん時間がたちますが、これといって進歩していないことが悔しいです。
結果を残せていないんですよね。
これまでに試した予測手法
- サポートヴェクトルマシン (libsvm)
- lazy (kstar)
- randum Forest
- J48
- MLP
- naive bayes
など、WEKA にあるアルゴリズムはほとんど試しています。バギングなんかのアンサンブル学習、集団学習手法も。
細かなチューニングが間違っている可能性も高い(使い方など)という理由もあるかもしれません。ぜんぶ独学ですので。
あと、データの不備も原因かも。特徴工学のことですね。属性に関すること。とにかく線形で予測できる内容ではないので、”現象をどう解釈するか?” でデータの作り方も変わると思うんです。これは特に手間がかかります。
このあたりが未熟なのかなと。
WEKAにはフィルター機能がついています。この機能を使って有用な属性を絞り込むことができます。
僕の場合は、まだ使いこなしてるとは言い難いですね。。
とにかく勘とか直感を数値にして予測したい
僕がやってることってのは、”テキストで書かれた予想を数値に置き換えて機械的に予測させること”
ガンバが調子がいいとか、セレッソは最近引き分けばっかりだ・・とか、そういうことをフツーは予想に反映します。
それらの情報を数値にして判別させたらどうなるか?
これで安定した予想をできるのか?・・・そういうことをやりたいんです。
ディープラーニングは認識精度を向上させた
僕の理解では、ディープラーニングは認識精度を向上させる手法です。
みずから考えて答えを出すというのとはちょっと違って、パターン認識だと思います。
あいまいで複雑なパターンを、ちゃんと識別できるというだけで、未来を予測できるわけではないと思うんだけど。
それで、サッカーの試合結果を読むということに関してディープラーニングを考えると次のようになると考えます。
あいまいで複雑なパターン・・・サッカーはほんとに分かりません。波乱試合も多い。
ちゃんと識別・・・なにかパターンらしきものがあれば、正解を出してくれる。
あいまいで複雑なパターン・・・コレを表現する属性をちゃんと表現することができれば・・・
読み取ってくれるかもしれない。
単純な考えですね。
あ、これ書いていて忘れていた属性を思いつきました。
- 得点パターン
- 失点パターン
これいいかも?
これまでデータ化したことありません。なんてマヌケなんでしょう!!
では。
コメント