第891回 海外トトくじ よく分かりませんがとにかく予想やってみました。
今回、海外トトです。機械学習による予想はたぶん初めてですね。とにかくチーム名すらよく分からないし、ドイツチームなんて発音からして慣れないせいか ややこしい感じがしてどうも苦手。とにかくいつもと同じ感覚で予想した結果が以下です。
詳しい人が見たら、なんかおかしい感じがするかもしれませんねぇ。僕はどう見たらいいのか、評価の仕方すら思いつかない。それぐらい何も知識がないです。まあ 「こんな感じかぁ?」 ってなぐらいにしか感じませんよ。
もうちょっと考えるかもね。
あ、表の右側は分類確率なんですが、向かって左から AWAY、DRAW, HOME となっています。間違わないでください。
ゴール3 で2等が当たったようです。
さて、まだ2試合残しての結果検証ですが・・・ 期待していなかったゴール3で当確があったようです。
フランクフルト で 2 をマークしていれば 16万円ほどの配当が付いていたようですが、残念。。それは無理。だって100円しか買ってなかったし、予想における分類確率でもホーム勝ちは一番可能性が低いと出ていましたからね。
肝心の13枠本トト。こちらは結果を待つまでもなく敗退確定です。だいたいのいつものパターンと似たような結果となっていますね。
薄いピンクマークが第一候補の当選枠です。ブルーの箇所は第二候補としてマルチで買ったところ。全体でダブル3のマルチです。まあ800円だけの勝負ということで様子見みたいな感じの買い目でした。パーセントでいうと 50~60% ほどの正解率となります。
予想方法はこれまでの国内リーグにおける方法とほぼ同じ。結果も事前の想定通りといったところでしょうか。ちなみに この予想は、おなじみ H2O の GBM を使用しています。データはヤフースポーツから取ってきたものをチーム別にソートしています。
ブンデスリーガ とか、イングランドのプレミアリーグ に関するデータは、海外サイトを利用するのも良いのですが、今回、検索した感触では、なかなか良いものが見つかりませんでした。できればJリーグのオフィシャルサイトみたいなのがあればベストなんですけどね。
ちょっとしたデータの違いが、機械学習においては重要な意味を持つ場合があります。日付とかキックオフ時間とか、あと試合会場とか、そういったもろもろの要素をどう扱うかで出力は変わってきます。それプラス、あとはアルゴリズムの設定ということになります。
一番良いデータとはどんなものか? プラス、それに合う 一番良いアルゴリズムとその設定はどうすればいいか?
この2点で正解率は大きく変わります。
トレーニングデータとアルゴリズムの相性による正解率の変化について
さて、本来ならページを改めてじっくり考えるべきテーマです。
どんなトレーニングデータなのか? どんなアルゴリズムで、どんな設定なのか? 対戦カード別にデータ構成やアルゴリズムを細かく変えた方が良いのか? などなど。検討すべきことは山ほどあります。ここでは 同じデータを使ってアルゴリズムのみを変えたケースを紹介したい。
論より証拠ではないですけど、以下の画像を見ていただきたい。
表示が小さいと思うので別枠で開いて確認してほしい。一番右側にある数値が ディープラーニング による分類確率と予想です。シングル予想で 10枠 正解しています。最初に行った GBM による予測よりもかなり良い感じに予測しているように思います。信じてもらえないかもしれませんが、この予測結果は本当で、ありのままを掲載しています。
ちなみに H2O の設定は、初期設定のままで何もいじらず走らせています。クロスバリデーションも行っていません。ただ残念なのは、この性能が常に保証されるものではないという点。同じデータ構成を用いて、同じように過去検証を行ったとしても、おそらく正解率にはかなりムラが生じるだろうと思います。
海外トトの予想と並行して、国内リーグが休止中の間に、来季に向けていろいろな見地から検証を行いたいと考えています。
コメント