clew

気になるモノ 気になる人 気になる言葉

*

第882回 トトくじ予想 そろそろ勝負をかけてみようと思う。

      2016/10/17

第882回 トト予想 J2 メインだが勝負をかけてみるか?

今回のトト、またも J2 11枠プラス なんと!? J3 2試合。。こんな変則パターン ありなのか? というぐらい変態的編成です。私が知らないだけかもしれませんが、たぶん初めてじゃないかと思います。自分の予測手法がどれくらい通用するかまったく見当もつきませんが、勝負してみたい。

これまでかなり時間を費やして過去検証をおこなってきました。おもに時間を使うのは データ構成 について考える時。これは本当に時間を食います。実務作業はアイデアにしたがって淡々とこなすだけです。

トト予想において効果的なマルチの買い目を導くためにはどうすればよいか?

これは長年の課題です。今回、この難題をクリアするために1枠に対して2パターンのトレーニングモデルを対応させてみます。アイデアとしてはべつに目新しいものではないです。ただデータ構成に関しては今まで試したことがないものです。というか思いつかなかったといった方がよい。

比較的、予測精度が良さそうだと思われる方法を2種類用意する。しかし機械予測は似たような予測傾向を示すパターンがほとんどです。2パターン用意して結果を比較すると、同じような枠で間違っていたり、同じ枠のみで正解が重なるパターンがよくある。かといって、予測パターンを増やせば増やすほどマルチがどんどん膨らんできて、結局絞り込みができなくなってしまう。。

一番気を遣うところは、どうやってマルチにすべき枠を特定するか? 表現を変えて言うと 予測精度が比較的高く、なおかつ傾向の違う予測パターンを上手く組み合わせること。

効果があるかどうかは実証実験するしかないので、とにかく出力結果を信じて買ってみることにします。自分自身としては、ある程度 再現性のある予測方法 だと考えているので手法や予測結果については公開しません。プログラム(アルゴリズム)に与えるデータ量など、まだまだ不明な点もたくさんあるのですが、ひとまず これまでのまとめとして、プロトタイプ とでもいうような位置づけでこの方法を捉えています。

この方法に説得力を持たせるためには、なにより実績が必要です。しかも何度でも。夢物語のようですけど本気にならなきゃ実現しませんから。

一例として前節 j2 35節 にて予測したパターンをふたつ載せます。これは偶然かもしれませんし、必然かもしれません。ちなみに今節は同じ手法では予測しません。先に述べた新しいパターンで攻めたいと思います。

j2-35%e3%83%91%e3%82%bf%e3%83%bc%e3%83%b3

テスト続行中・・・

過去検証の結果に不安があるのでテストを継続してます。経験からいうと 「いくらやってもベストな方法は見つからない」 というのが本当のところかもしれません。

ある回においては上手くはまってくれて良い予想ができても、別の開催回、組み合わせではまったく通用しない・・ということはよくあります。同じやり方、手順、方法、考え方などなど どんなに注意深くテストしても 「再現性に劣る」 「汎化性能が低い」 という問題に直面します。

これは仕方がない。。不確定要素が大きすぎるので本当に仕方がないと思う。それでも より良い方法 というのは存在します。比較的・・といった方が適切でしょうか。自分流のテストにおいて、比較的良い方法というのを探り出して、それをブラッシュアップ する。これしかないです。

1、トレーニングデータをどう作るか?

2、テストデータは?

3、アルゴリズムは?

大きく分けて以上の三つについて考える。つぎに検証についても考えておきます。比較検証するためには考えうる予測方法すべてについて予測方法とその設定、予測結果について記録を残しておく必要がある。そしてすぐに比較できるように整理しておかなければなりません。これも重要なことです。おざなりにしておくと、いざという時に大変面倒なことになり、最悪、設定事項について再度調べなおす必要がでてきます。ひどくなると、どうやって出した予測結果なのか わからなくなります。

以上、予想結果とは関係のない内容になってしまいましたが、注意点について自分なりに書き出してみました。


 

予想状況ですが、やっぱりダブル出力が多いです。事前には想定していたことですが、現実的に買う段階となると 削減するしかないかな という感じです。予想の公開については未定。まあ、見てくれている人もごく少数だと思うし、それほどもったいぶるものでもありませんが ネタ として楽しんでもらえればいいかな。

予想母体案 その1

予想母体をひとつだけ挙げておきます。

883%e4%ba%88%e6%83%b3%e6%af%8d%e4%bd%93

このままではデカすぎて使い物にはなりません。有効だと思われる予測手法によるシングル出力を、3種類寄せ集めたものです。松本や、清水を外しているのが何ともいやらしいんですが、わざとではありません。あくまで機械的判断によるものです。

今節は、この3種類のシングル予想から2種類を選び、組み合わせてマルチで買ってみようと思います。大ハズレなのか、そこそこ当たるのか 過去検証するにも限界があるので予測手法の信頼性に関しては何とも言えないです。検証作業は本当に手間がかかります。一からデータ整備して、何種類もの組み合わせを試行するというのは苦行に近い。しかもひとつの開催回についてだけではなく、いくつもの開催回について何種類もの予測方法を試し、その結果を精査するわけです。考えただけでも嫌気がさします。

できれば毎回、こまめに検証作業をして、その結果を記録に残しておくこと。まとめて作業しようとするのは無理がありますからね。

第882回 トトくじ 予想の振り返りとその評価

さて、早い時間の試合が終了しました。さっそく予想について評価します。下の表は私が現状で一番信頼を置いている予測方法による結果です。

882%e4%ba%88%e6%83%b3%e6%a4%9c%e8%a8%bc

向かって左から 対戦カード、第一選択 というのは分類確率が一番高いものです。続いてそれぞれの枠の 分類確率=事象の起こり易さ となります。

今回の予想、現時点では 長野 をはずしてしまいました。。残念です。しかし赤でマーキングした箇所を見ると僅差でドローの次にホームがあります。この予測方法においては、しっかりと 長野勝利 という可能性が高いことを示しています。

結果的に私自身がこの数値に注目できず、選択を誤ってしまいました。もし今後も同様の予測精度が保てるならば・・・つまり、この方法が他でもある程度通用するならば、なんらかの方法でこういった兆候を見逃さずに予想に反映できるシステムというか仕組みを考えなければなりません。

松本、清水 この2チームを外したのは完全に痛いです。まあ機械判断だからしょうがないのですが、あまりに無謀、なぜに外すような計算をするのか? もし外したことで当たれば 「機械学習すごい!!」 となるわけですが、今回はファインプレーとはならず。。やはり安定した予測結果の出力を期待するのには やや無理というか不安が残る。

予想全体をあらためて見ると・・・

1、松本、清水 など 対戦カードに照らして考えてみると実に不自然な予想結果だ。

2、北九州、群馬 の2カードについては予測不能だった。

3、セレッソ、札幌 のドローは想定範囲。

4、山形、町田、山口 の3カードはある程度は想定できた。

まあ、後から分析するのは簡単であり、なんとでもこじつけと言うか、理屈は付けることはできる。事前に予測できなかったのか? という観点からもう一度改良したトレーニングデータで予測した結果は以下。

882%e4%ba%88%e6%83%b3%e6%94%b9%e8%89%af

この評価ページで先に挙げたヴァージョンよりは マシ になっていると思う。

岡山ーセレッソ のドロー確率も高く出ている。しかし、残りのハズレ枠に関しては、まったくダメ。予想の方向性自体がずれているのが分かります。こういうところをフォローするために、もうひとつの傾向の違う出力をする予測方法を考えています。

今回 用意したものはダメだったわけですが、たまたま今節に合わなかっただけなのか、それともまったく使えない代物なのか そのへんの判断が難しい。

 

 

 

 

 

 - トト予想