第751回トトくじ予想
今回751より機械的予測を再開します。
それに伴いデータ構成、そしてアルゴリズムを新しいものに変えてみました。ディープラーニングのほうはまだまだです。。かなり情報もでてきておもしろくなってきてるのですが・・データの与え方でつまずいちゃってる。。もっと理解が必要ですね。
それでは、まずは予測一覧表をご覧ください。
使用したソフトは WEKA です。相変わらずですね。
データは直近5試合分。といってもシーズンを跨いでいますからね。。状況が変化していますから信頼できるものでもない。今回の予想の特徴は・・・直接対決結果を重視していなくて、それぞれのチームについて過去5試合の公式戦結果を対比させて計算させているところ。
普通の予想では過去対戦結果(直接対決)を比較して予想を組み立てるケースがほとんどですね。ある程度は信頼できるかもしれませんが大抵の場合には、そういう傾向は支持率に反映されてきます。したがって面白い予想にはなりにくい。
アルゴリズムは ベイズネット。ナイブベイズではありません。指向性のあるほうです。因果関係をグラフ表示できるヤツ。これにもいくつか種類があるのですが、今回は Simulated Annealing を使用してみました。
ウィキで調べてみたんですが、どうやら 焼きなまし法 というものらしい。読んでも意味がいまいち分かりづらいですね。。近似解というか・・まあ最適解というか・・ようはもっともらしい解を与えてくれるんだな。。という理解で。
吐き出された解をみて感じたのは・・「案外いい感じかも?」 でした。それほど的外れじゃないような気がするんですけどね。どうでしょうか?
さて、今回は二種類のデータを用意しました。詳細については省きますが、ふたつの予想をあわせたものが合成予想となります。ダブルが6個となり、少し大きな母体となります。
順当割合というのは、合成予想にどれだけ一番人気が含まれているか?というもの。
13枠の当選には必ず順当試合が含まれていることはよく知っているかと思います。非常に少ないときで3、多いときでは前回750のように10試合も含まれてきますね。
いつもはだいたい 4~9 含まれていることが多いんじゃないかと思います。表では合成予想と一番人気を色分けして見やすく表示してみました。
今回の予測では 最大8試合 の順当試合があることを示しています。
実際の購入にあたっては、J1 でダブルを使用して ダブル3でいってみようかと思います。J2でダブルを使用するってのはあんまりドキドキできないような気がするのよね。。J1でのっけからはずしてしまうと全然おもしろくないですからね。
ではでは、いってみよう。
第750回トトくじ 13枠勝敗結果の検証
さて、試合が終わりました。新しくページをつくって記事をあげるのもちょっと面倒?だなと思います。なので追記で書いていきますね。
まず一番人気の割合から
今回は 3試合のみ
非常に少ないです。大荒れ?なのかなあ。。まあ結果からみるとそういうこと。これは最低ランクといっていいかも。普通はもう少し多くて 6ぐらい だと思います。逆張りを意識してもやっぱり最低でも6チームぐらいは順当にマークしないとダメかな?
浦和 広島 あたりは今後も外せないかもしれない。
今回の予想的中は?
今回751の予想にあたってはすべて機械的予測です。
結果はダブル6で 7/13 ダブル3では 6/13 でした。。まあ半分ぐらい正解か・・とりあえずダブルでマークしたところはすべて外さなかったのが救い。
アルゴリズムの選択は?
これも長年やってるけど、どうもよく分からないというのが正直な感想。毎回、難易度というか傾向が違うので正解率にはバラつきが多いです。あとから検証してもあんまり意味がありません。次回も有効とは限らない。
データ形式、構成は?
たんなる感覚でしかありませんけれども、過去に試したものよりかは良い感触です。支持率はいっさい使用せずに、過去5試合のみのデータを使いました。今季のデータが増えるに従い予測精度が上がることを期待しています。
詳細は以下の通り。
1、ホームチーム、アウエイ についてそれぞれ 過去5試合 の 対戦相手、ゴール数、失点 を記入
2、これらをすべて 1行 に並べる。ただし 列 はきちんと対応するように。属性をそろえて記入すること。
まあ、あとから検証テストをやって言うのもなんですけど・・アルゴリズムとデータ構成を少し変化させて試したところ、シングル予想で 7/13 という結果に。
こういうのを毎回安定して吐き出してくれると良いんですけどね。。安定してくれれば、それをベースに考えることも可能となってきますんで。
反省はここまで。また次回がんばりましょう。では。
コメント