第850回トトくじ予想 j2-16節 ナビスコ杯

スポンサーリンク

weka による予測 クロスバリデーションでアルゴリズムを選択する

今節はナビスコ杯とJ2による変則開催です。まずはWEKAでJ2の勝敗予測をします。単純にこれまでのデータをクロスバリデーションした結果をもとにアルゴリズム(分類器)を選んでみました。といっても全部のスキームを試すのも効率が悪いですし、飛びぬけて良い予測をするアルゴリズムも おそらくありませんので、そのあたりは適当にやりました。選ばれたスキームは以下の通り。

weka.classifiers.meta.IterativeClassifierOptimizer

weka.classifiers.trees.J48

j-48 は結構有名ですね。安定した決定木による分類です。ではさっそく一覧表を載せましょう。

j2-16

色付きはトト対象枠です。ナビスコは後ほど予想を出します。ただリーグのデータは使いませんので、何か予想方法を考えてからやりましょう。

第850回トト ナビスコ予測

ナビスコカップについては、やっぱりデータの面で上手くまとめられないのでリーグ戦績を参考に機械予測を行いました。おそらく選手起用はかなり変わってくると思われますし、ナビスコにおける得失点の状況もリーグ戦とは違うのであんまり参考にはならないと思います。以下がその結果。

850nabi

予測に使用したアルゴリズムはJ2とまったく同じとしました。

ナビスコの状況を見る限りでは、神戸、そして 磐田 をマークしたほうが良いかもしれません。神戸は得点力で圧倒していますし、名古屋は失点が多すぎます。あと大宮の勝ち とか。一見すると 鹿島の得点力に目が行きますが、失点も多いです。比較して 大宮のディフェンスは堅い。なのでドローか大宮の勝ちもあると思います。

全体を見ると、ナビスコの得失点の状況とは かなり違う印象の予想となっています。

J2 16節 結果を見る

1枠 岐阜ー長崎

試合開始 早々 ボンボン点が動いちゃって・・どうなるんでしょうか? ちょっと分からない展開ですねぇ。

試合序盤こそバタバタしましたが、後半は動きもなくそのまま長崎が勝ち逃げしました。ここまでを整理すると、 山形ー横浜FC、そして セレッソー讃岐 以外はみな正解しています。あ、正解率の良い方は weka.classifiers.meta.IterativeClassifierOptimizer ですね。

セレッソ―讃岐 については、本当に惜しいです。後半アディショナルタイムのほんとのラスト、後半49分の追加点がなければドローでした。讃岐がロスタイムを抑えきれば勝ちでしたけど、それは多分予測不能だったと思います。

水戸―清水 はトト対象外でしたが、ドローという結果に終わっています。予測においてはドローか清水の勝ちでした。ここも IterativeClassifierOptimizer の予測では当てています。自画自賛ではありますが、うれしいですね。この分類器、けっこう使えるかもしれません。いろいろ検証してみなければ分かりませんが。直訳すると 反復分類最適化 というような意味になります。ちなみに検索情報では英語ばっかりの資料が見つかりますね。理屈について調べるとなると、日本語では参考資料が皆無かもしれません。

さて、J2 が終了しました。全体を振り返ってみます。

J2 は全部で11枠、今節の予測においては二つの分類器を使って予測をしました。二つの出力結果 予測を合成しますと ダブル3 という予想母体になります。正解率は 6/11 ということで、50%ぐらいとなります。こうして見てみると 大したことないです。クロスバリデーションの結果は、二つの分類器とも 大体 70% ぐらいの正解率はあるのですが、こうやって実戦で使ってみると やや正解率は落ちる ということになりますね。仮に90%ぐらいの検定結果が出たとしても、おそらく70%ぐらいに落ち着くのではないかと思われます。

開催回の傾向によっても かなり正解率は異なってくるのではないかと思います。一筋縄ではいきませんね。残念。

J1 ナビスコの勝敗はどうだったか?

今回は J1リーグ戦のデータでもって、ナビスコの勝敗を予測するという試みでした。結果的には 2/6 という正解率です。ぜんぜん良くはない。やっぱり無理があります。ナビスコの今季のデータだけで予測したほうが良かったかもしれません。ただ入手できるデータがリーグほど細かくありませんし、年度をまたいだデータで予測をするのも意味がない気がします。今後のやり方についてはちょっと考えたい。

 

 

 

コメント

タイトルとURLをコピーしました