一見するとまったく相関がない説明変数と目的変数。果たしてディープラーニングはパターンを見出せるのか?
今回はトレーニングデータを一新しました。内容についてはナイショです。
これまでは事前に入手できる情報が限られていたために説明変数が十分ではなく、空欄状態で予測させる方法をとっていました。今回、試したのは、すべての空欄を説明変数で埋めたこと。
つまり未知の試合について「結果を予測するための情報をきちんと一行のインスタンスに納めた」
本来の機械学習というのは、説明変数が空欄というのはあり得ないことで、僕がやっていたことはデタラメです。まあ、分かっていてやっていたんですけど、仕方がなかったわけで。
今回は、ちゃんとした相関というか関係性があるのかどうかもよくわからない説明変数というのを考えて、それで予測モデルを作ってみました。
出力は以下の通り。
出力結果を見る限り、それほどデタラメでもないような気がします。表は第一候補だけ示してあります。スコア部分はたぶん当たりません。勝敗だけ注目ですね。
とりあえずの目標は ダブルで全部当てです。試合が終わったら答え合わせですね。
第961回 トト予想 ダブル予想
これでもまだどこか撃ち漏らしはある。たぶん。
ダブル予想の発展形
やっつけ仕事で新しい予測方法を試してみたわけですが、どうも検証結果が思わしくありません。なのでちょっと手直ししたヤツでもう一回予測してみようと思います。
後ほど13枠についての再予測をアップ予定です。
予測完了です。
こんな感じ。あまり変わってないかも。最後に 「やり直しのダブル予測」 を載せときます。
二日目が残ってますが、ちょっと感想を・・
さて、今回は 「あんまり相関がないようなデータ構成」 で、パターン認識ができるか? という問題設定で予測してみました。
ハズレはやっぱり出現しましたが、それなりに手ごたえはあったと感じます。特に最初にやった方に可能性を感じます。ディープラーニングはパッと見た限りでは相関がないように感じるものでも、それなりにパターンを認識しているのは間違いないです。
最初に挙げてあるダブル予測はいくつかハズレていますが、甲府を拾えているのがうれしいですね。ここはまず柏一本でいくのが普通だから。ほとんどの予想はおそらく鳥栖と甲府でやられているはず。
キャリーになる可能性は高いんじゃないかな。
。
コメント