トレーニングデータを一新しての予測
従来のトレーニングデータフォーマットをすべて一新しました。全く違う形のデータとなっています。アルゴリズムは今まで通り H2O AI を使用しています。
今回のシングル予想は以下の通り。
6~7枠 当たれば上出来ですね。
追記 訂正
J2 のトレーニングデータについて間違いがあり、J2のみ再予測しました。
この予測ではおそらく当たらない。ハズレも多発する。
予測しておいて 「なんだ? 当たらねえだと?」 と、思われるかもしれないけど、予測方法の完成形などというのははっきり言って ない です。
とりあえず試してみて、ダメだったなら違うアプローチを試すということの繰り返しです。
そういうわけで、アルゴリズムとその設定、データの構成の仕方、パース時の修正とか、その都度都度、いろいろ変えて試行錯誤しています。
種明かしすると、今回のトレーニングデータはすべて 直接対決 のデータのみを使っています。今回、初顔合わせ というのはありませんでしたが、もしそういうパターンがあれば 累積データ がないこととなり、予測することができない状況となります。極端にインスタンスが少ないケースでも上手く予測できない場合があります。
しかし、そういった欠点はあるものの データの作り方、構成 としてはおそらく一番良い形ではないかと思っています。
問題があるとしたらそれはアルゴリズムの方です。設定とその扱い方です。よくわからない点もたくさんあるので。あと出力結果の解釈によっても変わります。得られた数値をどう解釈するか?
先に挙げた今回の予測、じつはアルゴリズムの設定で、まだ十分な検討をしていない状態での予測となっています。いろいろ設定を変えて比較検討している最中ですが、予測結果が不安定となる原因がよく分かっていません。
単なるブレによるものなのか、あるいは決定的に何かマズイ箇所があるのか、その両方なのか、過去検証を通して多くの正解パターンやハズレパターンについて調べてみないと分からないんですよね。
正直言って、どういうテストを行って判断していけばいいのかさえ分からない。
ソニーのライブラリ 早く試したい。
あ、ソニーから無料でニューラルネットワークのライブラリ 提供されてますね。
なんだかすごそう。今使ってるへっぽこPCのスペックじゃ無理みたいなので、自室の据え置きPCで早く試してみたいです。
自動でデータ構造を解析して、最適なモデルを提示してくれる機能もあるようだし、(まあ、これは H2O でも似たような機能・・AUTO ML がある)、なによりプラモデルを組み立てるような感覚で、ディスプレイを見ながらモデルを組み立てることができるところがすごい。
試合終了 今回の予測についての感想
ダメです。このやり方じゃダメ。方針転換します。
直接対決のデータは 「イケルかも」 と、感じていたんですが、ちょっとダメっぽい。このデータ構成で粘るよりも、さっさと構成を変えて次に行った方が良い気がします。
データフォームも変えて、さらにパース時設定もちょっと変えます。
コメント