ディープラーニングで回帰予測を試してみる
H2O-3 のディープラーニングでは、分類だけではなく、回帰 Regression も予測できます。目的変数を 数値属性 NUMERIC に選ぶと自動的に切り替わって 連続量 を推定することができます。今回はゴール数を上手く予測することができるか 試行してみたいと思います。本来ならゴール数は連続量ではなく離散値、もしくはカテゴリ変数として考えなければいけないと思うのですが、連続量として考えてみます。
やり方はいつものカテゴリ分類とほぼ同じ様式で行います。データに付け足したのはホーム側とアウェイ側で分離したゴール数です。単純に 数値 として記入したものを付加します。
今回の試行で除外した属性は以下の通り。
1、枠内シュート数
2、PKシュート数
3、シュート成功率
4、PK成功率
5、RESULT (これまでのリーグ戦結果)
6、ホームチームゴール数を予測するときは、アウェイ側ゴール数を除外する。逆も同じ。
基本的に、テストデータにおいて空欄となる属性(直接、結果につながるような属性)は除外します。例として RESULT などはまだ未知ですからテストデータには反映できません。同じようにゴール数も考えられるので、片方の予測時には除外します。このようにして得られた j2-24節 の予測結果は以下。
注意 バックテスト等はまったく行っていませんので・・信頼度ゼロです。。
正直 自信などまったくありません。トンチンカンな結果かもしれないです。活性化関数は rectifier で、 初期設定で走らせています。数値はゴール数そのものとして見るのですが、マイナスなどがあって、不自然ですね。やはりカテゴリ変数としてみるのが適切なのかな? とも思います。
結果を見て、またチャレンジしたいと思います。
通常の勝敗予測
同じ rectifier を使った勝敗予測は以下です。除外した属性などは先のスコア予測とほぼ同じです。
結果検証
ゴール予測は完全に失敗です。また、勝敗予測もいまいち。ゴール数を目的変数にするなら、やはり離散値化してやるか、カテゴリ変数として扱ったほうがよいと思います。
コメント