トト予想 Rによる時系列予測は有効なのか?
このページでは、統計解析ソフト R を使用したトトの機械学習予測について書いています。私自身、あまりRを使ったことがないので、その準備や備忘録といった内容となります。
データ準備編
ゼロからの時系列データの作成方法については情報はあるけれど、手持ちのデータをどうやってRに時系列データとして認識させるか? というのは「ありそうでない」 です。というより、あるけれど情報が少ない。もしくは分かりにくい。
まず使用するデータ形式は CSVファイル です。データの年月日は一応記入しておく。年月日情報がなくても時系列データとして認識させることは可能なようですが、まず第一に自分自身が分かりにくくなります。なのでRにおいては使わなくても、データ自体にはきちんと年月日を記入しておいた方がよい。これを昇り順にソートして見やすくしておきます。
基本的にRの時系列処理では、観測時点のデータがExcelデータに書き込んであっても、それは使いません。スクリプトの中に、それが何年から何年までのデータであるかを書きます。
データ作成のだいたいの流れは上のリンクを参考にすれば理解できると思います。ちょっと分かりにくいのはたぶん frequency
この 頻度、度数、回数 というものを、いくつにすればいいのかというところじゃないかと思います。単位時間毎の観測回数という意味だと思いますが、これは ”1” でいいんじゃないかと。
“ts” という関数で時系列データに変換すると次にようになりました。
変換前のデータ
上の二枚の画像は、ほぼ同じ箇所を示しています。
イマイチよく分からないんですが、一番左にインデックスのような数値が付きます。そして数値データはそのまま表示され、文字列などは一括して数値?に変換されてますね。
とりあえずこの状態で予測モデルを作ってみて、PREDICT関数で予測をする という流れになるんじゃないかと思います。一通りやってみましょう。
つづく。
以下工事中。
コメント