clew

気になるモノ 気になる人 気になる言葉

*

ディープラーニング labellio  お試し中。使い方について

      2016/02/06

ディープラーニング labellio

ふと目にした labellio

これはブラウザ上で簡単に画像をラベリングできるソフト?らしい。

教師データとして、いくつか画像を分類していき、分類モデルを作成する。

ある画像を見せたときに、機械的に ”それが何を示しているのか?” ということを判断させる。

まだよくわからないけれども、いちいちパラメーターを設定することは必要ないようだ。

以前から画像を判定させるのに、”数値化” の方法について悩んでいたのだけれど、これを使いこなせればその問題も解決するかもしれない。

 

       Labellio - Sign in
Labellio – Sign in

labellio は グーグル のログイン情報で簡単に登録できます。

Create Model という ブルー のボタンを押すと 自分の予測モデルを構築する画面が開きます。

そこで自分のパソコンに保存してあるデータファイルを ZIPファイル形式 に圧縮して画像ファイルとして放り込むだけ。

これで予測モデルが出来上がるはずです。

最初に与えるデータファイルの基本的な形式については、日本語マニュアルを参照してください。

https://www.labell.io/static/manual/ja/index.html

ただし非常に時間が掛かります。現在の私のパソコンCPUは I5 なのですが・・これで丸2日つけっぱなしでも まだ終わる気配がありません。

データ数も多いのが原因のひとつだろうとは思いますが、それにしても遅い。

一応 原理的には 何を行っているのか? については THEANO を試した点からは理解しています。この時も非常に時間が掛かりました。。途中でストップしましたが。

ここから下の文は最初の投稿時のものです。大きな勘違いした文章ですので参考にはなりません。正しいファイルの作り方は日本語マニュアルを参照してください。

”いま、試しているのだけれど、やっぱりハード面でクリアしなければならない点があるようだ。

それはパソコンスペック。

CPU というか GPU というか、そっち方面の能力がスピードに大きく関係するのは間違いない。

現に、いま私が使っているノートパソコンのスペックじゃ、かなりノロマでモデル構築まで相当時間がかかりそう。

もう一台の やや高いスペックを持ったパソコンならもっと処理が早いと思われる。

i5,i7 など コア数の多い奴とか。


 

この記事を書き始めてかなり時間が経つ。

それでも処理は終わらないね。。

それほどデータ量が多いわけではないけど、やっぱりこのパソコンじゃ無理だな。”

ここまで。


現在モデル構築中のデータは2015のJ1対戦前レーダーチャート

今現在 ラべリオ に読み込ませているのは J! のレーダーチャートといわれるグラフ。

ヤフースポーツ で取得できる画像です。これを1ST と2ST あわせてすべて保存してひとつの画像データとしました。全部で 34節分×9試合 ですから 306枚の画像データとなります。

けっこうな数の画像ファイルですねー。とにかく結果がでるまで待ちたいと思います。

LABELLIO 日本語マニュアル

 

Home - Labellio User ManualHome – Labellio User Manual
ラベリオ 日本語マニュアルは上のリンクで読むことができます。

labellio へのデータの与え方

2016.1.20 追記

 

ラべリオの日本語マニュアルをちゃんと読んでいなかったせいで、とんでもなく時間を無駄にしてしまったようです。

まず画像フォルダをつくります。空っぽでいいので。

フォルダの名前はなんでもいいです。デスクトップなど適当な場所に置いて下さい。

次に中身。

データの中身について

データの中身は教師データとしてあらかじめ名前(分類名)を付与しておく必要があります。名前(ラベル名)は ”ルート直下のフォルダ名” になります。

つまり 分類名のフォルダがいくつか集まって、ひとつのデータとなります。

エクスプローラーのファイル展開図のような感じですね。フォルダツリーでいうところのトップがルートで、その下にずらーっとカテゴリ名でファイルが連なって格納されている形式です。

下は日本語マニュアルにおけるファイルの説明図です。

ラべリオ フォルダ構造

ラべリオ日本語マニュアル資料によると、見本でのラベル(カテゴリ名)は全部で4個。

dog,cat,bird,unlabeled となっています。このそれぞれがひとつづつのファイルとなっていて、フォルダ名が ”ラベル” になっています。これらをひとつのフォルダに格納したものが ラべリオに最初に与えるデータとなります。

なお、ファイル形式は ZIP形式 となります。データができたら最後にデスクトップなどに圧縮しておきます。

J1レーダーチャートでの例

そもそも学習失敗の原因は・・

ちゃんとフォルダ内で ”分類” をしていなかったからだと思います。

具体的には・・

それぞれのチャートパターンをいくつかのパターンに分類しておくこと。

単純に考えれば・・HOME,AWAY、DRAW の3個のパターンにチャートをフォルダごとに分ける。

チャートパターン と 勝敗の相関関係 をすること。つまり典型的なチャートパターンで勝敗について画像分類させてみるということです。

 - 機械学習