tkato’s blog

ブログ名は暫定。

Deep Learning Lab コミュニティ キックオフ 参加報告

Deep Learning Lab コミュニティ キックオフに参加してきました。

dllab.connpass.com

午前だけ有給取得して参加しました。
午後から仕事の予定だったので、懇親会は早々に切り上げてきました。
しかし、色々あって午後も休暇を頂いたので、気持ちが冷めないうちにブログを書きます。
各セッションの資料は公開されるのかな?

Deep Learning Labとは、

dllab.connpass.com

Deep Learning Lab(ディープラーニング・ラボ)は、ディープラーニングを中心とした先端技術の持つ可能性を、実際のビジネスへ応用するべく、技術とビジネスの両面に精通したプロフェッショナルたちが集まるコミュニティです。Microsoft AzureとChainerを、主要なプラットフォーム/フレームワークとして、ニーズに合わせた最適な技術を選択し開発した事例や、最新技術動向の情報発信を行い、ディープラーニング領域のソリューション検討を具体的に進められるように支援します。

ちなみにロゴは脳をモチーフにしていて、Deep Learning Labの頭文字であるdllが書かれてるそうです。

4つのセッションがありました。印象に残った点をまとめると、

  • DeepLearningのビジネスでの活用事例や技術動向を共有して、AIの実社会利用を推進していくとのこと
  • ChainerやDIMoがすぐ使える環境をAzureに用意するとのこと
    • 現状でも、データサイエンス仮想マシンを使えば、PythonGPU環境はすぐ整う
    • ここに、ChainerやDIMoをプリインストールする
  • 3年で5万人のAI技術者の育成を目指すとのこと
  • その他、私の感想
    • 技術動向については知ってるものが多かった
    • DIMoの中身は知らなかったので、面白かった
    • 特に、ビジネスに活かすための考え方、参考になることが多かった
    • 闇雲にDeepLearningでなく、目的に応じて使うことが大事だとあらためて思った

以下は、それぞれのセッションについて印象に残ってることをメモします。
セッション中にとったメモベースなので、誤解してる内容があればすみません。

★は、聞きながら重要と思ったところ。

Preferred Networks と Microsoft の業務提携が意味するもの

株式会社Preferred Networks
取締役 最高執行責任者 COO
長谷川順一氏
(途中からPFNのリサーチャー斉藤氏による説明)

ChainerとDIMoをMicrosoftのAzureで簡単に使えるようにするとのこと。
→ AIの普及推進のため

3年で5万人のAI人材を育成
→すごいな… そんなにいると単価が下がる??

DIMoは、異常検知アルゴルやGUIなどツール含むパッケージ
様々なPoCで使っているとのこと

DIMoによるPoCの一例としては、

  • 外観検査
    • 現状目視を自動化をしたい
  • 数値予測
    • 明日はどれくらいのエネルギー必要かの予測
  • パラメータ最適化
    • 機械のパラメータの調整
  • 他にも色々あった

DIMoパッケージ紹介

ここから、PFNリサーチャー斉藤氏にバトンタッチ
DIMoで具体的にどんなことができるかの説明。

NTT Comの再照合技術
PFNが技術協力している
カメラで正面から高画質に撮らなくても認識できるように
プレスリリースは以下。
http://www.ntt.com/about-us/press-releases/news/article/2016/20160330.html

外観検査
製品の傷あり、なしのデータで学習
学習データには、傷の場所のラベルは不要とのこと
NNの出力として、傷の有無のスコアと傷の場所が出せるそう

DIMoは、教師データ作成のアノテーションツールやGUIなどフロントエンドUIを提供している

Chainer v2では、学習時のGPUメモリが削減された
保持しなくてもいい配列を減らすことで実現。
また、Cupyを別リポジトリに移動し、DeepLearning以外のユースケースでもCupy単独で使えるように。

ChainerをWindowsで動かせるようにもしている
今もできるが、環境構築手順がめんどい(Visual C++、Cudaなどのインストール)
今後は、ビルド済みバイナリ配布など検討しているとのこと

現状でも、Azureに用意されたData Science VMGPUPython環境が整っている
しかしChainer等はプリインストールされていないとのこと。

Chainerno追加パッケージとして以下がある

  • ChainerMN
    • 理想値に限りなく近いスケールアウトを実現(Azureでも試した)
    • 予算に応じてスケール設定を変えられるようなマネージャーツールの提供も検討
      • Azure Resource Manager
  • ChainerRL
  • ChainerCV

ディープラーニング技術の最新事例と導入の課題

株式会社Ridge-i
代表取締役社長 柳原尚史氏

PFNの研究成果をフレームワーク化したものがDIMo
Ridge-iは、DIMoの導入等、検討から導入までサポート

目先の効率化や、とりあえずのAI導入は駄目
3歩先をみると、今手元に何のデータが足りないかなどわかってくる★

AIやりたい人はたくさんいるが、何を使えばいいかなどわかる人材は不足
AIという言葉は曖昧。機械学習以外も含む…

1つ1つの案件をスクラッチでやるのは非効率なのでフレームワークDIMoを使う

2フェーズでコンサルする

  • コンサルテーションフェーズ
    • 課題はなに?を分析する。
    • 解決策はDeepLearningにこだわらない。
    • DIMoを使う必要ある?他のAIでできる?など判断
    • Big Pictureを描く
  • ソリューション開発フェーズ
    • 導入支援、カスタマイズ

Semantic Segmentationか、Bounding Boxか
→車の位置を求めたいくらいなら、BBoxでじゅうぶん
→車の下に人がいるかを検出したいならSegmentationなど、用途に応じて選択

DL Shimons

  • 音楽生成。5000曲位のクラシックやジャズを学習すると作曲する
  • 作曲家らしさを良く抽出するらしく、
  • 実際のBachの曲とShimonsがBachで学習して生成した曲を人に聞かせると、
  • Shimonsの曲の方がBachらしいと感じるそうだ。

DeepLearningでしか解決できない課題はなんだろうと考える★
ルールベースでは解決できない課題
→自動彩色はまさにそのタスク

ローマの休日の自動彩色の例

  • ImageNetで学習したぽい
  • 課題は、服や車などの色に多様性がある部分はすべてセピア色になることだそう。
    →汎用化されすぎたことが問題。そこそこOverfittingさせたほうが良いことも。

一方、Overfittingさせて成功した例:昔の大相撲の映像のカラー化
https://www.youtube.com/watch?v=E0DLqV81FMg
あえて汎用化でなくOverfittingすることもビジネスによっては大切★
→学習のさせ方で工夫が必要

ここからは、実活用への技術課題について。

自動運転は複数のDeepLearning技術の組み合わせが必要★

  • 現状のモデル化
    • 障害物検知DL、行動予測DLなど
  • 行動のプランニング
    • 強化学習

1台の車だけ上手く動かすのでなく、渋滞しないように複数台を制御するための渋滞予測なども必要
→組み合わせが重要

全体像を描き、どこがクリティカルパス化を見極め、
1の矢、2の矢が失敗してもビジネスとして成り立つよねという考え方が重要★

あとは、どの技術レイヤでやるか
例えば、渋滞予測はクラウド、衝突回避はエッジ

技術の組み合わせの良い例が、NTTのリアルタイム人物監視

DL1つで解決するのではなく、ビジネスのためにどうするか
どうすれば競争優位に立てるか、などちゃんと考える★

DIMoの操作実演とSCSKが提供するプログラム

SCSK株式会社
AIビジネス推進室
課長 島田源邦氏

DIMoの説明とデモ。
ソフト屋の目線では、この発表が面白かったです。

DIMoを使えば複雑なコーディング不要でDeepLearningシステムを組める
→とはいえ、現状は設定ファイルとしてBQLやJSONを書いたり、CUI操作も一部ありそう

DIMoは、大きく3つのモジュールから構成。
各モジュールは独立したDockerのコンテナで動くっぽい説明。
各コンテナのOSはUbuntuだが、今後はWindowsもサポート予定

3つのモジュールの説明

  • Hawk
    • 学習用映像にラベリングして教師データを作成するツール
    • 領域指定やラベルの指定などをGUIで効率的にできる
    • 管理者によるアノテーションの承認などの機能もある
    • データを一元的に管理するための機能なども
  • Scouter
    • 実装済みモデルに対する学習と、それを使った推論を行う
    • SensorBee, Chainerが乗っているコンテナがこれ
    • RAM 32GB以上 GPU必要などの仮想マシンの要件がある
    • コーディング不要
    • ユーザーは、パラメータファイルの設定と、簡単なスクリプトで処理フローを記述
  • Kanohi(かのひー)
    • 認識結果の可視化ツール
    • 位置や属性の統計情報を、フロアマップ上にオーバレイするとか

ここからはデモ。
今回はAWSで動かしてるそう。

  • Hawk
    • データのアップロードすると、動画のフレームを自動で切り出してくれる
    • 検出:DnDでBBoxを指定してアノテーションを付ける
    • 認識:BBoxのクラスを指定
    • 同じ画像を複数人で作業してマージできる
    • ポイントは多数決できること。教師データの品質が上がる
    • アノテーションJsonとして保存される
  • Scouter
    • 車載カメラの映像で認識のデモ
    • 学習の設定ファイルはJSONで、epochなどハイパーパラメータの設定や、データセットのパスを指定
    • 学習はCUIでコマンドを叩いてる様子
    • 処理フローはBQLで指定
      • 入力データ、使用モデル、出力先などを定義する
    • ブラウザで、検出・認識結果がストリーム映像で見れる
      • 動きがカクカクしていたが、回線の都合とのこと
  • Kanohi
    • Scouterで認識した結果が、フロアの地図上にマッピングされたり
    • リアルタイムトラッキングやヒートマップ表示など

SCSKはDIMo研修プログラムを提供

トレーニング展開のご紹介

日本マイクロソフト株式会社
廣野淳平氏

P40/P100のGPUが夏までにはAzureでも使えるようになる★

VMのセットアップの時間で課金されるのが嫌だという開発者の声
→データサイエンス仮想マシンを提供

Azure Batch??

SQL Server 2017のストアドプロシージャでR,Pythonが動く
→Chainerも動く!
お客様のデータはRDB上にあるので、その上でDeepLearningできたら、
便利だし、DBからデータを出さないのでセキュア★

PFN x MS 認定トレーニング

  • AI凄いぞと世間が騒いでる割には、使える人材が不足。
  • AIの実利用を空想で終わらせないために、人材育成が必要

今まではエンジニア向けや初歩のトレーニングが多かった
今、マーケットの課題は、MNISTなどの基礎はできるがその先は…という感じ。

今回のトレーニングは、3種類のオーディエンス向けに作成

  • ビジネス経営企画
  • エンジニア
  • アカデミック

MSにラボ環境があるので、これからはハンズオンをどしどしやっていきたい

講師とコンテンツがボトルネック
機械学習を理解していて、かつ教えるのが上手い人が少ない★

Deep Learning Labのご紹介

日本マイクロソフト株式会社
新井浩之氏

connpassのロゴは、脳をモチーフにしてるらしい。頭文字dll

DLの技術だけでなく、ビジネスの両面に精通したプロが情報発信するコミュニテイにしていく★
生の情報を持つSIerの話や実例が聞けるようにする

また、「こんなプロジェクトやりたい」に対してマッチングできる場にも

今後は定期的に勉強会などやっていく
懇親会も活用してね

その他

懇親会では、参加者の方から面白い話が聞けました。
外に出ると、やっぱりモチベーションアップに繋がりますね。

次回のイベントは7/25にあるとのことで、早速申し込みました。 平日ですが、また有給取って行こうと思います。

dllab.connpass.com

私としては、エッジ側でDeepLearningをどう実装していくかに興味があるので、
そうした内容を今後取り上げてくれると嬉しいかな。

イベントの1時間ほど前に東京駅に着いたので、皇居外苑のベンチで読書してました。 爽やかに晴れていたので、とても気持ちよかったです。 良い息抜きになりました。