足ることを知らず

Data Science, global business, management and MBA

Google CloudのCloud AutoMLでパラダイムが変わるかも・・・という話

あんまり普段仕事の話を書かないのですが、お仕事ではもっぱらGoogle Cloudをいじり倒しています。

 

ちょっと前までは、割とウェブログ系のデータをいじいじとしながら、時系列予測や、ありがちなCV期待値みたいなものをScikit-learnとかKerasでグリグリモデリングして、成果出して、ヤッターみたいな話が多かったんですが、春から少し新しいデータを触るロールになったので、 もう少し広い範囲のプロダクトをいじったりしていました。

 

広告領域における画像分析活用の課題

画像ラベリングの精度やラベル自体の種類、整理などを既成品及び自社オリジナルそれぞれでバーっと作っては評価し、ということをやっていたのですが、既成品のラベルはどうしてもGeneralすぎて、どうにもクリエーティブの示唆にはならんなぁと困っていたのです。一方で自社オリジナルはオリジナルでかなり仮説を持って作り込まないと、時間食った割にゴミプロダクトができるというジレンマがあったのです。(特にConvolutionalでは、パラメーター設計どうするというのがなかなか匠の技やなぁというのを痛感しました。)

 

EC(特にファッション)みたいに、パフォーマンスのKPIがクリアで、更に解析対象の改善によって、見える形でフィードバックがあるとゴリゴリ作りに行く価値もあるんですけどね。広告の場合メディアインパクトとクリエーティブインパクトをきっぱり分けるのはそんなに単純じゃない上に、コンバージョンまでのタイムラグも長いので、なかなかこの領域にたくさんリソースを割く余力がなかったりします。

 

Cloud AutoMLとは?

で、この夏出たのがCloud AutoML。色々触っている中でも、このツールはBreak Throughだなぁと思ったので、実例と共に簡単に紹介したいと思います。

 

Cloud AutoMLとは何か?

Cloud AutoML - Custom Machine Learning Models  |  AutoML  |  Google Cloud

 

利点・欠点

利点としては間違いなく、Bespokeなラベルを返す人工知能APIを簡単に作ることができるという1点に尽きると思います。Vision APIとの比較でいうと下記。

f:id:monnalisasmile:20181021205110p:plain

AutoML Vision Beginner's guide  |  Cloud AutoML Vision  |  Google Cloud

 

 

一方難点としては、もちろんFrom Scratchで画像とラベルのデータを用意して、AutoMLが求める形でGCS上に配置しなければならないという点です。しかしながら、ラベルあたり100枚の画像があれば、そこそこの精度は出ますので、正直難点らしい難点が見つからないなぁというのが率直なところ。(Googleがいつ課金を始めるかというビジネス的難点はある)

 

 

おもちゃをつくってみた

実はさっきの難点もGoogle Image Searchから画像をスクレイピングしてきて、サーチワードをラベルとして格納するみたいなことをすれば、1日でそこそこいけてる画像認識人工知能が作れてしまいます。(前処理のコードはGithubで公開しています)

 

いくつかガラクタを作ったのですが、その中でもこの前ハッカソンで使ったものを紹介します。

学習データとして、King、Knight, 忍者、侍、jedi(!?)など旧来の「戦士」をTrainのデータとして、実際の予測ではマーベルなどのスーパーヒーローの画像を入れます。

「現在のスーパーヒーローたちは一体旧来のどのような戦士にインスパイアされてデザインされているのか」を人工知能でサクッと一日で答えて見た結果が下記です。

 

f:id:monnalisasmile:20181021211051j:plain

f:id:monnalisasmile:20181021211054j:plain

f:id:monnalisasmile:20181021211058p:plain

割と昔だと海外ヒーローはナイト系の印象が強かったんですが、忍者インスパイア系(スパイダーマンデッドプール)とかも最近人気出てきてますよね!
 
 

 

パラダイムの変化

AutoMLのようなプロダクトで、より人間は「質問」に時間を割くことができるようになると思います。そして、次世代のデータサイエンティスト、若しくはAIを活用されるビジネスマンに求められる機能って下記のようなタイプなのではないでしょうか。

 

①ガチンコの方々:アルファZeroを作るレベルの方々。新しい技術を作る人。

②コンサルタイプ:複雑怪奇なビジネス課題を既存技術・データで解けるレベルに分解・抽出できる人

③アイディア・実行タイプ:既存技術・データの組み合わせによってクリエイティブな解決策を考え付き、実行できる人

④生産タイプ:既存技術・データの落とし穴や不足領域を見出して、埋めに行く人。(事業を起こして新しいデータを生成するとか)

 

 ①と④はそんなに頭数がいる必要はないので、まともに生きていくなら②、③かなと。そういう意味では、ちゃんと技術を理解するだけではなく、ビジネス課題を理解すること、及び自分の専門外の技術も含めて組み合わせによって独自価値を生み出す胆力がないと難しいのかなと思います。