足ることを知らず

Data Science, global business, management and MBA

グローバルでnetflixが鬼な理由

netflixのイメージ
netflixってどんなイメージがあるかわかりませんが、
データサイエンス領域からしても、レコメンデーションの鬼ですし、データエンジニアリング領域からにしても、トラフィックのでかい動画コンテンツをうまくさばく鬼なのです。

簡単に言ってますが、コンテンツ分類は「涙が出てくるヒューマンドラマ」「ヒューマンドラマ」等、かなり細分化されて管理されています。

今、トラフィックissueに関しても、DMMとかストリーミング見れたものではないですが、netflixはほとんどストレスがないです。多分ピーク時とノンピーク時のdistributionとかとてもうまくやってるのだと思います。(グローバルっていうのもレバレッジあるのか?regionalでAWS契約してるだろうからあまり影響ない気がする。教えて詳しい人)


強い理由は「データ」だけではない
ネットフリックスはデータ界隈では泣く子も黙るケイパビリティを持っているのは明らかなのですが、それ以上に凄いなと思っていることがあります。
それは「ビジネスissue」を第一に考えて、後の全てを手段としてきっちり割り切っていること。
例えば、下記のワールドワイドでのレコメンデーションについてのブログ。
Recommending for the World – Netflix TechBlog – Medium

Challenge 1: Uneven Video Availability
Challenge 2: Cultural Awareness
Challenge 3: Language
Challenge 4: Tracking Quality

一個もアルゴリズムに関するものはないのです。確かにアルゴはもう既にかなり鍛えられていると思うのですが、ここに書いてあるのはアルゴリズム以前の問題です。

Challenge 1は、版権が国によって異なる問題です。日本ではHouse Of Cardsがローンチ時にまさかのHuluでしか見れない状態という本末転倒状態でした。
よって、グローバルでこれを考慮せずにレコメンドを作ることは不可能なのです。そもそも商品の仕入れ状況が地域によって違う、というのはかなり大きな差異ですよね。

Challenge 2はBollywoodのような地域性のあるコンテンツです。日本でもTerras Houseがあるわけですが、このようなglobal, regional, personalなレコメンドのロジックを適切に設定するというのは至難の業です。

Challenge3は米国コンテンツのregion化に当たって、字幕と翻訳の好みがそもそもコンテンツや地域によって変わるということです。勿論、二つとも即提供できればいいのですが、そうもいかないわけです。

Challenge 4はどこまで細かいデータを正確に取れているか。上記のチャレンジを実現するためにも不可欠な要素になっています。

ビジネスインパクトの大きい部分に集中する

機械学習やデータ分析をしていると、そもそものデータが間違っているという大きなリスクを忘れて、その精度を磨くために必死になっていることがあります。
そして、そのロジックやアルゴリズムの良さを論文にして、学術的な権威を得ることも可能でしょう。

しかしながら、ビジネスインパクトを伸ばすためには、そもそものデータの前提を疑い、考えることが重要です。そういう意味で、tech blogでこういう記事が紹介されること自体、とても強い会社なのだなと感じました。

Netflixに関しては、他にも人事やオペの部分で凄いなと思った記事があったのですが、それはまた今度。