Nuts and Bolts of Applying Deep Learning

CS231の講義の関連動画を辿ってAndrew Ng先生がNIPS2016で行った講演「Nuts and Bolts of Applying Deep Learning」を見つけました。これがすごく面白い内容だったので超主観的にポイントをまとめてみます。

講演のビデオやスライド、Web上で見つけたブログは以下にあります。

スライドと1番目のBlog記事がよくまとまっているのでそれを読めば十分な気はします。が、自分の勉強としてまとめていきます。。

To hit the top margin, you need a huge amount of data and a large NN model.

定式化: データ量 x 大きなモデル = 性能

End-to-end works only when you have enough (x,y) data to learn function of needed level of complexity.

データ量万歳＼(^o^)／です。

基本的なワークフロー f:id:sanshonoki:20170520204228p:plain

学習用データの環境とアプリケーションの環境が異なるケースが増えてきている

学習環境とアプリケーション環境のデータセットの違いも考慮したワークフロー f:id:sanshonoki:20170520204239p:plain

人間の認識精度をリファレンスとすべき
リファレンスと学習結果の差を見て何にフォーカスするか判断できる

human-levelエラーとtrainエラーの差が大 trainエラーとdevエラーの差が大

Biasにフォーカス Varianceにフォーカス

human-levelエラーとtrainエラーの差が大	trainエラーとdevエラーの差が大
Biasにフォーカス	Varianceにフォーカス

AIアプリケーションとして有望なもの

Dirty workは進捗がなかなか実感できないので勇気づけられます。「No magic」ということなので愚直にやりましょうということですね。。