ディープラーニング学習メモ #2 行列の積

UdacityのDeepLearning基礎コース、Week3以降は週5-6時間程度でレッスンコンテンツは一通りはこなせています。ただ、後でしっかり復習しないと身につかない感じはあります。。そりゃそうですよね、、世の中そんなに甘くない。(;^_^A

今日は行列の積についてメモを残します。

学校の授業で習ったいわゆる行列の掛け算はdot演算と呼ばれるものになります。

f:id:sanshonoki:20170301050110p:plain:w400

elementwise演算は単純に要素同士を掛け算するだけです。

f:id:sanshonoki:20170301050124p:plain:w400

numpyにはブロードキャストという仕組みがあるので列数と行数が一致していなくても演算可能になっています。ここが混乱しどころです。これは numpyが演算するときにサイズを変換してくれるためです。

ブロードキャストできるかどうか? Broadcasting — NumPy v1.12 Manual

okのパターンでは (m, n)の行列が出力されます。

ディープラーニングで出てくる計算の中で2種類の掛け算をどう使い分けるのか、、、

ざっくりまとめてみました。

*演算	dot演算
1つのノード内での計算（シグモイドの微分計算etc）	複数ノード間の計算（重みWとベクトルとの計算）
例1: シグモイドの微分 $\sigma'(h) = \sigma(h) * (1 - \sigma(h))$ 例2: 入力誤差の伝搬 $(\delta W^{T}) * \sigma'(h)$	例1: 順伝搬 ${Wx}$ 例2: 入力誤差の計算 $\delta W^{T}$ 例3: 誤差から ${\Delta W}$ を計算 $\delta x^{T}$