Professional Documents
Culture Documents
PRML 5.2.1,5.2.2section
PRML 5.2.1,5.2.2section
PRML 5.2.1,5.2.2section
2節
5.2.1パラメータ最適化(1)
• 誤差関数E(w)を最小化する重み
ベクトルwを探す
• この場合、誤差関数の幾何的な
イメージをつくのは役に立つ
• 重み空間において、 w → w + ±w
場合、誤差関数値は ±E ≃ ±wT ∇E(w)
程度変化する。ベクトル ∇E(w) は 図5.5 E(w)は重み空間
にある曲面である。wA
誤差関数が最速に増加する方向 は極小値、wBは最小値。
任意の点wcにおいて、
を指している 曲面の局所勾配を
とする ∇E(w)
5.2.1パラメータ最適化(2)
• 誤差関数E(w)はwに関する連続関
数であるため、その最小値は重み空
間の中の誤差関数の勾配が消える
点のところ発生する。つまり以下の
式(5.26)が成り立つ。
∇E(w) = 0 (5.26)
その中ヘッセ行列は点 において計算される。
w ⋆
局所二次近似(3)
• 幾何的な解釈をするため、ヘッセ行列の固有
式を考える。
Hui = λi ui (5.33)
その中固有ベクトルは正規直交セットを生成
するため、つまり式(5.34)が成り立つ。
uTi uj = ±
ij (5.34)
• 式(5.35)を座標系変換と見ることが出来る。
詳しくは付録Cに参照
– 原点が w⋆ に移動され
– 軸の方向は固有ベクトルの方向になる
• 式(5.35)を式(5.32)に代入し、式(5.33),(5.34)を
利用して、誤差関数を式(5.36)のように書くこ
とができる
1
⋆
E(w) = E(w ) + λi α2i (5.36)
2 i
局所二次近似(5)
• 行列Hは正定値である場合、任意のベクトルv
について、以下の式のみが成り立つ
vT Hv > 0 (5.37)
• 固有ベクトル{ui}は完全セットになるため、任
意のベクトルvを式(5.38)のように書くことがで
きる
v= ci ui (5.38)
i
局所二次近似(6)
Hui = λi ui (5.33)
uTi uj = ±
ij (5.34)
• 式(5.33),(5.34)から、式(5.39)を導きことができ
る
T
v Hv = c2i λi (5.39)
i
• もしHは正定値であれば、固有値はすべて正
でなければならない
局所二次近似(7)
• 新しい座標系(図5.6)の中に
– 基底ベクトルは固有ベクトル{ui}
– Eが同じ値をとるときの等高線は原点を
中心とする楕円である
• 一次元の重み空間の場合、停留点
は最小値点になるためには式(5.40)
が成立する必要がある。 図5.6最小値点 w⋆の周囲誤差関数
2
を二次形式で近似できる。
∂ E
2 >0 (5.40) 等高線は楕円で、その軸はヘッセ行列
∂w w⋆ の固有ベクトルである。
軸の長さは固有ベクトルのルート
の逆数に比例する
対してD次元の場合の条件は w⋆ 点で計算された
ヘッセ行列は正定値である