score function estimator의 미분을 다시 한번 ∇θL로 표현해 나타내 보겠습니다.
∇θL=∇θEx[f(x;θ)]
=∇θ∑xp(x;θ)f(x;θ)
=∑x∇θ(p(x;θ)f(x;θ))
=∑x(∇θp(x;θ)f(x;θ)+p(x;θ)∇θf(x;θ))
=∑x(p(x;θ)f(x;θ)∇θlogp(x;θ)+p(x;θ)∇θf(x;θ))
=E[f(x;θ)∇θlogp(x;θ)+∇θf(x;θ))]
=E[g(x;θ)]
g(x;θ)는 Ex[f(x;θ)]의 gradient로 두가지 term으로 나타낼 수있습니다.
f(x;θ)∇θlog(p(x;θ))는 SF trick에 의해 만들어집니다.
∇θf(x;θ)는 가끔 f가 θ가 아닌x로 이루어졌기 때문에 종종 제외되는 경향을 보였습니다. 하지만, g 는 x와 θ 모두로 이루어졌기 때문에, 제외되지 않습니다.
여기서는 높은 차수의 L을 추정하기 위해 SL의 접근 방식으로 ∇θEx[g(x;θ)]에 적용하는데, 다음 장에서 이 같은 접근이 실패함을 보입니다.