Negative Log-likelihood function Also not commutative like KL.posterior prior KL Divergence 를 minimize하는 건 log likelihood를 maximize하는 것과 같다Cross Entropy NotionAdditive Cross Entropy