Exercise 11.2 - EM for mixture of Gaussians

Answers

We are to optimize the following target w.r.t. $𝜃$ :

\begin{align} Q (𝜃, 𝜃^{old}) = & 𝔼_{p (𝐳 | 𝒟, 𝜃^{old})} [\sum_{n = 1}^{N} \log p (𝐱_{n}, 𝐳_{n} | 𝜃)] \\ = & \sum_{n = 1}^{N} 𝔼_{p (𝐳 | 𝒟, 𝜃^{old})} [\log \prod_{k = 1}^{K} {(π_{k} \cdot p (𝐱_{n} | z_{k}, 𝜃))}^{z_{𝑛𝑘}}] \\ = & \sum_{n = 1}^{N} \sum_{k = 1}^{K} 𝔼_{p (𝐳 | 𝒟, 𝜃^{old})} [z_{𝑛𝑘} \cdot \log (π_{k} \cdot p (𝐱_{n} | z_{k}, 𝜃))] \\ = & \sum_{n = 1}^{N} \sum_{k = 1}^{K} 𝔼_{p (𝐳 | 𝒟, 𝜃^{old})} [z_{𝑛𝑘}] \cdot \log (π_{k} \cdot p (𝐱_{n} | z_{k}, 𝜃)) \\ = & \sum_{n = 1}^{N} \sum_{k = 1}^{K} r_{𝑛𝑘} \cdot \log (π_{k} \cdot p (𝐱_{n} | z_{k}, 𝜃)), \end{align}

where:

r_{𝑛𝑘} = p (z_{𝑛𝑘} = 1 | 𝐱_{n}, 𝜃^{old}) .

(Recall the graphical structure of GMM model. $𝐳_{n}$ is the one-hot variable that encodes the belonging of sample $𝐱_{n}$ to the centroids.) When the base distribution $p (𝐱 | 𝐳, 𝜃)$ is Gaussian, consider the terms involving $μ_{k}$ and $Σ_{k}$ in $Q (𝜃, 𝜃^{old})$ first (adopting non-information prior):

\begin{aligned} \sum_{n = 1}^{N} r_{𝑛𝑘} \cdot \log p (𝐱_{n} | z_{k} = 1, 𝜃) & = \sum_{n = 1}^{N} r_{𝑛𝑘} \cdot \log 𝒩 (𝐱_{n} | μ_{k}, σ_{k}^{2}) \\ = \sum_{n = 1}^{N} r_{𝑛𝑘} \cdot (C - \frac{1}{2} \log | Σ_{k} | - \frac{1}{2} {(𝐱_{n} - μ_{k})}^{T} Σ_{k}^{- 1} (𝐱_{n} - μ_{k})) \\ = L (μ_{k}, Σ_{k}) . \end{aligned}

Optimizing this target w.r.t. $μ_{k}$ and $Σ_{k}$ is tantamount to optimizing the mean and covariance of a weighted Gaussian model, hence:

\frac{\partial L}{\partial μ_{k}} = \sum_{n = 1}^{n} r_{𝑛𝑘} \cdot Σ^{- 1} (𝐱_{n} - μ_{k}) .

Setting it to zero yields:

μ_{k} = \frac{\sum_{n = 1}^{N} r_{𝑛𝑘} \cdot 𝐱_{n}}{\sum_{n = 1}^{N} r_{𝑛𝑘}} .

Finally:

\frac{\partial L}{\partial Λ_{k}} = \sum_{n = 1}^{N} r_{𝑛𝑘} (\frac{1}{2} Λ_{k}^{- 1} - \frac{1}{2} (𝐱 - μ_{k}) {(𝐱 - μ_{k})}^{T}),

where $Λ_{k} = Σ_{k}^{- 1}$ . Setting it to zero yields:

Σ_{k} = Λ_{k}^{- 1} = \frac{\sum_{n = 1}^{N} r_{𝑛𝑘} (𝐱 - μ_{k}) {(𝐱 - μ_{k})}^{T}}{\sum_{n = 1}^{N} r_{𝑛𝑘}} .

So far we have proven (11.114) and (11.115).

solour_lfq

2021-03-24 13:42

Exercise 11.2 - EM for mixture of Gaussians

Answers

Comments

Add answer