我们也可以很容易地计算这个模型的下界(10.3)。在实际应用中,能够在重新估计期间监视模型的下界是很有用的,这可以用来检测是否收敛。它也可以为解的数学表达式和它们的软件执行提供一个有价值的检查,因为在迭代重新估计的每个步骤中,这个下界的值应该不会减小。我们可以进一步地使用变分下界检查更新方程的数学推导和它们的软件执行的正确性,方法是使用有限差来检查每次更新确实给出了下界的一个(具有限制条件的)极大值(Svensen and Bishop, 2004)。
对于高斯分布的变分混合,下界(10.3)为
其中,为了保持记号简洁,我们省略了$$ q
$$
\begin{eqnarray}
\mathbb{E}[\ln p(X|Z,\mu,\Lambda)] &=& \frac{1}{2}\sum\limits_{k=1}^KN_k\Bigg{\ln\tilde{\Lambda}k - D\beta_k^{-1} - v_k Tr(S_kW_k) \
& & - v_k(\bar{x}k - m_k)^TW_k(\bar{x}k - m_k) - D\ln(2\pi)\Bigg} \tag{10.71} \
\mathbb{E}[\ln p(Z|\pi)] &=& \sum\limits{n=1}^N\sum\limits{k=1}^Kr{nk}\ln\bar{\pi}k \tag{10.72} \
\mathbb{E}[\ln p(\pi)] &=& \ln C()\alpha_0) + (\alpha_0 - 1)\sum\limits{k=1}^K\ln\tilde{\pi}k \tag{10.73} \
\mathbb{E}[\ln p(\mu,\Lambda) &=& \frac{1}{2}\sum\limits{k=1}^K\Bigg{D\ln\left(\frac{\beta_0}{2\pi}\right) + \ln\tilde{\Lambda}k - \frac{D\beta_0}{\beta_k} \
& & -\beta_0v_0(m_k - m_0)^TW_k(m_k - m_0)\Bigg} + K\ln B(W_0,v_0) \
& & +\frac{v_0 - D - 1}{2}\sum\limits{k=1}^K\ln\tilde{\Lambda}k - \frac{1}{2}\sum\limits{k=1}{K}v_k Tr(W_0^{-1}W_k) \tag{10.74} \
\mathbb{E}[\ln q(Z)] &=& \sum\limits_{n=1}^N\sum\limits_{k=1}^Kr_{nk}\ln r_{nk} \tag{10.75} \
\mathbb{E}[\ln q(\pi)] &=& \sum\limits_{k=1}^K(\alpha_k - 1)\ln\tilde{\pi}k + \ln C(\alpha) \tag{10.76} \
\mathbb{E}[\ln q(\mu,\Lambda)] &=& \sum\limits{k=1}^K\left{\frac{1}{2}\ln\tilde{\lambda}_k + \frac{D}{2}\ln\left(\frac{\beta_k}{2\pi}\right) - \frac{D}{2} - H[q(\Lambda_k)]\right} \tag{10.77}
\end{eqnarray}
$$
其中$$ D
最后,值得注意的一点是,下界提供了另一种推导变分重估计方程的方法(变分重估计方程在10.2.1节已经得到)。为了说明这一点,我们使用下面的事实:由于模型有共轭先验,因此变分后验分布(即$$ Z