一名AI算法工程师,热爱生成式模型和具身智能.
什么是Bank Conflicts?如何解决这个问题?
解读FlashAttention的原理和极简代码实现。
cuda基本功,矩阵乘法优化。
机器学习的基本功,熟能生巧。
费曼学习法的基本原则。
人生必须有个足够强大且恒定的动力。
本文将从上篇文章理解EM算法出发,继续推导出$VAE$算法。
$EM$算法是1977年发明的,但是到今天,想要透彻理解并不容易。到底什么是隐变量?$Q$函数到底是怎么回事?作者怎么想到$Jessen$不等式来证明的?有没有一种简单直观的理解方式?本文试图解答。