Hi! 我是李文举.

一名AI算法工程师,热爱生成式模型和具身智能.

FlashAttention解读

解读FlashAttention的原理和极简代码实现。

阅读全文 »

cuda矩阵乘法优化

cuda基本功,矩阵乘法优化。

阅读全文 »

矩阵求导没你想的那么难

机器学习的基本功,熟能生巧。

阅读全文 »

费曼学习法

费曼学习法的基本原则。

阅读全文 »

如何保持进步

人生必须有个足够强大且恒定的动力。

阅读全文 »

理解VAE算法

本文将从上篇文章理解EM算法出发,继续推导出$VAE$算法。

阅读全文 »

理解EM算法

$EM$算法是1977年发明的,但是到今天,想要透彻理解并不容易。到底什么是隐变量?$Q$函数到底是怎么回事?作者怎么想到$Jessen$不等式来证明的?有没有一种简单直观的理解方式?本文试图解答。

阅读全文 »

MinerU核心代码阅读笔记

Note:MinerU已经重构升级,本笔记可能过时,阅读时请注意。 记录一下MinerU核心代码阅读时的一些笔记。

阅读全文 »