一名AI算法工程师,热爱生成式模型和具身智能.
费曼学习法的基本原则。
人生必须有个足够强大且恒定的动力。
本文将从上篇文章理解EM算法出发,继续推导出$VAE$算法。
$EM$算法是1977年发明的,但是到今天,想要透彻理解并不容易。到底什么是隐变量?$Q$函数到底是怎么回事?作者怎么想到$Jessen$不等式来证明的?有没有一种简单直观的理解方式?本文试图解答。
记录一下MinerU核心代码阅读时的一些笔记。
最近使用paddleocr框架训练一个识别模型,方式是蒸馏svtrv2。训练完成后,想进一步实验一下添加center loss,对识别形近字的提升效果。 第一步就是要导出center,官方文档中只有简单的ocrv2的center导出。没有蒸馏模型,多head的情况下的导出。把自己的解决方案记录下来。
Triton server如何实现模型的加解密,这对私有部署模型,担心模型权重泄露的场景很有价值。本文记录笔者实现这一目标的过程。 先定义一个最简单的加解密方案。加密就是在onnx模型文件的开头添加一个字节00000000,解密就是去掉这个字节。 因为只是想跑通流程,这个加解密方案已经可以满足目的了。
原始文档链接:cmakelist-cheatsheet