欢迎来到 - 文举的博客

paddleocr蒸馏模型的center导出
2024-08-27

最近使用paddleocr框架训练一个识别模型，方式是蒸馏svtrv2。训练完成后，想进一步实验一下添加center loss，对识别形近字的提升效果。第一步就是要导出center，官方文档中只有简单的ocrv2的center导出。没有蒸馏模型，多head的情况下的导出。把自己的解决方案记录下来。

triton server 模型的加解密
2024-05-09

Triton server如何实现模型的加解密，这对私有部署模型，担心模型权重泄露的场景很有价值。本文记录笔者实现这一目标的过程。先定义一个最简单的加解密方案。加密就是在onnx模型文件的开头添加一个字节00000000，解密就是去掉这个字节。因为只是想跑通流程，这个加解密方案已经可以满足目的了。

离线安装ubuntu操作系统和nvidia-driver
2023-09-22

记录一下安装过程中遇到的问题。

gpt2 tokenizer源码解析
2023-01-10

上一篇文章中，分析了bert的tokenizer的细节，本篇继续分析gpt2的tokenizer的细节。 bpe的基本原理可以参考这篇文章：https://huggingface.co/course/chapter6/5?fw=pt

bert tokenizer源码解析
2023-01-05

做序列标注时，label和token之间的对应关系至关重要。但是大多数tokenizer都会对原始的字符序列做一定的修改，这对保持token和label之间的对应关系造成了一定的影响。因此，有必要对tokenizer的细节行为有一个清楚的认识。本文以bert tokenzier为例说明里面的细节。

2023年，训练模型时，使用DDP成为标准的炼丹师技能。DDP本身呢是依赖torch.distributed提供的进程间通信能力。所以，理解torch.distributed提供的进程间通信的原理，对理解DDP的运行机制有很大的帮助。官方的tutorial中，实现了依靠torch.distributed实现DDP功能的demo代码，学习一下，很有裨益。本文将会分成两部分，首先介绍torch.distributed提供的基本功能。然后介绍用torch.distributed实现demo版的DDP。

Hi! 我是李文举.

paddleocr蒸馏模型的center导出
2024-08-27

阅读全文 »

triton server 模型的加解密
2024-05-09

阅读全文 »

cmakelist速查手册
2024-04-09

阅读全文 »

deepspeed快速上手教程
2023-09-27

阅读全文 »

离线安装ubuntu操作系统和nvidia-driver
2023-09-22

阅读全文 »

gpt2 tokenizer源码解析
2023-01-10

阅读全文 »

bert tokenizer源码解析
2023-01-05

阅读全文 »

pytorch进程间通信
2022-12-31

阅读全文 »

栏目分类

最新文章

相关链接

Hi! 我是李文举.

paddleocr蒸馏模型的center导出 2024-08-27

triton server 模型的加解密 2024-05-09

cmakelist速查手册 2024-04-09

deepspeed快速上手教程 2023-09-27

离线安装ubuntu操作系统和nvidia-driver 2023-09-22

gpt2 tokenizer源码解析 2023-01-10

bert tokenizer源码解析 2023-01-05

pytorch进程间通信 2022-12-31

栏目分类

最新文章

相关链接

paddleocr蒸馏模型的center导出
2024-08-27

triton server 模型的加解密
2024-05-09

cmakelist速查手册
2024-04-09

deepspeed快速上手教程
2023-09-27

离线安装ubuntu操作系统和nvidia-driver
2023-09-22

gpt2 tokenizer源码解析
2023-01-10

bert tokenizer源码解析
2023-01-05

pytorch进程间通信
2022-12-31