Hi! 我是李文举.

一名AI算法工程师，热爱生成式模型和具身智能.

gpt2解码参数解析
2022-12-28

使用gpt2进行文本生成时，有几个参数可调，本文简要总结了一下这些个参数的作用。

阅读全文 »

NLP模型训练时数据预处理的教训
2022-06-18

一个比较难debug的问题。

阅读全文 »

python中那些让你想扇自己两耳光的错误
2022-06-07

总结一下python中超级低级的错误。

阅读全文 »

pytorch中的lr scheduler
2022-06-07

总结一下pytorch中lr scheduler的核心逻辑。

阅读全文 »

BLEU的计算
2022-06-06

介绍一下BLEU的计算原理。

阅读全文 »

pytorch有用的脚本片段和函数的积累
2022-05-10

积累日常工作中用到的pytorch脚本片段，以及一些强大但难以理解的函数的解释

阅读全文 »

文本tokenize方法总结
2022-05-10

如何将文本拆分成一个个的token，简要介绍几种主流的方法。 https://huggingface.co/docs/transformers/tokenizer_summary

对一个预训练模型来说，使用它时，只有用和训练时相同的tokenize方法时，模型的表现才能正常。

阅读全文 »

M1 mac 安装tensorflow
2022-04-26

记录一下，后续可能还要使用。

阅读全文 »

栏目分类

最新文章

相关链接

karpathy的博客神经网络的知识
谭升的博客主要是cuda，AI数学基础等
科学空间苏剑林博客，主要是自然语言处理
铁蕾的博客铁蕾的博客，主要是分布式系统，后端等
巩鹏的博客巩鹏，程序员必读书单作者
Nvidia Cuda官方博客 cuda最新进展
刘建平博客数学统计学，数据挖掘，机器学习，大数据平台，大数据平台应用开发，大数据可视化
唐巧的博客 iOS工程师，猿辅导工作
华校专的博客阿里资深算法工程师
pytorch官方的博客性能优化文章
jalammar的博客 illustrated transformer作者
colah的博客 rnn经典文章作者
uinio博客 latex速查手册
ezyang的博客 pytorch源码分享，核心作者
郭飞的笔记统计算法-NLP-CV
openai大佬lilian 扩散模型、视频生成
中科院博士令宇 VLM Vary作者
陈博远具身智能大佬
池正浩 VAE explained作者
Keller Jordan Muon优化器作者
keith TinyTorch作者