收集那些看了之后直呼过瘾的资料。
深度学习中的Normalize
GEMM代码优化讲解
pytorch实现Transformer
pytorch源码解读系列
矩阵求导术
cuda 入门的正确姿势:how-to-optimize-gemm
transformer-xl和xlnet解读