Wesleya
@wesleya
DeepSeek 宣布开源 DeepGEMM ChainCatcher消息,Deepseek于开源周第三天宣布开源DeepGEMM。DeepGEMM是一个专为简洁高效的FP8通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如DeepSeek-V3中所提出。它支持普通和混合专家(MoE)分组的GEMM。 该库采用CUDA编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。FP8GEMM库,为V3/R1训练和推理提供支持。
0 reply
0 recast
0 reaction