DeepSeek宣布开源DeepGEMM
2025-04-21 23:04:10 Source:a Classification: XM-MT5
XM外汇官网APP报道,宣布DeepSeek在开源周第三天推出了DeepGEMM。开源这是宣布XM外汇一个针对FP8通用矩阵乘法(GEMM)优化的库,具备细粒度缩放功能,开源如同DeepSeek-V3中提到的宣布。该库支持普通和混合专家(MoE)的开源GEMM,使用CUDA编写,宣布安装过程简便,开源无需编译,宣布所有内核在运行时通过轻量级的开源XM外汇即时编译(JIT)模块编译。FP8GEMM库专为V3/R1训练和推理提供支持。宣布
在开源周的开源第二天(2月25日),DeepSeek发布了DeepEP,宣布这是开源首个用于MoE模型训练和推理的开源EP通信库。其特点包括:高效的宣布全员通信;支持NVLink和RDMA;设有高吞吐量内核及低延迟解码内核;原生FP8调度支持;灵活的GPU资源控制以实现计算与通信的重叠。
DeepSeek于2月24日启动了“开源周”,首次发布了代码库FlashMLA。早在2月21日,DeepSeek在社交平台上宣布,成立了一个探索AGI(通用人工智能)的小团队,计划开源5个代码库,并以完全透明的方式分享研究进展。