IT之家 3 月 17 日消息,摩尔线程官方今日发文宣布, 已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架 。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库,在国产全功能 GPU 上实现混合并行训练和推理,提升了训练效率与稳定性。
他喜欢说自己是Megatron(威震天),只要把球丢给他,他都会搞定。他的防守能力很强,能制造防守回合,抢下篮板,然后迅速推进转换进攻。他在场上能防守、能组织,这对我们球队来说是一个巨大的提升。
目前,MT-DualPipe 可以完整接入摩尔线程 MT-Megatron 框架和 MT-TransformerEngine 框架(即将开源),实现 DeepSeek V3 训练流程完整复现。此外,MT-DualPipe 结合 MT-Megatron 可实现完整 DeepSeek V3 模型 MLP-FFN 分离以及 DW-DG 分离,进一步降低气泡占比,优化通信效率。同时 ...
比如,今天DeepEP上午开源,Nvidia这边下午就集成到了Megatron-LLM。据了解,老黄在NV内部把DeepSeek的支持重要性排到了Llama之前,成为了最重要的开源 ...