资讯

当前RT-Thread仓库中BSP和.git内容占比约90%,而RT-Thread核心代码及文档仅占约100MB,约为3%。为进一步优化用户体验,我们计划了 ...
在大规模分布式训练中,NCCL 的拓扑发现和建模是确保高效通信的核心机制,可以帮助建立硬件感知的通信优化,比如充分利用异构带宽,避免通信成为瓶颈,会直接影响训练的性能和扩展性。 如下图所示为 NCCL 初始化时拓扑相关的核心流程,主要负责系统拓扑 ...