资讯

9 月 12 日,淘天集团联合爱橙科技正式对外开源大模型训练框架 ——Megatron-LLaMA,旨在让技术开发者们能够更方便的提升大语言模型训练性能 ...
ROCm 6.4.0版主要有以下重要改进: 1、在Megatron-LM框架中添加了对几种新内核支持,Megatron-LM框架是Megatron-LM的特殊分支,旨在AMD GPU上实现高效训练大 ...