IT之家 3 月 17 日消息,摩尔线程官方今日发文宣布,已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库,在国产全功能 GPU ...
IT之家 3 月 17 日消息,摩尔线程官方今日发文宣布, 已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架 。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库,在国产全功能 GPU 上实现混合并行训练和推理,提升了训练效率与稳定性。
欢迎围观“AI新榜”的「AI日报」栏目。AIGC前沿资讯,及时拿捏! 【1分钟速看版】 3月18日,在腾讯混元3D开源日活动中,腾讯混元宣布推出5个全新3D生成模型,在生成速度、细节和材质表达上均有提升,并且全部开源。 腾讯混元3D生成模型家族 同时 ...
据报道,字节跳动旗下豆包大模型团队近日宣布了一项关于混合专家架构的重要技术突破,并决定将这一成果开源,与全球AI社区共享。这一技术通过一系列创新方法,成功将大模型的训练效率提升了约1.7倍,同时显著降低了训练成本,降幅高达40%。开源不仅有助于加速行业技术发展能为更多研究者和开发者提供宝贵的资源,进一步推动人工智能技术的创新与应用。
戛纳短片金棕榈奖不仅是全球短片创作的最高荣誉之一,更是新人导演迈向国际舞台的重要跳板。对于初出茅庐的导演而言,获得这一奖项意味着他们的才华得到了世界顶级电影节的认可,为其后续的长片创作铺平了道路。
2025-2031全球与中国多圈旋转电位器市场竞争前景研究报告 +——+——+——+——+——+——+——+——+——+ 【市场人员】:张炜 【出版机构】:智信中科研究网 资料来源:更多资料请参考智信中科研究网发布内容!!! 【免费服务一年,定制报告,需求调研或专项课题需求,欢迎来电咨询 】 ...
1 月下旬,字节正式设立代号为“Seed Edge”的研究项目,目标是探索 AGI 的新方法,其中“Seed”是豆包大模型团队名称,Edge 代表最前沿的 AGI 探索。 该项目团队近日发布了其最新的研究成果:一项针对 MoE 架构的关键优化技术 ...
2012 年 ImageNet 竞赛中 AlexNet 的横空出世,开启了现代 AI 发展的新纪元。彼时我们不会想到,十年后支撑 AI 训练的 GPU 集群会从研究室里的几台服务器,发展成需要专门供电系统的万卡级计算矩阵。在这个算力爆发式增长的过程中,训练系统的稳定性管理正经历着从「简单运维」到「精密工程」的深刻变革。 2022 年之前的 AI 训练,更像是手工作坊式的精雕细琢。大多数训练任务只需 ...
5 天
人人都是产品经理 on MSN物流AI智能化现状总结与案例分析之京东言犀大模型与“京东物流超脑”本文将深入探讨中国供应链物流AI智能化的现状,聚焦多模态语言大模型、多智能体协作和具身智能等前沿技术,并通过对京东言犀大模型及其在物流领域的应用案例分析,揭示AI如何赋能物流行业,实现降本增效和创新发展。
摩尔线程依托深度学习框架Torch-MUSA(已开源)和MUSA软件栈全方位的兼容性,实现了对DualPipe这一算法的高效支持。MT-DualPipe可以完整接入摩尔线程MT-Megatron框架和MT-TransformerEngine框架(即将开源),实现DeepSeek V3训练流程的完整复现。 作为开源技术和人工智能社区发展的 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果