30000个tokens每秒,太炸裂了! 刚刚,英伟达在2025GTC大会上宣布了创世界纪录的满血 DeepSeek-R1 推理性能。 DGX系统搭载八颗NVIDIA Blackwell GPU,在DeepSeek-R1模型(6710亿参数)推理任务中创下了世界纪录↓ 单用户推理速度超过每秒250个token,峰值吞吐量超过每秒30000个token。 这一突破性的性能提升,得益于针对NVIDIA ...
3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。 据介绍,在搭载了八块 Blackwell GPU 的单个 ...
近期 Nvidia 的股价遭受重创,但在人工智能 (AI) 硬件市场中仍然占据主导地位。在公司最新发布的 AI 数据平台中,"主动式 AI" 和"推理"成为最新的热门词汇,各大存储供应商也纷纷追随其后。
运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU 单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU) 测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发 计算精度:B200 采用 FP4,H200 采用 ...
英伟达承诺,随着Blackwell Ultra GPU和Blackwell GPU不断进化,NVIDIA平台将在推理性能的道路上勇往直前。而这种进步不仅限于硬件的迭代,还涉及到软件的全面优化。自2025年1月以来,英伟达通过结合硬件与软件的优势,成功将DeepSeek-R1671B模型的吞吐量提升了惊人的36倍。
IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。 据介绍,在搭载了八块 Blackwell GPU ...
运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU 单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU) 测试参数:最新测试采用 TensorRT-LLM 内部版本 ...
今天推出了搭载 NVIDIA Grace Blackwell 平台的 NVIDIA DGX个人 AI 超级计算机。 DGX Spark(原名 Project DIGITS)和 DGX Station(一款由 NVIDIA Blackwell Ultra 平台驱动的 ...
英伟达在NVIDIA GTC 2025大会上宣布,其最新推出的NVIDIA Blackwell DGX系统在DeepSeek-R1大模型推理性能上创造了世界纪录。这一突破性进展标志着英伟达在人工智能推理技术上的又一次飞跃。
在刚刚过去的Nvidia GTC 2025大会上,尽管股价遭遇重创,Nvidia依然站稳了人工智能 (AI)硬件市场的头把交椅。此次大会的核心亮点是推出全新的AI数据平台,其中“主动式AI”和“推理”成为热议关键词,各大存储厂商纷纷效仿,试图乘上这班快车。
Peak:AIO's storage servers will offer Scan customers with Peak's GPUDirect NVMe-oF, which is designed for seamless data ...
黄仁勋表示,借助这些新的DGX个人AI计算机,AI可以从云服务扩展到桌面和边缘应用程序。 当地时间3月19日,NVIDIA英伟达推出了搭载NVIDIA Grace Blackwell ...