int8 - 搜索 News

11 天

美团DeepSeek R1模型INT8量化版发布，老显卡也能畅享高效推理

近日，美团技术团队宣布了一项重大突破，成功将DeepSeek R1模型进行了INT8精度量化，这一技术升级不仅拓宽了模型的应用场景，也为广大开发者和企业带来了全新的可能性。在此之前，DeepSeek ...

12 天

美团开源INT8无损量化DeepSeek R1，A100性能提升50%，AI优化新标杆诞生

Deepseek问世以后，越来越多的人开始担心自己会不会被AI替代。但真正清醒的突围者早已发现，与其恐惧被AI替代，不如让AI成为生产力杠杆。

12 天

老显卡也能满血复活！美团首发INT8无损DeepSeek R1模型

在3月8日【妇女节】的特别日子里，美团为科技界带来一次精彩的发布会，宣布了对行业老显卡的一项重大利好——INT8无损满血版DeepSeek R1模型。该模型原生权重采用FP8格式，专为最新的NVIDIA GPU设计，但美团技术团队经过努力，成功实现了INT8精度量化，解锁了包括A100在内的老型号GPU的支持。

中国IDC圈2 小时

这10+国产算力集群已部署DeepSeek

简介： 2025年2月14日，无锡太湖亿芯智算中心上线基于燧原科技第三代推理卡S60的DeepSeek全系列开源模型推理服务。中心部署83台智算服务器和332台燧原POD一体机，单卡算力达200 ...

12 天

老显卡也能用！美团开源首发INT8无损满血版DeepSeek R1

据介绍，DeepSeek R1发布以后不少企业和个人都在尝试部署满血版本，但原生版本的模型权重为FP8数据格式，对GPU芯片类型有严格限制，仅能被英伟达新型GPU支持（如Ada、Hopper架构芯片），其他型号GPU（如A100）无法直接部署。

12 天on MSN

美团开源INT8无损量化DeepSeek R1，A100性能提升50%

近期，美团搜推机器学习团队宣布了一项开源新进展，成功实现了对DeepSeek R1模型的无损INT8精度量化。这一成果在3月4日正式对外公布，标志着美团在深度学习模型优化方面取得了重要突破。

12 天

美团开源首发INT8满血版DeepSeek R1!老显卡也能用

DeepSeek R1 原生版本的模型权重为 FP8 数据格式，对 GPU 芯片类型有严格限制，仅能被英伟达新型 GPU 支持（如 Ada、Hopper 架构芯片），其他型号 GPU（如 A100）无法直接部署。目前，量化代码已经合入到了开源 LLM 推理框架 SGLang，量化模型已经发布到了 Hugging Face 社区，方便用户使用。官方测试，满血版 DeepSeek R1 部署 ...

12 天on MSN

美团INT8量化技术：老型号GPU也能满血运行DeepSeek R1

近期，美团技术团队传来新进展，他们成功对DeepSeek R1模型实施了INT8精度量化处理，此举意味着该模型将不再受限于特定型号的GPU，能够在更多设备上实现高效部署。自DeepSeek R1发布以来，众多企业和个人用户纷纷尝试部署其满血版本。然而，该模型原生版本的 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果