在全球计算机存储领域的顶级会议——第23届USENIX文件与存储技术会议(FAST)上,中国团队月之暗面与清华大学的研究成果引起了广泛关注。他们提出的Mooncake系统凭借其在处理效率上的显著提升,一举夺得埃里克·里德尔最佳论文奖。这一成就不仅展示了中国在人工智能领域的技术进步,也为中国在面对美国芯片禁令的情况下,减少对进口高端芯片的依赖提供了强有力的依据。
【文/观察者网 熊超然】上个月,全球计算机存储领域的顶级学术会议——第23届USENIX文件与存储技术会议(USENIX Conference on File and Storage ...
今天的GTC大会上,黄仁勋拿出了全新的Blackwell Ultra ...
黄仁勋说,如果你有1000块GPU在跑AI推理,过去可能只有一半的算力真正被用上,剩下的要么在等待,要么就是因为任务分配不均,效率打折。但用了Dynamo之后,每一块GPU都会被充分利用,提高推理效率。
在当地时间3月18日召开的GTC大会上,黄仁勋拿出了全新的Blackwell Ultra GPU,以及在此基础上衍生的应用于推理、Agent的服务器SKU,也包括基于Blackwell架构的RTX全家桶,这一切都与算力有关,但 ...
DeepSeek挑起的模型价格战,冲击了市场对英伟达的信仰。黄仁勋的公开回击是,一边向DeepSeek、月之暗面与字节跳动等中国企业致敬,一边将其开源的优化思路,封装在自己的Dynamo中,促进创新的民主化。黄仁勋将Dynamo称为AI工厂的操作系统 ...
2月26日,据计算机存储领域顶会FAST2025,Kimi与清华大学联合参与的项目论文《Mooncake: Trading More Storage for Less Computation-A KVCache-centric Architecture for Serving LLM Chatbot》获得最佳论文奖。Mooncake是月之暗面Kimi的底层推理服务平台。
Kimi与清华大学合作研发的Mooncake项目技术报告获得计算机存储领域顶会FAST 2025最佳论文奖。 2月26日,Kimi与清华大学合作研发的Mooncake项目技术报告 ...
据月之暗面消息,2月26日,Kimi与清华大学合作研发的Mooncake项目技术报告获得计算机存储领域顶会FAST 2025最佳论文奖。Mooncake是月之暗面Kimi的底层推理服务平台,核心是其以KVCache为中心的全局缓存和调度器,旨在在严格的延迟相关服务级别目标(SLOs)下最大化吞吐量。
2月26日,全球计算机存储领域的顶会FAST2025上,Kimi公司与清华大学合作的项目论文《Mooncake:Trading More Storage for Less Computation—AKV Cache-centric Architecture ...