HDFS - 搜索 News

6 小时

揭秘老黄演讲中关键技术：PD分离！UCSD华人团队力作，LLM吞吐量跃升4倍

前有Mooncake/DeepSeek等公司采用这种技术来优化大模型的推理服务，后有Nvidia/PyTorch基于该技术孵化下一代LLM服务系统。甚至最近，黄仁勋也在2025 GTC的舞台上提到了PD分离（Prefill-Decode ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果