DeCode - 搜索 News

1 天

【新智元导读】老黄GTC重点展示的PD分离技术为何成兵家必争之地？UCSD全华人团队力作，创新性地提出预填充-解码分离技术。在严格的延迟约束下，相比现有最先进的服务系统，可实现高达4.48倍的有效产出率或10.2倍更严格的SLO达成率。

1 天

在人工智能领域，大模型技术的飞速发展广受瞩目，成为了推动产业创新的重要动力。华为最近推出的昇腾大EP方案，为大模型应用提供了强大的算力支持，吸引了广泛的行业关注。业内专家指出，当前大模型的发展呈现出两条明确的路径：一家是科技巨头们积极探索技术极限、需求不断升高；另一条则是以DeepSeek为首的工程创新路径。它的出现大大降低了行业的门槛，使得大模型训练变得更为简便。如此一来，从前的专家团队模式正向 ...

腾讯网3 天

比亚迪夏的惨淡开局，都怪“智驾平权”和友商？

过去两年，比亚迪接连用“冠军版”和“荣耀版”主导国内车市内卷，一度让车企一把手在公开场合真情流露，表示“这样卷下去不是办法”。

腾讯网8 天

联想车计算，还在蛰伏期

2022年5月，联想研究院成立了车计算实验室。同年11月，联想在Tech World首次公布“车计算”战略布局，时任联想集团首席技术官、高级副总裁的芮勇再次定调，“联想集团不造车，联想要做的是车计算。” ...

腾讯网8 天

EP架构：DeepSeek突破性实践背后，分布式推理的终极形态之争

作者 | PPIO 派欧云推理加速团队DeepSeek MoE 架构采用跨节点专家并行（EP）架构，当 DeepSeek MoE 以 EP320 架构在解码阶段实现惊人的批处理规模时，整个 AI ...

知乎 on MSN14 天

DeepSeek 和尤洋对模型服务成本的测算方式差别在哪里？对 AI 产业有 ...

尤洋到底错在哪？这个问题下面有效信息实在是太少，都在人身攻击、拉踩这一套。实际上真正要解决的一个问题，那就是尤洋的测算也有理有据，到底错在了哪里呢。涉及到核心细节，他们就好像觉得幻方有什么魔法一样，用一个简单的优化二字一笔带过。其实尤洋认为Deepseek很多云服务商会亏损，是犯了一个核心错误，那就是最低运行硬件要求 ≠ 平均下来单卡效率最高的硬件。

腾讯网15 天

家家都有DeepSeek服务，如何谎称速度快？

不是人人都有“钞能力”，我们的故事，从用单节点方案部署DeepSeek-R1开始。为什么是单节点呢？因为H200单卡有140GB显存，可用单节点（8卡）方案部署。而H800和HI00显存80GB，需要双节点方案。有卡了，就可以来玩DeepSeek。世界是场游戏，是游戏就有作弊的玩家。怎么作弊呢？等下说，先看看芯片厂商AMD的官网技术博客。网址 ...

来自MSN16 天

2.0版价格战，智驾平权让比亚迪又赚麻了

过去4年，比亚迪通过三轮价格战，基本锁定了中低端市场的王者title。去年427万辆年销量中，20万以下车型贡献了8成。但进入2025年，比亚迪却借两场发布会悄悄改变了群众路线：新年第一场产品发布会，王朝系列新IP、24.98万起售的MPV夏，正式进军20万+价格带 ...

IT之家18 天

官方详解 DeepSeek-V3 / R1 推理系统：理论利润率达 545%

DeepSeek 采用多机多卡间的专家并行策略来达到以下目的： Prefill：路由专家 EP32、MLA 和共享专家 DP32，一个部署单元是 4 节点，32 个冗余路由专家，每张卡 9 个路由专家和 1 个共享专家 Decode：路由专家 EP144、MLA 和共享专家 DP144，一个部署单元是 18 节点，32 个冗余 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果