Batch - 搜索 News

13 天

AI大模型DeepSeek日前在知乎贴文《DeepSeek-V3 / R1 推理系统概览》，DeepSeek称，在最近的 24 小时里（北京时间 2025/02/27 12:00 至 2025/02/28 12:00），DeepSeek V3 和 ...

14 天

突然宣布！暂停DeepSeek API服务

就在DeepSeek披露大规模部署成本和收益之后，潞晨科技突然宣布：“尊敬的用户，潞晨云将在一周后停止提供DeepSeek API服务，请尽快用完您的余额。如果没用完，我们全额退款。 ” ...

腾讯网11 天

家家都有DeepSeek服务，如何谎称速度快？

不是人人都有“钞能力”，我们的故事，从用单节点方案部署DeepSeek-R1开始。为什么是单节点呢？因为H200单卡有140GB显存，可用单节点（8卡）方案部署。而H800和HI00显存80GB，需要双节点方案。有卡了，就可以来玩DeepSeek。世 ...

财富中文网15 小时

特朗普不再看重股市，美债变得更有吸引力

• 特朗普在其首个任期内或许曾视股市为政绩晴雨表，但如今这位总统及其经济团队官员似乎愿意承受短期经济阵痛，以重塑美国经济。这使得债券对投资者更具吸引力，他们可能会提高对美联储降息的预期。

腾讯网14 天

突然宣布！潞晨科技一周后暂停DeepSeek API服务

【导读】DeepSeek一天能赚多少钱？官方突然揭秘！潞晨科技暂停DeepSeek API服务中国基金报记者泰勒大家好，一起关注一下关于DeepSeek的最新消息！DeepSeek首次披露：理论成本利润率545%当市场以为DeepSeek的开源周内容发布完毕之后，3月1日，DeepSeek宣布了“One More ...

1 天

没有归一化层的Transformer！刘壮带队，何恺明、Yann LeCun都参与了

过去十年，归一化层已经巩固了其作为现代神经网络最基本组件之一的地位。这一切可以追溯到 2015 年批归一化（batch ...

来自MSN14 天

DeepSeek突袭公布成本利润率：545%

鱼羊编辑整理量子位 | 公众号 QbitAI 五连开源后，DeepSeek还有One More Thing！就在刚刚，DeepSeek官方亲自揭秘了DeepSeek-V3/R1推理系统。重点包括，优化吞吐量和延迟的方法： ...

中华网新闻频道8 天

1个人14天做出收入超1700万的游戏 AI助力创收奇迹

最近有个案例引起了广泛关注：一位名叫 Pieter Levels ...

腾讯网14 天

one more thing！DeepSeek王炸开源第六弹：全面揭秘V3/R1 推理系统秘密

本来以为DeepSeek开源周连续五天的开源项目已经结束了，万万没想到DeepSeek还有one more thing ，补了一个王炸开源项目第六弹：深度揭秘DeepSeek V3/R1 ...

14 天

DeepSeek 再次震惊全球：价格只有 OpenAI 1/25，利润率却超过 500%

敏锐的网友——如 MenloVentures 投资人 Deedy 翻译了这意味着什么：「理论 ARR 2 亿美金、利润率超过 500%，这样的商业效率理应是一家值 100 亿美金的公司。」从 2024 年 5 月发布 DeepSeekV2 以来，DeepSeek 模型服务就以「价格屠夫」示众，总是比行业其他模型便宜 1/10 左右，质疑 DeepSeek 亏本打价格战的声音也一直有。

知乎专栏 on MSN14 天

DeepSeek-V3 / R1 推理系统概览

DeepSeek-V3 / R1 推理系统的优化目标是：更大的吞吐，更低的延迟。为了实现这两个目标，我们的方案是使用大规模跨节点专家并行（Expert Parallelism / EP）。首先 EP 使得 batch size 大大增加，从而提高 GPU 矩阵乘法的效率，提高吞吐。其次 EP 使得专家分散在不同的 GPU 上，每个 GPU ...

IT之家14 天

官方详解 DeepSeek-V3 / R1 推理系统：理论利润率达 545%

IT之家 3 月 1 日消息，DeepSeek 官方今日在知乎发布《DeepSeek-V3 / R1 推理系统概览》一文，详细介绍如何使用大规模跨节点专家并行（Expert Parallelism / EP）来增大 batch size，如何隐藏传输的耗时，如何进行负载均衡。官方表示，DeepSeek-V3 / R1 推理系统的优化目标是更 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果