Tokens - 搜索 News

3 小时

文心4.5通过引入MoE架构，根据不同模态建立专家模型，并设计自适应模态感知的损失函数，动态调整不同模态的权重（降低过高模态的权重，提高过低模态的权重），从而解决不均衡问题，提升多模态融合能力。

3 小时

NVIDIA创下DeepSeek推理速度新纪录：每秒高达30,000 Tokens！

在2025年的GTC大会上，NVIDIA宣布了一项重磅创新：其搭载8颗Blackwell GPU的DGX系统在DeepSeek-R1模型（6710亿参数）的推理任务中取得了突破性进展！单用户推理速度惊人地超过每秒250个token，而峰值吞吐量更是突破了每秒30,000个token，标志着AI推理性能的全新高峰。

10 小时on MSN

地表最贵 AI 模型：OpenAI 推出 o1-pro API，每百万 tokens 输入 150 / 输出 ...

IT之家 3 月 20 日消息，OpenAI 昨日（3 月 19 日）在 X 平台发布推文，宣布通过开发者 API，正式推出 o1 系列升级版“o1-pro” ，宣称其通过更高计算资源投入实现“更一致且优质的回应”。

金融界财经 on MSN3 小时

NVIDIA突破DeepSeek推理性能记录：每秒3万Tokens！

NVIDIA在2025 GTC大会上宣布了重大突破 - 搭载8颗Blackwell GPU的DGX系统在DeepSeek-R1模型(6710亿参数)推理任务中创下世界纪录: ·单用户推理速度超过每秒250个token ...

腾讯网12 天

NeoBERT：4096 tokens上下文窗口，参数更少但性能翻倍

点击上方“Deephub Imba”,关注公众号,好文章不错过 ...

11 天on MSN

国家超算互联网平台：上线阿里模型，100 万 Tokens 免费

【国家超算互联网平台 QwQ-32B API 接口服务上线，免费提供 100 万 Tokens】国家超算互联网平台于 3 月 8 日晚透露，本周上线了阿里巴巴开源推理模型 QwQ-32B API 接口服务，用户能够获取免费的 100 万 Tokens ...

16 天

标点符号成大模型训练神器！KV缓存狂减一半，可处理400万Tokens长 ...

最近，DeepSeek的NSA与月之暗面的MoBA让稀疏注意力机制受到了较大的关注，相较于上述工作采用固定token数来划分压缩区间，SepLLM根据原生语义来划分动态数量的token数。

新浪网11 天

国家超算互联网平台 QwQ-32B API 接口服务上线，免费提供 100 万 Tokens

IT之家 3 月 9 日消息，国家超算互联网平台昨日晚宣布本周上线阿里巴巴开源推理模型 QwQ-32B API 接口服务，用户可获得免费 100 万 Tokens。 QwQ-32B 是阿里 Qwen 团队最新发布的推理模型，基于 ...

1 天on MSN

黄仁勋 2 个半小时演讲，英伟达已经进入「Agentic AI」时代

「AI 届春晚」过去以来一直是 GTC 的外号之一，但在 GTC 2025 的开幕主题演讲中，这个梗被英伟达创始人、爱穿皮衣的老黄「偷了」。「我觉得 GTC 已经变成了 AI 界的超级碗」黄仁勋这样介绍 GTC 的盛况。「但在这里，AI 会让我们每个人都成为赢家」。在 GTC，没有输家好吗｜图片来源：英伟达但面对近期股价的数次暴跌，尤其是以 ...

财联社 on MSN11 天

国家超算互联网QwQ-32B API接口服务上线免费100万Tokens

【国家超算互联网QwQ-32B API接口服务上线免费100万Tokens】财联社3月9日电，本周，国家超算互联网平台上线阿里巴巴开源推理模型QwQ-32B ...

腾讯网15 天

华为杨超斌：2030年tokens消耗带动的流量，将超过当前移动互联网接入 ...

每经AI快讯，在MWC25巴塞罗那期间举办的产品与解决方案发布会上，华为董事、ICT BG CEO杨超斌发布了以AI为中心网络解决方案（AI-Centric ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果