Tokens - 搜索 News

3 小时

文心4.5通过引入MoE架构，根据不同模态建立专家模型，并设计自适应模态感知的损失函数，动态调整不同模态的权重（降低过高模态的权重，提高过低模态的权重），从而解决不均衡问题，提升多模态融合能力。

3 小时

NVIDIA创下DeepSeek推理速度新纪录：每秒高达30,000 Tokens！

在2025年的GTC大会上，NVIDIA宣布了一项重磅创新：其搭载8颗Blackwell GPU的DGX系统在DeepSeek-R1模型（6710亿参数）的推理任务中取得了突破性进展！单用户推理速度惊人地超过每秒250个token，而峰值吞吐量更是突破了每秒30,000个token，标志着AI推理性能的全新高峰。

10 小时on MSN

地表最贵 AI 模型：OpenAI 推出 o1-pro API，每百万 tokens 输入 150 / 输出 ...

IT之家 3 月 20 日消息，OpenAI 昨日（3 月 19 日）在 X 平台发布推文，宣布通过开发者 API，正式推出 o1 系列升级版“o1-pro” ，宣称其通过更高计算资源投入实现“更一致且优质的回应”。

金融界财经 on MSN3 小时

NVIDIA突破DeepSeek推理性能记录：每秒3万Tokens！

NVIDIA在2025 GTC大会上宣布了重大突破 - 搭载8颗Blackwell GPU的DGX系统在DeepSeek-R1模型(6710亿参数)推理任务中创下世界纪录: ·单用户推理速度超过每秒250个token ...

1 天on MSN

黄仁勋 2 个半小时演讲，英伟达已经进入「Agentic AI」时代

「AI 届春晚」过去以来一直是 GTC 的外号之一，但在 GTC 2025 的开幕主题演讲中，这个梗被英伟达创始人、爱穿皮衣的老黄「偷了」。「我觉得 GTC 已经变成了 AI 界的超级碗」黄仁勋这样介绍 GTC 的盛况。「但在这里，AI 会让我们每个人都成为赢家」。在 GTC，没有输家好吗｜图片来源：英伟达但面对近期股价的数次暴跌，尤其是以 DeepSeek-R1 为代表的、对业内「我们真 ...

商业新知 on MSN4 小时

从沈抖到谢广军，百度智能云何时“云开月明”？

文：互联网江湖作者：刘致呈春回大地万物复苏之时，百度智能云却迎来“多事之秋”。先是业务一把手沈抖向友商“开炮”。

IB资讯2 天

QwQ-32B大模型登陆国家超算平台，免费体验百万Tokens等你来拿！

为了进一步推广新用户，平台特别推出了新用户活动：凡注册用户均可获得100万Tokens的免费使用权，这无疑为更多用户提供了尝试和体验的机会。 QwQ-32B模型由阿里Qwen团队倾力打造，它基于Qwen2.5-32B与强化学习技术的结合，展现出强大的推理能力。在官方公布的 ...

中时新闻网3 天

提前对用户完全免费百度发布文心大模型4.5及X1

目前，两款模型均已在文心一言官网上线，用户登录即可免费体验。同时，企业及开发者可在百度智慧云千帆大模型平台叫用新模型，文心大模型4.5已同步上线，输入价格为0.004元（人民币，下同）/千tokens，输出0.016元/千tokens，约为GPT4.

23 小时

CBN丨Lisa Su vs. Jensen Huang: The epic AI chip battle heating up

On Tuesday, ahead of Huang’s keynote address, "Queen of AI Semiconductors" Lisa Su made a bold move in Beijing. Su revealed ...

腾讯网1 天

火山引擎推出大模型应用防火墙

3月19日，火山引擎官微宣布推出大模型应用防火墙。据介绍，大模型应用防火墙能够有效抵御算力DDoS攻击，消除发生率约30%的恶意tokens消耗风险；通过防范提示词注入攻击，使敏感数据泄露事件发生率降低70%；降低模型滥用、幻觉、回复不准确的发生率90%以上；严格满足输入输出合规要求，将不良信息输出率控制在5%以内。

中华网财经频道2 天

OpenAI打小报告，要求禁用DeepSeek

韩国国防部宣布，已禁止DeepSeek访问其联网军用电脑；韩国教育部在全国教育系统内禁用了我国的DeepSeek模型，从小学一路延伸到大学，只要跟教育沾边的必须得全面执行。

2 天

法国人工智能初创公司Mistral AI发布了其最新的开源模型Mistral Small3.1。这家公司宣称，这款仅有 240亿参数的“迷你”模型，其性能表现竟然能够匹敌甚至超越谷歌和OpenAI等美国科技巨头的同类产品。这无疑给目前由美国主导的AI市场注入了一剂强心针，预示着竞争将更加激烈。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果