32K - 搜索 News

1 小时

豆包发布大模型 1.5 Pro ，实测后我发现这个国产 AI 用最笨的方法干翻 ...

今天，字节跳动旗下的豆包大模型 1.5 Pro 模型正式亮相，不仅全面升级了模型的核心能力，也融合并进一步提升了多模态能力，在多项公开评测基准中也是全球领先水平。 Doubao-1.5-pro：多项基准测试综合得分优于 GPT-4o、Claude 3 ...

4 小时

原作者带队再次改造xLSTM，7B模型速度最快超Mamba 50%，权重代码全开源

具体来讲，xLSTM 7B 模型基于 DCLM 数据集，使用 128 块 H100 GPU，在 8192 上下文长度下训练了 2.3 万亿 token。研究者对原始 xLSTM 架构进行了改进，确保训练效率和稳定性，同时保持任务性能。新架构依靠 ...

腾讯网1 天

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理 ...

机器之心报道编辑：张倩多模态，性能超 GPT-4o Mini、Gemma 3，还能在单个 RTX 4090 上运行，这个小模型值得一试。小模型正在变得越来越好，而且越来越便宜。刚刚，法国 AI 创企 Mistral AI 开源了一个 24B ...

腾讯网6 天

TI全球最小MCU：国产芯片积极应战

近期TI发布的全球最小MCU刷屏，在惊叹强悍的同时不免联想到一些国产芯片原厂，列了一些有竞争力的产品，其它原厂待续。PART/1 最小MCUCH32V005D6U6是2*2mm的QFN12封装，体积比TI的大，但32K ...

DOIT1 天

重磅！国产AI卷疯了，QwQ-32B登顶全球最强开源模型！全球大模型格局 ...

阿里巴巴最新开源的推理模型通义千问QwQ-32B以综合评分92.3分位列全球第五，超越OpenAI-GPT-4.5preview（91.8分）、Google-Gemini2.0（90.1分）等顶尖闭源模型，成为榜单前十中仅有的两款开源模型之一。

13 天on MSN

AI大战前夕？火山引擎模型半价促销，百度智能云却取消DeepSeek优惠

近日，有关AI服务价格变动的消息引起了广泛关注。据网友分享的信息显示，火山引擎旗下的火山方舟平台计划于2025年3月7日零时起，对特定模型批量推理服务的标准价格实施调整，调整幅度为原价的一半。

1 天

Mistral 开源多模态小模型：仅需RTX 4090即可体验超越GPT-4的性能

在智能设备和人工智能技术飞速发展的今天，法国AI创企MistralAI推出了一款令人瞩目的多模态小模型MistralSmall3.1。这一新型号以其24B参数的设计和令人称道的性能，引发了开发者和AI爱好者们的热烈讨论。根据发布消息，MistralSmall3.1不仅在各项基准测试中超越了多种同类模型，比如Gemma3和GPT-4oMini，而且其推理速度可高达150个token/秒。这一显著优势 ...

中时新闻网8 天

低薪工作面试1特徵！一票人有共鸣：最搞不懂「这问题」

许多求职者接受面试时，都会被询问各种问题。一位女子近日表示，她曾参加不同薪水级距的工作面试，发现通常28K至32K的低薪工作，面试时都比40K以上还要更严格、更多问题，贴文曝光后引发许多网友共鸣，不少人坦言最无法认同的，就是面试低薪的基层人员时，被问「你能带给公司什么？」，但基层根本就不能影响公司决策。

2 天

新注意力让大模型上下文内存占用砍半！精度不减还能加速2倍

此外在Slim Attention的致谢中还提到，艾伦实验室的Dirk Groeneveld，以及SGLang三作谢志强，对其工作提供了有益讨论；Transformer作者之一、Character.AI创始人Noam Shazeer给出了积极反馈。

2 天

苹果杀疯了，Mac Studio内存狂飙，跑满血DeepSeek R1消耗448GB，M3 Ultra竟然 ...

最终，DeepSeek R1 在 M3 Ultra Mac Studio 表现不错。虽然这里用的是 4-bit 量化版本，牺牲了一定的精度，但模型依然保持了完整的 6710 亿参数，速度为 16-18 ...

懂球帝 on MSN22 天

世体：居莱尔在皇马处境微妙，他将在今夏思考自己的未来

《世界体育报》指出，居莱尔在皇马的处境有些微妙，他将在今夏思考自己的未来。在安切洛蒂的战术体系中，居莱尔似乎并没有得到太多机会。在对阵赫罗纳的比赛中，居莱尔不仅没有出场，甚至没有进行热身。当安切洛蒂在赛后被问及居莱尔的情况时，他的回答也显得冷淡：“他状态很好，随时可以上场。”本赛季，居莱尔在28场比赛 ...

南方+客户端 on MSN2 天

用DeepSeek读报告，省医河源医院智慧就医再推新举措！

2025年新年伊始，人工智能模型DeepSeek凭借其超强推理能力与实时动态分析技术迅速蹿红，成为全球科技领域的焦点。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果