32K - 搜索 News

1 小时

今天，字节跳动旗下的豆包大模型 1.5 Pro 模型正式亮相，不仅全面升级了模型的核心能力，也融合并进一步提升了多模态能力，在多项公开评测基准中也是全球领先水平。 Doubao-1.5-pro：多项基准测试综合得分优于 GPT-4o、Claude 3 ...

4 小时

具体来讲，xLSTM 7B 模型基于 DCLM 数据集，使用 128 块 H100 GPU，在 8192 上下文长度下训练了 2.3 万亿 token。研究者对原始 xLSTM 架构进行了改进，确保训练效率和稳定性，同时保持任务性能。新架构依靠 ...

一些您可能无法访问的结果已被隐去。

今日热点