Learning Openai - 搜索 News

23 小时

官方介绍，QwQ-32B 模型仅有 320 亿参数，然而其性能却能与拥有 6710 亿参数的满血版 DeepSeek R1 相媲美。尽管阿里云尚未发布完整的技术报告，但官方数据足以展现其强大实力。在编程竞赛（LiveCodeBench）和美国数学竞赛 ...

腾讯网4 天

GPT-5 的雏形；OpenAI如何研发Agent；中国大厂投更多算力｜AI月报

去年 12 月，Google 就发布基于 Gemini 1.5 模型的 Deep Research 功能；OpenAI 刚推出一天，开源社区 HuggingFace 就提供了开源复现版本；之后不久，大模型搜索应用 Perplexity 推出类似的功能 ...

腾讯网12 小时

揭示显式CoT训练机制：思维链如何增强推理泛化能力

基于逐步生成解决方案的大语言模型（LLMs）训练范式在人工智能领域获得了广泛关注，并已发展成为行业内的主流方法之一。例如，OpenAI 在其「12 Days of OpenAI」直播系列的第二日推出了针对 O1 ...

第一生活网2 天

陈军：推正版绝杀三生肖动文化交流合作增进两岸同胞心灵契合

近日，播客「Unsupervised Learning」采访了 OpenAI 早期员（yuán）工（gōng）（目前已离（lí）职（zhí））David Luan，采访中双方（fāng）探讨了 DeepSeek 给大模型领域带来的研究和实（shí）践所呈现的启正版绝杀三生肖（qǐ）示，并对未来 AI 模型的突破做出了（le）预测分享。

GitHub6 天

openai-gpt-dev-notes-for-cn-developer

在写了一堆应用以后，我们打算众筹一个GPT课程。之前我以为现在GPT应用已经是红海了，但实际测试下来发现，GPT应用其实可以是非标准品。独有的提示词、独有的知识库、独有的工作流都可以做出独一无二的GPT体验。在课程中我们将讲解如何设计、搭建和开发 ...

未来网 on MSN10 小时

DeepSeek-R2或将于下周一发布

（来源：九派新闻综合）有市场消息称，DeepSeek下一代AI模型DeepSeek-R2或提前于下周一（3月17日）正式发布。 DeepSeek-R2在多个关键领域实现突破，包括更出色的编程能力、多语言推理能力，以及以更低的成本提供更高的准确性。专业人士认为，这些特性若得以兑现，可能使其在全球AI竞赛中占据显著优势。

日经中文网1 天

DeepSeek冲击的真意：盲目扩张只会造就更多“鱼脑AI”

由于中国AI企业DeepSeek开发出了高性能的低成本大语言模型，2025年1月下旬，英伟达（NVIDIA）等美国高科技公司的股价暴跌。“DeepSeek冲击”这一说法，可能模仿了前苏联在1957年成功发射全世界第一颗人造卫星“斯普特尼克1号（Spu ...

1 天

又一个复现Manus团队出现了，5000名开发者一夜涌入

截至目前，多家AI企业相继成功复现Manus产品。此前第一财经对话MetaGPT团队解析复现路线，3月11日，在锦秋基金的一场分享上，同样成功复现的李国豪向第一财经记者解析Manus对行业造成的影响。

5 小时

图灵奖的获奖者们，担心成为 AI 界的「奥本海默」

其中，约书亚·本希奥和杰弗里·辛顿（亦是 2024 年诺贝尔物理学奖获奖者）两位「人工智能教父」在最近两年的 AI 浪潮里，也频繁呼吁全球社会和科学界警惕大公司对人工智能的滥用。

1 天

从DeepSeek到千问QwQ-32B，看AI“小模型”如何撬动中国智造生态

2025年3月10日，国家超算互联网平台宣布接入阿里通义千问大模型。这一动作绝非偶然，尤其是在千问 QwQ-32B 推理模型登顶开源社区榜单之际，标志着中国正在将国家级算力资源与顶尖算法深度绑定，构建起基础算力+核心模型的自主AI生态。

知乎 on MSN6 天

为什么deepseekR1之后的大模型都开始做思维链？

思维链最早是在预训练模型中涌现出来的现象。人们发现，仅仅只是在模型解数学题的时候，要求它 think step by step，模型就能极为显著地改善其做数学题的正确率。这个现象在最初是让很多人感到相当震撼的，和 In-context learning ...

电脑商情在线5 天

图灵奖授予人工智能领域的两位先驱者——Andrew Barto 和 Richard Sutton

20世纪40年代，英国计算机科学先驱艾伦·图灵提出，机器也可以以类似的方式学习，但真正开始探索这一数学原理的是巴托博士与萨顿博士。“当谈到人类和动物时，这是一个显而易见的想法，”萨顿博士表示，“当我们将其应用于机器时，情况就不同了。” ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果