GPT 原理 - 搜索 News

文章转载于量子位（QbitAI）思维链（CoT）为什么能够提升大模型的表现？大模型又为什么会出现幻觉？北大课题组的研究人员，发现了一个分析问题的新视角，将语言数据集和GPT模型展开为蒙特卡洛语言树。具体来说，数据集和模型分别被展开成了Data-Tre ...

4 天

DeepSeek与GPT的技术较量：谁更强？

此外，DeepSeek的另一项重要技术创新是在硬件适配上的灵活性。与埃尔德梦出租的GUD依赖于同一套高端硬件不同，DeepSeek通过采用PTX指令集，使其能够更精准地控制GPU性能。这一技术降低了对NVIDIA特定API的依赖，赋予了开发者更大的自 ...

腾讯网22 小时

GPT-4o、Claude 3.5全部被攻破，开源大模型超强攻击框架

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！随着GPT-4o、Gemini等多模态大模型的出现，在处理多种任务时展现出强大能力。

1 天

OpenAI内部已实现GPT-4.5？未来会走向开源？Altman透露发展路线

传统的大语言模型遵循一个相对简单的扩展逻辑：每一代模型的计算能力大约是前一代的 100 倍。正如 Altman 所说：“在过去的范式中，我们只做预训练，从 GPT-1 到 GPT-4，每个版本都大约是前一个版本的 100 ...

新浪网10 天

大模型推理更可能是概率模式匹配？北大团队从蒙特卡洛语言树的新 ...

从GPT-tree的视角来看，输入X位于父节点，输出Y位于比较深的叶节点。思维链的原理就是试图弥补这一缺口，即试图寻找路径Z来帮助GPT模型更好的 ...

商业新知 on MSN14 天

国产大模型DeepSeek震惊世界：团队没有“海归”，训练成本不到GPT的 ...

蓝鲸新闻1月27日讯（记者郝妍）国产大模型DeepSeek超越ChatGPT，登顶苹果中国和美国应用商店免费APP下载排行榜，成为了全球科技圈的热议话题。 DeepSeek登顶苹果美国区免费APP下载排行榜 1月27日，苹果App ...

10 天

DeepSeek挑战中科院物理所竞赛题，超越GPT-o1与Claude

在人工智能和大数据技术飞速发展的今天，新的竞争势力不断涌现，科技领域的战局日益复杂。近期，DeepSeek公司在一场由中国科学院物理研究所主办的竞赛中，取得了令人瞩目的成绩，表现超越了市场上知名的程序GPT-o1和Claude，标志着其在人工智能领域的重要进步。这一事件引起了广泛关注，受到行业内外的高度评价，并可能对未来的科技发展产生深远影响。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果