LLM - 搜索 News

4 小时

腾讯高管解读Q4财报：DeepSeek结束了“每次LLM更新都需要更多数量级GPU ...

资本支出的第二个用途，是使用GPU进行大语言模型训练。去年有一段时间，人们曾经认为每一次大语言模型的更新都需要数量级更多的GPU，但随着Deepseek大模型取得突破，这种情况结束了。如今，整个行业包括我们公司，都能利用现有的GPU实现更高的大语言模型训练效率，无需像之前预期的那样大量增加GPU。第三个用途与云业务相关。我们购买GPU服务器，再出租给客户，从中获取回报。这可能不是我们投资组合中回报 ...

13 小时

AI安全警报：新型攻击手法利用“沉浸式世界”绕过LLM防护

近期，网络安全领域迎来了一次震撼性的曝光。据TechRadar报道，Cato CTRL的威胁情报团队宣布了一项惊人的发现：他们成功利用一种前所未有的攻击手段，突破了多个顶尖大语言模型（LLM）的防御，其中包括ChatGPT-4o、DeepSeek-R1和DeepSeek-V3等。值得注意的是，实施这次攻击的研究人员并无恶意软件开发的背景。

腾讯网22 小时

真·MoE？路由LLM最全面探索：一种笔记本也能玩的大模型Scaling Up研究

这种方法主要是把像ChatGPT、Qwen、DeepSeek这些成型的LLM当作 “专家” ，当给一个输入的时候，有分类能力的Router（路由器）就会把这个输入分配给合适的LLM处理。

1 天

Django创造者Simon Willison分享：我如何使用LLM帮我写代码

近段时间，著名 AI 科学家 Andrej Karpathy 提出的氛围编程（vibe coding）是 AI 领域的一大热门话题。简单来说，氛围编程就是鼓励开发者忘掉代码，进入开发的氛围之中。更简单地讲，就是向 LLM ...

2 天

阿里云启动“T项目”，加速AI研发

阿里云已启动了“T项目”，主要指面向下一代AI技术，做AI引擎、LLM、多模态等未知领域探索，员工以类似项目“借调”的方式加入。知情人士表示：项目是为了加速AI的研发。（科创板日报黄心怡） ...

2 天

MCP气候已成，API供应商的机会来了

MCP 在推出的头几个月就吸引了很多人的兴趣，包括来自Speakeasy等 API 管理公司。API 公司将 MCP 视为连接LLM 和代理框架丰富生态系统的机制。为了了解更多信息，我采访了 Speakeasy 首席执行官Sagar Batchu。

盖世汽车3 天

Cerence AI推出基于LLM的混合平台xUI 助力全面提升车载体验

盖世汽车讯 3月13日，人工智能（AI）公司赛轮思（Cerence AI）宣布推出代理式AI助手平台Cerence xUI™，可在边缘和云端运行，以推进下一代LLM赋能的车载用户体验。

14 天

MWC｜智谱林超婷：Agentic LLM正在改变整个手机产业

MWC｜智谱林超婷：Agentic LLM正在改变整个手机产业,智谱,手机,华为,agentic,agent,mwc ...

来自MSN16 天

OpenAI公布迄今最大LLM GPT-4.5，费用是4o的30倍

OpenAI昨日公布GPT-4.5研究预览版推向ChatGPT，但价格也大幅调升，比GPT-4o贵30倍。 GPT-4.5是OpenAI最大知识最丰富的模型。OpenAI团队以新的监督手法结合GPT-4o使用的传统方法，如监督式微调（supervised fine-tuning，SFT）及人员反馈的强化式学习（reinforcement learning ...

来自MSN16 天

LLM Siri可能缺席iOS19，苹果或推迟到2027年推出

关于iOS19，大家最期待的升级应该就是LLM Siri，但根据最新爆料，该功能在苹果公司内部似乎被推迟了，而且推迟长达数年。此前有消息提示，苹果计划在iOS19.4中推出LLM Siri，现在看来，今年6月的WWDC 2025上应该看不到这项功能了。

搜狐17 天

LLM自我纠正能力飞跃！全球华人团队引领数学推理新纪元

【新智元导读】在人工智能领域，大型语言模型（LLM）对推理任务的表现突出，如今又迎来了重大突破。最近，由伊利诺伊大学厄巴纳-香槟分校（UIUC）和马里兰大学合作的全华人研究团队，推出了一种革命性的自我奖励推理框架。这一框架不仅将生成、评估和 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果