资本支出的第二个用途,是使用GPU进行大语言模型训练。去年有一段时间,人们曾经认为每一次大语言模型的更新都需要数量级更多的GPU,但随着Deepseek大模型取得突破,这种情况结束了。如今,整个行业包括我们公司,都能利用现有的GPU实现更高的大语言模型训练效率,无需像之前预期的那样大量增加GPU。第三个用途与云业务相关。我们购买GPU服务器,再出租给客户,从中获取回报。这可能不是我们投资组合中回报 ...
近期,网络安全领域迎来了一次震撼性的曝光。据TechRadar报道,Cato CTRL的威胁情报团队宣布了一项惊人的发现:他们成功利用一种前所未有的攻击手段,突破了多个顶尖大语言模型(LLM)的防御,其中包括ChatGPT-4o、DeepSeek-R1和DeepSeek-V3等。值得注意的是,实施这次攻击的研究人员并无恶意软件开发的背景。
这种方法主要是把像ChatGPT、Qwen、DeepSeek这些成型的LLM当作 “专家” ,当给一个输入的时候,有分类能力的Router(路由器)就会把这个输入分配给合适的LLM处理。
近段时间,著名 AI 科学家 Andrej Karpathy 提出的氛围编程(vibe coding)是 AI 领域的一大热门话题。简单来说,氛围编程就是鼓励开发者忘掉代码,进入开发的氛围之中。更简单地讲,就是向 LLM ...
阿里云已启动了“T项目”,主要指面向下一代AI技术,做AI引擎、LLM、多模态等未知领域探索,员工以类似项目“借调”的方式加入。知情人士表示:项目是为了加速AI的研发。(科创板日报 黄心怡) ...
MCP 在推出的头几个月就吸引了很多人的兴趣,包括来自Speakeasy等 API 管理公司。API 公司将 MCP 视为连接LLM 和代理框架丰富生态系统的机制。为了了解更多信息,我采访了 Speakeasy 首席执行官Sagar Batchu。
盖世汽车讯 3月13日,人工智能(AI)公司赛轮思(Cerence AI)宣布推出代理式AI助手平台Cerence xUI™,可在边缘和云端运行,以推进下一代LLM赋能的车载用户体验。
MWC|智谱林超婷 :Agentic LLM正在改变整个手机产业,智谱,手机,华为,agentic,agent,mwc ...
OpenAI昨日公布GPT-4.5研究预览版推向ChatGPT,但价格也大幅调升,比GPT-4o贵30倍。 GPT-4.5是OpenAI最大知识最丰富的模型。OpenAI团队以新的监督手法结合GPT-4o使用的传统方法,如监督式微调(supervised fine-tuning,SFT)及人员反馈的强化式学习(reinforcement learning ...
关于iOS19,大家最期待的升级应该就是LLM Siri,但根据最新爆料,该功能在苹果公司内部似乎被推迟了,而且推迟长达数年。 此前有消息提示,苹果计划在iOS19.4中推出LLM Siri,现在看来,今年6月的WWDC 2025上应该看不到这项功能了。
【新智元导读】在人工智能领域,大型语言模型(LLM)对推理任务的表现突出,如今又迎来了重大突破。最近,由伊利诺伊大学厄巴纳-香槟分校(UIUC)和马里兰大学合作的全华人研究团队,推出了一种革命性的自我奖励推理框架。这一框架不仅将生成、评估和 ...