prompt response - 搜索 News

资讯

14 terrorists killed in northern Mali following failed infiltration attempt

BAMAKO, June 2 (Xinhua) -- Fourteen terrorists were killed in the northern Malian city of Timbuktu on Monday after a failed attempt by terrorist fighters to infiltrate a military camp, according to a ...

腾讯网1 天

1 条 Prompt 顶 10 行代码：YC 合伙人讲透 AI 创业护城河

全文 4,500字 | 阅读约24分钟（摘自YC《Lightcone》播客合伙人圆桌讨论）2025 年 5 月 31 日，硅谷顶级创业孵化器 Y Combinator（简称 YC）官方播客《Lightcone》抛出一个技术圈炸点：Prompt ...

51CTO28 天

强化微调来袭！如何让AI真正“听懂”人类需求原创精华

在当今快速发展的 AI 领域，如何让模型更好地理解人类的需求并提供真正有价值的服务，一直是开发者们努力的方向。而强化微调（Reinforcement Finetuning）的出现，无疑是为这一目标带来了新的曙光。它通过结合人类反馈和强化学习，让模型能够不断调整自身行为 ...

腾讯网2 天

基于内存高效算法的 LLM Token 优化：一个有效降低 API 成本的技术方案

点击上方“Deephub Imba”,关注公众号,好文章不错过 !在使用 OpenAI、Claude、Gemini 等大语言模型 API ...

7 天

扩散语言模型九倍推理加速！上海交大：KV Cache并非自回归模型的 ...

1. 训练无关，即插即用。 dLLM-Cache完全在推理过程中工作，无需修改模型参数或重训练。dLLM-Cache可以在完全不损失模型输出质量的前提下，带来最高9.1倍的推理速度提升。

China.org.cn2 天

3rd LD Writethru: EU condemns U.S. steel tariff hike, prepares countermeasures

"The EU is prepared to impose countermeasures, including in response to the latest U.S. tariff increase," the spokesperson said, adding that the Commission is finalising consultations on expanded ...

SHINE2 天

EU condemns US steel tariff hike, prepares countermeasures

"The EU is prepared to impose countermeasures, including in response to the latest US tariff increase," the spokesperson said ...

InfoQ中国 on MSN15 天

领域驱动的RAG：基于分布式所有权构建精准的企业知识系统

我们的背景作为一家在银行技术领域拥有超过30年行业经验的领军供应商，我们拥有丰富且极具创新性的代码库，并通过战略性收购不断扩大业务。多年来，我们一直将自己定位为行业的创新者，但创新的迅猛步伐也为我们带来了在庞大产品线中保持文档一致性与时效性的挑战。

51CTO19 天

突破LLM的token限制：多块上下文保留的实用系统（含code）

在未来的研究和开发中，可以进一步优化算法，减少请求次数或提高每次请求的效率，以降低处理时间。例如，可以探索更智能的分块策略，根据文本的语义结构进行分块，而不仅仅是基于词元数量；或者开发更高效的上下文摘要算法，减少不必要的信息传递。

7 天

舍弃自回归！国内团队打造纯扩散多模态大模型LLaDA-V，理解任务新SOTA

近年来，多模态大语言模型（MLLMs）在处理图像、音频、视频等多种输入模态方面取得了显著进展。然而，现有的大多数方法依赖自回归模型。虽然有研究尝试将扩散模型引入 MLLMs，但往往采用混合架构（自回归 + 扩散）或者受限于语言建模能力，导致性能不佳。

7 天

免训练推理加速新突破：dLLM-Cache让扩散语言模型如虎添翼

在人工智能领域，扩散语言模型（dLLMs）正逐渐崭露头角，成为语言生成的新宠。然而，推理过程中的高计算成本一直是其发展的一大瓶颈。近日，上海交通大学的EPICLab团队提出了一种名为dLLM-Cache的创新解决方案，成功实现了推理速度的显著提升，最高可达9.1倍，且无损生成质量。

科技行者 on MSN7 天

深潜大语言模型的"真空地带"：不是所有层都在全力工作，偷懒的层 ...

最近一项由独立研究者Mani Shemiranifar开展的研究提出了一个引人深思的问题：在大语言模型运行时，真的需要所有神经层都参与工作吗？这项研究于2025年5月发表在arXiv上，论文标题为《Void in Language ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果