资讯

【新智元导读】 英伟达联合港大提出全新Fast-dLLM,模型跳脱自回归生成方式,借助KV Cache和并行解码,将Diffusion LLM推理加速达27.6倍。 那是一种把整句话、整段意思同时呈现出来的语言:没有先后顺序,开头和结尾在同一瞬间显现 ...
在2025年,人工智能技术的迅猛发展再次迎来了新的突破。 英伟达 联合 香港大学 推出了全新的 Fast-dLLM 框架,成功将扩散大语言模型(Diffusion ...
在2025年5月发布于arXiv的最新研究中,来自NVIDIA、麻省理工学院 (MIT)和香港大学的研究团队带来了一项令人振奋的技术突破。由Chengyue Wu、Hao Zhang(共同第一作者)、Shuchen Xue、Zhijian Liu、Shizhe Diao、Ligeng Zhu、Ping Luo、Song Han和Enze Xie共同完成的这项研究,为扩散型大语言模型 ...
Google近日为其旗舰AI视频生成工具Veo3推出全新FAST/TURBO模式,以更低的成本、更快的生成速度和带声音的视频输出,掀起了业界热议。这一更新不仅大幅提升了生成效率,还让高质量AI视频创作变得更加普惠。
扩散模型被认为是传统自回归模型(Autoregressive Models)的有力竞争者,采用双向注意力机制(Bidirectional Attention Mechanisms),理论上能通过同步生成多个词元(Multi-token Generation)加速解码过程。
2020 年 1 月 11 日,贵州平塘的喀斯特洼地迎来历史性时刻 ——500 米口径球面射电望远镜 (FAST)通过国家验收正式开放运行。这座被称为 “中国天眼” 的超级工程,以直径相当于 30 ...
近日,科技巨头英伟达联合麻省理工学院(MIT)与香港大学,发布了名为 Fast-dLLM 的新框架。这一创新的框架旨在显著提高扩散模型 (Diffusion-based LLMs)的推理速度, 最高 可达27.6倍,为人工智能的应用提供了更为强大的技术支持。
Fast-dLLM框架在多项基准测试中均展现出了惊人的表现。在GSM8K数据集上,生成长度为1024词元时,其8-shot配置下实现了27.6倍的加速,准确率高达76.0%。在MATH基准测试中,加速倍数为6.5倍,准确率约为39.3%。而在Huma ...
Google近日为其旗舰AI视频生成工具Veo3推出全新FAST/TURBO模式,以更低的成本、更快的生成速度和带声音的视频输出,引起业界热议。