资讯

智源研究院携手上海交通大学等科研机构,近期震撼发布了Video-XL-2,一款专为超长视频理解设计的新一代模型。这一创新成果标志着长视频理解技术在开源领域迈入了一个全新的里程碑,为多模态大模型在视频内容深度解析的道路上铺设了坚实的基石。
近日,一项旨在推动我国水利标准管理向智能化迈进的重要成果——“水利标准AI大模型”由水利部国科司携手水利科学研究院正式面世。这一创新举措,不仅标志着我国水利标准化工具研发取得了突破性进展,更为水利领域的未来发展注入了新的活力。
近日,科技巨头英伟达联合麻省理工学院(MIT)与香港大学,发布了名为 Fast-dLLM 的新框架。这一创新的框架旨在显著提高扩散模型 (Diffusion-based LLMs)的推理速度, 最高 可达27.6倍,为人工智能的应用提供了更为强大的技术支持。
Google日前推出Veo 3 AI模型,可以快速生成拟真的八秒短片,其中包含声音和唇形同步的对话,引起社交媒体用户广泛讨论。
扩散模型被认为是传统自回归模型(Autoregressive Models)的有力竞争者,采用双向注意力机制(Bidirectional Attention Mechanisms),理论上能通过同步生成多个词元(Multi-token ...
赵天成博士的演讲围绕基于R1强化学习的视觉语言模型 (VLM-R1)展开,探讨其在高泛化开放视觉理解中的技术突破与应用。重点介绍强化学习 ...
人民财讯6月3日电,近日,由水利部国科司组织中国水科院自主研发的基于多源语料的“水利标准AI大模型”正式发布,并在水利技术标准专题评估工作中实际应用。该模型基于中国水科院“SkyLIM”体系,采用“海量知识库+DeepSeek/Qwen双模型+标准服务”技术架构,深度集成自然语言处理、知识图谱、多模态数据融合等技术,实现了 ...
航锦科技旗下的超擎数智,为DeepSeek供应了光模块和交换机,满足其在大规模数据处理和高效计算过程中的网络连接需求。超擎数智凭借在光通信和网络设备领域的技术领先优势,提供的高性能光模块和交换机能够保障DeepSeek在AI模型训练和数据分析过程中, ...
近日,新加坡国立大学(NUS)团队发布了一个名为 “OmniConsistency” 的创新项目,旨在以极低的成本复现 OpenAI 的 GPT-4o 模型在图像风格化上的一致性。这项技术不仅解决了当前开源社区在图像风格化和一致性之间的矛盾,还为广大开发者提供了可行的解决方案。
除了宣布开源外,Anthropic依据介绍电路追踪方法的原始论文《On the Biology of a Large Language Model》中多步推理和多语言电路示例,利用该工具深入探究了几个涉及Gemma-2-2b的归因图。
5月,全球多家科技公司发布新的大模型,它们在语义理解、多模态等方面进一步提升,人工智能(AI)的能力边界在不断扩大。随着无人驾驶、机器人等技术借助AI快速进化并逐步投入市场,不少国家通过推进法规建设、开展国际合作等方式,为AI领域创新提供更好的土壤。
IT之家 6 月 3 日消息,微软必应(Microsoft Bing)于本周一宣布在其应用程序中推出 Bing 视频创作器(Bing Video Creator),该功能基于 OpenAI 的 Sora 模型,允许用户通过文本提示词生成视频。此前,OpenAI 一直将 Sora 的视频生成能力限制为付费客户专享,而此次与微软必应的合作,使其首次面向用户免费开放。