模态 - 搜索 News

37 分钟

IT之家 3 月 28 日消息，湖北药监官方公众号昨日（3 月 27 日）发布博文，报道称武汉协和医院叶哲伟教授团队联合衷华脑机公司，全球首次发布微米级脑机接口多模态三维图谱。

10 小时

3月27日，阿里宣布开源Qwen2.5-Omni，这是通义系列模型中首个端到端全模态大模型。这一消息引发了行业内外的广泛关注。Qwen2.5-Omni不仅能够同时处理文本、图像、音频和视频等多种模态数据，还能实时生成文本与自然语音合成输出。更令人惊叹 ...

3月27日凌晨，阿里巴巴发布并开源首个端到端全模态大模型通义千问Qwen2.5-Omni-7B，可同时处理文本、图像、音频和视频等多种输入，并实时生成文本与自然语音合成输出。据介绍，在权威的多模态融合任务OmniBench等测评中，Qwen2.5-O ...

界面新闻 on MSN13 小时

3月27日凌晨，阿里巴巴发布并开源首个端到端全模态大模型通义千问Qwen2.5-Omni，可同时处理文本、图像、音频和视频等多种输入，并实时生成文本与自然语音合成输出。

观点网 on MSN19 小时

70亿参数规模较月初发布的QwQ-32B缩减78%，但宣称保持同等性能，支持在智能手机、笔记本电脑等终端设备运行，旨在降低AI智能体开发成本。

15 小时

在AI技术飞速发展的今天，多模态大模型正在成为新一轮技术革命的核心。基于谷歌技术打造的轻量级多模态大模型Gemma3，凭借其卓越的跨语言理解、图像交互和高效推理能力，正在为开发者打开全新的应用可能。今晚19:00-21:00，一场聚焦Gemma3技术 ...

23 小时

3月27日，阿里巴巴在凌晨时分隆重推出了其首个全模态大模型 —— 通义千问 ...

19 小时on MSN

阿里云近期在人工智能技术领域迈出了重要一步，隆重推出了其新一代多模态旗舰模型Qwen2.5-Omni，这款模型的问世标志着在全方位多模态感知能力上的重大突破。

日前，阿里云方面正式发布新一代端到端多模态旗舰模型Qwen2.5-Omni-7B。据了解，这也是通义系列模型中首个端到端全模态大模型，可同时、无缝处理文本、图像、音频和视频等多种输入形式，并通过实时流式响应同时生成文本与自然语音合成输出。根据阿里云方 ...

15 小时

3月27日，腾讯开源团队宣布推出了一项创新的多模态理解技术——HaploVL。这一技术旨在通过单个Transformer架构实现高效的多模态融合，显著提升AI在视觉和语言交互中的表现，特别是在细粒度视觉理解任务上。

9 小时

自 1971 年首台临床 CT 扫描仪诞生以来，医学影像经历了从二维切片到三维立体的革命性跨越。现代 256 排螺旋 CT 可在 0.28 秒内采集 0.16mm ...

盖世汽车 on MSN2 天

盖世汽车讯据外媒报道，近日，软银公司（SoftBank Corp.）宣布已成功研发“远程自动驾驶支持系统”（remote autonomous driving support ...

一些您可能无法访问的结果已被隐去。