diffusion - 搜索 News

22 分钟

Soul App实时人像视频生成研究成果获国际学术顶会CVPR2025录用

Soul App团队在论文中提出了一个新的面向实时音频驱动人像动画（即Talking Head）的自回归框架，解决了视频画面生成耗时长的行业挑战外，还实现了说话时头部生成以及人体各部位运动的自然性和逼真性。此次论文的入选，也证明了Soul ...

4 天

逐字生成非最优？试试逐「块」生成！Block Diffusion打通了自回归与扩散

目前，离散扩散模型目前面临至少三个限制。首先，在聊天系统等应用中，模型必须生成任意长度的输出序列（例如对用户问题的回答）。但是，大多数最新的扩散架构仅能生成固定长度的向量。其次，离散扩散模型在生成过程中使用双向上下文，因此无法使用 KV ...

4 天

逐字生成非最优？Block Diffusion打通了自回归与扩散

腾讯网6 小时

贵州省2025年“世界水日”“中国水周”AI设计海报征集即将开始！

人民网贵阳3月21日电 (陈洁泉)为加大水利法治宣传教育力度，贵州省水利厅将开展贵州省纪念第三十三届“世界水日”第三十八届“中国水周”AI设计海报征集活动。作品征集时间从3月22日截至6月6日。据了解，本次征集活动主题为“AI 绘黔水，共护水安全” ...

腾讯网4 小时

Google杀回来了！Gemini 2.0图像编辑实测：说人话就能干掉美图秀秀？

当基座模型更新之后，作为创业者的你，是感到焦虑？还是感到兴奋？在十字路口播客的《2025 开年对谈：AI 关键之年，Agent 开启元年》中，我们请真格基金管理合伙人雨森给 2025 年的 AI 创业者们一个建议，他提出了上面这个「灵魂拷问」。在 ...

腾讯网21 天

被Github 上的Stable Diffusion 坑惨了？失业、欠账、恐慌，工程师怒喷 ...

黑客还在网上声称，自己在迪士尼有一个 “内线”。而处于事件漩涡中心的这款 AI 图像生成器，被曝很可能是 Stable Diffusion。去年 6 月，据外媒报道，以厌倦了大公司通过 AI 滥用他人的工作为由，NULLBULGE 黑客组织开始通过破坏 Github 上免费共享的扩展 ComfyUI ...

2 天

理想汽车发布下一代自动驾驶架构MindVLA

3月18日，理想汽车自动驾驶技术研发负责人贾鹏在NVIDIA GTC 2025发表主题演讲《VLA：迈向自动驾驶物理智能体的关键一步》，分享了理想汽车对于下一代自动驾驶技术MindVLA的最新思考和进展。

腾讯网2 天

直击GTC 2025，VLA是否会拉高智驾门槛？

近日，英伟达GTC 2025正式开幕。首日，作为国内高阶智驾的主要代表，理想汽车和元戎启行都带来了其最新智驾方案介绍，即VLA。此外，元戎启行同步展示了公司的最新战略布局RoadAGI，并发布道路通用人工智能平台——AI ...

3 天

速度秒杀GPT们10倍，国外的DeepSeek时刻来了？

虽然目前还不如顶尖的 Claude3.5 Haiku 等，但考虑到它是一目十行的效率，能保持这个生成质量已经是非常哇塞了。我们也在官方放出的 Mercury Coder Playground ...

生物通6 小时

JAMA研究表明，人工智能技术可以改善帕金森病的诊断

“这是一个例子，技术和人工智能之间的创新已被证明可以提高诊断精度，使我们有机会进一步改善帕金森病患者的治疗，”迈克尔·奥肯医学博士说，他是帕金森基金会的医学顾问，也是佛罗里达大学健康中心诺曼·菲克尔神经疾病研究所的主任。“我们期待看到这项创新如何进一步影响帕金森氏症社区，并推进我们为所有人带来更好结果的共同目标。” ...

11 天

深度解析：设计院如何高效运用AI工具？Stable Diffusion从零学起的实操 ...

近年来，随着人工智能技术的飞速发展，AI工具已经悄然成为各行业不可或缺的助手。在诸多领域中，设计行业尤为突出。设计院们纷纷将AI技能融入工作流程，以提升工作效率与创新能力，带来一场实实在在的革命。特别是搜狐简单AI这一工具，以其强大的绘画功能和便捷的图像处理能力，成为众多设计师的首选。搜狐简单AI的核心功能之一是文字描述生成图像，设计师只需输入简单的文字描述，这个AI工具便能自主生成符合需求的视 ...

1 天

理想汽车发布下一代自动驾驶架构MindVLA 可显著提升安全下限

据介绍，MindVLA打破自动驾驶技术框架设计的传统模式，使用能够承载丰富语义，且具备出色多粒度、多尺度3D几何表达能力的3D高斯（3D Gaussian）这一优良的中间表征，充分利用海量数据进行自监督训练，极大提升了下游任务性能。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果