资讯

近年来,多模态AI技术以其强大的跨领域能力,逐渐成为科技行业的增长引擎。谷歌DeepMind最新发布的Veo3模型以及OpenAI的GPT-4o,通过结合文本、图像、视频甚至音频的生成能力,不仅提升了用户体验,还在全球范围内引发了广泛关注和流量激增。
我花了很多时间测试和评测 ...
可以说,V2A 就是 Veo 3 的“耳朵”和“声带”。再配合谷歌的音视频数据资源—— YouTube 很可能是训练数据之一——Veo 3 的音画合成功能,已经遥遥领先。 一个小遗憾:视频仍只有 8 秒。 另外,目前 Veo 3 仅面向美国 Ultra 订阅用户开放,定价为 249.99 美元/月。
为何Veo 3的效果会这么好? 有人分析说,这都要归功于谷歌拥有的Youtube,这样,他们就可以轻松使用数百万个视频来训练AI模型,要多少有多少,效果自然是吊打其他家。 可怕的是,这样发展下去,视频和音频证据都将不再可信,司法系统将变得极其脆弱。
公司联合创始人Sergey Brin后来坦承,问题源于“测试不充分”。 除了发布Veo 3,谷歌还宣布对Veo 2进行更新,新增支持通过文字提示对视频中物体进行增删的功能。同时,谷歌还开放了其AI音乐生成模型Lyria 2,供YouTube Shorts创作者及Vertex AI企业客户使用。
相关视频在TikTok上动辄收获超百万播放,获赞几十万。在Instagram上也有一些专门制作此类内容的账号,同样迅速走红。此前《星球大战》的冷酷风暴兵账号,创作者在三天内涨粉超30万,让人一度怀疑AI起号也如呼吸般简单。
此外,Veo 3也将纳入谷歌面向企业客户的Vertex ... 同时,谷歌还开放了其AI音乐生成模型Lyria 2,供YouTube Shorts创作者及Vertex AI企业客户使用。
Veo 3能够根据提示词生成高质量视频 ... 同时,谷歌开放了其AI音乐生成模型Lyria 2,供YouTube Shorts创作者及Vertex AI企业客户使用。