资讯

在底层技术架构方面,HunyuanVideo-Avatar基于腾讯混元视频大模型与MuseV技术融合开发,具备多模态理解能力。它能够自动识别图像中的人物环境信息及音频情感内容,生成高度匹配的视频片段。这一技术的推出,无疑为数字人技术的发展注入了新的活 ...
想用AI整活的玩家又有“新玩具”了。 这两天,腾讯混元最新开源了一款语音驱动的数字人模型:HunyuanVideo-Avatar。 只要上传一张图片和一段音频,就能让图中的人物说话、唱歌,生成一段音画同步、表情自然的高保真视频。