资讯
人工智能语音技术领域迎来重大突破!加拿大初创公司Resemble AI近日发布其 首款 开源文本转语音(TTS)模型ChatterBox,采用MIT许可证。这一模型以其卓越的语音克隆能力、情绪控制功能和超低延迟特性,迅速成为行业焦点,甚至在盲测中超越了知名闭源模型ElevenLabs。
Chatterbox的发布标志着TTS领域开源浪潮的加速。与ElevenLabs等传统闭源系统相比,Chatterbox的免费可用性和高度可定制性使其立即在开发者社区中大受欢迎。社交媒体用户称赞其精确性和情感表达,称其为“语音合成的游戏规则改变者”。
Chatterbox由Resemble AI开发,基于MIT许可证完全开源,允许开发者自由使用和修改。这款模型基于0.5B规模的LLaMA架构,训练数据超过50万小时的精选音频,性能直逼甚至超越部分闭源系统。
根据近期Chatterbox Labs的测试,Anthropic旗下的Claude 3.5 Sonnet在大型语言模型(LLM)安全性表现上,领先于多家竞争对手,成为众多模型中的佼佼者。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果