资讯
人工智能语音技术领域迎来重大突破!加拿大初创公司Resemble AI近日发布其 首款 开源文本转语音(TTS)模型ChatterBox,采用MIT许可证。这一模型以其卓越的语音克隆能力、情绪控制功能和超低延迟特性,迅速成为行业焦点,甚至在盲测中超越了知名闭源模型ElevenLabs。
Chatterbox的发布标志着TTS领域开源浪潮的加速。与ElevenLabs等传统闭源系统相比,Chatterbox的免费可用性和高度可定制性使其立即在开发者社区中大受欢迎。社交媒体用户称赞其精确性和情感表达,称其为“语音合成的游戏规则改变者”。
Chatterbox由Resemble AI开发,基于MIT许可证完全开源,允许开发者自由使用和修改。这款模型基于0.5B规模的LLaMA架构,训练数据超过50万小时的精选音频,性能直逼甚至超越部分闭源系统。
Chatterbox是一款基于开源的TTS模型,具有卓越的性能和创新功能,包括实时合成、零样本语音克隆和情感夸张控制等,成为行业焦点。 Chatterbox基于0.5B规模的LLaMA架构,训练数据超50万小时,盲测中63.75%的听众更偏好其真实感和流畅度。 支持实时合成,延迟低于 ...
近日, AI领域迎来重磅消息!中国AI初创公司DeepSeek正式发布了其开源大语言模型 DeepSeek-R1-0528的最新版本。这一更新不仅在性能上实现了重大突破,还通过免费API的提供进一步推动了AI技术的普及与应用。
本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)M ...
十轮网科技资讯 on MSN5 天
布尔:威胁AI模型可提升表现,却引发安全性隐忧在最近的一次Podcast访谈中,Google共同创办人谢尔盖·布尔( Sergey Brin)提出一个引人瞩目的观点,认为威胁人工智能( AI )模型能够产生更好的结果。
蚂蚁集团宣布全面开源多模态模型 Ming-lite-omni,具备 220 亿参数,标志其 AI 技术的新高度,能够与 GPT-4o 相媲美。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果