在科技迅速发展的今天,语音技术已经成为人工智能领域的重要组成部分。2025年3月21日,美东时间周四,OpenAI举行了一场颇具影响力的技术直播,向大众介绍了其最新推出的三款语音模型。这些模型的问世无疑将为各行各业的语音交互和信息处理带来革命性的变化 ...
9 小时
品玩 on MSNOpenAI 推出新一代语音模型 API品玩3月21日讯,OpenAI 官方今天宣布,在API 中推出新一代语音模型,可以构建更强大、可定制和智能的语音 Agent。 据OpenAI ...
就在刚刚,OpenAI 宣布在其 API 中推出全新一代音频模型,包括语音转文本和文本转语音功能,让开发者能够轻松构建强大的语音 Agent。 据 OpenAI 介绍,新推出的 gpt-4o-transcribe ...
至于OpenAI的新语音转文本模型“GPT-4o-transcript”和“GPT-4o-mini- transcript”,它们的准确度明显高于 OpenAI之前发布的语音转文本模型Whisper,并在多种语言中实现更低的词错误率 (WER)。
就在昨天,OpenAI 推出的「最贵大模型 API」o1-pro API 还因为每百万 token 收费 600 美元而遭到了 AI 社区的广泛吐槽。今天 OpenAI 推出的三款语音 API ...
OpenAI称开发者不仅可以“指示”模型说什么,还能指定怎么说(指定的情绪进行表达),从而为包括客户服务到创意故事叙述在内的多种应用场景提供更加定制化的体验,该模型现已通过文本转语音API提供。
凌晨 1 点的时候,OpenAI 突然做了三项发布:语音转文本(STT)模型文本转语音(TTS)模型一个体验网站:OpenAI.fm结论前置:不大的发布,实用的东西,不错的 ...
2 天on MSN
据悉,这一计划的首个数据中心综合体位于得克萨斯州的小城阿比林,预计将于2026年中期竣工。该综合体的设计电力容量高达1.2吉瓦,足以容纳多达40万个英伟达强大的AI芯片。一旦全部装满,它将成为全球范围内已知的最大AI算力集群之一,为OpenAI的先进 ...
1 天on MSN
IT之家 3 月 20 日消息,OpenAI 昨日(3 月 19 日)在 X 平台发布推文,宣布通过开发者 API,正式推出 o1 系列升级版“o1-pro”,宣称其通过更高计算资源投入实现“更一致且优质的回应”。 o1-pro ...
在文本转语音上,OpenAI 最新推出了 gpt-4o-mini-tts 模型,开发者通过“模拟耐心客服”或“生动故事叙述”等指令,控制语音风格,可以应用于客服(合成更具同理心的语音,提升用户体验)和创意内容(为有声书或游戏角色设计个性化声音)方面。
在迅速发展的科技时代,人工智能已成为推动社会进步的重要动力。3月20日,美国开放人工智能研究中心(OpenAI)宣布推出其全新的转录及语音生成AI模型。这一消息引发了业内的广泛关注与热议,因为这款新模型相较于其前代产品,具有显著的技术升级。
1 天on MSN
星际之门计划的首个数据中心综合体选址于美国得克萨斯州的小城阿比林。这一综合体设计独特,能够容纳多达40万个英伟达的高性能AI芯片。一旦全部装满,它将成为全球范围内算力最为强大的AI集群之一,为OpenAI的先进AI模型提供坚实的物理基础设施支持。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果