埃隆-马斯克的人工智能公司 xAI 在其 API 中添加了图像生成功能。目前,API 中只有一个模型"grok-2-image-1212"可用。 给出提示后,该模型每次请求最多可生成 10 张 JPG 格式的图片(每秒仅限 5 次请求),每张图片售价 ...
就在今天,字节豆包大模型团队在 arxiv 上发布了一篇技术报告,完整公开了文生图模型技术细节,涵盖数据处理、预训练、RLHF 在内的后训练等全流程模型构建方法,也详细披露了此前大火的文字精准渲染能力如何炼成。