xAI的Grok Imagine由Aurora驱动——一个在数十亿样本上训练的自回归混合专家模型。擅长逼真渲染、精确的文字指令遵循,以及生成具有自然空间关系的复杂多人场景。
Grok Imagine是xAI的AI图像生成平台,基于Aurora引擎构建——一个自回归混合专家Transformer模型,逐块生成图像,使每个部分都能感知整个构图的上下文。与扩散模型不同,Aurora的架构能产出卓越的文字渲染、自然的多人场景(各人面部清晰可辨)和一致的光照效果。在Artificial Analysis文生视频基准测试中排名第一,Grok Imagine还通过统一API支持图像编辑和视频生成。
与扩散模型不同,Aurora逐块生成图像,每个部分都能感知之前生成的部分——从而实现卓越的构图一致性。
准确渲染图像中可读的文字、Logo、标牌和标签。Aurora的架构天然理解排版和字符排列。
生成包含多个人物的复杂场景,每个人都有清晰可辨的面孔、自然的空间关系和逼真的比例。
单次请求可生成最多10个图像变体。非常适合A/B测试、探索创意方向和寻找理想构图。
上传现有图像并用自然语言进行转换。Grok Imagine Edit支持背景替换、风格重塑和定向修改。
从逼真到动漫、数字绘画到赛博朋克——Grok Imagine以一致的品质和创意忠实度驾驭多样化的视觉风格。
Single pricing tier for this model.
编写详细的文字提示。包含光照、构图和风格的具体描述。Aurora的MoE架构能精确遵循复杂指令。
从5种宽高比选项中选择(1:1、16:9、9:16、2:3、3:2)。Grok Imagine自动为最高逼真品质进行优化。
约8秒即可获得您的逼真AI图像。以高品质PNG格式下载,可直接用于专业项目。
Fast AI image generation with Gemini 2.5 Flash
Next-gen AI image generation with multi-image support
High quality text-to-image generation with Z Image
Advanced AI image generation with enhanced text rendering by ByteDance
关于xAI Grok Imagine的常见问题
Grok Imagine是xAI的AI图像生成平台,由Aurora自回归混合专家模型驱动。擅长逼真渲染、图像中的文字/Logo渲染以及复杂的多人场景。同时支持图像编辑和视频生成。
Grok Imagine每次图像生成5积分。图像编辑模式(Grok Imagine Edit)同样以相同积分价格提供图生图转换功能。
Grok Imagine采用自回归架构(非扩散模型),逐块生成图像并具有完整的上下文感知。这使其在文字渲染、面部各异的自然多人场景以及构图一致性方面优于基于扩散的替代方案。
支持,Grok Imagine Edit可在图生图页面使用。上传图像并用自然语言描述更改。AI可以进行风格重塑、替换背景和定向编辑,同时保留整体构图。
Aurora是xAI的自回归混合专家Transformer模型,在数十亿文本和图像样本上训练。与使用噪声的扩散模型不同,Aurora按顺序预测图像块——使其对构图、光照和空间关系有深入理解。
可以,Grok Imagine具有一流的文字渲染能力。能在图像中准确生成可读的文字、Logo、标牌和标签——这是相比许多在排版方面表现不佳的扩散模型的重大优势。
Can't find what you're looking for? Contact our support team