什么是Z Image?
Z Image(造想)是由Alibaba通义MAI团队开发的高效60亿参数图像生成基础模型。其Single-Stream Diffusion Transformer(S3-DiT)架构将文本、视觉语义Token和图像VAE Token拼接为统一的输入流,实现最大参数效率。Z-Image-Turbo变体仅需8步即可实现亚秒级推理,该模型在Artificial Analysis文生图排行榜上排名第8——是所有开源模型中排名最高的。
为什么选择Z Image?
超高效架构
6B参数配合S3-DiT架构——比Flux.1快4倍,可在仅16GB显存的消费级GPU上运行。企业硬件上实现亚秒级推理。
双语文字渲染
一流的中英双语文字渲染能力,词错率仅0.072——显著优于Flux.2 Dev(0.143)及其他竞品。
开源模型第一名
在Artificial Analysis文生图排行榜上排名第8——是排名最高的开源模型,超越所有其他开源替代方案。
语义理解
使用结构化推理链注入逻辑和常识。Z Image超越了表面级的提示描述,能调用世界知识。
丰富的美学品质
跨多样化风格展现鲜艳色彩、精细纹理和逼真细节——人像、风景、建筑、创意艺术、科幻等。
Apache 2.0开源
基于Apache 2.0许可证完全开源,GitHub星标超10K。支持ComfyUI、DiffSynth,在Hugging Face上有400+社区微调模型。
技术规格
Single pricing tier for this model.
3步使用Z Image创作
输入您的提示
描述您想要创建的图像。Z Image擅长处理关于风格、构图、光照和主题的详细描述——支持中英双语。
选择宽高比
从5种宽高比中选择:正方形(1:1)、横版(4:3、16:9)或竖版(3:4、9:16),以匹配您的内容格式。
生成并下载
约8秒即可获得您的AI生成图像。以高品质PNG格式下载,可立即使用。
您可以用Z Image创建什么?
逼真人像与场景
双语海报与平面设计
创意艺术与插画
社交媒体与营销内容
探索更多AI模型
Nano Banana
Fast AI image generation with Gemini 2.5 Flash
Nano Banana 2
Next-gen AI image generation with multi-image support
Grok Imagine
Photorealistic text-to-image generation
Seedream 4.5
Advanced AI image generation with enhanced text rendering by ByteDance
Z Image常见问题
关于Alibaba Z Image的常见问题
Z Image(造想)是Alibaba通义MAI团队推出的60亿参数开源图像生成模型。基于S3-DiT架构构建,在Artificial Analysis排行榜上排名第8——是开源图像模型第一名——具有亚秒级推理和双语文字渲染。
Z Image每次图像生成5积分。模型本身基于Apache 2.0许可证开源,我们在平台上提供优化的推理服务,实现快速、可靠的生成。
Z Image是独立排行榜上的开源图像模型第一名。核心优势包括亚秒级推理速度、一流的双语文字渲染(中英文)以及高效的6B参数架构,能提供媲美大型模型的品质。
支持,Z Image具有所有图像模型中最佳的双语文字渲染能力——能在图像中原生渲染英文和中文文字,词错率仅0.072,远超Flux.2 Dev(0.143)等竞品。
Z Image在品质、速度和效率之间提供了最佳平衡。比Flux.1快4倍,可在16GB消费级GPU上运行,排名高于所有开源替代方案。如需逼真风格,可试用Grok Imagine;如需4K分辨率,可选择Nano Banana Pro。
Z Image在我们的平台上约8秒即可生成图像。Z-Image-Turbo变体在企业GPU上仅需8步即可实现亚秒级推理——是目前效率最高的图像模型之一。
Can't find what you're looking for? Contact our support team