Z Image es el generador de imágenes de código abierto de 6 mil millones de parámetros de Alibaba construido sobre la arquitectura Single-Stream Diffusion Transformer (S3-DiT). Clasificado #1 entre modelos de código abierto en la clasificación de Artificial Analysis con inferencia en menos de un segundo y renderizado de texto bilingüe.
Z Image (Zao Xiang) es un modelo fundacional eficiente de generación de imágenes de 6 mil millones de parámetros desarrollado por el equipo Tongyi MAI de Alibaba. Su arquitectura Single-Stream Diffusion Transformer (S3-DiT) concatena tokens de texto, tokens semánticos visuales y tokens VAE de imagen en un flujo de entrada unificado para máxima eficiencia de parámetros. La variante Z-Image-Turbo logra inferencia en menos de un segundo con solo 8 pasos, y el modelo se clasifica en el puesto 8 general en la clasificación de Texto a Imagen de Artificial Analysis — el más alto de cualquier modelo de código abierto.
6B parámetros con arquitectura S3-DiT — 4 veces más rápido que Flux.1 y funciona en GPUs de consumo con tan solo 16GB de VRAM. Inferencia en menos de un segundo en hardware empresarial.
Renderizado de texto de primera clase en inglés y chino con una tasa de error de palabras de 0.072 — superando significativamente a Flux.2 Dev (0.143) y otros competidores.
Clasificado en el puesto 8 general en la clasificación de Texto a Imagen de Artificial Analysis — el modelo de código abierto mejor clasificado, superando a todas las demás alternativas de código abierto.
Utiliza cadenas de razonamiento estructuradas para inyectar lógica y sentido común. Z Image trasciende las descripciones superficiales del prompt para aprovechar el conocimiento del mundo.
Colores vibrantes, texturas finas y detalle fotorrealista en diversos estilos — retratos, paisajes, arquitectura, arte creativo, ciencia ficción y más.
Completamente de código abierto bajo licencia Apache 2.0 con más de 10K estrellas en GitHub. Compatible con ComfyUI, DiffSynth y más de 400 ajustes finos de la comunidad en Hugging Face.
Single pricing tier for this model.
Describe la imagen que quieres. Z Image destaca con descripciones detalladas de estilo, composición, iluminación y sujeto — tanto en inglés como en chino.
Elige entre 5 relaciones de aspecto: cuadrado (1:1), horizontal (4:3, 16:9) o vertical (3:4, 9:16) para ajustarse a tu formato de contenido.
Obtén tu imagen generada por IA en unos 8 segundos. Descárgala en formato PNG de alta calidad lista para uso inmediato.
5 créditos por generación de imagen. Calidad de primer nivel en código abierto a un precio accesible.
Fast AI image generation with Gemini 2.5 Flash
Next-gen AI image generation with multi-image support
Photorealistic text-to-image generation
Advanced AI image generation with enhanced text rendering by ByteDance
Genera impresionantes imágenes IA con el modelo de código abierto #1 de Alibaba. Inferencia en menos de un segundo, renderizado de texto bilingüe y calidad excepcional.
Empieza a Crear con Z ImagePreguntas comunes sobre Z Image de Alibaba
Z Image (Zao Xiang) es un modelo de generación de imágenes de código abierto de 6 mil millones de parámetros del equipo Tongyi MAI de Alibaba. Construido sobre la arquitectura S3-DiT, está clasificado en el puesto 8 general en la clasificación de Artificial Analysis — el modelo de imagen de código abierto #1 — con inferencia en menos de un segundo y renderizado de texto bilingüe.
Z Image cuesta 5 créditos por generación de imagen. El modelo en sí es de código abierto bajo licencia Apache 2.0, y nosotros proporcionamos inferencia optimizada en nuestra plataforma para una generación rápida y confiable.
Z Image es el modelo de imagen de código abierto #1 en clasificaciones independientes. Sus fortalezas clave incluyen velocidad de inferencia en menos de un segundo, renderizado de texto bilingüe de primera clase (inglés y chino) y una arquitectura altamente eficiente de 6B parámetros que ofrece calidad comparable a modelos mucho más grandes.
Sí, Z Image tiene el mejor renderizado de texto bilingüe de cualquier modelo de imagen — renderiza nativamente texto en inglés y chino dentro de las imágenes con una tasa de error de palabras de solo 0.072, muy por delante de competidores como Flux.2 Dev (0.143).
Z Image ofrece el mejor equilibrio de calidad, velocidad y eficiencia. Es 4 veces más rápido que Flux.1, funciona en GPUs de consumo de 16GB y se clasifica por encima de todas las alternativas de código abierto. Para fotorrealismo, prueba Grok Imagine. Para resolución 4K, elige Nano Banana Pro.
Z Image genera imágenes en aproximadamente 8 segundos en nuestra plataforma. La variante Z-Image-Turbo logra inferencia en menos de un segundo en GPUs empresariales con solo 8 pasos — convirtiéndolo en uno de los modelos de imagen más eficientes disponibles.
Can't find what you're looking for? Contact our support team