Z Image è il generatore di immagini open-source di Alibaba con 6 miliardi di parametri basato sull'architettura Single-Stream Diffusion Transformer (S3-DiT). Classificato #1 tra i modelli open-source nella classifica Artificial Analysis con inferenza sub-secondo e rendering del testo bilingue.
Z Image (Zao Xiang) è un modello fondazionale di generazione immagini efficiente da 6 miliardi di parametri sviluppato dal team Tongyi MAI di Alibaba. La sua architettura Single-Stream Diffusion Transformer (S3-DiT) concatena token di testo, semantici visivi e VAE di immagine in un flusso di input unificato per la massima efficienza dei parametri. La variante Z-Image-Turbo raggiunge inferenza sub-secondo con soli 8 passaggi, e il modello si classifica 8° nella classifica Artificial Analysis Text-to-Image Leaderboard — il più alto tra i modelli open-source.
6B parametri con architettura S3-DiT — 4 volte più veloce di Flux.1 e funziona su GPU consumer con appena 16GB di VRAM. Inferenza sub-secondo su hardware enterprise.
Rendering del testo migliore della categoria sia in inglese che in cinese con tasso di errore delle parole di 0,072 — superando significativamente Flux.2 Dev (0,143) e altri concorrenti.
Classificato 8° nella classifica Artificial Analysis Text-to-Image Leaderboard — il modello open-source con la posizione più alta, battendo tutte le alternative OSS.
Utilizza catene di ragionamento strutturato per iniettare logica e buon senso. Z Image va oltre le descrizioni superficiali dei prompt per attingere alla conoscenza del mondo.
Colori vibranti, texture fini e dettaglio fotorealistico in stili diversi — ritratti, paesaggi, architettura, arte creativa, fantascienza e altro.
Completamente open-source sotto licenza Apache 2.0 con oltre 10K stelle su GitHub. Supportato da ComfyUI, DiffSynth e oltre 400 finetune della comunità su Hugging Face.
Single pricing tier for this model.
Descrivi l'immagine che desideri. Z Image eccelle con descrizioni dettagliate di stile, composizione, illuminazione e soggetto — sia in inglese che in cinese.
Scegli tra 5 proporzioni: quadrato (1:1), panoramico (4:3, 16:9) o ritratto (3:4, 9:16) per adattarsi al formato del tuo contenuto.
Ottieni la tua immagine generata dall'IA in circa 8 secondi. Scarica in formato PNG di alta qualità pronto per l'uso immediato.
5 crediti per generazione immagine. Qualità open-source ai vertici delle classifiche a un prezzo conveniente.
Fast AI image generation with Gemini 2.5 Flash
Next-gen AI image generation with multi-image support
Photorealistic text-to-image generation
Advanced AI image generation with enhanced text rendering by ByteDance
Genera immagini IA straordinarie con il modello open-source #1 di Alibaba. Inferenza sub-secondo, rendering del testo bilingue e qualità eccezionale.
Inizia a Creare con Z ImageDomande frequenti su Z Image di Alibaba
Z Image (Zao Xiang) è un modello di generazione immagini open-source da 6 miliardi di parametri del team Tongyi MAI di Alibaba. Basato sull'architettura S3-DiT, è classificato 8° nella classifica Artificial Analysis — il modello open-source #1 — con inferenza sub-secondo e rendering del testo bilingue.
Z Image costa 5 crediti per generazione immagine. Il modello stesso è open-source sotto licenza Apache 2.0, e noi forniamo inferenza ottimizzata sulla nostra piattaforma per una generazione veloce e affidabile.
Z Image è il modello open-source #1 nelle classifiche indipendenti. I punti di forza principali includono velocità di inferenza sub-secondo, rendering del testo bilingue migliore della categoria (inglese e cinese) e un'architettura altamente efficiente da 6B parametri che offre qualità paragonabile a modelli molto più grandi.
Sì, Z Image ha il miglior rendering del testo bilingue di qualsiasi modello di immagini — renderizza nativamente sia il testo inglese che cinese all'interno delle immagini con un tasso di errore delle parole di appena 0,072, molto avanti rispetto ai concorrenti come Flux.2 Dev (0,143).
Z Image offre il miglior equilibrio tra qualità, velocità ed efficienza. È 4 volte più veloce di Flux.1, funziona su GPU consumer da 16GB e si classifica più in alto di tutte le alternative open-source. Per il fotorealismo, prova Grok Imagine. Per la risoluzione 4K, scegli Nano Banana Pro.
Z Image genera immagini in circa 8 secondi sulla nostra piattaforma. La variante Z-Image-Turbo raggiunge inferenza sub-secondo su GPU enterprise con soli 8 passaggi — rendendolo uno dei modelli di immagini più efficienti disponibili.
Can't find what you're looking for? Contact our support team