Z Image ist Alibabas 6-Milliarden-Parameter Open-Source-Bildgenerator, basierend auf der Single-Stream Diffusion Transformer (S3-DiT) Architektur. Platz 1 unter Open-Source-Modellen auf der Artificial Analysis Bestenliste mit Inferenz unter einer Sekunde und zweisprachiger Textdarstellung.
Z Image (Zao Xiang) ist ein effizientes 6-Milliarden-Parameter Bildgenerierungs-Grundlagenmodell, entwickelt von Alibabas Tongyi MAI-Team. Die Single-Stream Diffusion Transformer (S3-DiT) Architektur verknüpft Text, visuelle semantische Tokens und Bild-VAE-Tokens zu einem einheitlichen Eingabestrom für maximale Parametereffizienz. Die Z-Image-Turbo-Variante erreicht Inferenz unter einer Sekunde mit nur 8 Schritten, und das Modell belegt Platz 8 auf der Artificial Analysis Text-zu-Bild-Bestenliste — die höchste Platzierung eines Open-Source-Modells.
6 Milliarden Parameter mit S3-DiT-Architektur — 4x schneller als Flux.1 und läuft auf Consumer-GPUs mit nur 16GB VRAM. Inferenz unter einer Sekunde auf Enterprise-Hardware.
Erstklassige Textdarstellung in Englisch und Chinesisch mit einer Wortfehlerrate von 0,072 — deutlich besser als Flux.2 Dev (0,143) und andere Konkurrenten.
Platz 8 auf der Artificial Analysis Text-zu-Bild-Bestenliste — das bestplatzierte Open-Source-Modell, das alle anderen OSS-Alternativen übertrifft.
Verwendet strukturierte Argumentationsketten, um Logik und gesunden Menschenverstand einzubringen. Z Image geht über oberflächliche Prompt-Beschreibungen hinaus und nutzt Weltwissen.
Lebendige Farben, feine Texturen und fotorealistische Details in diversen Stilen — Porträts, Landschaften, Architektur, kreative Kunst, Sci-Fi und mehr.
Vollständig Open-Source unter Apache 2.0-Lizenz mit über 10.000 GitHub-Sternen. Unterstützt von ComfyUI, DiffSynth und über 400 Community-Feinabstimmungen auf Hugging Face.
Single pricing tier for this model.
Beschreiben Sie das gewünschte Bild. Z Image zeichnet sich durch detaillierte Beschreibungen von Stil, Komposition, Beleuchtung und Motiv aus — auf Englisch und Chinesisch.
Wählen Sie aus 5 Seitenverhältnissen: quadratisch (1:1), Querformat (4:3, 16:9) oder Hochformat (3:4, 9:16), passend zu Ihrem Inhaltsformat.
Erhalten Sie Ihr KI-generiertes Bild in etwa 8 Sekunden. Download im hochwertigen PNG-Format, sofort einsatzbereit.
5 Credits pro Bildgenerierung. Erstklassige Open-Source-Qualität zu einem erschwinglichen Preis.
Fast AI image generation with Gemini 2.5 Flash
Next-gen AI image generation with multi-image support
Photorealistic text-to-image generation
Advanced AI image generation with enhanced text rendering by ByteDance
Generieren Sie beeindruckende KI-Bilder mit Alibabas Nr. 1 Open-Source-Modell. Inferenz unter einer Sekunde, zweisprachige Textdarstellung und außergewöhnliche Qualität.
Mit Z Image loslegenHäufige Fragen zu Z Image von Alibaba
Z Image (Zao Xiang) ist ein 6-Milliarden-Parameter Open-Source-Bildgenerierungsmodell von Alibabas Tongyi MAI-Team. Basierend auf S3-DiT-Architektur belegt es Platz 8 auf der Artificial Analysis Bestenliste — das Nr. 1 Open-Source-Bildmodell — mit Inferenz unter einer Sekunde und zweisprachiger Textdarstellung.
Z Image kostet 5 Credits pro Bildgenerierung. Das Modell selbst ist Open-Source unter Apache 2.0-Lizenz, und wir bieten optimierte Inferenz auf unserer Plattform für schnelle, zuverlässige Generierung.
Z Image ist das Nr. 1 Open-Source-Bildmodell auf unabhängigen Bestenlisten. Hauptstärken sind Inferenzgeschwindigkeit unter einer Sekunde, erstklassige zweisprachige Textdarstellung (Englisch & Chinesisch) und eine hocheffiziente 6-Milliarden-Parameter-Architektur, die Qualität auf dem Niveau deutlich größerer Modelle liefert.
Ja, Z Image hat die beste zweisprachige Textdarstellung aller Bildmodelle — es rendert nativ sowohl englischen als auch chinesischen Text in Bildern mit einer Wortfehlerrate von nur 0,072, weit vor Konkurrenten wie Flux.2 Dev (0,143).
Z Image bietet das beste Gleichgewicht aus Qualität, Geschwindigkeit und Effizienz. Es ist 4x schneller als Flux.1, läuft auf 16GB Consumer-GPUs und rangiert höher als alle Open-Source-Alternativen. Für Fotorealismus probieren Sie Grok Imagine. Für 4K-Auflösung wählen Sie Nano Banana Pro.
Z Image generiert Bilder in etwa 8 Sekunden auf unserer Plattform. Die Z-Image-Turbo-Variante erreicht Inferenz unter einer Sekunde auf Enterprise-GPUs mit nur 8 Schritten — eines der effizientesten Bildmodelle überhaupt.
Can't find what you're looking for? Contact our support team