Z Image는 Single-Stream Diffusion Transformer(S3-DiT) 아키텍처 기반 Alibaba의 60억 파라미터 오픈소스 이미지 생성기입니다. Artificial Analysis 리더보드에서 오픈소스 모델 중 1위를 차지하며 1초 이내 추론과 이중 언어 텍스트 렌더링을 제공합니다.
Z Image(造想)는 Alibaba의 Tongyi MAI 팀이 개발한 효율적인 60억 파라미터 이미지 생성 파운데이션 모델입니다. Single-Stream Diffusion Transformer(S3-DiT) 아키텍처는 텍스트, 시각적 의미 토큰, 이미지 VAE 토큰을 통합 입력 스트림으로 연결하여 최대 파라미터 효율을 달성합니다. Z-Image-Turbo 변형은 단 8단계로 1초 이내 추론을 달성하며, Artificial Analysis 텍스트-이미지 리더보드에서 전체 8위 — 오픈소스 모델 중 최고 순위를 기록합니다.
S3-DiT 아키텍처의 6B 파라미터 — Flux.1보다 4배 빠르고 16GB VRAM의 소비자용 GPU에서도 실행됩니다. 엔터프라이즈 하드웨어에서 1초 이내 추론.
영어와 중국어 모두에서 0.072 단어 오류율로 최고 수준의 텍스트 렌더링 — Flux.2 Dev(0.143) 및 기타 경쟁 모델을 크게 능가합니다.
Artificial Analysis 텍스트-이미지 리더보드에서 전체 8위 — 최고 순위의 오픈소스 모델로, 다른 모든 OSS 대안을 능가합니다.
구조화된 추론 체인을 사용하여 논리와 상식을 주입합니다. Z Image는 표면적인 프롬프트 설명을 넘어 세계 지식을 활용합니다.
생생한 색상, 세밀한 텍스처, 다양한 스타일에 걸친 사실적인 디테일 — 초상화, 풍경, 건축, 크리에이티브 아트, SF 등.
Apache 2.0 라이선스의 완전 오픈소스로 10K+ GitHub 스타. ComfyUI, DiffSynth, Hugging Face에서 400+ 커뮤니티 파인튠을 지원합니다.
Single pricing tier for this model.
원하는 이미지를 설명하세요. Z Image는 영어와 중국어 모두에서 스타일, 구도, 조명, 피사체에 대한 상세한 설명에 뛰어납니다.
5가지 화면비 중 선택: 정사각형(1:1), 가로(4:3, 16:9), 또는 세로(3:4, 9:16)로 콘텐츠 형식에 맞출 수 있습니다.
약 8초 만에 AI 생성 이미지를 받으세요. 즉시 사용 가능한 고품질 PNG 형식으로 다운로드하세요.
Fast AI image generation with Gemini 2.5 Flash
Next-gen AI image generation with multi-image support
Photorealistic text-to-image generation
Advanced AI image generation with enhanced text rendering by ByteDance
Alibaba의 #1 오픈소스 모델로 멋진 AI 이미지를 생성하세요. 1초 이내 추론, 이중 언어 텍스트 렌더링, 뛰어난 품질.
Z Image로 창작 시작Alibaba Z Image에 대한 자주 묻는 질문
Z Image(造想)는 Alibaba의 Tongyi MAI 팀이 개발한 60억 파라미터 오픈소스 이미지 생성 모델입니다. S3-DiT 아키텍처 기반으로 Artificial Analysis 리더보드 전체 8위 — #1 오픈소스 이미지 모델이며, 1초 이내 추론과 이중 언어 텍스트 렌더링을 제공합니다.
Z Image는 이미지 생성당 5크레딧입니다. 모델 자체는 Apache 2.0 라이선스의 오픈소스이며, 빠르고 안정적인 생성을 위해 플랫폼에서 최적화된 추론을 제공합니다.
Z Image는 독립 리더보드에서 #1 오픈소스 이미지 모델입니다. 주요 강점은 1초 이내 추론 속도, 최고 수준의 이중 언어 텍스트 렌더링(영어 및 중국어), 훨씬 큰 모델에 필적하는 품질을 제공하는 고효율 6B 파라미터 아키텍처입니다.
네, Z Image는 모든 이미지 모델 중 최고의 이중 언어 텍스트 렌더링을 제공합니다 — 0.072의 단어 오류율로 이미지 내에서 영어와 중국어 텍스트를 네이티브로 렌더링하며, Flux.2 Dev(0.143) 등 경쟁 모델을 크게 앞서갑니다.
Z Image는 품질, 속도, 효율성의 최적 균형을 제공합니다. Flux.1보다 4배 빠르고, 16GB 소비자용 GPU에서 실행되며, 모든 오픈소스 대안보다 높은 순위를 차지합니다. 포토리얼리즘에는 Grok Imagine을, 4K 해상도에는 Nano Banana Pro를 선택하세요.
Z Image는 플랫폼에서 약 8초 만에 이미지를 생성합니다. Z-Image-Turbo 변형은 엔터프라이즈 GPU에서 단 8단계로 1초 이내 추론을 달성하여 가장 효율적인 이미지 모델 중 하나입니다.
Can't find what you're looking for? Contact our support team