我们很高兴宣布 Z Image Base 正式上线,这是一个稳定、通用的 AI 图像生成基础模型:
- 文生图生成:支持中英文自然语言描述,生成高质量图像
- 图生图转换:保持原有结构,生成风格化图像
- 多尺寸支持:支持 1024×1024、2048×2048 等多种分辨率
- 批量生成:单次最多生成 4 张图像
- 历史记录:保存生成历史,方便查看和下载
- 6B 参数规模:在保证质量的同时降低部署门槛
- S3-DiT 架构:单流扩散 Transformer,效率与质量兼顾
- 结构稳定性:人体比例、物体结构稳定,不易出现畸形
- 双语支持:对中英文混合 prompt 有良好支持
- Apache 2.0 开源许可:可自由商业化使用
- 16GB 部署门槛:消费级显卡即可运行
- LoRA 友好:完整未蒸馏版本,适合微调开发