X (Twitter)

阿里巴巴發布全新圖像模型：Z-Image 看來下效果真的很不錯啊 1/3 的參數達到了與國際商業模型幾乎相同的視覺質量模型參數：6B 顯存佔用：16GB 以下即可運行生成速度：8步採樣即可出高清圖支援設備：消費級顯示卡即可流暢運行能理解複雜指令並且會推理、會思考畫面寫實、光影自然、文字渲染很準確（中英雙語）

1. 照片級真實感 Z-Image-Turbo 在人物、物體、光影上的表現接近攝影等級：光線自然銜接；肌膚紋理真實；景深層次明顯；色彩平衡柔和。它能在真實感與美感之間達到較好平衡。

2. 中英文文字渲染 Z-Image 在中文文字生成上具備獨特優勢：字體形態穩定（不會亂碼或錯位）；可辨識中英文混排排版構圖協調（適合廣告、封面等場景）。

3.語義與文化理解 Z-Image 展現出深厚的語意理解與文化建模能力。不只是“畫畫”，它“懂文化、懂世界”。它知道地標、人物、節慶、詩詞等概念。例如：能正確生成「蘇遼夜遊承天寺」的場景；視覺化古詩內容，依詩句畫意境圖；根據地理座標產生特定地區景象（如“杭州西湖”）。也能理解中國傳統文化，如茶藝、書法、節氣等。

4.會推理、會思考它的Prompt Enhancer（提示詞增強器）內建了“邏輯思維鏈” 可以理解複雜任務或模糊指令。例如： “雞兔同籠，共35個頭，94隻腳，求雞兔數量” Z-Image 知道該畫出雞和兔的數量對應場景。

5.複雜影像編輯 Z-Image-Edit 能執行複雜的文字式編輯指令： “讓人物笑起來，背景改成雪天，保留原衣服顏色。” 模型能同時調整表情、環境與光照，並保持畫面一致性。

Z-Image 用1/3 的計算量，達到了與國際商業模型幾乎相同的視覺品質。根據Elo 人類偏好評估（在AI Arena 上），Z-Image 與其他領先模型相比表現出極強的競爭力，同時在開源模型中取得了最先進的結果。詳細介紹：https://t.co/0pAGcfyWel

来自小互（@imxiaohu）的推文线程

作者信息

线程正文