阿里巴巴發布全新圖像模型:Z-Image 看來下效果真的很不錯啊 1/3 的參數達到了與國際商業模型幾乎相同的視覺質量 模型參數:6B 顯存佔用:16GB 以下即可運行生成速度:8步採樣即可出高清圖支援設備:消費級顯示卡即可流暢運行能理解複雜指令並且會推理、會思考畫面寫實、光影自然、文字渲染很準確(中英雙語)
1. 照片級真實感 Z-Image-Turbo 在人物、物體、光影上的表現接近攝影等級: 光線自然銜接; 肌膚紋理真實; 景深層次明顯; 色彩平衡柔和。 它能在真實感與美感之間達到較好平衡。
2. 中英文文字渲染 Z-Image 在中文文字生成上具備獨特優勢: 字體形態穩定(不會亂碼或錯位); 可辨識中英文混排排版構圖協調(適合廣告、封面等場景)。
3.語義與文化理解 Z-Image 展現出深厚的語意理解與文化建模能力。 不只是“畫畫”,它“懂文化、懂世界”。 它知道地標、人物、節慶、詩詞等概念。 例如: 能正確生成「蘇遼夜遊承天寺」的場景; 視覺化古詩內容,依詩句畫意境圖; 根據地理座標產生特定地區景象(如“杭州西湖”)。 也能理解中國傳統文化,如茶藝、書法、節氣等。
4.會推理、會思考 它的Prompt Enhancer(提示詞增強器) 內建了“邏輯思維鏈” 可以理解複雜任務或模糊指令。 例如: “雞兔同籠,共35個頭,94隻腳,求雞兔數量” Z-Image 知道該畫出雞和兔的數量對應場景。
5.複雜影像編輯 Z-Image-Edit 能執行複雜的文字式編輯指令: “讓人物笑起來,背景改成雪天,保留原衣服顏色。” 模型能同時調整表情、環境與光照, 並保持畫面一致性。
Z-Image 用1/3 的計算量,達到了與國際商業模型幾乎相同的視覺品質。 根據Elo 人類偏好評估(在AI Arena 上),Z-Image 與其他領先模型相比表現出極強的競爭力,同時在開源模型中取得了最先進的結果。 詳細介紹:https://t.co/0pAGcfyWel








