一份【Z-Image】的零基礎上手指南,含本地部署+提示詞模板實戰 6GB顯存筆記本即能產生帶有中文字的商業級海報,指南從模型下載、配置ComfyUI、寫提示詞、解決常見報錯入手系統講解 1.依電腦配置,選取適用的部署方案(配置方案請參閱圖) 如果是RTX 3060(6GB)、RTX 4050或其他顯存為6–8GB的設備,需要採用GGUF量化方案,如果顯存≥12GB(如RTX 3060 12G、4070、4080 等),則可使用原始BF16模型,無需額外插件 2、配置ComfyUI 想讓Z-Image在本地順利運行,需在ComfyUI中正確配置三個核心元件,擴散模型、文字編碼器和變分自編碼器 1)安裝ComfyUI、下載核心組件安裝ComfyUI最新版,從官網下載便攜包 然後下載三個核心文件,並放置在ComfyUI的相應目錄下 擴散模型檔案:z_image_turbo_bf16.safetensors (或FP8/GGUF版本,依據顯存選擇) 路徑:ComfyUI/models/diffusion_models/ 文字編碼器檔案:qwen_3_4b.safetensors (注意,這是一個3.4B參數的大語言模型,非傳統的CLIP) 路徑:ComfyUI/models/text_encoders/ 變分自編碼器檔案:ae.safetensors (通常可通用Flux的VAE,但是建議使用官方提供的) 路徑:ComfyUI/models/vae/ 將這三個檔案分別放入ComfyUI的對應目錄擴散模型放入models/diffusion_models/ 文字編碼器放入models/text_encoders/ VAE 放入models/vae/ 完成後,即可根據顯存大小選擇對應的工作流程 第二步見下條 #ZImage #AI圖像#圖像生成教程
2)12GB+顯存的快速部署方案如果顯示卡顯存≥12GB(如RTX 3060 12G、4070、4080等),建議使用Z-Image的標準工作流程獲得最佳畫質與速度 【載入模型節點】 在ComfyUI中,從左側範本庫選擇 “Z-Image Turbo文生圖”,系統會自動載入已放入對應目錄的三個核心元件 使用Load Diffusion Model節點載入z_image_turbo_bf16.safetensors 使用Load VAE節點載入ae.safetensors 使用DualCLIPLoader或自訂的Z-Image Text Encoder Loader 載入qwen_3_4b 若已正確放置文件,模型通常會自動加載,無需手動配置 【採樣器設定】 預設子圖模式下可以修改基本設置,如果需要更多詳細設置,可以點擊右上角打開子圖進一步設置 KSampler的參數對產生效果至關重要,必須嚴格遵守以下設定 Steps:設為8或9,切勿設定過高20或30,否則容易導致皮膚出現蠟質感或色斑(Blotchy Skin)21 CFG:設為1.0 Sampler Name:推薦euler Scheduler:推薦sgm_uniform或預設的simple,經測試sgm_uniform能有效緩解低步數下的雜訊問題 Shift:1024解析度下設為3,2K解析度下設為7 【解析度設定】 Z-Image對1024x1024、1280x720、720x1280等標準解析度最佳化最佳,避免直接產生超高解析度,例如4K,可以先生成2K圖再透過Upscaler放大,確保構圖穩定性與細節品質 完成以上三步驟後,即可輸入提示字並點選 “Queue Prompt” 產生圖像
3)低顯存工作流程6–8GB 顯存用戶的GGUF量化方案 若使用的是RTX 3060(6GB)、RTX 4050等6–8GB顯存設備,則需採用GGUF量化方案 首先需要在ComfyUI中透過ComfyUI Manager安裝ComfyUI-GGUF插件 然後,從模型平台下載兩個GGUF格式的文件,擴散模型z_image_turbo_Q4_K_M.gguf和文字編碼器qwen_3_4b_Q4_K_M.gguf 這一步至關重要,未量化的qwen_3_4b.safetensors本身就會佔用超過6GB顯存,即使主模型已量化,加載時仍會因顯存溢出而失敗 將這兩個檔案分別放入models/diffusion_models/ 和models/text_encoders/目錄 在ComfyUI中,使用Unet Loader (GGUF) 節點載入擴散模型,使用CLIP Loader (GGUF) 節點載入文字編碼器,並連接VAELoader節點以載入官方ae.safetensors 採樣器參數設定與標準工作流程一致,Steps=8, CFG=1.0, Scheduler=sgm_uniform 顯存佔用可壓縮至6GB以下,雖然推理時間有所延長,但徹底解決了OOM問題
3.提示詞增強工作流程 可以在工作流程前端加入一個LLM 處理環節(可選),來充分發揮Z-Image的潛力 此LLM會將簡單的輸入(例如「一隻香水瓶」)自動擴展為包含場景、光影、材質和攝影參數的詳細指令,從而提升生成質量 以下是三類高頻場景可直接重複使用的模板,無需額外配置 1)電商產品攝影,【為一款香水瓶生成展示圖】 提示詞:一張超寫實、電影感的商業產品攝影大片。主體是一個半透明的琥珀色玻璃香水瓶,配有拉絲金金屬瓶蓋,優雅地坐落在從平靜水面浮出的一塊粗糙紋理的深色板岩上。場景設定在日出時分霧氣繚繞的熱帶雨林中 光線與氛圍:強烈的體積光(丁達爾效應)透過上方鬱鬱蔥蔥的棕櫚葉傾瀉而下,投下複雜的斑駁陰影,並在水面和玻璃瓶上形成明亮舞動的焦散光斑(Caustic patterns)。光線溫暖、金黃且空靈,與岩石和水的冷暗色調形成對比 細節與材質:極致的微距特寫焦點。瓶身表面可見冷凝水珠,反射周圍的綠植。板岩的紋理極為細緻,帶有苔蘚斑塊。水面有輕微的漣漪,具有逼真的反射和折射效果。背景中漂浮著失焦的微粒和精緻的白色茉莉花,漂流在水面上 技術規格:使用哈蘇X2D 100C 相機拍攝,80mm 微距鏡頭,f/2.8 光圈以獲得奶油般的虛化背景。 8k 分辨率,品牌Logo 區域超清晰對焦,光線追蹤反射,虛幻引擎5 渲染風格,調色風格為奢華雜誌社論風 2)東方文化/漢服/地標【生成一張身著漢服的女性肖像】 提示詞:一位絕世容顏的唐代貴妃,身穿層層疊疊的紅色真絲漢服(齊胸衫裙),上面繡著複雜的金線鳳凰和牡丹圖案。她站在宏偉的宮殿露台上,背景是繁華的長安城夜景,成千上萬的孔明燈漂浮在夜空中 化妝細節:額頭畫著精緻的“花釷”,髮髻高聳,插滿了步搖、金釵和珍珠流蘇,在燈光下閃閃發光 氣氛:暖黃色的燈籠光與冷藍色的月光交織。畫面充滿了節慶的氣氛 渲染:極其細緻的織物紋理,電影級照明,景深效果,8K分辨率,像電影《妖貓傳》一樣的視覺盛宴
4.常見問題至此,這是Z-Image完整本地部署流程,實際使用中可能會遇到,例如影像全黑、文字亂碼或皮膚出現蠟質感 通常源自於參數設定不當、文件載入錯誤或是提示詞格式不規範等
GitHub:github.com/Tongyi-MAI/Z-I… Hugging Face:huggingface.co/Tongyi-MAI/Z-I… ModelScope:modelscope.cn/models/Tongyi-…









