X (Twitter)

一份【Z-Image】的零基礎上手指南，含本地部署+提示詞模板實戰 6GB顯存筆記本即能產生帶有中文字的商業級海報，指南從模型下載、配置ComfyUI、寫提示詞、解決常見報錯入手系統講解 1.依電腦配置，選取適用的部署方案（配置方案請參閱圖）如果是RTX 3060（6GB）、RTX 4050或其他顯存為6–8GB的設備，需要採用GGUF量化方案，如果顯存≥12GB（如RTX 3060 12G、4070、4080 等），則可使用原始BF16模型，無需額外插件 2、配置ComfyUI 想讓Z-Image在本地順利運行，需在ComfyUI中正確配置三個核心元件，擴散模型、文字編碼器和變分自編碼器 1）安裝ComfyUI、下載核心組件安裝ComfyUI最新版，從官網下載便攜包然後下載三個核心文件，並放置在ComfyUI的相應目錄下擴散模型檔案：z_image_turbo_bf16.safetensors (或FP8/GGUF版本，依據顯存選擇) 路徑：ComfyUI/models/diffusion_models/ 文字編碼器檔案：qwen_3_4b.safetensors （注意，這是一個3.4B參數的大語言模型，非傳統的CLIP）路徑：ComfyUI/models/text_encoders/ 變分自編碼器檔案：ae.safetensors （通常可通用Flux的VAE，但是建議使用官方提供的）路徑：ComfyUI/models/vae/ 將這三個檔案分別放入ComfyUI的對應目錄擴散模型放入models/diffusion_models/ 文字編碼器放入models/text_encoders/ VAE 放入models/vae/ 完成後，即可根據顯存大小選擇對應的工作流程第二步見下條 #ZImage #AI圖像 #圖像生成教程

2）12GB+顯存的快速部署方案如果顯示卡顯存≥12GB（如RTX 3060 12G、4070、4080等），建議使用Z-Image的標準工作流程獲得最佳畫質與速度【載入模型節點】在ComfyUI中，從左側範本庫選擇 “Z-Image Turbo文生圖”，系統會自動載入已放入對應目錄的三個核心元件使用Load Diffusion Model節點載入z_image_turbo_bf16.safetensors 使用Load VAE節點載入ae.safetensors 使用DualCLIPLoader或自訂的Z-Image Text Encoder Loader 載入qwen_3_4b 若已正確放置文件，模型通常會自動加載，無需手動配置【採樣器設定】預設子圖模式下可以修改基本設置，如果需要更多詳細設置，可以點擊右上角打開子圖進一步設置 KSampler的參數對產生效果至關重要，必須嚴格遵守以下設定 Steps：設為8或9，切勿設定過高20或30，否則容易導致皮膚出現蠟質感或色斑（Blotchy Skin）21 CFG：設為1.0 Sampler Name：推薦euler Scheduler：推薦sgm_uniform或預設的simple，經測試sgm_uniform能有效緩解低步數下的雜訊問題 Shift：1024解析度下設為3，2K解析度下設為7 【解析度設定】 Z-Image對1024x1024、1280x720、720x1280等標準解析度最佳化最佳，避免直接產生超高解析度，例如4K，可以先生成2K圖再透過Upscaler放大，確保構圖穩定性與細節品質完成以上三步驟後，即可輸入提示字並點選 “Queue Prompt” 產生圖像

3）低顯存工作流程6–8GB 顯存用戶的GGUF量化方案若使用的是RTX 3060（6GB）、RTX 4050等6–8GB顯存設備，則需採用GGUF量化方案首先需要在ComfyUI中透過ComfyUI Manager安裝ComfyUI-GGUF插件然後，從模型平台下載兩個GGUF格式的文件，擴散模型z_image_turbo_Q4_K_M.gguf和文字編碼器qwen_3_4b_Q4_K_M.gguf 這一步至關重要，未量化的qwen_3_4b.safetensors本身就會佔用超過6GB顯存，即使主模型已量化，加載時仍會因顯存溢出而失敗將這兩個檔案分別放入models/diffusion_models/ 和models/text_encoders/目錄在ComfyUI中，使用Unet Loader (GGUF) 節點載入擴散模型，使用CLIP Loader (GGUF) 節點載入文字編碼器，並連接VAELoader節點以載入官方ae.safetensors 採樣器參數設定與標準工作流程一致，Steps=8, CFG=1.0, Scheduler=sgm_uniform 顯存佔用可壓縮至6GB以下，雖然推理時間有所延長，但徹底解決了OOM問題

3.提示詞增強工作流程可以在工作流程前端加入一個LLM 處理環節（可選），來充分發揮Z-Image的潛力此LLM會將簡單的輸入（例如「一隻香水瓶」）自動擴展為包含場景、光影、材質和攝影參數的詳細指令，從而提升生成質量以下是三類高頻場景可直接重複使用的模板，無需額外配置 1）電商產品攝影，【為一款香水瓶生成展示圖】提示詞：一張超寫實、電影感的商業產品攝影大片。主體是一個半透明的琥珀色玻璃香水瓶，配有拉絲金金屬瓶蓋，優雅地坐落在從平靜水面浮出的一塊粗糙紋理的深色板岩上。場景設定在日出時分霧氣繚繞的熱帶雨林中光線與氛圍：強烈的體積光（丁達爾效應）透過上方鬱鬱蔥蔥的棕櫚葉傾瀉而下，投下複雜的斑駁陰影，並在水面和玻璃瓶上形成明亮舞動的焦散光斑（Caustic patterns）。光線溫暖、金黃且空靈，與岩石和水的冷暗色調形成對比細節與材質：極致的微距特寫焦點。瓶身表面可見冷凝水珠，反射周圍的綠植。板岩的紋理極為細緻，帶有苔蘚斑塊。水面有輕微的漣漪，具有逼真的反射和折射效果。背景中漂浮著失焦的微粒和精緻的白色茉莉花，漂流在水面上技術規格：使用哈蘇X2D 100C 相機拍攝，80mm 微距鏡頭，f/2.8 光圈以獲得奶油般的虛化背景。 8k 分辨率，品牌Logo 區域超清晰對焦，光線追蹤反射，虛幻引擎5 渲染風格，調色風格為奢華雜誌社論風 2）東方文化/漢服/地標【生成一張身著漢服的女性肖像】提示詞：一位絕世容顏的唐代貴妃，身穿層層疊疊的紅色真絲漢服（齊胸衫裙），上面繡著複雜的金線鳳凰和牡丹圖案。她站在宏偉的宮殿露台上，背景是繁華的長安城夜景，成千上萬的孔明燈漂浮在夜空中化妝細節：額頭畫著精緻的“花釷”，髮髻高聳，插滿了步搖、金釵和珍珠流蘇，在燈光下閃閃發光氣氛：暖黃色的燈籠光與冷藍色的月光交織。畫面充滿了節慶的氣氛渲染：極其細緻的織物紋理，電影級照明，景深效果，8K分辨率，像電影《妖貓傳》一樣的視覺盛宴

4.常見問題至此，這是Z-Image完整本地部署流程，實際使用中可能會遇到，例如影像全黑、文字亂碼或皮膚出現蠟質感通常源自於參數設定不當、文件載入錯誤或是提示詞格式不規範等

GitHub：github.com/Tongyi-MAI/Z-I… Hugging Face：huggingface.co/Tongyi-MAI/Z-I… ModelScope：modelscope.cn/models/Tongyi-…

來自 AIGCLINK（@aigclink）的推文串

作者資訊

推文串內容