Black Forest Labs 發布FLUX.2,依舊開源! 支援文生圖、多圖參考以及圖像編輯,文字生成和提示詞遵循能力大幅提高。 具體的模型能力有: - 最多同時參考10 張圖片,提供最佳一致性。 - 更豐富的細節、更清晰的紋理和更穩定的光線。 - 複雜排版、資訊圖表、表情包和使用者介面的文字渲染 - 在遵循複雜、結構化指令方面得到改進 - 現實世界知識、光照和空間邏輯方面顯著更有根據 - 支援高達4MP 解析度的影像編輯 這次發布了四個模型版本: FLUX.2 [pro]:與最優秀的封閉模型相媲美的最先進圖像質量,在提示遵從性和視覺逼真度方面與其他模型相當,同時生成圖像更快且成本更低。速度與質量兩者兼得。 FLUX.2 [flex]:可控制模型參數,例如步數和引導強度,讓開發者對品質、提示遵從性與速度有完全控制。該模型在渲染文字和細節方面表現出色。 FLUX.2 [dev]:32B 開放權重模型,源自FLUX.2 基礎模型。目前最強大的開源圖像生成與編輯模型,將文字到圖像合成與多輸入圖像的圖像編輯結合在單一模型中。 FLUX.2 [klein](即將推出):開源,Apache 2.0 許可證模型,從FLUX.2 基礎模型透過蒸餾得到的同尺寸模型。比同等尺寸且從頭訓練的可比模型更強大且更利於開發者使用。 FLUX.2 - VAE:一種新的變分自編碼器,用於潛在表示,在可學習性、品質和壓縮率之間提供最佳化的權衡。
多圖參考和圖像編輯



