X (Twitter)

Black Forest Labs 發布FLUX.2，依舊開源！支援文生圖、多圖參考以及圖像編輯，文字生成和提示詞遵循能力大幅提高。具體的模型能力有： - 最多同時參考10 張圖片，提供最佳一致性。 - 更豐富的細節、更清晰的紋理和更穩定的光線。 - 複雜排版、資訊圖表、表情包和使用者介面的文字渲染 - 在遵循複雜、結構化指令方面得到改進 - 現實世界知識、光照和空間邏輯方面顯著更有根據 - 支援高達4MP 解析度的影像編輯這次發布了四個模型版本： FLUX.2 [pro]：與最優秀的封閉模型相媲美的最先進圖像質量，在提示遵從性和視覺逼真度方面與其他模型相當，同時生成圖像更快且成本更低。速度與質量兩者兼得。 FLUX.2 [flex]：可控制模型參數，例如步數和引導強度，讓開發者對品質、提示遵從性與速度有完全控制。該模型在渲染文字和細節方面表現出色。 FLUX.2 [dev]：32B 開放權重模型，源自FLUX.2 基礎模型。目前最強大的開源圖像生成與編輯模型，將文字到圖像合成與多輸入圖像的圖像編輯結合在單一模型中。 FLUX.2 [klein]（即將推出）：開源，Apache 2.0 許可證模型，從FLUX.2 基礎模型透過蒸餾得到的同尺寸模型。比同等尺寸且從頭訓練的可比模型更強大且更利於開發者使用。 FLUX.2 - VAE：一種新的變分自編碼器，用於潛在表示，在可學習性、品質和壓縮率之間提供最佳化的權衡。

多圖參考和圖像編輯

来自歸藏(guizang.ai)（@op7418）的推文线程

作者信息

线程正文