X (Twitter)

FLUX 2 重磅發布：前沿視覺智慧的突破 Black Forest Labs 這次發布了四個版本： · FLUX 2 [pro]：最高品質版本，透過API 提供，速度快、成本低，在品質和速度間實現了完美平衡。 · FLUX 2 [flex]：開放參數控製版本，開發者可以調節步數和引導係數，在品質、提示詞遵循度和速度間自由權衡。 · FLUX 2 [dev]：32B 參數的開放權重模型，目前最強大的開放式影像產生和編輯模型，可在單張RTX 4090 顯示卡上本地運行。 · FLUX 2 [klein]（即將推出）：Apache 2.0 開源模型，從基礎模型蒸餾而來，更輕但保持強大能力。核心創新點 1. 多參考影像支援FLUX 2 可以同時參考多達10 張影像，在保持角色、產品或風格一致性方面達到業界最佳水準。這對品牌設計、角色開發等場景意義重大。 2. 極致的真實感與細節模型在光線、紋理和空間邏輯上有顯著提升，適合產品攝影、視覺化和類攝影應用場景。 3. 文字渲染能力複雜的排版、資訊圖表、表情包和介面原型中的精細文字現在可以在生產環境中可靠運作。這解決了AI 影像生成中長期存在的文字準確性問題。 4. 高解析度編輯支援高達400 萬像素的影像編輯，同時保持細節和連貫性。 5. 更強的提示詞遵循對複雜、結構化指令的理解力大幅提升，包括多部分提示和構圖約束。模型家族技術架構 FLUX 2 基於潛在流匹配架構，將影像產生和編輯整合到單一架構中。模型結合了Mistral-3 24B 參數的視覺-語言模型與修正流變換器，前者帶來真實世界知識和上下文理解，後者捕捉空間關係、材質屬性和構圖邏輯。此外，團隊從頭重新訓練了模型的潛在空間（VAE），在可學習性、品質和壓縮率之間實現更優平衡。意義與影響這次發布的核心意義在於：從炫技工具到生產工具的轉變。 FLUX 2 不只是產生精美圖片，而是真正能處理品牌規範、保持風格一致性、精確渲染文字、遵循複雜指令——這些都是創意工作流程中的剛需。 Black Forest Labs 的"開放核心"理念也值得關注：既提供商業級API，又發布開放權重模型，讓研究者、創作者和開發者都能參與塑造視覺智能的未來，而不是由少數公司壟斷。這是通往多模態智能體的重要一步——未來的AI 將統一感知、生成、記憶和推理能力。 FLUX 2 讓我們看到這個未來正在加速到來。

来自 meng shao（@shao__meng）的推文线程

作者信息

线程正文