FLUX 2 重磅發布:前沿視覺智慧的突破 Black Forest Labs 這次發布了四個版本: · FLUX 2 [pro]:最高品質版本,透過API 提供,速度快、成本低,在品質和速度間實現了完美平衡。 · FLUX 2 [flex]:開放參數控製版本,開發者可以調節步數和引導係數,在品質、提示詞遵循度和速度間自由權衡。 · FLUX 2 [dev]:32B 參數的開放權重模型,目前最強大的開放式影像產生和編輯模型,可在單張RTX 4090 顯示卡上本地運行。 · FLUX 2 [klein](即將推出):Apache 2.0 開源模型,從基礎模型蒸餾而來,更輕但保持強大能力。 核心創新點 1. 多參考影像支援FLUX 2 可以同時參考多達10 張影像,在保持角色、產品或風格一致性方面達到業界最佳水準。這對品牌設計、角色開發等場景意義重大。 2. 極致的真實感與細節模型在光線、紋理和空間邏輯上有顯著提升,適合產品攝影、視覺化和類攝影應用場景。 3. 文字渲染能力複雜的排版、資訊圖表、表情包和介面原型中的精細文字現在可以在生產環境中可靠運作。這解決了AI 影像生成中長期存在的文字準確性問題。 4. 高解析度編輯支援高達400 萬像素的影像編輯,同時保持細節和連貫性。 5. 更強的提示詞遵循對複雜、結構化指令的理解力大幅提升,包括多部分提示和構圖約束。 模型家族 技術架構 FLUX 2 基於潛在流匹配架構,將影像產生和編輯整合到單一架構中。模型結合了Mistral-3 24B 參數的視覺-語言模型與修正流變換器,前者帶來真實世界知識和上下文理解,後者捕捉空間關係、材質屬性和構圖邏輯。 此外,團隊從頭重新訓練了模型的潛在空間(VAE),在可學習性、品質和壓縮率之間實現更優平衡。 意義與影響這次發布的核心意義在於:從炫技工具到生產工具的轉變。 FLUX 2 不只是產生精美圖片,而是真正能處理品牌規範、保持風格一致性、精確渲染文字、遵循複雜指令——這些都是創意工作流程中的剛需。 Black Forest Labs 的"開放核心"理念也值得關注:既提供商業級API,又發布開放權重模型,讓研究者、創作者和開發者都能參與塑造視覺智能的未來,而不是由少數公司壟斷。 這是通往多模態智能體的重要一步——未來的AI 將統一感知、生成、記憶和推理能力。 FLUX 2 讓我們看到這個未來正在加速到來。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
![FLUX 2 重磅發布:前沿視覺智慧的突破
Black Forest Labs 這次發布了四個版本:
· FLUX 2 [pro]:最高品質版本,透過API 提供,速度快、成本低,在品質和速度間實現了完美平衡。
· FLUX 2 [f](https://pbs.twimg.com/media/G6o6jvAbwAIZRzL.jpg)