Keep on to blur preview images; turn off to show them clearly

Have questions, or building something cool with Cloudflare's Developer products? We're here to help. For help with your account please try @CloudflareHelp


Creator of @tailwindcss. Listener of Slayer. Austin 3:16.


https://t.co/zSf5Z2H78P https://t.co/ryMAyS77qn https://t.co/Gm6gdHaLgp On a mission to inspire 1B people to build stuff!


Asst professor @MIT EECS & CSAIL (@nlp_mit). Author of https://t.co/VgyLxl0oa1 and https://t.co/ZZaSzaRaZ7 (@DSPyOSS). Prev: CS PhD @StanfordNLP. Research @Databricks.


Asst professor @MIT EECS & CSAIL (@nlp_mit). Author of https://t.co/VgyLxl0oa1 and https://t.co/ZZaSzaRaZ7 (@DSPyOSS). Prev: CS PhD @StanfordNLP. Research @Databricks.

![FLUX 2 重磅发布:前沿视觉智能的突破
Black Forest Labs 这次发布了四个版本:
· FLUX 2 [pro]:最高品质版本,通过 API 提供,速度快、成本低,在质量和速度间实现了完美平衡。
· FLUX 2 [flex]:开放参数控制版本,开发者可以调节步数和引导系数,在质量、提示词遵循度和速度间自由权衡。
· FLUX 2 [dev]:32B 参数的开放权重模型,目前最强大的开放图像生成和编辑模型,可在单张 RTX 4090 显卡上本地运行。
· FLUX 2 [klein](即将推出):Apache 2.0 开源模型,从基础模型蒸馏而来,更轻量但保持强大能力。
核心创新点
1. 多参考图像支持FLUX 2 可以同时参考多达 10 张图像,在保持角色、产品或风格一致性方面达到业界最佳水平。这对品牌设计、角色开发等场景意义重大。
2. 极致的真实感与细节模型在光照、纹理和空间逻辑上有显著提升,适合产品摄影、可视化和类摄影应用场景。
3. 文字渲染能力复杂的排版、信息图表、表情包和界面原型中的精细文字现在可以在生产环境中可靠运行。这解决了 AI 图像生成中长期存在的文字准确性问题。
4. 高分辨率编辑支持高达 400 万像素的图像编辑,同时保持细节和连贯性。
5. 更强的提示词遵循对复杂、结构化指令的理解力大幅提升,包括多部分提示和构图约束。
模型家族
技术架构
FLUX 2 基于潜在流匹配架构,将图像生成和编辑整合到单一架构中。模型结合了 Mistral-3 24B 参数的视觉-语言模型与修正流变换器,前者带来真实世界知识和上下文理解,后者捕捉空间关系、材质属性和构图逻辑。
此外,团队从头重新训练了模型的潜在空间(VAE),在可学习性、质量和压缩率之间实现更优平衡。
意义与影响
这次发布的核心意义在于:从炫技工具到生产工具的转变。FLUX 2 不只是生成精美图片,而是真正能处理品牌规范、保持风格一致性、精确渲染文字、遵循复杂指令——这些都是创意工作流程中的刚需。
Black Forest Labs 的"开放核心"理念也值得关注:既提供商业级 API,又发布开放权重模型,让研究者、创作者和开发者都能参与塑造视觉智能的未来,而不是由少数公司垄断。
这是通往多模态智能体的重要一步——未来的 AI 将统一感知、生成、记忆和推理能力。FLUX 2 让我们看到这个未来正在加速到来。 FLUX 2 重磅发布:前沿视觉智能的突破
Black Forest Labs 这次发布了四个版本:
· FLUX 2 [pro]:最高品质版本,通过 API 提供,速度快、成本低,在质量和速度间实现了完美平衡。
· FLUX 2 [flex]:开放参数控制版本,开发者可以调节步数和引导系数,在质量、提示词遵循度和速度间自由权衡。
· FLUX 2 [dev]:32B 参数的开放权重模型,目前最强大的开放图像生成和编辑模型,可在单张 RTX 4090 显卡上本地运行。
· FLUX 2 [klein](即将推出):Apache 2.0 开源模型,从基础模型蒸馏而来,更轻量但保持强大能力。
核心创新点
1. 多参考图像支持FLUX 2 可以同时参考多达 10 张图像,在保持角色、产品或风格一致性方面达到业界最佳水平。这对品牌设计、角色开发等场景意义重大。
2. 极致的真实感与细节模型在光照、纹理和空间逻辑上有显著提升,适合产品摄影、可视化和类摄影应用场景。
3. 文字渲染能力复杂的排版、信息图表、表情包和界面原型中的精细文字现在可以在生产环境中可靠运行。这解决了 AI 图像生成中长期存在的文字准确性问题。
4. 高分辨率编辑支持高达 400 万像素的图像编辑,同时保持细节和连贯性。
5. 更强的提示词遵循对复杂、结构化指令的理解力大幅提升,包括多部分提示和构图约束。
模型家族
技术架构
FLUX 2 基于潜在流匹配架构,将图像生成和编辑整合到单一架构中。模型结合了 Mistral-3 24B 参数的视觉-语言模型与修正流变换器,前者带来真实世界知识和上下文理解,后者捕捉空间关系、材质属性和构图逻辑。
此外,团队从头重新训练了模型的潜在空间(VAE),在可学习性、质量和压缩率之间实现更优平衡。
意义与影响
这次发布的核心意义在于:从炫技工具到生产工具的转变。FLUX 2 不只是生成精美图片,而是真正能处理品牌规范、保持风格一致性、精确渲染文字、遵循复杂指令——这些都是创意工作流程中的刚需。
Black Forest Labs 的"开放核心"理念也值得关注:既提供商业级 API,又发布开放权重模型,让研究者、创作者和开发者都能参与塑造视觉智能的未来,而不是由少数公司垄断。
这是通往多模态智能体的重要一步——未来的 AI 将统一感知、生成、记忆和推理能力。FLUX 2 让我们看到这个未来正在加速到来。](/_next/image?url=https%3A%2F%2Fpbs.twimg.com%2Fmedia%2FG6o6jvAbwAIZRzL.jpg&w=3840&q=75)
邵猛,中年失业程序员 😂 专注 - Context Engineering, AI Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱:shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴
