X (Twitter)

Black Forest Labs が FLUX.2 をリリース。まだオープンソースです! テキストから画像への生成、複数画像の参照、画像編集をサポートし、テキスト生成とプロンプト単語の遵守機能が大幅に向上します。具体的なモデル機能は次のとおりです。 - 一貫性を最適に保つために、一度に最大 10 枚の画像を参照します。 - より豊かなディテール、よりクリアなテクスチャ、より安定した照明。 - 複雑なタイポグラフィ、インフォグラフィック、絵文字、ユーザーインターフェースでのテキストレンダリング - 複雑で構造化された指示に従う際のパフォーマンスの向上 - 現実世界の知識、照明、空間ロジックにさらに深く根ざしています。 - 最大4MP解像度までの画像編集をサポート今回発売されたモデルは以下の4種類です。 FLUX.2 [pro]：最高級のクローズドモデルに匹敵する最先端の画質を実現。他のモデルと同等のキューコンプライアンスと視覚的なリアリズムを提供しながら、より高速かつ低コストで画像を生成します。スピードと品質の両立を実現します。 FLUX.2 [flex]：開発者は歩数やガイダンスの強度といったモデルパラメータを制御できるため、品質、キューへの適合性、速度を完全に制御できます。このモデルは、テキストやディテールのレンダリングに優れています。 FLUX.2 [dev]: FLUX.2ベースモデルから派生した32Bオープンウェイトモデル。テキストから画像への合成と複数入力の画像編集を1つのモデルに統合した、現在最も強力なオープンソース画像生成・編集モデルです。 FLUX.2 [klein] (近日公開): オープンソースのApache 2.0ライセンスモデル。FLUX.2ベースモデルの精緻化版です。ゼロから学習した同規模の同等モデルよりも強力で、開発者にとって使いやすいモデルです。 FLUX.2 - VAE: 学習可能性、品質、圧縮率の間で最適化されたトレードオフを提供する潜在表現用の新しい変分オートエンコーダ。

複数画像の参照と画像編集

歸藏(guizang.ai)（@op7418）のスレッド

作者情報

スレッド内容