Z画像実世界テスト!このモデルはたった6ピクセル!効果は抜群です! Tongyi Z-image-Turboのハンズオンテストをご紹介します!これは、出力アスペクト比の設定に対応したテキスト画像変換モデルです。最高解像度は6.5メガピクセル近くまで対応可能です(それ以上の解像度で画像を生成できないわけではありませんが、画質は低下します)。最適な解像度は4~5メガピクセルです(つまり、生成される画像の品質はかなり良好です)。 このモデルの最大の魅力は、6バイトという超小型サイズでありながら、パワフルなパフォーマンスを実現していることです。大容量ビデオメモリ(16GB)を搭載したほとんどのゲーミンググラフィックカードで動作可能です。プロ仕様のグラフィックカードであれば、わずか数秒で画像生成も可能です。 このテストは、映画ポスター生成(複雑なシーンの再構成+テキスト生成)と絵文字生成(キャラクターの表情制御)に焦点を当てています。 端的に言って、私がテストした映画ポスター生成シーンは、他のものを完全に圧倒しています。表紙画像を見れば、マーロン・ブランドの2つの顔がほぼ融合しているのが分かります。すごい! もちろん、テスト中に遭遇した問題についても触れておく必要があります。これはモデルのサイズにも関連しています。モデルのサイズが非常に小さいため、命令部分も非常に小さく、命令に対する推論能力は非常に限られています。「黒板を描き、4の3乗と1300を計算し、結果を黒板に書きなさい」といった複雑で抽象的な指示を用いると、実装は間違いなく不可能です。モデルに「1364と書かれた黒板を描きなさい」と直接指示する方が、より信頼性が高いでしょう。 もちろん、成功か失敗かはサイズにかかっています。6バイトのサイズは、ローカル展開や動的な画像生成には十分です。さらに、テキスト生成とコマンドコンプライアンスも優れています。Z-imageとLoRAを使った様々なアプリケーションが今後数多く登場することが予想されます。つまり、すぐにローカルにコピーを保存して使い始めるということです。 #zimage #TongyiLab #ナノバナナ #WenshengTuLargeModel #KCORESLargeModelArena
素晴らしいジョーズとゴッドファーザーのポスター
タイタニックと流浪の地球のポスター
晴れた日と絵文字生成
要約














