ピチャイ氏への感謝のツイートを書いたとき、私は大体次のような一文を盛り込んだ。 真の「魔法の瞬間」は、Nano Banana Proの視覚化能力と世界知識を、Geminiのリアルタイム接続性と融合させた時に訪れます。Nano Banana Proは、あなたの最も大胆なアイデアを実現するだけでなく、私たち一人ひとりに自由な創造力を与えてくれます。 そこでこのネットユーザーが私に質問しました。 ワークフロー全体の中で最も難しい部分は何だと思いますか? ここで最も難しいのは、プロンプトでも創造性でもなく、AI の機能の限界、モデルの得意なことと不得意なことを知り、モデルの機能と自分のアイデアの最適な組み合わせを見つける必要があることです。 例えば、都市の天気予報の例ですが、GPT-4o Imageの開発中に似たようなものを作成しました。当時は非常に良い結果を生成できたものの、画像を生成するための日付や天気情報自体を取得できませんでした。そのため、天気情報を取得してGPTに変換するAPIを作成する必要があり、それがプレイアビリティを制限していました。 そのため、Gemini に Nano Banana Pro が統合されたときに、すぐにこのアイデアを再テストしたところ、Gemini モデルが現在の日付と天気を取得して画像を生成できるようになり、このアイデアを簡単に実装できることが分かりました。 もう一つの課題は、作品が単一のシーンで完結したり、作者が自分のプロンプトの素晴らしさを披露するだけのものであってはならないということです。読者が参加できるような、単なるプロンプトではなく、テンプレートとして機能させるべきです。誰もが自分のシナリオや興味に合わせて試したり、修正したりできるので、これは非常にやりがいのあることです。例えば、この都市の天気プロンプトセットなら、誰でも自分の都市で、異なる日付で試すことができます。タイムトラベルしたり、火星に場所を設定したり、仮想のゲームアドレスを設定したりなど、様々な楽しいバージョンを作ることができます。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
