X (Twitter)

否定的な意見に耳を貸さないでください。Gemini 3はあらゆる種類のコーディングタスクに非常に優れています。WebアプリのUI、SwiftでのiOS開発、Pythonでのバックエンドコード、AI/ML関連のあらゆるものなど、あらゆる用途に対応します。ルールの遵守とツールの活用において、非常に強力で優れています。

主要なフロンティアモデルがリリースされるたびに、影響力を狙う人たちが「期待外れ」だとか、自分たちの得意なタスクに失敗したとか言うようです。大抵は、彼らのプロンプトが下手だったか、タスクが馬鹿げていて現実世界とは全く関係がなかったというだけの話です。

Llama4のような例外もありますが、3分間試しただけで誰が見てもひどいものでした。しかし、GPT-5についても同じことを言う人がいましたが、それは笑ってしまうほど間違っていました。株式市場では、懐疑的で逆張りの姿勢をとる人の方が注目を集めるのと同じです。ネガティブな意見は売れるのです。

重要なのは (少なくともコーディングにおいては)、ソフトウェア開発で同様のモデルを使用するスキルをすでに持っている人にとってそのモデルがどれだけ優れているか、そして、愚かな落とし穴の問題ではなく、さまざまな現実的な現実世界のタスクで数時間試した後の彼らの理にかなった意見です。

そして、モデルがどれだけ一貫性があり自律的であるか、どれだけの主体性と「根性と決意」を示しているか（これはエージェントハーネス、つまり Cursor と Gemini-CLI にも関係します）、ツールがどれだけ信頼できるかを実際に確認するには、実際の時間と多くの独立した試験が必要です。

Jeffrey Emanuel（@doodlestein）のスレッド

作者情報

スレッド内容