X (Twitter)

アンドレイ・カルパティ氏は2025年についての感想を語った。トレーニングパラダイム、ベンチマーク無効化、カーソル、クロードコード、VibeCoding、LLMGUIの変更について 1. RLVR RLVRは、事前学習、教師ありファインチューニング、RLHFに続く新たな学習フェーズです。数学やコードなどの検証可能な環境での学習を通じて、LLMは自発的に推論戦略を学習し、問題を分解して複数のステップで解決します。従来のファインチューニングとは異なり、RLVRは長期的な最適化を可能にし、高い能力対コスト比を実現しながら、事前学習に使用された計算能力を消費します。2025年までの能力向上は、主に強化学習のより長い実行によってもたらされるでしょう。 2. 幽霊対動物 LLMの最適化目標は人間のニューラルネットワークのそれとは大きく異なり、結果として鋸歯状の知能、つまり小学生にも簡単に騙される天才学者のような知能を生み出します。RLVRは検証可能な領域におけるLLMの能力を飛躍的に向上させましたが、全体的なパフォーマンスは依然として不均一です。ベンチマークは検証可能であるため、最適化の対象として容易に設定でき、「テストセットでのトレーニング」が新たな技術となっています。 3. カーソル Cursorは、LLMアプリケーションの新たな形態を提示します。垂直ドメインにおける複数のLLM呼び出しのオーケストレーション、コンテキストエンジニアリングの実行、専用GUIと自律スライダーの提供といった機能です。このアプリケーション層の「厚み」が議論の的となっています。彼は、LLMラボは汎用的な人材を育成する一方、LLMアプリケーションは、プライベートデータ、センサー、フィードバックを通じて、それらをドメイン固有の専門チームへと活性化させると主張しています。 4. クロード・コード Claude Codeは、ツールの使用と推論をループするLLMエージェントの初の成功例です。重要なのは、クラウドではなくローカルコンピュータ上で実行されることです。OpenAIは誤ってエージェントをクラウドコンテナにデプロイしましたが、機能が変化する移行期間中は、ローカルでの操作と開発者間の連携がより合理的です。CLI形式で提供されるClaude Codeは、ウェブサイト上のAIをコンピュータ上の「生きた」スプライトへと変換し、全く新しいインタラクションパラダイムを提示します。 5. バイブコーディングはソフトウェアに革命をもたらし、職務内容を変えるでしょう。 Vibe Codingは、プログラミングを専門家だけでなく、誰もが利用できるようにします。また、専門家が普段は書かないようなソフトウェアを書けるようにすることで、コードを無料、一時的、そして使い捨てにできるようにします。 6. ナノバナナ / LLM GUI ナノバナナは、LLM GUIのプロトタイプを予感させます。コンピュータがコマンドラインからGUIへと進化したように、LLMもプレーンテキストチャットからビジュアル出力へと進化するはずです。人々はテキストを読むことを好みません。それは時間がかかり、面倒だからです。ナノバナナは、テキスト生成、画像生成、そして世界知識の融合という、複合的な機能を示しています。

歸藏(guizang.ai)（@op7418）のスレッド

作者情報

スレッド内容