Ilya Sutskever – 私たちは「スケーリングの時代」から「研究の時代」へと移行しています。 @ilyasutさんと@dwarkesh_spさんのインタビューがついに公開されました!OpenAIを去って以来、最も充実した公開インタビューです。@ssiの謎めいた創設者であり、OpenAIの元チーフサイエンティストでもある二人がインタビューに登場します。どんな新たな洞察がもたらされるのか、ぜひご覧ください!👁 1. スケーリングの時代は終わりました。 • 2020年から2025年は、コンピューティングパワー、データ、事前トレーニングを積み重ねることで着実に強くなることができる「スケーリング時代」です。 • 限界収益が急激に低下している現在、単に計算能力を 100 倍に増やしても質的な変化はもたらされません。 今後 5 ~ 10 年間のブレークスルーは、エンジニアリング材料ではなく、再び「研究とイノベーション」に依存することになるでしょう。 イリヤ氏は、2025年以降は2012~2020年の「研究時代」に戻るが、今回は誰もがより大きな計算能力を持つことになるだろうと明言している。 2. 現在のモデルの「ギザギザ」した機能が実際のパフォーマンスと一致しない根本的な原因: このモデルはベンチマーク テストでは非常に優れたパフォーマンスを発揮しますが、実際のタスクでは新しいバグが繰り返し発生し、反復的な修正が必要になります。 イリヤの説明: • RL フェーズでの評価の過剰最適化 (人間の研究者による「報酬ハック」) は、過剰な特化につながります。 • 「競技プログラミングを 10,000 時間しか練習していない学生」と同様、優れたスキルは持っているものの、「センス」と幅広い判断力が欠けています。 本当のボトルネックとなっているのは計算能力ではなく、むしろ一般化能力が人間に比べてはるかに劣っていることです。 3. 人間はなぜモデルよりもはるかに一般化できるのでしょうか? 人間のサンプルは非常に効率的で、強力な継続的な学習能力を備え、驚くべき堅牢性を示します。 進化により、極めて強力な事前知識(視覚、動作、固有の価値関数)がもたらされますが、言語、数学、プログラミングなどの新しい分野では、人間は依然としてモデルをはるかに上回っています → 問題は事前知識ではなく、学習アルゴリズム自体の優位性にあることを示しています。 イリヤ氏は、彼とSSIが、人間に近いレベルの継続的な学習と一般化を実現できる新しい機械学習パラダイムを研究していることを示唆した(ただし、競争のため詳細は明らかにできない)。 4. 「事前トレーニング + RL」パラダイムに関する考察:事前トレーニングの成功は、「データを選択する必要がなく、ネットワーク全体からデータを投入するだけ」であることにあります。 しかし、これにより人々は「AGI は単に十分に大きなサイズに事前トレーニングされているだけ」であると誤って信じるようになり、真に柔軟な知能ではなく「暗記型の競争マシン」が生み出される結果となりました。 真の AGI は「15 歳の優秀な学生」のようなものです。つまり、基本的な能力は非常に優れていますが、展開と継続的な学習を通じて特定の知識とスキルを習得する必要があります。 5. SSIの真の目標:直線的な安全なスーパーインテリジェンス デフォルトの計画は、「最初に製品をリリースするのではなく、本質的に安全な超インテリジェントシステムが開発されるまで純粋な研究に焦点を当て、その後すべてを一度にリリースする」というものです。 しかし、イリヤは初めて、「段階的な展開+現実世界からの継続的な学習」という道も真剣に検討していることを示唆した。その理由は以下の通り。 強力な AI に世界が徐々に適応できるようにすることは、完全に閉じたシステムで AI を開発するよりも安全かもしれません。 超知能は、おそらく「一度きりの全知全能」の最終状態ではなく、むしろ人間と同じように、その役割において継続的に学習し、成長できるシステムである。 6. 視点を合わせるための重要な更新: 過去 1 年間における Ilya の考え方の最大の転換: **段階的な展開と、世界に AI の力を真に感じてもらうことが、単なる熟考よりも重要です。** AIが本当に「強力」になり始めると、すべての大手企業が突然、セキュリティに関して極度の偏執症になるだろうと彼は予測している。 • 整合の究極の目標: 将来、知覚力を持つ存在のほとんどが AI 自身となるため、超知能が「人間」だけではなく知覚力を持つ存在を真に気にかけるようにすること。 長期的に安定した解決策の 1 つは (彼は好んではいないが、必要になるかもしれないと認めている)、人間とマシンの深い統合 (Neuralink++ レベル) であり、これにより人間が AI の意思決定に直接参加して理解できるようになります。 7. タイムライン予測: 人間レベルの学習能力を備え、超知能につながるシステム: 5 ~ 20 年 (おそらくそれより早い期間)。 現在の事前トレーニング + RL パラダイムは引き続き収益の成長を促進しますが、明らかにある時点で「行き詰まり」、真の人間レベルの一般化を達成できなくなります。 8. 研究の趣旨の本質: 優れた研究の方向性は、以下の条件を同時に満たす必要があります。 • 人間の脳の有効なアナロジーに基づいている • シンプルでエレガント、そして醜さを感じさせない • 複数の視点から真実である「トップダウンの確信」 こうした好みにより、実験が失敗し続け、すべてのデータが「間違っている」と示しているときに諦めるのではなく、デバッグを続けることができます。 YouTubeビデオリンク:
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
