自然言語のルールを学習することが実際に非常に効果的である理由(そしていつ)は、実際には、意図と好みを聞き出すことにあります。 コア仕様は英語で記述するのが最も簡単な場合が多いです。しかし、エッジケースや障害パターンのロングテールは、一般的に、例やフィードバックを通して表現するのが最も簡単で(そして最も自然に現れます)、分散的に表現されます。 しかし、それらをどのようにポリシーに変換すればいいのでしょうか?低レベルの機械的または運動的なスキルの場合、勾配更新に勝るものはありません。高レベルのステアリングや、緊急/潜在的な要件の場合、迅速な学習に勝るものはありません。 このため、AI ソフトウェアでは、システムを完全に *指定* するために、自然言語シグネチャ、データ駆動型評価/フィードバック、記号構成の 3 つすべてが必要になります。 そして、システムを最大限に*調整*するには、プロンプト最適化、勾配更新、推論時間のスケーリングの 3 つすべてが必要になります。
AIソフトウェアにおける学習がデータセットへの適合であると考えると、こうしたニュアンスは完全に失われます。評価だけ(あるいはプログラムだけ)では、問題が十分に特定されていないことになります。