X (Twitter)

自然言語のルールを学習することが実際に非常に効果的である理由（そしていつ）は、実際には、意図と好みを聞き出すことにあります。コア仕様は英語で記述するのが最も簡単な場合が多いです。しかし、エッジケースや障害パターンのロングテールは、一般的に、例やフィードバックを通して表現するのが最も簡単で（そして最も自然に現れます）、分散的に表現されます。しかし、それらをどのようにポリシーに変換すればいいのでしょうか？低レベルの機械的または運動的なスキルの場合、勾配更新に勝るものはありません。高レベルのステアリングや、緊急/潜在的な要件の場合、迅速な学習に勝るものはありません。このため、AI ソフトウェアでは、システムを完全に *指定* するために、自然言語シグネチャ、データ駆動型評価/フィードバック、記号構成の 3 つすべてが必要になります。そして、システムを最大限に*調整*するには、プロンプト最適化、勾配更新、推論時間のスケーリングの 3 つすべてが必要になります。

AIソフトウェアにおける学習がデータセットへの適合であると考えると、こうしたニュアンスは完全に失われます。評価だけ（あるいはプログラムだけ）では、問題が十分に特定されていないことになります。

Omar Khattab（@lateinteraction）のスレッド

作者情報

スレッド内容