X (Twitter)

실제로 자연어 규칙을 배우는 것이 매우 효과적인 이유(그리고 *언제*)는 사용자의 의도와 선호도를 파악하는 데 있습니다. 핵심 사양은 영어로 설명하는 것이 가장 쉽습니다. 하지만 긴 꼬리의 엣지 케이스와 실패 패턴은 일반적으로 분포적으로 예시나 피드백을 통해 표현하는 것이 가장 쉽고 (가장 자연스럽게 나타납니다). 그렇다면 어떻게 이를 정책으로 전환할 수 있을까요? 저수준 기계 또는 모터 관련 기술의 경우, 그래디언트 업데이트보다 나은 것은 없습니다. 고수준 조향 또는 신규/잠재 요구 사항의 경우, 신속한 학습보다 나은 것은 없습니다. 이것이 바로 AI 소프트웨어에서 자연어 서명, 데이터 기반 평가/피드백, 기호적 구성이라는 세 가지가 모두 필요한 이유입니다. 이를 통해 시스템을 완전히 *명시*할 수 있습니다. 그리고 시스템을 최대한 *조정*하려면 신속한 최적화, 그래디언트 업데이트, 추론 시간 확장이라는 세 가지가 모두 필요합니다.

AI 소프트웨어 학습이 데이터셋을 맞추는 것이라고 생각한다면 이런 미묘한 차이는 완전히 사라집니다. 평가(또는 프로그램)만으로는 문제의 심각성을 크게 과소평가할 수 있습니다.

Omar Khattab(@lateinteraction)의 스레드

작성자 정보

스레드 내용