카르파티가 ImageNet을 수동으로 연구했던 시절을 기억하는 사람이 있을까요? 모델에 대한 입력을 수동으로 검사하는 것은 여전히 엄청난 잠재력을 가지고 있으며, 오늘날 LLMS/에이전트를 사용하면 더욱 그렇습니다. 이는 직관을 개발하고 더 나은 에이전트 엔지니어링을 수행하는 데 도움이 됩니다. 오늘날 에이전트 입력은 시스템 프롬프트, 도구 정의, 도구 입력/출력, 사고, 사용자 메시지, 에이전트 출력 등이 어우러진 거대한 덩어리입니다. "데이터 좀 봐"라는 @HamelHusain의 말처럼요. 만약 당신이 이 모든 걸 실제로 읽었다면, 도대체 무슨 일이 벌어지고 있는지 알 수 있었을까요? 하지만 입력을 잘 처리하는 시스템(컨텍스트 엔지니어링)을 갖추면 모델이 당신을 도울 수 있습니다. 실패 모드에 대한 가장 좋은 직관은 종종 추적 데이터를 직접 읽는 것에서 나옵니다. 오늘날 상담원은 여러 실행 과정에서 생성된 방대한 데이터를 면밀히 검토하는 데 도움을 줄 수 있습니다. 하지만 최신 정보를 파악하세요. 인간은 자신이 잘 아는 분야에서 훌륭한 평가자이고, 상담원은 방대한 데이터 속에서 훌륭한 패턴 매칭 능력을 발휘합니다. 훌륭한 조합이죠. 에이전트를 구축하는 사람들이 얼마나 많은 수동 작업을 하고 있다고 느끼는지, 그리고 그것이 얼마나 도움이 된다고 생각하는지 듣고 싶습니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.