내가 가장 좋아하는 새로운 도구는 "불확실성 도구"라고 부릅니다. 모델이 사용자 쿼리에 응답할 수 없을 때마다 이를 나에게 보고하고 검토할 수 있습니다. 또한 모델이 스스로를 반성하고 사용자에게 상황을 만들어내는 대신 명확한 질문을 할 수 있는 곳이기도 합니다.
이것이 어떻게든 환각률을 결정하는 데 벤치마킹될 수 있을 거라고 확신합니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 2개 · 2025. 11. 2. 오후 5:23
내가 가장 좋아하는 새로운 도구는 "불확실성 도구"라고 부릅니다. 모델이 사용자 쿼리에 응답할 수 없을 때마다 이를 나에게 보고하고 검토할 수 있습니다. 또한 모델이 스스로를 반성하고 사용자에게 상황을 만들어내는 대신 명확한 질문을 할 수 있는 곳이기도 합니다.
이것이 어떻게든 환각률을 결정하는 데 벤치마킹될 수 있을 거라고 확신합니다.