V3.2도 비슷한 맥락에서, 하지만 우아하지는 않게 이를 증명하는 것 같습니다. LLM들은 일반적으로 9/10점(인간 결과의 10/10점과 비교했을 때)을 줍니다. Gemini의 결과는 4/10점입니다. API의 Gemini는 제게 약간의 엉터리 보상을 해주었습니다.
우리는 타오 고래에게 약을 먹여야 합니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 2개 · 2025. 12. 3. 오전 12:13
V3.2도 비슷한 맥락에서, 하지만 우아하지는 않게 이를 증명하는 것 같습니다. LLM들은 일반적으로 9/10점(인간 결과의 10/10점과 비교했을 때)을 줍니다. Gemini의 결과는 4/10점입니다. API의 Gemini는 제게 약간의 엉터리 보상을 해주었습니다.
우리는 타오 고래에게 약을 먹여야 합니다.