“GPT‑5.1-Codex-Max는 24시간 이상 작업에 사용됩니다.” 최첨단 AI 연구실에서 이런 주장을 할 때, 실제로 어떤 작업이었는지, 그리고 모델이 무엇을 산출했는지 알려주시겠습니까? 게으른 인턴도 24시간 일하고 10줄의 코드를 배포할 수 있거든요.
알겠습니다. 흥미로운 지표네요. "OpenAI 엔지니어의 95%가 Codex를 매주 사용하고 있으며, 이 엔지니어들은 Codex를 도입한 이후 풀 리퀘스트를 약 70% 더 많이 전송했습니다." 나머지 5%의 엔지니어가 Codex를 사용하지 않는 이유는 무엇입니까?

