@aidotengineer의 CODE에서 진행된 코딩 평가의 과거/현재/미래에 대한 최고의 강연이었습니다. 기본적으로 시간 순서대로 추적해 보세요. 초: 코파일럿 아레나 분: LiveCodeBench 몇 분: RepoChat ~시간: GSO 여러 시간: 시지기 날: ??? https://t.co/exTyCakFxe @StringChaos 님을 초청했을 당시에는 그분이 @Cursoryoutube.com/watch?v=tHN44y…몰랐습니다. 그저 LiveCodeBench에 대한 이야기만 기대했었죠. 그런데 기대 이상으로 많은 것을 얻었습니다. 지난 3년간 코딩 평가 도구가 어떻게 발전해왔는지, 커뮤니티에서 얻은 모든 지식과 경험, o3의 보상 해킹, 그리고 이제는 정말 많은 양의 코드를 마이그레이션하고 온라인 평가 도구를 지연 시간 및 실제 환경 제약 조건에 맞춰 조정하는 벤치마크까지 포괄적으로 살펴볼 수 있었습니다. 마지막에는 직접 코딩 평가 도구를 개발하는 분들을 위해 실질적인 조언을 제공하기도 했습니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.


