1년 전만 해도 SWE-Bench는 모델이 프로그래머 일자리를 코딩하거나 위협할 수 있다고 가정하는 야심찬 계획을 세웠습니다. 이러한 진전은 에이전트 코딩 데이터에 대한 막대한 투자에 의해 직접적으로 촉진되었습니다. 다른 직업에서도 이런 일이 일어나는 것을 막을 수 있는 것은 없습니다.
또한 어떤 직업이 실제로 "인간적인 접촉"으로부터 혜택을 받는지도 알아낼 것입니다. 안타깝게도, 사람들이 생각하는 것보다 훨씬 적을 것입니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 2개 · 2025. 12. 7. 오전 7:43
1년 전만 해도 SWE-Bench는 모델이 프로그래머 일자리를 코딩하거나 위협할 수 있다고 가정하는 야심찬 계획을 세웠습니다. 이러한 진전은 에이전트 코딩 데이터에 대한 막대한 투자에 의해 직접적으로 촉진되었습니다. 다른 직업에서도 이런 일이 일어나는 것을 막을 수 있는 것은 없습니다.
또한 어떤 직업이 실제로 "인간적인 접촉"으로부터 혜택을 받는지도 알아낼 것입니다. 안타깝게도, 사람들이 생각하는 것보다 훨씬 적을 것입니다.