X (Twitter)

비관적인 사람들의 말은 듣지 마세요. Gemini 3는 모든 종류의 코딩 작업에 매우 뛰어납니다. 웹 앱 UI, Swift로 iOS 개발, Python으로 백엔드 코드 작성, AI/ML 관련 모든 작업 등 모든 것을 처리할 수 있습니다. 규칙을 따르고 도구를 사용하는 데 매우 강력하고 능숙합니다.

주요 프론티어 모델이 출시될 때마다 영향력을 좇는 사람들이 얼마나 "실망스러웠는지", 그리고 자기들이 가장 좋아하는 과제를 어떻게 실패했는지 떠벌리는 것 같습니다. 대개 그들은 자극을 제대로 주지 못했거나, 그들의 과제가 어리석고 현실과 전혀 관련이 없다고 말합니다.

Llama4처럼 예외도 몇 가지 있는데, 3분만 써 본 사람이라면 누구나 끔찍했을 겁니다. 하지만 GPT-5에 대해서도 사람들은 그렇게 말했고, 그건 터무니없이 틀렸습니다. 주식 시장에서처럼 회의적이고 역발상적인 사람들이 더 많은 관심을 받는 것과 마찬가지입니다. 부정적인 태도가 잘 먹힙니다.

중요한 것은 (적어도 코딩에 있어서는) 소프트웨어 개발을 위해 비슷한 모델을 사용하는 데 능숙한 사람들에게 그 모델이 얼마나 좋은지, 그리고 다양한 현실적인 실제 업무에서 몇 시간 동안 시도해 본 후 합리적으로 내린 의견인지, 멍청한 함정 문제가 아닙니다.

그리고 모델이 얼마나 일관되고 자율적인지, 얼마나 많은 작용성과 "끈기와 결단력"을 보이는지(이 중 일부는 에이전트 하네스, 즉 Cursor 대 Gemini-CLI에 달려 있음), 도구를 얼마나 안정적으로 사용하는지 등을 파악하려면 실시간으로 많은 독립적인 시도가 필요합니다.

Jeffrey Emanuel(@doodlestein)의 스레드

작성자 정보

스레드 내용