새해에 Symbolic은 큰 소식을 전할 예정입니다. 기대해 주세요! 그때 저는 간단한 축하 행사를 갖고, 발표할 성과를 가능하게 한 접근 방식에 대해 이야기해 보겠습니다. 하지만 제 CTO로서 가진 비밀은 바로 이것입니다. 저는 AI에 대한 과대광고를 믿지 않습니다. 🤷♂️
깃허브 스타가 수없이 많은 "AI" 저장소에 대한 과대광고는 믿지 않습니다. 실제로 저장소를 클론해 보면 실질적인 작업은 거의 없고, 흥미로운 부분은 의존성 추가 없이 제 앱에 그대로 가져다 쓸 수 있다는 것을 알게 됩니다.
"내가 연구실에서 본 비밀 때문에 세상이 순식간에 바뀔 거야"라는 식의 과장된 주장은 믿지 않아. 예전에도 애매모호한 글들을 믿지 않았고, 지금도 마찬가지야. 연구실에 뭐가 있는지도 틀렸고, 세상에 대한 생각도 틀렸어. 주사위를 굴려서 눈 하나 안 나왔네.
저는 프론티어 랩의 특정 기능 출시가 해당 제품 카테고리 전체를 뒤흔들어 놓았다는 식의 과대광고를 믿지 않습니다. 여러분과 달리 저는 데모 영상을 일시 정지하고 결과물을 꼼꼼히 살펴보고 평가하는 데 시간을 투자하는데, 대개 형편없고 가짜에 불과하며 과장된 경우가 많습니다.
"AI가 이제 뉴스 기사를 마음대로 쓸 수 있으니 콘텐츠는 이미 완성됐다"는 식의 과장된 주장을 믿지 않습니다. GPT-3 시절부터 이런 말을 들어왔지만 그때도 사실이 아니었고 지금도 마찬가지입니다. 저는 AI를 활용해 뉴스 기사를 쓰려는 기자들과 함께 일하고 있기 때문에 이 점을 잘 알고 있습니다.
코딩 모델에 대한 과대광고, 특히 극단적인 형태의 모델에 대해서는 회의적입니다. 소프트웨어 엔지니어링에서 무엇이 좋고 무엇이 나쁜지에 대한 깊이 있는 지식의 가치는 AI 때문에 떨어진 것이 아니라 오히려 높아졌습니다. (물론 주니어 개발자들은 정말 어려운 상황에 처해 있긴 합니다.)
저는 벡터 데이터베이스에 대한 과대광고를 믿지 않았습니다. 그냥 포스트그레스(PostgreSQL)를 계속 사용했고, pgvector는 초창기에는 충분히 좋았고 지금도 많이 개선되었습니다. 하지만 새로운 종속성을 추가하려면 기준이 매우 높아야 하는데, "별점이 많다"는 것만으로는 충분하지 않습니다.
저는 상담원 시스템에 대한 과대광고를 믿지 않습니다. 제대로 작동하는 상담원은 여전히 매우 단순하고, 사람이 직접 확인하기 전까지는 별다른 작업을 하지 않습니다. 상담원 오류는 서로 상쇄되지 않고 오히려 누적됩니다. 따라서 가능한 한 모든 것을 수동으로 처리하는 것이 최선입니다.
저는 프론티어 랩의 예측을 믿지 않습니다. 물론, 연구소들이 예측한 미래 벤치마크 성능이 맞아떨어지는 건 당연한 일이죠. "수치 상승"과 관련된 금액을 보셨나요?! 이런 예측과 "지능" 사이의 괴리는 점점 더 커지고 있습니다.
저는 LLM에 대한 과대광고를 믿지 않습니다. 이는 시퀀스를 도출하는 데 유용한 매우 협소하고 취약한 기술이며, 사용자를 경제적으로 가치 있는 잠재 공간 영역으로 유도하려면 엄청난 소프트웨어 엔지니어링(컨텍스트 엔지니어링에 대한 과대광고는 사실이지만)이 필요합니다. LLM은 인공 일반 지능(AGI)이 아닙니다.
Symbolic에서는 침착함을 유지하고 들뜨지 않으며, 묵묵히 한 가지 일에 집중함으로써 놀라운 성과를 거두었습니다. 사업을 운영하려면 반드시 해야 할 일, 즉 고객의 실제 문제를 파악하고 해결하는 데 전념해 왔습니다.
AI 개발자로서, AI 과대광고, 모호한 게시물, 지나친 FOMO, 그리고 스레드 보이들을 무시하고 LLM을 도구 상자의 여러 도구 중 하나이자 유용한 응답을 얻을 수 있는 또 다른 REST API처럼 다루는 데에는 많은 알파적인 요소가 있었습니다.
2026년 AI에 대한 제 예측은, AI 관련 논의의 90%를 무시하는 알파 버전의 양이 계속 증가할 것이라는 것입니다. 이는 벤치마크 수치가 LLM을 실제 고객이 실제 작업을 수행하는 데 필요한 실제 기능에 통합하는 현실과 점점 더 동떨어지게 될 것이기 때문입니다.