셰르질 오자이르는 생성적 미디어 혁명(AI 이미지, 비디오 등)을 촉발한 것으로 평가받는 "생성적 적대 신경망(Generative Adversarial Networks)" 논문으로 명성을 얻었습니다. 이 논문은 신경망에 '상상'하는 방법을 사실상 가르쳐 주었습니다. 셰르질 오자이르는 인도 공과대학교 델리 캠퍼스의 몬트리올 대학교를 방문하여 주저자 이언 굿펠로우와 튜링상 수상자인 요슈아 벤지오와 함께 작업했습니다.(https://t.co/LhtYzhBYGL) 그 이후로 그는 뒤돌아보지 않았습니다. 행운과 재능 덕분이죠. 그의 스타트업 '제너럴 에이전트'는 제프 베조의 프로젝트 프로메테우스에 인수되었고, 그는 2025년 6월부터 이 프로젝트의 공동 창립자로 참여하고 있습니다. 베조스가 왜 그들의 기술에 관심을 갖는지 알아보는 것도 흥미로울 것이다. 이유는 다음과 같습니다. AI가 GUI 입력으로 컴퓨터를 조작하게 하면 AI 모델에 매우 긴 입력이 발생합니다. 비용이 많이 들고 속도도 느립니다. 그의 스타트업 "제너럴 에이전트(General Agents)"는 화면에 표시되는 내용을 빠르게 이해하고 입력(예: 마우스 클릭)을 어떻게 조작할지 결정할 수 있도록 하는 차별화된 접근 방식을 사용합니다. 아마도 가벼운 시각 언어 행동(VLA) 모델을 사용할 것입니다. 또한 추론용 모델과 커서를 정확히 어디에 놓아야 할지 파악하는 모델 두 가지를 사용할 가능성이 높습니다. 데모는 여기에서 확인하실 수 있습니다. 실제 속도입니다. https://t.co/e6On4WAIEQ 이러한 모델은 웹 브라우징을 위한 컴퓨터 사용 외에도 SCADA 소프트웨어 및 엔지니어링 설계 소프트웨어 운영 등 다양한 용도로 활용될 수 있습니다. 컴퓨터 사용이 새로운 것은 아니지만, 그 속도는 놀랍습니다. Qwen의 VLA 모델도 비슷한 작업을 할 수 있지만, 속도는 그만큼 빠르지는 않습니다. 셰르질 오자이르는 DeepMind와 Tesla Autopilot 프로젝트에서 풍부한 경험을 쌓았습니다. 그의 논문은 10만 회 이상의 인용 횟수를 기록했으며, 이미 Prometheus 프로젝트의 가치 있는 공동 창립자입니다. 그는 많은 최고 인재를 유치하고 검증하는 데 도움을 줄 수 있습니다. @deedydas를 이기려고 해요. "Tweet like Deedy"라는 MCP 서버를 만들 거예요. Claude Code에게 대학이나 학교를 검색하고 홍보하는 기능도 추가해 달라고 부탁할 거예요! 😂 무례한 건 아니고 그냥 농담일 뿐이야, 디디. 네 옹호에 큰 팬이야. 진지하게 말씀드리자면, 하루 종일 컴퓨터로 일하는 사람들은 언젠가 MCP로 대체될 것 같습니다. 제 말이 믿기지 않으시다면 Claude 코드를 리버스 엔지니어링해서 Slash Command, Skills, SubAgents가 어떻게 작동하는지 직접 확인해 보세요. 모든 것이 .md 파일과 텍스트 설명으로 구성되어 있습니다. Bash만 있으면 됩니다. 추수감사절 잘 보내세요!
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
