X (Twitter)

Karpathy에 대한 헌사 😂 K-Dense-AI에서 Claude를 사용하여 최첨단 머신 러닝 모델의 학습을 자동화하는 Agentic Machine Learning Engineer인 "karpathy"를 출시했습니다. 핵심 아이디어: Claude Code SDK를 독립적으로 코드를 작성하고, 실험을 실행하고, 결과를 분석하고, 반복적으로 최적화할 수 있는 "가상 ML 엔지니어"로 전환하는 것입니다. Andrej Karpathy에게 경의를 표하며, K-Dense 팀은 최첨단 Agent 기술을 사용하여 Karpathy와 유사한 효율적인 ML 개발 프로세스를 "재현"했습니다. 기술 스택 및 핵심 구성 요소: AI 모델 기반: Claude(OpenRouter API 호출을 통해)를 기반으로 Claude Code SDK와 결합하여 모델은 샌드박스 환경에서 Python 코드를 직접 작성하고 실행할 수 있습니다. • 샌드박스 환경: Google ADK를 사용하여 안전한 코드 실행 샌드박스를 제공하며, 여기에는 주요 ML 라이브러리가 사전 설치되어 있습니다. • PyTorch, transformers, scikit-learn 등 • uv(차세대 고속 Python 패키지 관리자) • 과학 기술 라이브러리: 또 다른 저장소인 K-Dense-AI/claude-scientific-skills를 활용하여 119개 이상의 기성 과학 도구와 워크플로(데이터 처리, 시각화, 통계 분석, 실험 추적 등)를 제공하여 Claude가 ML 작업에서 탁월한 성과를 낼 수 있도록 지원합니다. • 실행 방법: `uv sync` 명령어로 종속성을 설치하고, `OPENROUTER_API_KEY`를 설정하고, `python start.py` 명령어를 실행하여 로컬 샌드박스와 웹 UI(http://localhost:8000)를 시작합니다. 그런 다음 채팅 인터페이스에서 "CIFAR-10에서 최첨단 이미지 분류기를 학습시키세요"와 같은 작업을 실행합니다. 실제로 이 지능형 에이전트는 일반적인 머신 러닝 개발 프로세스를 종단 간에 완료할 수 있습니다. • 데이터 수집 및 전처리 • 모델 선택 및 구축(Transformer, ViT 등 최신 아키텍처 포함) • 하이퍼매개변수 검색, 학습 및 평가 • 오류 진단 및 반복 최적화 • 실험 보고서 및 시각화 생성 전체 프로세스에는 거의 인간 코딩이 필요하지 않습니다. 자연어로 목표를 설명하기만 하면 클로드 에이전트는 고성능 모델을 얻을 때까지 샌드박스에서 반복적으로 실험합니다. 이는 본질적으로 2025년까지 Agentic AI가 머신러닝에 실질적으로 적용될 수 있음을 보여주는 사례입니다. 즉, 대규모 모델이 스스로 연구를 수행하도록 하는 것입니다. 오픈소스 주소:

meng shao(@shao__meng)의 스레드

작성자 정보

스레드 내용