X (Twitter)

Un hommage à Karpathy 😂 K-Dense-AI lance « karpathy » : Agentic Machine Learning Engineer, qui utilise Claude pour automatiser l'entraînement de modèles d'apprentissage automatique de pointe. Idée centrale : Transformer le SDK Claude Code en un « ingénieur ML virtuel » capable d’écrire du code de manière indépendante, d’exécuter des expériences, d’analyser les résultats et d’optimiser de manière itérative, en hommage à Andrej Karpathy, l’équipe K-Dense a utilisé une technologie d’agent de pointe pour « reproduire » un processus de développement ML efficace similaire à celui de Karpathy. Pile technologique et composants principaux : Modèle d’IA piloté par modèle : Basé sur Claude (via des appels d’API OpenRouter), combiné au SDK de code Claude, les modèles peuvent écrire et exécuter directement du code Python dans un environnement sandbox. • Environnement sandbox : Fournit un environnement d’exécution de code sécurisé utilisant Google ADK, préinstallé avec les bibliothèques ML courantes : • PyTorch, transformateurs, scikit-learn, etc. • uv (gestionnaire de paquets Python haute vitesse de nouvelle génération) • Bibliothèque de compétences scientifiques : s’appuyant sur un autre référentiel, K-Dense-AI/claude-scientific-skills, elle fournit plus de 119 outils et flux de travail scientifiques prêts à l’emploi (traitement des données, visualisation, analyse statistique, suivi des expériences, etc.), permettant à Claude d’exceller dans les tâches d’apprentissage automatique. • Procédure d'exécution : Installez les dépendances avec `uv sync` → définissez la `OPENROUTER_API_KEY` → puis exécutez `python start.py` pour démarrer l'environnement de test local et l'interface web (http://localhost:8000). Ensuite, soumettez des tâches via l'interface de chat, comme par exemple : « entraîner un classificateur d'images de pointe sur CIFAR-10 ». En pratique, cet agent intelligent peut mener à bien un processus de développement d'apprentissage automatique typique de bout en bout : • Acquisition et prétraitement des données • Sélection et construction du modèle (y compris les architectures les plus récentes telles que Transformer, ViT, etc.) • Recherche, entraînement et évaluation des hyperparamètres • Diagnostic des erreurs et optimisation itérative • Génération de rapports expérimentaux et de visualisations L'ensemble du processus ne requiert quasiment aucune intervention humaine en programmation ; il suffit de décrire l'objectif en langage naturel, et l'agent Claude effectuera des expériences itératives dans un environnement de test jusqu'à l'obtention d'un modèle performant. Il s'agit là d'une démonstration concrète de l'application de l'IA agentique à l'apprentissage automatique d'ici 2025 : permettre à de grands modèles de mener leurs propres recherches. Adresse open source :

Fil de meng shao (@shao__meng)

Informations sur l'auteur

Contenu du fil