Uma homenagem a Karpathy 😂 A K-Dense-AI lança "karpathy": Engenheiro de Aprendizado de Máquina Agético, que usa Claude para automatizar o treinamento de modelos de aprendizado de máquina de última geração. Ideia central: Transformar o SDK Claude Code em um "engenheiro de ML virtual" capaz de escrever código de forma independente, executar experimentos, analisar resultados e otimizar iterativamente. Em homenagem a Andrej Karpathy, a equipe K-Dense usou tecnologia de ponta em agentes para "reproduzir" um processo de desenvolvimento de ML eficiente semelhante ao de Karpathy. Pilha de tecnologias e componentes principais: Modelo de IA orientado: Baseado no Claude (via chamadas à API do OpenRouter), combinado com o SDK de código Claude, os modelos podem escrever e executar código Python diretamente em um ambiente de sandbox. • Ambiente sandbox: Fornece um ambiente sandbox seguro para execução de código usando o Google ADK, pré-instalado com as principais bibliotecas de aprendizado de máquina: • PyTorch, transformers, scikit-learn, etc. • uv (gerenciador de pacotes Python de alta velocidade de próxima geração) • Biblioteca de Habilidades Científicas: Baseada em outro repositório, K-Dense-AI/claude-scientific-skills, ela fornece mais de 119 ferramentas e fluxos de trabalho científicos prontos para uso (processamento de dados, visualização, análise estatística, acompanhamento de experimentos, etc.), permitindo que Claude se destaque em tarefas de aprendizado de máquina. • Como executar: Basta instalar as dependências com `uv sync` → definir a `OPENROUTER_API_KEY` → `python start.py` para iniciar o ambiente de teste local e a interface web (http://localhost:8000). Em seguida, envie tarefas na interface de bate-papo, como "treinar um classificador de imagens de última geração no CIFAR-10". Na prática, esse agente inteligente pode concluir um processo típico de desenvolvimento de aprendizado de máquina de ponta a ponta: • Aquisição e pré-processamento de dados • Seleção e construção de modelos (incluindo as arquiteturas mais recentes, como Transformer, ViT, etc.) • Busca, treinamento e avaliação de hiperparâmetros • Diagnóstico de erros e otimização iterativa • Geração de relatórios experimentais e visualizações Todo o processo praticamente não requer programação humana; basta descrever o objetivo em linguagem natural, e o agente Claude realizará experimentos repetidamente em um ambiente de teste até obter um modelo de alto desempenho. Essencialmente, esta é uma demonstração da aplicação prática da IA Agética em aprendizado de máquina até 2025: permitir que grandes modelos realizem suas próprias pesquisas. Endereço de código aberto:
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
