致敬Karpathy 😂 K-Dense-AI 發布「karpathy」:Agentic Machine Learning Engineer,利用Claude 來自動化訓練最先進的機器學習模式。 核心創意:把Claude Code SDK 變成一個可以獨立編寫程式碼、運行實驗、分析結果、迭代優化的“虛擬ML 工程師”,致敬Andrej Karpathy,是K-Dense 團隊用前沿Agent 技術“復現”了類似Karpathy 風格的高效ML 開發流程。 技術堆疊與核心元件· AI 模型驅動:基於Claude(透過OpenRouter API 呼叫),結合Claude Code SDK 讓模型能在沙盒環境中直接編寫和執行Python 程式碼。 · 沙盒環境:使用Google ADK 提供安全的程式碼執行沙盒,預先安裝主流ML 函式庫: · PyTorch、transformers、scikit-learn 等· uv(新一代高速Python 套件管理器) · 科學技能庫:依賴另一個倉庫K-Dense-AI/claude-scientific-skills,提供了119+ 項現成的科學工具和工作流程(資料處理、視覺化、統計分析、實驗追蹤等),讓Claude 在ML 任務中如魚得水。 ( 實際能做什麼這個智能體可以端到端完成典型的機器學習研發流程: · 資料取得與預處理· 模型選型與建置(包含最新架構如Transformer、ViT 等) · 超參數搜尋、訓練、評估· 錯誤診斷、迭代最佳化· 產生實驗報告與視覺化 整個過程幾乎不需要人工寫程式碼,只需用自然語言描述目標,Claude 智能體就會在沙盒裡反覆試驗,直到得到高效能模型。這本質上是2025 年Agentic AI 在機器學習領域的落地示範:讓大模型自己做科學研究。 開源位址:
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
