Karpathy へのトリビュート 😂 K-Dense-AI は、Claude を使用して最先端の機械学習モデルのトレーニングを自動化する Agentic Machine Learning Engineer「karpathy」をリリースしました。 核となるアイデア: Claude Code SDK を、独自にコードを記述し、実験を実行し、結果を分析し、反復的に最適化できる「仮想 ML エンジニア」に変え、Andrej Karpathy に敬意を表して、K-Dense チームは最先端のエージェント テクノロジーを使用して、Karpathy と同様の効率的な ML 開発プロセスを「再現」しました。 テクノロジー スタックとコア コンポーネント: AI モデル駆動型: Claude (OpenRouter API 呼び出し経由) をベースに、Claude Code SDK と組み合わせることで、モデルはサンドボックス環境で Python コードを直接記述して実行できます。 • サンドボックス環境: Google ADK を使用した安全なコード実行サンドボックスを提供し、主流の ML ライブラリがプリインストールされています。 • PyTorch、Transformers、scikit-learnなど • uv(次世代高速Pythonパッケージマネージャー) • 科学スキル ライブラリ: 別のリポジトリ K-Dense-AI/claude-scientific-skills を利用し、119 以上のすぐに使用できる科学ツールとワークフロー (データ処理、視覚化、統計分析、実験追跡など) を提供し、Claude が ML タスクで優れた成果を上げることができるようにします。 • 実行方法: `uv sync` で依存関係をインストール → `OPENROUTER_API_KEY` を設定 → `python start.py` を実行してローカルサンドボックスと Web UI (http://localhost:8000) を起動します。その後、チャットインターフェースで「CIFAR-10 で最先端の画像分類器をトレーニングする」などのタスクを発行します。 実際には、このインテリジェント エージェントは、典型的な機械学習開発プロセスをエンドツーエンドで完了できます。 • データの取得と前処理 • モデルの選択と構築(Transformer、ViTなどの最新のアーキテクチャを含む) • ハイパーパラメータの探索、トレーニング、評価 • エラー診断と反復最適化 • 実験レポートと視覚化の生成 このプロセス全体を通して、人間によるコーディングはほとんど必要ありません。目標を自然言語で記述するだけで、Claudeエージェントはサンドボックス内で実験を繰り返し、高性能なモデルを構築します。これは本質的に、2025年までにAgentic AIが機械学習に実用化されることを実証するもので、大規模なモデルが自ら学習を行うようになります。 オープンソースアドレス:
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
