RT @karminski3: Claude Code を使用して大規模モデルを直接微調整しています。Huggingface が alchemy 用の HF Skills プラグインをリリースしました。 SFT、DPO、GRPOの3つのトレーニング手法をサポートし、HF上でハードウェアを自動選択できます。また、本番稼働前に検証を行い、最終的にGGUFを介してローカルにデプロイすることも可能です。 これ…
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。