現在、当社の RL 環境フレームワークである Atropos には、@thinkymachines の Tinker API を介して高速かつ安価で使いやすいトレーナーが搭載されています。 既存の RL 環境を使用してモデルを構築し、テストしてトレーニングするか、独自の環境を作成してください。 リポジトリをチェックしてください: https://t.co/tTUpjODVfY
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。