RT @LotusDecoder: Li Bojie の 10 月の記事。 継続的なエージェント学習のジレンマ: なぜ推論エンジンは真のエージェントではないのか? 私のお気に入りの視点をいくつか紹介します。 (トレーニングモデル)これらのコストは、多くの人が想像するよりもはるかに低いです。さらに重要なのは、現在のトレーニングフレームワークが既に非常に成熟していることです。TRANSACTION、VERL、A…
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。