上記の結果として、計画の長さが長くなるにつれて o1 のような LRM のパフォーマンスが計画タスクで低下する理由は、タスクの計算の複雑さによるものではなく、LRM が、ますます長くなる展開にわたって検証信号をジェネレーターに段階的にコンパイルするためです。結局のところ、最後の文字の連結タスクでもパフォーマンスが低下します。これは明らかに O(n) タスクです。 👉
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
