尤其值得注意的是,你會看到人們列舉 101 個強化學習擴展面向的問題,但他們在思考解決方案時卻完全沒有展現出同樣的想像力。 值得注意的是,所有這些「RL環境」公司成立時間都不到6個月。我們還處於早期階段。從去年這個時候只能編輯單一檔案/自動補全,到如今使用 Codex 自主進行約 30 分鐘的軟體工程,這種進步簡直令人驚嘆。 年復一年,做空深度學習仍然是一個糟糕的主意。