尤其值得注意的是,你会看到人们列举出 101 个强化学习扩展方面的问题,但他们在思考解决方案时却完全没有展现出同样的想象力。 值得注意的是,所有这些“RL环境”公司成立时间都不到6个月。我们还处于早期阶段。从去年这个时候只能编辑单个文件/自动补全,到如今使用 Codex 自主进行约 30 分钟的软件工程,这种进步简直令人惊叹。 年复一年,做空深度学习仍然是一个糟糕的主意。