当你有一个革命性的想法,想要让 Transformer 在数学和编程等复杂任务上表现得更好(例如 human eval+、mbpp、gsm8k 基准测试),那就通宵进行实验,然后在早上面对真相。 你说失败,我说“有意思!”