非常荣幸能邀请到 @leerob 登上 AIE 的舞台,希望这只是他第一次登上 AIE 的舞台,以后会有更多机会。 Cursor 的执行力堪称世界一流,我非常欣赏 Lee 在 Composer 架构和训练方面的细致工作——看看他们使用的自定义 MXFP8 内核、@anyscalecompute Ray 负载均衡,以及对云代理生产后端进行复用/共同设计以用于训练。看看他们内部训练集群的仪表盘可视化图吧! 当然,任何强化学习训练都离不开一张平滑递增的对数 x 轴图表……
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。


