正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月4日 19:46
在花了那么多时间优化350米以内的训练之后,现在要适应不同的训练规模/形式,这其实挺有意思的。必须找到新的方法,让数据有更多发挥的空间。