重点——实验性工作占 PufferLib 开发总投入的数月时间。大概占三分之一,而不是百分之十。Puffer 2.0 到 3.0 的功能飞跃主要体现在算法层面。只是那些看似炫酷的功能,实际运行起来往往与纸面上的描述有所不同。
想要尝试新想法,PufferLib 是目前唯一一款既快速又易于修改的工具。仅在过去 48 小时内,我就在 MinGRU 和 Mamba 上移植并运行了数百个实验。下一个版本还会发布一些新的工具来辅助这项工作!
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 2 条推文 · 2025年11月5日 21:55
重点——实验性工作占 PufferLib 开发总投入的数月时间。大概占三分之一,而不是百分之十。Puffer 2.0 到 3.0 的功能飞跃主要体现在算法层面。只是那些看似炫酷的功能,实际运行起来往往与纸面上的描述有所不同。
想要尝试新想法,PufferLib 是目前唯一一款既快速又易于修改的工具。仅在过去 48 小时内,我就在 MinGRU 和 Mamba 上移植并运行了数百个实验。下一个版本还会发布一些新的工具来辅助这项工作!