正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月12日 19:02
黑色是标准的 15 亿层 28 层模型,蓝色是 arxiv 论文中的免费转换器,计算和内存开销增加了 3.5%,红色和橙色是 v2 的两个变体,开销增加了 1.3%,代码也简单得多。