让我想起了 Disco Diffusion 时代。甚至有点像 VQGAN+CLIP,有点儿像。 随着模型追求照片级真实感,我们失去了很多艺术价值。与那些难以操控的机器搏斗,真是一个探索发现的过程。 我们必须让DiTs更加困惑。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月9日 07:33
让我想起了 Disco Diffusion 时代。甚至有点像 VQGAN+CLIP,有点儿像。 随着模型追求照片级真实感,我们失去了很多艺术价值。与那些难以操控的机器搏斗,真是一个探索发现的过程。 我们必须让DiTs更加困惑。