为了说明 VAE 的问题,可以考虑一个由三个布尔随机变量 A、B、C 组成的信号,其中 A 和 B 独立,概率为 1/2,C = A xor B。 这三个变量的熵总共为 2 比特。 1/2
理想情况下,潜在的 Z 可以提供这两个比特,解码器将是完全确定性的。 正确调节编码器捕获的信息量 Z / 很复杂,如果我们过冲而编码器提供 3 位,我们就丢失了关节结构。 2/2
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 2 条推文 · 2025年11月10日 07:19
为了说明 VAE 的问题,可以考虑一个由三个布尔随机变量 A、B、C 组成的信号,其中 A 和 B 独立,概率为 1/2,C = A xor B。 这三个变量的熵总共为 2 比特。 1/2
理想情况下,潜在的 Z 可以提供这两个比特,解码器将是完全确定性的。 正确调节编码器捕获的信息量 Z / 很复杂,如果我们过冲而编码器提供 3 位,我们就丢失了关节结构。 2/2