X (Twitter)

スレッドを読み込み中

X から元のツイートを取得し、読みやすいビューを準備しています。

通常は数秒で完了しますので、お待ちください。

Yangyi (@Yangyixxxx): Transformer 中的“静默特征学习” 这是这周很有趣的一篇论文:它指出,loss 曲线可能会误导我们对模型学习内容的判断。 通常,… | Thread Easy