Yangyi (@Yangyixxxx): 看了一下Deepseek最新分享的DSA稀疏注意力的优化策略个人理解如下： Deepseek的优化简单来讲做了两大部分，第一部分是对之前…