솔직히 말해서, DSA를 완전히 포기하고 더 세분화된 NSA로 돌아오거나, 청크에서 상위 K 토큰으로 점진적으로 전환하고 새로운 사전 학습 알고리즘을 자연스럽게 도입하는 엉뚱한 하이브리드 방식을 택할 것 같습니다. DPSA는 DeepSeek Progressive Sparse Attention의 약자로, Whale 스타일입니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.