⚠️ DeepSeek-V3.2-Exp 추론 데모를 사용하는 모든 분들께 알려드립니다. 이전 버전의 인덱서 모듈에서는 RoPE 구현이 일치하지 않아 성능이 저하될 수 있었습니다. 인덱서 RoPE는 인터리브되지 않은 입력을 예상하는 반면, MLA RoPE는 인터리브된 입력을 예상합니다. https://t.co/2BDzSyt1cW에서 수정되었습니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.