숨겨진 사실: 네모트론은 이제 단순한 맘바2 하이브리드가 아니라, LatentMoE를 사용합니다. "라우팅된 전문가 연산과 모든 트래픽을 다음으로 이동함으로써..." 잠재 공간, 즉 전문가별 가중치 부하와 통신 페이로드가 모두 일정 비율로 감소합니다. 𝑑/ℓ» MLA와 이념적으로 유사함
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 12. 15. 오후 4:20
숨겨진 사실: 네모트론은 이제 단순한 맘바2 하이브리드가 아니라, LatentMoE를 사용합니다. "라우팅된 전문가 연산과 모든 트래픽을 다음으로 이동함으로써..." 잠재 공간, 즉 전문가별 가중치 부하와 통신 페이로드가 모두 일정 비율로 감소합니다. 𝑑/ℓ» MLA와 이념적으로 유사함