사람들이 프론티어 모델을 양자화한다고 생각하는 게 좀 이상하게 느껴져요. 제 생각엔 거의 100% 이미 FP4로 실행되고 있고, 그보다 낮은 연산 속도는 NVIDIA GPU에 최적화되어 있지 않으며, TPU나 Trainium 등도 마찬가지일 거라고 생각해요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 12. 16. 오전 8:25
사람들이 프론티어 모델을 양자화한다고 생각하는 게 좀 이상하게 느껴져요. 제 생각엔 거의 100% 이미 FP4로 실행되고 있고, 그보다 낮은 연산 속도는 NVIDIA GPU에 최적화되어 있지 않으며, TPU나 Trainium 등도 마찬가지일 거라고 생각해요.