1조 개의 매개변수 언어 모델이 전혀 불가능한 것은 아닙니다(모든 데이터를 어디서 얻을지는 차치하고서라도). 컨텍스트와 KV 캐시를 위해 이보다 25% 더 많은 GPU가 필요할 수 있지만 H100 10만 대면 가능할 듯
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 11. 5. 오후 10:24
1조 개의 매개변수 언어 모델이 전혀 불가능한 것은 아닙니다(모든 데이터를 어디서 얻을지는 차치하고서라도). 컨텍스트와 KV 캐시를 위해 이보다 25% 더 많은 GPU가 필요할 수 있지만 H100 10만 대면 가능할 듯