RL은 완전히 다른 세상입니다. 상위 9개 LLM의 총 토큰 수는 2.4T(약 10TB)입니다. PufferLib은 단일 6x4090 tinybox에서 1000TB 이상의 관측치를 학습합니다. 컴퓨팅 확장에는 엄청난 노력이 필요한 반면, 데이터 확장에는 거의 아무런 노력이 필요하지 않습니다!
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 11. 25. 오후 7:10
RL은 완전히 다른 세상입니다. 상위 9개 LLM의 총 토큰 수는 2.4T(약 10TB)입니다. PufferLib은 단일 6x4090 tinybox에서 1000TB 이상의 관측치를 학습합니다. 컴퓨팅 확장에는 엄청난 노력이 필요한 반면, 데이터 확장에는 거의 아무런 노력이 필요하지 않습니다!