벤치마크 기준으로 보면 대략 V3.2 수준의 모델이라고 할 수 있겠네요. 파라미터는 절반이고, 유효 토큰 수는 두 배 정도(뮤온 기준 23T)입니다. 여러 유능한 연구실에서 이 대규모 강화 학습 방법론을 따라잡고 있는 추세입니다. 차세대 기지에서 우리는 다시 한번 흥미로운 차이점을 보게 될 것입니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 12. 22. 오후 10:01
벤치마크 기준으로 보면 대략 V3.2 수준의 모델이라고 할 수 있겠네요. 파라미터는 절반이고, 유효 토큰 수는 두 배 정도(뮤온 기준 23T)입니다. 여러 유능한 연구실에서 이 대규모 강화 학습 방법론을 따라잡고 있는 추세입니다. 차세대 기지에서 우리는 다시 한번 흥미로운 차이점을 보게 될 것입니다.