Rednote도 그렇고요. 하지만 Nvidia 논문처럼 "처음부터 사전 학습"하는 건 아니고, 그냥 중간 학습 단계일 뿐이에요. 물론 Qwen이죠. 이게 주류가 될 거라고 생각해요. 기본적으로 합성 데이터와 RLVR을 둘러싼 현재의 복잡한 관행을 근본적으로 바꿔주는 거죠. 응답 길이라는 사실은 👀
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 12. 4. 오전 4:35
Rednote도 그렇고요. 하지만 Nvidia 논문처럼 "처음부터 사전 학습"하는 건 아니고, 그냥 중간 학습 단계일 뿐이에요. 물론 Qwen이죠. 이게 주류가 될 거라고 생각해요. 기본적으로 합성 데이터와 RLVR을 둘러싼 현재의 복잡한 관행을 근본적으로 바꿔주는 거죠. 응답 길이라는 사실은 👀