토큰 공간이 추론 LLM의 정보 병목 현상이라면, 강화 학습 모델이 모든 토큰을 고빈도로 사용하도록 학습할 것으로 예상할 수 있습니다. 하지만 제가 cot을 읽어 보면, 기본 모델이나 모델 출력보다 토큰 공간이 좁아 보입니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 11. 24. 오전 10:25
토큰 공간이 추론 LLM의 정보 병목 현상이라면, 강화 학습 모델이 모든 토큰을 고빈도로 사용하도록 학습할 것으로 예상할 수 있습니다. 하지만 제가 cot을 읽어 보면, 기본 모델이나 모델 출력보다 토큰 공간이 좁아 보입니다.