트랜스포머 아키텍처는 근본적으로 컨텍스트를 처리하는 병렬 프로세서이지만, 추론은 순차적이고 반복적인 과정입니다. 복잡한 문제를 해결하려면 모델은 출력 CoT뿐만 아니라 내부 상태에도 "임시 저장 공간"이 필요합니다. 즉, 모델이 작동하는 해법을 찾을 때까지 미분 가능한 방식으로 반복, 분기 및 역추적을 수행할 수 있어야 합니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.