새로운 영상이 공개되었습니다 – 작은 모델, 높은 처리량! NVIDIA 오픈소스 Nemotron 3 Nano 모델의 실제 환경 테스트 영상입니다. 이 영상에서는 기술 보고서를 간략하게 살펴보고 몇 가지 실제 테스트를 보여드리겠습니다. 이 영상에서는 다음 내용을 보실 수 있습니다: - 네모트론 3 나노의 핵심 구성: 파라미터 스케일, MoE + 맘바 트랜스포머 아키텍처, 1M 컨텍스트 - 25T 사전 학습 데이터, 2단계 학습 과정 + SFT + RLVR + RLHF 훈련 프로세스 - 공식 양자화 방식: BF16부터 FP8까지, 선택적 양자화를 통해 점수 보존을 극대화하는 방법. - Nano VS Qwen3 차세대 실무 과제: 코딩 + 글쓰기
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
