gpt-oss 모델에서는 미세 조정에 거의 성공하지 못했지만, qwen3 모델에서는 (명령어 버전까지 포함해서) 매우 성공적이었습니다. 이게 기술적인 문제인지는 잘 모르겠지만, qwen3 모델은 미세 조정에 그다지 적합하지 않습니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 10. 31. 오후 6:32
gpt-oss 모델에서는 미세 조정에 거의 성공하지 못했지만, qwen3 모델에서는 (명령어 버전까지 포함해서) 매우 성공적이었습니다. 이게 기술적인 문제인지는 잘 모르겠지만, qwen3 모델은 미세 조정에 그다지 적합하지 않습니다.