영어판 공식 SYNTH 나노챗 데이터 세트가 거의 완성되었습니다. 나노챗 교육 경험이 있는 분 중 가장 좋은 접근 방식이 무엇인지 테스트해 보거나 확인해 주실 분 계신가요? 보통은 최소한의 수정만 거치지만(이미 샤딩되어 있음), 데이터 세트 가져오기 스크립트는 FineWeb에 하드코딩되어 있습니다.
그렇지 않으면 주요 .sh 파일은 대부분 단순화되어야 합니다. SYNTH를 사용하면 사전/중간/사후 학습을 위한 별도의 단계가 필요하지 않습니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 2개 · 2025. 11. 20. 오후 3:01
영어판 공식 SYNTH 나노챗 데이터 세트가 거의 완성되었습니다. 나노챗 교육 경험이 있는 분 중 가장 좋은 접근 방식이 무엇인지 테스트해 보거나 확인해 주실 분 계신가요? 보통은 최소한의 수정만 거치지만(이미 샤딩되어 있음), 데이터 세트 가져오기 스크립트는 FineWeb에 하드코딩되어 있습니다.
그렇지 않으면 주요 .sh 파일은 대부분 단순화되어야 합니다. SYNTH를 사용하면 사전/중간/사후 학습을 위한 별도의 단계가 필요하지 않습니다.