이건 정말 말도 안 되는 소리입니다. "최종 학습 실행은 전체 R&D 연산량의 1%입니다"라는 말은 GDM(생체 근육량) 관행에 대한 이상한 일반화 오류인 것 같습니다. 아무도 본격적인 절제술을 하지 않고, GPU가 부족한 연구실에서는 *몇 년*이 걸릴 겁니다. 어차피 K2는 V3보다 훨씬 낫습니다. 돌, 유리 집. 그러지 말자.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
