모델의 성능을 파악하기 위해 특정 "기능"에 대한 테스트를 진행하는 것이 아닙니다. 제가 깊이 이해하고 기억하는 약 6만 건의 미학습 컨텍스트 데이터를 재사용하여 모델과 데이터를 주고받습니다. 이를 통해 제가 얼마나 학습하는지, 그리고 모델이 어떤 부분에서 한계를 드러내거나 제대로 작동하지 않는지 확인합니다. 자신만의 맥락이 필요합니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.