농구 인식을 위해 큰 모델이 담긴 바구니가 함께 섞여 있었습니다! 인식 효과를 보여드리겠습니다. 슈팅 위치, 슛 성공 여부, 등번호, 공의 위치(심지어 심판이 잡은 다른 공도 잡을 수 있습니다), 골대, 그리고 선수를 식별할 수 있습니다. 다음 모델이 총 다음과 같이 사용되었습니다. F-DETR(선수 감지) – DETR과 유사한 실시간 표적 감지기입니다. 미세 조정을 통해 선수, 등번호, 심판, 농구공, 심지어 슛 유형까지 감지할 수 있습니다. SAM2(플레이어 추적) – 세분화 및 추적에 사용됩니다. 플레이어가 가려진 후에도 재식별하고, 물리적 접촉 시에도 안정적인 대상 ID를 유지합니다. SigLIP + UMAP + K-means(비지도 팀 클러스터링) - 시각 언어 임베딩과 비지도 클러스터링을 결합한 이 방법은 균일한 색상과 질감을 사용하여 플레이어를 자동으로 그룹화하므로 수동 레이블 지정이 필요 없습니다. SmolVLM2(선수 번호 인식) — 이 기능은 매우 강력합니다. 올해 2월에 출시되었으며, 256M, 500M, 2.2B의 세 가지 버전으로 제공됩니다. 일반적으로 OCR 작업에 사용됩니다. VLM(가상 머신 라이브러리)으로, NBA 유니폼 이미지를 잘라내어 미세 조정한 후 팀 유니폼과 선수 번호 인식 정확도가 56%에서 86%로 향상되었습니다. ResNet-32 — (숫자 분류) 저지 번호 분류에 맞춰 정밀하게 조정된 고전적인 CNN으로, 93%의 테스트 정확도를 달성하여 정밀하게 조정된 SmolVLM2보다 성능이 뛰어납니다. 원본 텍스트는 훌륭하고 충분한 학습 자료가 됩니다. 강력히 추천합니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.