Uma cesta inteira de modelos grandes foi misturada para criar um símbolo de reconhecimento do basquete! Deixe-me mostrar o efeito de reconhecimento. Ele consegue identificar a posição do arremesso, se a bola entrou, o número da camisa, onde está a bola (consegue até mesmo capturar outra bola que o árbitro esteja segurando), a cesta e o jogador. Foram utilizados estes modelos no total: F-DETR (Detecção de Jogadores) – Este é um detector de alvos em tempo real semelhante ao DETR. Após ajustes finos, ele pode ser usado para detectar jogadores, números de camisa, árbitros, bolas de basquete e até mesmo tipos de arremesso. SAM2 (Tracking Player) – Utilizado para segmentação e rastreamento. Ele reidentifica jogadores após serem obscurecidos e mantém um ID de alvo estável durante o contato físico. SigLIP + UMAP + K-means (Agrupamento de Equipes Não Supervisionado) — Combinando incorporações visuais-linguísticas com agrupamento não supervisionado, este método agrupa automaticamente os jogadores usando cores e texturas uniformes, eliminando a necessidade de rotulagem manual. SmolVLM2 (reconhecimento de números de jogadores) — Este é bastante poderoso. Lançado em fevereiro deste ano, está disponível em três versões: 256M, 500M e 2.2B. Geralmente é usado em cenários de OCR. É uma VLM (Biblioteca de Máquina Virtual) e, após ajustes com imagens recortadas de uniformes da NBA, a precisão no reconhecimento de uniformes de times e números de jogadores aumentou de 56% para 86%. ResNet-32 — (Classificação de Números) Uma CNN clássica, otimizada para classificação de números de camisas, alcançando uma precisão de teste de 93%, superando a SmolVLM2, também otimizada. O texto original é excelente e serve como amplo material de aprendizagem; recomendo-o vivamente.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.