Réexamen de l'encodage positionnel multimodal dans les modèles vision-langage
Discutez avec l'auteuhuggingface.co/papers/2510.23…8now
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
2 tweets · 3 nov. 2025, 15:42
Réexamen de l'encodage positionnel multimodal dans les modèles vision-langage
Discutez avec l'auteuhuggingface.co/papers/2510.23…8now