Je pense que les ensembles de données ouverts deviennent les contributions les plus importantes en intelligence artificielle. Quelques raisons : Nous manquons encore de véritables ensembles de données ouverts couvrant différents domaines, modalités, langages et techniques, et ce manque est particulièrement criant dans le domaine de l'apprentissage par renforcement. Les jeux de données sont coûteux, exigeants en ressources et peu attrayants, ce qui les rend difficiles à créer pour les petites équipes. Sans jeux de données ouverts et de qualité, l'écosystème ouvert ne peut tout simplement pas rivaliser à armes égales avec les laboratoires fermés. - Les jeux de données ouverts offrent un tout nouveau niveau de transparence et de reproductibilité qui vous permet d'étudier les biais, l'efficacité, l'interprétabilité et bien plus encore. Les jeux de données ouverts prennent de la valeur. Réutilisables à chaque nouvelle architecture, optimiseur ou avancée majeure en matière d'entraînement, ils permettent de créer, au fil du temps, des centaines de modèles de pointe à partir d'un seul jeu de données. Contrairement aux modèles qui se déprécient, les jeux de données ouverts prennent de la valeur. C’est pourquoi je suis ravi de vous présenter une nouvelle fonctionnalité sur @huggingface pour les jeux de données : Duplicate, optimisée par Xet. Cela simplifie considérablement la création, le versionnage et l'itération sur les ensembles de données ouverts. Allons-y!
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
