RT @dongxi_nlp : Ranke-4B, que j’appellerais Time Amber LLM, a des données d’entraînement figées dans une époque. Un modèle entraîné uniquement sur des données antérieures à 1913. Ce modèle a appris la structure du langage, mais ignore tout des guerres mondiales et de la grippe espagnole. Ne serait-il pas plus intéressant d'aborder la modernité avec un modèle aussi vaste ?
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.