En fait, je crois avoir entraîné le tout premier modèle linéaire historique : notre modèle de correction OCR, ocronos, était entièrement pré-entraîné avant 1950 et pouvait être utilisé en mode modèle de base. Il s’appuyait principalement sur des sources journalistiques issues de Chronicle America.
Exemple de génération historiquement ancrée (ce modèle ignore tout de Trump et se réfère au début du XXe siècle). Je constate que ce modèle est encore populaihuggingface.co/PleIAs/OCRonos…/1ye5VEGerd
Ted Underwood et al. ont également entraîné un modèle GPT-1914 qui pourrait bien être à ce jour le plus grand modèle histarxiv.org/pdf/2505.00030lions d'individus). https://t.co/wSA1WCmz2D


