C'est comme parler en charabia à quelqu'un qui a grandi en parlant anglais. Oui, ils peuvent répondre. Mais ils ne le parleront pas couramment. Ils auront du mal et seront maladroits. Les modèles LLM sont entraînés sur des données JSON. Et aussi sur du XML. Permettez-leur de répondre nativement, quels que soient les jetons.
Pour plus de contexte : les modèles ne sont pas entraînés DANS du JSON, mais SUR du JSON. Tout jeu de données significatif lié à la programmation et à la science des données contient du JSON qui, lors de l'entraînement, indique aux modèles la signification et la structure des données. Pourquoi aller à l'encontre de ce processus ?