X (Twitter)

Esto es como usar jerigonza al hablar con alguien que se crió hablando inglés. Sí, pueden responder. Pero no lo hablarán con fluidez. Tendrán dificultades y serán torpes. Los modelos de aprendizaje lógico (LLM) se entrenan con datos JSON. También con algunos XML. Se les permite responder de forma nativa, independientemente de los tokens.

Para dar más contexto: los modelos no se entrenan CON JSON, sino CON JSON. Cualquier conjunto de datos significativo relacionado con la programación y la ciencia de datos contendrá JSON que, durante el entrenamiento, instruirá a los modelos sobre el significado y la estructura de los datos. ¿Por qué ir en contra de eso?

Hilo de Arvid Kahl (@arvidkahl)

Información del autor

Contenido del hilo