Estoy bastante convencido de que el siguiente paso en los agentes es utilizar la compactación pero con imágenes densas en información. > extractos de sesiones largas como imagen > habilidades descargables como imagen > Mapa de repositorio para millones de LOC como imagen
Deepseek OCR ya fue un paso en esa dirección. pero no necesitamos esperar para resolver todos los problemas con el entrenamiento con imágenes puras, podemos comenzar con la capa de agencia en tareas enfocadas y ver qué tan bien podemos comprimir la información primero.