X (Twitter)

¿Alguien lo ha hecho? Sí, de manera muy directa, pero no enmarcado principalmente como “TTC matemático”, sino más bien como un agente de largo horizonte. ReSum (2025) es esencialmente exactamente “resumen de contexto periódico → descartar historial → continuar”, motivado explícitamente por los límites del contexto, y también propone un método RL (ReSum‑GRPO) para entrenar a los agentes a razonar a partir de resúmenes (segmentan trayectorias en puntos de resumen y “transmiten” la ventaja de la trayectoria a los segmentos). ar5iv

Hilo de Taelin (@VictorTaelin)

Información del autor

Contenido del hilo