¿Alguien lo ha hecho? Sí, de manera muy directa, pero no enmarcado principalmente como “TTC matemático”, sino más bien como un agente de largo horizonte. ReSum (2025) es esencialmente exactamente “resumen de contexto periódico → descartar historial → continuar”, motivado explícitamente por los límites del contexto, y también propone un método RL (ReSum‑GRPO) para entrenar a los agentes a razonar a partir de resúmenes (segmentan trayectorias en puntos de resumen y “transmiten” la ventaja de la trayectoria a los segmentos). ar5iv
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.