X (Twitter)

Análisis de ingeniería inversa conversacional del sistema de memoria ChatGPT ❌ Carece por completo de base de datos vectorial y RAG ✅ Se trata, en cambio, de una estructura de contexto jerárquica y eficiente de cuatro niveles. Hallazgo clave: Más simple de lo esperado La "memoria" de ChatGPT no busca en una enorme base de datos cada palabra que has dicho. En cambio, logra un equilibrio entre personalización y capacidad de respuesta/costo combinando inteligentemente diferentes niveles de información. La estructura de cuatro capas del contexto de ChatGPT 1. Metadatos de la sesión • Conocimiento del entorno: incluye el tipo de dispositivo, la ubicación aproximada, la hora, el nivel de suscripción y los hábitos de uso recientes (como la frecuencia de actividad). Finalidad: Adaptar tu respuesta a tu entorno actual (como el modo oscuro o la geolocalización). Temporal solo para la sesión actual; no se guarda. 2. Banco de memoria del usuario: datos fundamentales a largo plazo: almacena información clave como su nombre, ocupación, preferencias y objetivos a largo plazo (en el ejemplo del autor se almacenan 33 elementos). • Origen: Datos importantes que usted solicitó explícitamente "recordar" o que el sistema identifica automáticamente. Persistentes entre sesiones hasta su eliminación. 3. Resumen de conversaciones recientes y mapa de intereses a corto plazo: Esta es la parte más sorprendente. No es un historial completo, sino un resumen breve de unas 15 conversaciones recientes (incluyendo marcas de tiempo, títulos y fragmentos de mensajes de los usuarios). • Función: Proporciona una sensación de continuidad, permitiendo que la IA sepa a qué has estado prestando atención recientemente sin cargar todo el historial. Se actualiza con el tiempo. 4. Ventana de sesión actual y contexto en tiempo real: Un registro completo de la conversación actual. Utiliza un mecanismo de "ventana deslizante"; cuando una conversación se alarga demasiado y excede el límite de tokens, se descarta el mensaje más antiguo. • Función: Garantiza el rigor y la coherencia de la lógica del diálogo actual. El estado actual se desplaza a medida que la conversación termina o se alarga excesivamente. ¿Por qué este diseño es tan inteligente? • La eficiencia es primordial: el RAG tradicional requiere buscar en cantidades masivas de datos históricos para cada consulta, lo que genera altos costos computacionales y una latencia significativa. • Centrarse en el panorama general y dejar de lado los pequeños detalles: la estrategia de ChatGPT es "recordar los hechos importantes (nivel 2), comprender la descripción general del tema reciente (nivel 3) y centrarse en los detalles de la conversación actual (nivel 4)". • La personificación de la filosofía de la ingeniería: Este es un diseño de ingeniería pragmático. Sacrifica la memoria perfecta de cada pequeño detalle del pasado a cambio de una experiencia interactiva extremadamente fluida, rápida y aparentemente intuitiva. Resumir ChatGPT te hace sentir como si tuviera una memoria excepcional, no porque recuerde algún detalle trivial que dijiste hace dos años, sino porque siempre lleva un archivo central (memoria a largo plazo) y un resumen de tu actividad reciente (resumen de conversaciones). Es una experiencia pseudoomnisciente extremadamente eficiente. Lea el artículo original (por @manthanguptaa)

Hilo de meng shao (@shao__meng)

Información del autor

Contenido del hilo