Hoy recibí mi flamante Tesla Model X HW4, así que inmediatamente lo saqué a probar el FSD, como solía hacer casi a diario durante 5 años. En resumen... estoy asombrado: se maneja de maravilla, con suavidad y confianza, notablemente mejor que el HW3 (mi coche anterior) al que estaba acostumbrado, y muchísimo mejor que la versión que recuerdo haber conducido por la autopista 280 en mi primer día en Tesla hace unos 9 años, donde tenía que corregir la trayectoria cada vez que la carretera tenía una ligera curva o pendiente. (Cabe mencionar que esta es la versión 13; mi coche aún no ha recibido la última actualización, la versión 14). En la autopista, me sentí como un pasajero en una cápsula de tren Maglev de altísima tecnología: el coche permanecía fijo en el centro del carril mientras yo, desde la posición elevada del Model X y su ventana panorámica, disfrutaba de la vista, el (increíble) sistema de sonido o charlaba con Grok. En las calles de la ciudad, el coche manejó con soltura una serie de situaciones complicadas que, hace tan solo unos años, me habían quitado el sueño. Se abrió paso entre los coches que venían de frente en carriles estrechos, sorteó con elegancia las obras y los coches detenidos momentáneamente en el carril, calculó a la perfección los giros a la izquierda complicados con tráfico en ambos sentidos, cedió el paso con elegancia al coche que se saltó el stop en el cruce de cuatro vías, encontró la manera de colarse entre el tráfico denso para girar, adelantó al autobús que estaba recogiendo pasajeros pero aun así se detuvo ante el stop que este bloqueaba, y al final del recorrido dio una vuelta por un aparcamiento, encontró sitio y... aparcó. En resumen, una conducción impecable. Para ponerlo en contexto, suelo dar una vuelta rápida por el barrio y volver con 20 vídeos de cosas que se podrían mejorar. Es nuevo para mí hacer exactamente lo mismo, pero volver sin nada. Conducción perfecta, sin observaciones. Supongo que al equipo aún le queda mucho trabajo por hacer para alcanzar la perfección, pero es genial ver que ya no basta con encontrar problemas en una simple vuelta de una hora por el barrio; ahora hay que analizar toda la flota. Antes, procesaba la increíble promesa de la autonomía vehicular a gran escala (al estilo Tesla, totalmente escalable, basado únicamente en visión y de extremo a extremo) solo intelectualmente, pero ahora también es posible sentirla intuitivamente con solo salir a dar una vuelta. Un momento, claro que la transmisión de vídeo envolvente a 60 Hz procesada por una red neuronal dedicada exclusivamente a la conducción funcionará, y será mucho mejor y más segura que un conductor humano. ¿Alguien más pensaba lo contrario? También vi la nueva charla de @aelluswamy en ICCV25 la semana pasada (https://t.co/RdaM23kvez), donde se insinúan algunos de los componentes técnicos recientes que impulsan este progreso. Los flujos de datos de sensores (vídeos, mapas, cinemática, audio, etc.) durante largos periodos (por ejemplo, ~30 segundos) se introducen en una gran red neuronal, de la cual se obtienen datos de dirección y aceleración, opcionalmente con datos auxiliares de visualización. Este es el objetivo de la reescritura completa del software 1.0 a software 2.0, que escala perfectamente con el flujo de datos de millones de vehículos de la flota y la capacidad de cómputo del chip, no con la ingeniosa abstracción en C++ de algún ingeniero, como DoubleParkedCarHandler, con características de memoria y tiempo de ejecución indefinidas durante las pruebas. El vídeo ofrece muchas más pistas sobre la dirección que está tomando la emergente arquitectura de "robótica + IA a gran escala". Reconstructores de mundos, simuladores de mundos, dinámicas "soñadas", aprendizaje por refuerzo, todos estos componentes generales, fundamentales, basados en redes neuronales, cómo el coche es realmente solo un tipo de robot... ¿lo entiende la gente ya? ¡Enhorabuena al equipo! ¡Estáis creando objetos mágicos del futuro, sois geniales! Y me encanta mi coche <3.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.