Básicamente, las únicas dos evaluaciones que me importan en esta etapa del juego son: ¿Con qué fiabilidad puede realizar tareas de más de 30 minutos sin fallar? ¿Cuánto me hacen sentir las cunas el AGI? (Esta publicación no pretende ser una crítica a Gemini 3 de ninguna manera; parece un modelo sólido y ¡felicitaciones al equipo por el lanzamiento!)
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.