“Hay muchas más empresas que ideas. El cálculo es lo suficientemente grande como para que no sea obvio que se necesita mucho más cálculo para probar alguna idea. AlexNet se construyó con 2 GPU. El transformador se construyó con entre 8 y 64 GPU. ¿Qué serían, qué? ¿2 GPU hoy en día? Se podría argumentar que el razonamiento o1 no era lo más complejo del mundo. Para la investigación, sin duda se necesita una cierta cantidad de computación, pero no es obvio que se necesite la mayor cantidad posible de computación. Si todos estamos dentro del mismo paradigma, entonces la computación se convierte en uno de los grandes diferenciadores”. @ilyasut
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.