Tan increíblemente fundamentado que DeepSeek ganó el premio al mejor artículo en la ACL con la NSA, luego, al parecer, no quedó satisfecho con los resultados a escala, ideó una mejor arquitectura que puede usar modelos de atención completa para arrancar, la publicó y compartió los pesos. A menudo sospechamos que Google hace lo contrario
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
