RT @gu_xiangming: Me alegra ver que los sesgos de sumidero de atención funcionan tanto en el modelado del lenguaje como en contextos extensos. Por favor, vean mi publicación reciente…
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.