¿Por qué ninguna de las variantes de RNN lineales se compara con... ya sabes, las celdas recurrentes originales? Estoy probando MinGRU y no encuentro información sobre si debería igualar el aprendizaje de GRU con la misma cantidad de parámetros. Ahora mismo, parece un poco más débil que mi celda LSTM.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.