Wenxin ERNIE-5.0-Preview-1203 ha alcanzado sorprendentemente el número uno en el ranking de búsqueda de texto nacional LMARaena. Más adelante, básicamente todo es GPT, Claude y Gemini. Mientras tanto, obtuvieron 23 puntos más en esta versión de LMARaena en comparación con la versión anterior, lo cual representa una mejora considerable. Los criterios de puntuación se centraron principalmente en la escritura creativa y las instrucciones desafiantes, que también son las áreas donde las habilidades textuales del modelo son actualmente más exigentes. Ya no se guardan grandes sorpresas; en cambio, lanzan nuevas versiones con frecuencia y las ajustan constantemente para mejorar el rendimiento. Este enfoque es correcto; deberían comunicarse más con la comunidad de código abierto para obtener retroalimentación.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
