No sé cuál es la diferencia actual entre los modelos chino y estadounidense. Hace unos años, se creía que la brecha generacional era de uno o dos años. ¿Parece que ya ha pasado más de medio año? Por ejemplo, en la lista de modelos grandes más populares, LMARaena, el año pasado los modelos nacionales estaban básicamente en la etapa de "es lo suficientemente bueno para estar en la lista", pero este año han comenzado a competir con sitios como Claude y GPT. Si observamos las clasificaciones de texto más competitivas, Baidu ERNIE-5.0-Preview-1203 de hecho logró ubicarse entre los 10 primeros puestos de la clasificación de texto de LMARaena, ocupando el primer lugar entre los modelos a gran escala producidos a nivel nacional. Según los comentarios de LMARaena, la mejora fue principalmente en la escritura creativa y la comprensión de instrucciones complejas. Estos dos aspectos son generalmente los más cercanos a los escenarios de uso real y también los más propensos a errores. Desconozco cómo Baidu los ha optimizado. En realidad, las capacidades de ingeniería de Baidu siempre han sido fuertes, pero parece que recién ahora están comenzando a poner en práctica su potencial. He oído que la versión oficial saldrá en enero. La probaré entonces a ver si es realmente buena.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.

