Si grabas una página web y se la muestras a una IA, ¿puede la IA replicarla? Acabo de ver una página web de iluminación muy chula. Tiene una función que te permite hacer clic en un botón para ver el efecto de encender la luz, e incluso la paleta de colores de la página se atenúa, creando un efecto muy atmosférico. De repente se me ocurrió: ¿y si quisiéramos usar IA para crear un sitio web como este? ¿Deberíamos simplemente copiar el código fuente? ¿O usar una instrucción ridículamente compleja para completarlo? ¿Es posible grabar un vídeo que demuestre el efecto "apagar las luces" y luego usar una IA para crear un sitio web a partir de ese vídeo? Por lo tanto, esta importante tarea se asignó al modelo que estamos probando hoy: la nueva versión preliminar Wenxin-5.0 de Baidu, un modelo modal completo de gran tamaño. Este modelo admite texto, imágenes, audio y vídeo como entradas, y puede generar texto e imágenes. Así, nuestra prueba puede aprovechar al máximo sus capacidades. Primero grabé el efecto del sitio web y luego escribí una guía para complementarlo, indicándole cómo debía verse el efecto y dónde se encontraban las imágenes preparadas. Cabe mencionar que las imágenes que se muestran en el sitio web también las generé yo con Wenxin-5.0-preview. Puedes ver el efecto que generé en el video. Para enunciar directamente la conclusión de la prueba: Actualmente, todas las modalidades están disponibles y la interrelación entre ellas es excelente. He probado vídeo + texto, imagen + texto e imagen + voz, y todas ellas permiten completar la tarea. Por supuesto, la prueba también reveló algunos problemas, como que la velocidad de salida de tokens no era particularmente rápida y problemas ocasionales de tiempo de espera (que se han reportado al equipo de Baidu). Mi sugerencia es aprovechar al máximo sus capacidades multimodales para realizar tareas que antes eran inimaginables; realmente eleva el listón de las posibilidades de sus casos de uso. #WenxinLargeModel#Wenxin5#Baidu#WenxinOneWord#AITutorial
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.