A versão 5.0 é um modelo grande e totalmente modal primitivo. Possui recursos completos x.com/imxiaohu/statu…o modal, suportando processamento de texto, imagem e áudio. Entrada e saída de diversas informações, como vídeo. Estes são os resultados dos meus testes anteriores; possui uma capacidade de compreensão de vídeo muito forte. Parece que a versão oficial está prestes a ser lançada.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.