Experimentei o novo aplicativo Qianwen do Alibaba só para entrar na brincadeira. Surpreendentemente, é muito bom. Não se parece em nada com o Alibaba. É fácil de usar, tem muitos recursos e todas as funções são totalmente gratuitas. Em termos de variedade de modelos, acredito que só eles podem competir com o Google. Desta vez, finalmente entenderam a estratégia e querem se concentrar em aplicações de IA. Abaixo estão alguns testes do Mestre Zang. Várias funções me pareceram muito boas; recomendo experimentá-las. 👇
Se você estiver commp.weixin.qq.com/s/0JJN1qss9iBj…la construção 🚧, pode pular direto para o artigo completo: https://t.co/Q3m2A6VSKo
Em primeiro lugar, o estilo de design geral é bastante simples e consistente. Completamente diferente do estilo de outros produtos da Alibaba, ele me lembrou vagamente o design do Quark, que antes me impressionava. Todas as funções principais estão concentradas na página inicial e na área de resumo abaixo, o que é muito intuitivo e fácil de entender. Muitas funcionalidades podem ser acionadas diretamente usando linguagem natural, o que é bastante importante, já que nem todos estão tão familiarizados com os diversos modelos quanto nós.
Como usuário da internet, raramente saio de casa, mas quando saí outro dia, percebi que ainda existe muita demanda por reconhecimento e interpretação de imagens por IA. Por exemplo, perguntar à IA sobre locais históricos e relíquias culturais pode fornecer muitos tópicos de conversa e ajudar você a entender melhor o lugar. Aqui está uma foto de uma placa que tirei há alguns dias, porque tem um personagem que eu sinceramente não reconheço. Então eu lhe fiz uma pergunta, e ele me deu uma resposta incrível. Ele não só explicou o significado das palavras, como também sabia a que lugar a placa pertencia.
Este aqui aguenta; vamos passar para algo mais complicado. Encontrei uma imagem praticamente sem texto ou conteúdo; os únicos objetos identificáveis são provavelmente árvores de ginkgo e construções antigas. Para minha surpresa, ele terminou muito rapidamente, e esse tipo de tarefa complexa ativa automaticamente a capacidade de pensamento profundo, mesmo que eu não tenha selecionado essa opção.
Ao abrir o aplicativo de fotos, descobri que ele também tinha a capacidade de traduzir fotos. O que é realmente impressionante é que ele não apenas gera uma tradução de texto, mas também fornece uma imagem traduzida, com a formatação correta — apenas o idioma estrangeiro foi alterado para chinês. Isso é muito útil! Pode traduzir não só medicamentos, mas também imagens e informações do exterior.
Depois de dominar o reconhecimento de imagens, vamos analisar um cenário muito comum do dia a dia: resumir um artigo. Escolhi um caso relativamente complexo. Encontrei meu relatório de exame físico de junho deste ano e pedi para ele analisá-lo. Acho que muitos dos nossos amigos têm essa necessidade. Um monte de números é realmente difícil de entender, e a análise automática é muito simplista. Como você pode ver, toda a análise é muito mais clara e intuitiva do que a fornecida pelo centro de exames físicos; ela integra partes relacionadas e as explica para você. A seção sobre lipídios sanguíneos apresenta diretamente o colesterol, os triglicerídeos e o LDL (lipoproteína de baixa densidade) em conjunto e recomenda que você os verifique regularmente. Parece que o Alibaba investiu bastante nesse aspecto dos dados de saúde.
Além de fazer perguntas comuns, também realizamos pesquisas aprofundadas, uma ferramenta que usamos frequentemente para coletar dados. Selecionar o botão da cápsula correspondente acima da caixa de entrada acionará o evento. Aqui, optei por que ele investigasse o evento de matchmaking "Film Hurricane", que recentemente se tornou popular. O design da interface do usuário é excelente, muito mais claro do que o do Gemini e do GPT, que só têm uma barra de progresso. É possível ver claramente que eles planejam o esboço e depois realizam várias buscas e resumos, e cada busca é proposital e contribui para o resultado. Em particular, eles chegaram a começar a procurar incidentes semelhantes envolvendo outros criadores de conteúdo para fundamentar seus argumentos. A página de resultados para pesquisas aprofundadas também foi especialmente projetada. Ao contrário de alguns produtos que simplesmente juntam uma exibição em Markdown e a ignoram, sem se preocuparem com tamanho da fonte, lógica de quebra de linha, altura da linha, etc., o Qianwen tem uma aparência muito agradável e os botões de uso frequente são bastante intuitivos. O resultado foi um relatório de 8.000 palavras, muito detalhado, que abrangia tudo, desde a visão geral inicial até os detalhes do evento, e finalmente as reflexões, bem como o impacto e os pontos de vista de todas as partes envolvidas.
Além disso, existem muitas tendências de imagem e vídeo que podem gerar muito tráfego para os produtos, especialmente depois que uma determinada tendência se torna popular nas redes sociais. O Qianwen também oferece suporte à geração e edição de imagens. Por exemplo, para necessidades comuns de edição de imagens, ele pode ajudar você a ajustar a cor das fotos ou remover pessoas irrelevantes de fotos de paisagens. Ele ainda oferece suporte à edição contínua, permitindo que você processe a mesma foto várias vezes.
Também é possível gerar vídeos. Usei uma foto que tirei casualmente para gerar um vídeo, e o realismo ficou muito bom, a resolução era altíssima e ainda tinha efeitos sonoros. Eu não escrevi nenhuma instrução; ele adicionou o movimento de câmera por conta própria. O mais legal desse vídeo gratuito, disponível 15 vezes por dia, é que ele não tem marca d'água. Quem trabalha na área sabe o quanto é trabalhoso remover marcas d'água de vídeos.
Por fim, gostaria de apresentar um recurso que considero extremamente poderoso, e talvez o mais poderoso que usei recentemente: a "gravação em tempo real", que pode ser encontrada no botão em formato de cápsula acima da caixa de entrada. Ele consegue transcrever os sons do seu ambiente atual em tempo real, distinguindo os falantes durante a transcrição. Melhor ainda, também oferece suporte à tradução em inglês em tempo real. Você pode considerá-lo um serviço de interpretação simultânea baseado em texto. A geração e a velocidade de tradução são bastante rápidas, e a precisão é muito alta.
Isso é bastante útil para estudantes e usuários que participam de reuniões com frequência. Além disso, após salvar, o programa perguntará se são anotações de uma reunião ou de aula e resumirá e analisará sua gravação com base no contexto. Por exemplo, se você selecionar a gravação de uma aula, ele resumirá os pontos de conhecimento correspondentes e também poderá gerar um mapa mental.
Muito bem, isso conclui a experiência das mil perguntas do Mestre Zang. Selecionei apenas alguns recursos que considero realmente excelentes. Na verdade, o Qianwen também possui vários outros recursos úteis, como divisão de tela dedicada, geração de apresentações em PowerPoint com IA, videochamadas com IA e escrita inteligente. Basicamente, tem tudo o que você possa imaginar.









