O Google está desenvolvendo uma ferramenta de IA para navegação no Street View: o StreetReaderAI, com tecnologia Gemini, que transforma o Street View em um sistema de navegação acessível e com interação por voz. A taxa de acerto nas respostas às perguntas atingiu 86%. Atualmente, temos sistemas de navegação acessíveis; no futuro, poderão existir guias turísticos com inteligência artificial que ajudarão você a realizar levantamentos no local, como, por exemplo: "Ajude-me a caminhar da estação de metrô até a biblioteca, verifique se há obstáculos ao longo do caminho e descreva como é a entrada da biblioteca." Possui diversas funcionalidades, uma das quais é a descrição de cenas em tempo real por IA. O Gemini combina a localização do usuário, a orientação e outras informações geográficas na visualização virtual da rua para transmitir relatórios em tempo real de ruas, cruzamentos e pontos de referência. A segunda funcionalidade é o AI Chat, uma ferramenta de diálogo com múltiplas interações que memoriza cada passo dado pelo usuário. Você pode fazer perguntas como: "Havia algum assento no ponto de ônibus que acabei de visitar?" ou qualquer pergunta sobre a paisagem atual ou anterior e a geografia ao redor. Com tecnologia Gemini Live, este recurso permite interação em tempo real, chamadas de função e retenção temporária de todas as interações dentro de uma única sessão. Ele suporta 1 milhão de contextos de token e aproximadamente 4.000 imagens do Street View. Os controles incluem setas esquerda e direita para virar e setas para cima e para baixo para mover para frente e para trás. Comandos de voz também estão disponíveis, fornecendo informações de direção e distância para cada passo. Em um teste realizado com 11 indivíduos cegos, o recurso de Chat com IA foi utilizado seis vezes mais frequentemente do que a Descrição de Cena em Tempo Real com IA, e acertou 86,3% das 816 perguntas e respostas. #Navegação por IA #Navegação por IA para Cegos #Guia Turístico por IA
blog: