Outro projeto de código aberto para uso do telefone: android-action-kernel, que permite que a IA manipule diretamente aplicativos nativos do Android, reduzindo o custo por chamada em 95% e a latência para menos de 1 segundo. Sua principal abordagem não utiliza um modelo visual; em vez disso, aproveita a API de Acessibilidade nativa do Android para obter a árvore XML da interface, incluindo o texto dos botões, as coordenadas e o status de clicabilidade, adquirindo diretamente informações semânticas da tela para a tomada de decisões do LLM. Elimina os altos custos de captura de tela, OCR e modelos visuais, custando apenas US$ 0,01 por operação, uma redução de 95%; a latência é reduzida de 3 a 5 segundos para menos de 1 segundo, um aumento de 5 vezes na velocidade; a precisão é aprimorada para mais de 99%. Projeto de @ethanjlim #uso do celular #uso do Android #IA móvel
github:github.com/actionstatelab…