No macOS, a função de ditado integrada para entrada de voz tem baixa precisão de reconhecimento e não oferece suporte à otimização por IA, por isso sempre parece um pouco deficiente. Descobri recentemente o FluidVoice, uma ferramenta de código aberto de conversão de fala em texto disponível no GitHub. Ela funciona inteiramente em ambiente local e também pode integrar inteligência artificial para aprimorar o desempenho do reconhecimento. Ele oferece suporte ao modo de comando, permitindo que você controle diretamente o seu Mac com a sua voz para realizar diversas operações, bem como ao modo de escrita, onde você pode inserir ou reescrever conteúdo diretamente por voz em caixas de texto de qualquer aplicativo. GitHub: https://t.co/gwjFMylQde A transcrição em tempo real é realizada com base no modelo Parakeet TDT v3, que suporta a detecção automática de mais de 25 idiomas, e a entrada de voz pode ser iniciada a qualquer momento por meio de uma tecla de atalho global. O processo de transcrição exibe uma pré-visualização em tempo real em uma janela flutuante. Assim que a transcrição é concluída, ela é automaticamente inserida no aplicativo em uso. Também é possível conectar-se a modelos como OpenAI ou Groq, que não só transcrevem com precisão, como também ajudam a aprimorar o texto. Se você precisa usar comandos de voz com frequência ou quer controlar seu Mac de uma forma mais inteligente, vale a pena experimentar esta ferramenta. Atualmente, é compatível apenas com Macs equipados com chips Apple Silicon e requer o macOS 14.0 ou posterior.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.

