Muitas empresas estão trabalhando agora em sistemas de entrada de voz. Mas o futuro que eles previam era completamente diferente. Essas poucas empresas do Vale do Silício, como a Typeless e a Whisperflow. Eles disseram que estavam desenvolvendo um sistema operacional de voz. O que eles estavam pensando era: O controle por voz se tornará o ponto de entrada para operar tudo. Assim como as telas sensíveis ao toque são hoje em dia. WeChat e Doubao focam na experiência entre aplicativos em dispositivos móveis. A Doubao chegou a colaborar com a ZTE na integração de sistemas. O que eles estavam pensando era: Os métodos de entrada de voz podem ser integrados ao sistema operacional. Mas primeiro precisamos fazer o sistema funcionar. Zhipu é o mais pragmático, afirmando diretamente que deseja ser um ponto de entrada para agentes. Utilize métodos de entrada para distribuir recursos de IA. Assim como Flow fez há muito tempo: Ao pressionar uma única tecla, a função de busca do Perplexity será acionada diretamente. Os três caminhos são diferentes, mas as premissas subjacentes são as mesmas: A interação por voz substituirá em grande parte a digitação. A precisão da tecnologia de transcrição deu um salto qualitativo. A entrada de voz é uma necessidade essencial e de alta frequência. Quem vai ganhar? Não sei. Mas uma coisa é certa: Digitar está se tornando uma escolha, não uma necessidade.
O conteúdo foi originalmente compartilhado pelo fundador do Flash Talk e, em seguida, reescrito usando sugestões.