Durante o jantar, um amigo me perguntou qual eu achava ser a etapa mais difícil no desenvolvimento de produtos de IA. Depois de pensar um pouco, concluí que a etapa mais difícil era projetar um mecanismo de feedback e avaliação. Primeiro, precisamos definir a soma e a diferença, o que significa encontrar a função de recompensa. Mas essa etapa pode ser desafiadora para muitos produtos. Porque, em muitos cenários, é difícil construir indicadores quantificáveis para distinguir entre o bom e o ruim. Os indicadores de feedback são geralmente divididos em duas categorias: feedback explícito e feedback implícito. O feedback explícito inclui ações como uma resposta, um "curtir" ou um "não curtir"; o feedback implícito inclui ações como a análise normalizada do comportamento do usuário (como cliques, tempo de permanência, etc.). No entanto, a dificuldade com o feedback explícito reside no fato de que ele se torna uma restrição negativa em vez de positiva. Por exemplo, você não pode incentivar os usuários a dizerem que este produto é ótimo porque, mesmo que os usuários deem um feedback "bom"... Não há muitos benefícios positivos. Quando as pessoas dão feedback "ruim", elas estão criando expectativas, esperando que o feedback leve a uma melhoria. No entanto, o feedback positivo não as beneficia pessoalmente; ele apenas proporciona conforto e incentivo ao sistema. Isso levanta um problema: o sucesso inicial de um produto depende da experiência de especialistas, e não do feedback. Somente depois de atingir cerca de 60 pontos é que ele terá gradualmente a oportunidade de coletar feedback positivo explícito. Em certa medida, a maioria dos produtos de IA depende da intervenção humana em vez da própria IA em seus estágios iniciais. No entanto, mesmo os humanos podem não ser capazes de descrever com precisão o que é "bom". Medir o que é "bom", decompô-lo em várias dimensões ortogonais e, em seguida, avaliá-lo e aprimorá-lo com base nessas dimensões, é uma tarefa relativamente difícil. Se isso for feito corretamente, o progresso dos produtos de IA se tornará muito mais tranquilo.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.