Os pontos de pressão na camada do aplicativo: 1) Custos do Modelo: Se você estiver atendendo a um caso de uso altamente complexo, precisa oferecer o modelo SOTA (para o qual os preços dos tokens permaneceram estáveis), ou seu concorrente, apoiado por outro fundo de capital de risco de primeira linha, o fará. Reversão da margem bruta? Não tenho tanta certeza. 2) Capacidades do Modelo: Os modelos estão se tornando cada vez mais capazes (veja o gráfico METR). Por que envolver a cognição em fluxos de trabalho se estes potencialmente se tornarem irrelevantes? Sim, a distribuição e outros fatores importam, mas até mesmo as pessoas comuns que conheço usam IA de alguma forma e, portanto, a menos que sejam proibidas pelo empregador de usar um modelo horizontal, garanto que qualquer pessoa que use um produto de IA/fluxo de trabalho vertical também terá tentado o mesmo comando com o modelo de sua escolha — e se não funcionou há 6 meses, provavelmente funciona hoje.
Então, todos os aplicativos estão fadados ao fracasso? Não. Acredito que os aplicativos duradouros do futuro são "pós-esqueuomórficos", começando pelas nuances do modelo e encontrando o caminho para criar novos fluxos de trabalho e experiências.