então Quão ruim é usar a Análise de Forças Simples (SFT) em dados de qualidade mediana e depois simplesmente aplicar a Análise de Rotina (RL) às métricas que você considera importantes, em comparação com usar a SFT em dados de boa qualidade desde o início? Pensando em situações onde você quer treinar a estrutura de uma tarefa, mas sem gerar "conteúdo" de alta qualidade, por assim dizer.
Minha suspeita é que o aprendizado por reforço que você faria para retificar os efeitos de dados ruins não é abrangente o suficiente para realmente neutralizá-los.