Aprimorando ainda mais o modelo de recompensas para o modelo PPO centrado na mão (tm). Chegando perto do que eu quero. Preciso diminuir a velocidade máxima e quero dar mais passos/passadas mais largas, além de menos apoio na ponta do pé esquerdo, idealmente. É quase inacreditável que isso seja real!
Alguns exemplos de teletransporte do alvo também, já que no vídeo acima eu estava basicamente ajustando. Gostaria de diminuir um pouco o ritmo dessa corrida.