"Nosso modelo de taxa de acerto também nos dá boas intuições sobre por que o jogo individual tem sido tão produtivo na história da RL. Se você está competindo contra um jogador quase tão bom quanto você, seu equilíbrio gira em torno de uma taxa de acerto de 50%, o que maximiza os bits que você obtém de uma variável binária aleatória."
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.