Um robô, ou “bot”, pode superar os humanos no poker? Com tecnologias cada vez mais sofisticadas, os programas de Inteligência Artificial (IA) atingiram um novo patamar com o nascimento do Pluribus.
O programa foi desenvolvido pelo Facebook em parceria com a universidade Carnegie Mellon. A instituição é a mesma responsável pela criação do Libratus, bot que já havia superado profissionais em jogos heads-up.
VEJA MAIS: Spin & Go de US$ 1 milhão foi acertado ao vivo no Twitch de russo; confira a reação
A nova criação, o Pluribus, conseguiu pela primeira vez ser vencedor em um jogo 6-Max, que traz muito mais complexidade. Outra diferença é que enquanto o Libratus precisava de um supercomputador para rodar, o novo bot exige apenas cerca de US$ 150 em recursos na nuvem.
A competição foi qualificada. Participaram do desafio: Chris Ferguson, Linus Loeliger, Nick Petrangelo, Seth Davies, Darren Elias, Greg Merson, Dong Kim, Anthony Gregg, Jake Tooler, Jimmy Chou, Daniel McAulay, Trevor Savage, Jason Les, Michael Gagliano e Sean Ruane.

Foram dois tipos de partidas: com cinco humanos e uma inteligência artificial, e cinco inteligências artificiais e um humano. As mesas eram de cash game, com stacks de 100 big blinds em todas mãos, e os profissionais não sabiam quem eram os adversários.
VEJA MAIS: Satélite para o BSOP Gramado volta a dobrar premiação garantida no PokerStars
No primeiro formato, após 10.000 mãos jogadas, o Pluribus obteve um resultado de 5BB/100, ou seja, 5 big blinds de lucro a cada 100 mãos, em média. Importante ressaltar que os pesquisadores usaram um algoritmo que busca diminuir a variância da partida, calculando um resultado “teórico”.
No segundo experimento, apenas Ferguson, Elias e Loeliger participaram. Os três jogaram 5.000 mãos cada e saíram derrotados contra os cinco robôs. Elias perdeu 4BB/100, Ferguson 2,5BB/100, e Loeliger 0,5BB/100.
Diferentemente do Libratus, que usava o sistema de “árvore de decisões” para jogar, o Pluribus aprendeu o poker simplesmente jogando um número gigantesco de mãos contra si mesmo. Assim, a inteligência artificial foi aprendendo as estratégias mais lucrativas. Foi essa mudança que permitiu, também, a necessidade de uma capacidade de processamento muito menor.

Segundo os pesquisadores, após 7 horas de “treinamento”, o Pluribus já tinha uma performance melhor do que a média. Após 20 horas, passou a superar também os humanos de melhor performance no jogo. Curiosamente, após 60 horas de treinamento, o programa eliminou completamente o limp de sua estratégia.
O que isso significa para a situação do poker ainda é impossível saber. Mas o fato é que a entrada da inteligência artificial pode mudar a situação do jogo pra sempre.