No primeiro artigo desta série sobre a Inteligência Artificial, explicamos como essa tecnologia derrotou o maior jogador de xadrez do mundo, Garry Kasparov. Agora, imagine que, durante o confronto contra o Deep Blue ou na final de um dos muitos campeonatos de xadrez que venceu, Kasparov sentisse uma vontade incontrolável de ir ao banheiro. E, para não atrasar os procedimentos, colocasse um colega para jogar em seu lugar. Teoricamente, ele conseguiria dar sequência à partida, sem a mesma classe, pois, no xadrez, todas as informações estão no tabuleiro.

O pôquer é diferente. Um jogador começa uma partida sabendo muito pouco. A única informação que tem são as suas cartas. Não sabe as do adversário. Além disso, as mãos são fluídas e cada uma é diferente da outra. Você pode começar com nenhum jogo e de repente receber o ás que precisava e adotar uma estratégia mais agressiva. O craque precisa ser capaz de acompanhar essas variações e trabalhar com informações incompletas. A inteligência artificial também. Por isso, demorou muito mais tempo para que um programa de computador conseguisse, como dizem na indústria, solucionar todos os problemas de um jogo de pôquer na modalidade mais famosa, o Texas Hold’em.

Nesse estilo de pôquer, cada jogador recebe duas cartas. Em seguida, cinco são abertas na mesa. Primeiro, três juntas (flop), depois duas, uma de cada vez (turn e river). Pode haver apostas entre todas as etapas e o objetivo é fazer o melhor jogo possível juntando cinco cartas. Dentro dessa modalidade, existem variáveis. Pode ser jogada com ou sem limite, no heads up, também chamado de mano a mano, ou com múltiplos jogadores na mesa, como na maioria das partidas transmitida na televisão. E cada uma delas apresenta um número de possibilidades e combinações diferentes e, quanto maior elas forem, maior também a dificuldade para a inteligência artificial.

Além de mestre internacional em xadrez, Vinicius Marques é jogador profissional de pôquer, treinador e produz conteúdo sobre o assunto para sites especializados. “O jogo sem limites é mais técnico porque você desenvolve outras habilidades e tem mais recursos. Quanto menor o número de jogadores na mesa, há mais habilidade (envolvida) porque a probabilidade de alguém ter jogos altos é baixa. Quanto mais jogadores na mesa, mais seletivo você tem que ser com as mãos porque a chance de alguém ter recebido um jogo muito bom é maior. O heads up é um jogo à parte, e o mais importante é se adaptar ao estilo do seu adversário, mas sempre com uma conduta agressiva”, comenta.

O mais simples é o mano a mano com limite. A máquina enfrenta apenas um jogador e as opções de aposta são limitadas. A Universidade de Alberta, no Canadá, tem um grupo de pesquisa dedicado ao pôquer que desenvolve programas desde 1997.  Em 2015, eles chegaram a um marco, quando anunciaram o Cepheus, o primeiro sistema capaz de enfrentar qualquer um em uma partida longa dessa modalidade de Texas Hold’em e terminar com mais dinheiro – se não acredita, teste a tese no site da Universidade de Alberta (poker.cs.ualberta.ca). 

O robô passou dois meses jogando o equivalente a bilhões de mãos e construindo uma base dados com as cartas recebidas, decisões de apostas e resultados. Ao fim do treinamento que faria Rocky Balboa parecer um preguiçoso, ele tinha um registro de todas as mãos possíveis e de quais decisões geraram benefícios e quais geraram prejuízos.

O brasileiro Marlos C. Machado fez doutorado em inteligência artificial em Alberta, onde participou de um outro grupo de pesquisas de Michael Bowling, que assina o artigo científico do Chepeus, e atualmente trabalha como cientista-pesquisador no Google Brain. “O que acontece é que a larga maioria dos programas de pôquer, desde 2007, sempre tentou chegar ao Equilíbrio de Nash”, disse Machado.

Se Alan Turing foi interpretado por Benedict Cumberbatch no cinema, John Nash ganhou Russell Crowe, no filme Uma Mente Brilhante. Recebeu o prêmio Nobel de ciências econômicas pelas suas contribuições à Teoria dos Jogos, ramo da matemática que estuda a tomada de decisão e estratégias adotadas por jogadores para melhorar os seus retornos. A pesquisa de Nash encontrou o ponto de equilíbrio. “No qual nenhum dos jogadores tem incentivo para sair desse equilíbrio. Se fizerem qualquer coisa fora da ação que estão fazendo, vão sofrer mais”, explica Machado.

No exemplo mais utilizado para ilustrar o conceito, existem dois suspeitos de cometerem um crime. A polícia não tem provas para condená-los então os coloca em salas separadas e oferece um acordo: se apenas um confessar, ou seja, trair o outro, sai livre e o colega pega dez anos de prisão; se ambos confessarem, cada um pega cinco anos de prisão; se os dois ficarem quietos, pegam um ano de prisão. Cada um deles, portanto, tem que tomar uma decisão, sem saber o que o outro fará, porque não há comunicação entre eles: confessar ou ficar quieto?

Nos dois casos, a melhor estratégia é confessar, independentemente do que o outro fará. “Se você estiver atuando conforme o Equilíbrio de Nash, tem a garantia de que não vai sofrer, não importa o que o outro estiver fazendo”, acrescenta Machado. Nos programas de pôquer, “há garantias teóricas de que chegarão ao Equilíbrio de Nash, se tiverem tempo. Em termos técnicos, a taxa de convergência para esse equilíbrio foi mais rápida. Em 2015, havia muito mais computação disponível. No final, o Cepheus gastou aproximadamente mil anos de computação para chegar ao Equilíbrio de Nash”.

Resolvido o Texas Hold’em mano a mano com limite, o próximo desafio seria fazê-lo sem limite, o que aumenta exponencialmente o número de possibilidades de decisão a serem tomadas. “Se eu puder apostar qualquer quantidade, e você puder apostar todas as quantidades, você tem possibilidades demais, então a estratégia tem que ser um pouco diferente porque não dá para usar as mesmas abordagens do passado”, afirma Machado. “No pôquer heads up sem limite, o número de possibilidades de combinação é maior que o número de átomos no universo. Se você quiser usar um átomo para armazenar cada possibilidade, você não teria átomos (suficientes) no universo”.

Quase ao mesmo tempo, no começo de 2017, dois programas conseguiram derrotar jogadores profissionais no mano a mano sem limite. A Universidade de Alberta lançou o DeepStack, que derrotou 11 adversários em 44.000 mãos de pôquer. Enquanto isso, a Universidade Carnegie Mellon, de Pittsburgh, anunciou que o seu programa, chamado Libratus, havia vencido uma maratona de 20 dias contra quatro dos melhores jogadores profissionais do mundo.

Dois anos depois, os desenvolvedores do Libratus, Tuomas Sandholm e Noam Brown deram um passo à frente e desenvolveram uma inteligência artificial que, na prática, consegue encarar e vencer um jogo de pôquer Texas Hold’em sem limites em uma mesa com múltiplos jogadores. O Pluribus foi testado contra 13 profissionais diferentes, cinco por vez contra a máquina, que ganhou aproximadamente cinco big blinds (a maior das duas apostas obrigatórias em cada mão, frequentemente usada como métrica) a cada 100 mãos de pôquer.

Da mesma maneira que seu antecessor, o Pluribus desenvolveu suas estratégias atuando contra si mesmo. Começou jogando de maneira completamente aleatória e foi melhorando à medida em que aprendeu quais ações geravam mais lucros. Foi programado para variar as táticas porque, se adotasse sempre a mesma ou se nunca blefasse, seria facilmente lido pelos seus adversários. Mas embora tenha esse aspecto imprevisível dos humanos, não possui emoções, como o medo, e conseguiu realizar apostas maiores do que as habituais, maximizando seus ganhos quando tinha boas mãos. 

“O pôquer é um jogo de pessoas antes de cartas e é guiado por três pilares: o caótico (o homem), o aleatório (o baralho) e a ciência (estratégia). É um jogo de lógica difusa e essa modelagem matemática se complica pelo fator caótico, não a bagunça, mas uma pequena mudança que altera o resultado final. Ou seja, o computador ajuda muito a resolver dois dos pilares (aleatório e caótico) e o homem ainda é preponderante na questão caótica”, opina Vinicius Marques.

 

Agora, acesse nossa página de apostas em cassino e venha curtir nossas mesas de pôquer online.