Conselhos para um campeão

O mundo de Go está em estado de choque, como relatamos em uma publicação anterior. Pela primeira vez, um programa de computador bateu um jogador profissional. O programa de computador por trás desse feito, AlphaGo, é desenvolvido pelo Google Deep Mind, e usa várias técnicas de ponta (veja nossa publicação anterior para detalhes). O resultado foi inovador porque Go – um jogo asiático com muitas mais possibilidades do que o xadrez – foi visto como o Santo Graal da AI. Pensava-se que os computadores deveriam poder exibir a intuição para jogar em um nível superior – agora parece que eles podem fazê-lo.

As coisas poderiam piorar muito cedo para a humanidade. De 9 de março a 15 de março, AlphaGo vai jogar contra o 9-dan Lee Sedol (Coréia do Sul), um dos melhores jogadores do mundo. A partida terá lugar em Seul e será disputada em cinco jogos, com um prêmio de US $ 1 milhão. Will Lee Sedol defenderá o último bastião do orgulho humano contra a IA?

Fernand Gobet
Fonte: Fernand Gobet

A Coreia do Sul é um dos principais países de Go, onde é chamado de "baduk" em vez do nome japonês. (Talvez AlphaGo seja renomeado AlphaBaduk para esta partida). Lee Sedol, de trinta e três anos, confia em que ele vencerá, mas a comunidade Go não tem tanta certeza.

Do lado positivo, Lee Sedol é muito mais forte do que o Fan Hui, o campeão profissional e europeu de 2 dan que perdeu 0 a 5 para o AlphaGo em outubro passado. A diferença é semelhante à diferença, no xadrez, entre um Mestre e um Grande Mestre. Lee Sedol deverá vencer a maioria dos jogos contra o Fan Hui.

Do lado negativo, Fan Hui perdeu todos os jogos da partida, o que indica claramente que o AlphaGo é muito superior a um profissional de 2-dan. Também é provável que o Google Deep Mind use uma versão melhorada. Por exemplo, a AlphaGo aproveitou cinco meses adicionais de aprendizagem desde outubro, com mais jogos mestres, para melhorar sua avaliação das posições e sua seleção de movimentos. Também pode usar hardware mais poderoso, e também empregar um banco de dados de abertura, o que não fez na partida anterior. Isso permitiria aproveitar o conhecimento humano nos primeiros movimentos e assim evitar linhas de abertura inferiores.

Qual estratégia deve adoptar Lee Sedol?

Alguns podem reivindicar descaradamente que a pressão exercida é "tudo em sua cabeça", mas, como um novo estudo revelou (Chib, Shimojo, & O'Doherty, 2014), a pressão deixa uma pegada neurológica real induzindo pessoas a "sufocar" e a realizar abaixo suas nível de habilidade. Sedol estará sob uma pressão psicológica considerável durante a partida, dada a atenção do mundo, ele aumentará. Ele parece confiante e já fala sobre uma revanche, o que é uma boa atitude, a menos que se torne um excesso de confiança. Em seu jogo contra o Deep Blue em 1997, o campeão mundial de xadrez, Gary Kasparov, não lidou bem com a pressão e cometeu sérios erros (Hsu, 2002). Existem várias técnicas que Sedol pode usar para se preparar psicologicamente. Ele pode jogar contra programas de computador, para que ele se acostume a jogar máquinas. Como os programas de computador disponíveis são muito mais fracos que o AlphaGo, ele deve selecionar posições difíceis que ele então jogaria contra o computador; Isso inclui jogos onde ele começa com deficiência material. Obviamente, ele deve praticar com o controle de tempo acordado para a partida.

Se possível, ele deve olhar para os jogos jogados pela Alpha-Go para que ele possa identificar fraquezas específicas. Idealmente, o contrato da partida deveria ter estipulado que o time Alpha-Go deveria fornecer esses jogos regularmente durante a preparação da partida. Dada a publicidade que o concurso criará, duvidamos que este seja o caso. Em geral, a força da AlphaGo também é sua fraqueza: precisa de milhões de posições para aprender e usa um grande número de jogos mestres, porque há muito menos jogos de jogadores de nível superior competindo um contra o outro. Assim, sua peça é modelada no jogo de mestres em vez de jogadores de nível superior. Os mestres são, obviamente, mais fracos do que os jogadores de nível superior, e um jogador de classe mundial como o Lee Sedol deve aproveitar esse conhecimento relativamente inferior. No entanto, o AlphaGo também aprende por auto-jogo. Até que ponto isso compensa o tipo de jogos usados ​​para aprender é desconhecido e pode ser o fator decisivo da partida.

Embora excelente no reconhecimento de padrões, que é muitas vezes considerado como a marca registrada da experiência humana (Gobet, 2015), o AlphaGo é mais fraco quando se trata de procurar a frente. Isso ocorre porque a forma como ele realiza pesquisa é estatística, e examinando linhas críticas. A este respeito, é o oposto do Deep Blue, que foi otimizado para uma pesquisa precisa. Lee Sedol pode aproveitar isso escolhendo posições contendo variações táticas, onde o julgamento depende de alguns movimentos críticos. A pesquisa estatística da AlphaGo pode perder essas sutilezas e ir para linhas que são suportadas pela grande maioria dos movimentos, mas refutados por uma única jogada.

Para Lee Sedol, o dilema será se ele deveria jogar como faria contra humanos ou mudar seu estilo para aproveitar as fraquezas da AlphaGo. Existe o perigo de fazer o último. A pesquisa sobre o xadrez mostrou que os jogadores, quando jogam fora do estilo em que se especializam, se apresentam em um nível mais fraco (Bilalić, McLeod e Gobet, 2009). Esta conclusão provavelmente se aplicará a Go também. Além disso, tentar antecipar o modo de pensar da AlphaGo irá envolver os recursos cognitivos que não são usados ​​para jogar, vá bem.

Apesar dos formidáveis ​​poderes computacionais da AlphaGo e suas notáveis ​​habilidades de reconhecimento de padrões, Lee Sedol tem uma compreensão muito mais profunda do jogo. Assim, dadas as incertezas sobre a força real da AlphaGo, nosso conselho para ele é iniciar a partida jogando o tipo de jogo em que ele normalmente se destaca. Somente se as coisas ficarem azedas se ele tentar aplicar métodos visando aproveitar diretamente as fraquezas (presumidas) da AlphaGo.

Fernand Gobet e Morgan Ereku

Referências

Bilalić, M., McLeod, P., & Gobet, F. (2009). Efeito de especialização e sua influência na memória e na resolução de problemas em jogadores especializados de xadrez. Cognitive Science, 33 , 1117-1143.

Chib, V., Shimojo, S., &, O'doherty, J. (2014). Os efeitos do enquadramento de incentivos nos decrementos de desempenho para grandes resultados monetários: mecanismos comportamentais e neuronais. The Journal of Neuroscience, 34 , 14833-14844.

Gobet, F. (2015). Experiência compreensiva: uma abordagem multidisciplinar . Londres: Palgrave.

Hsu, F.-H. (2002). Behind Deep Blue: Construindo o computador que derrotou o campeão mundial de xadrez . Princeton, NJ: Princeton University Press.