Procure e você deve encontrar: como a imprevisibilidade se relaciona com a exploração

Um tempo atrás, escrevi uma publicação sobre imprevisibilidade no comportamento humano. Eu discuti o conceito de correspondência de probabilidade na escolha. Um caso simples de correspondência de probabilidade é aquele em que você tem uma escolha entre duas xícaras, sendo que somente uma delas terá uma M & M nele. Se o M & M estiver no copo esquerdo de 80% do tempo e o copo direito 20% do tempo, você pode maximizar o número de M & Ms que você provavelmente receberá sempre selecionando o copo esquerdo. Dessa forma, você receberá M & Ms 80% do tempo. As pessoas (e a maioria dos outros animais) tendem a não fazer essa resposta ótima. Em vez disso, tendemos a coincidir com a probabilidade. Ou seja, se o copo esquerdo tiver a M & M 80% do tempo, então escolhemos o copo esquerdo 80% do tempo.

Há muitas razões pelas quais realizamos esse comportamento, e um artigo de Wolfgang Gaissmaier e Lael Schooler na edição de dezembro de 2008 da Cognição sugere uma nova razão. Eles acham que as pessoas que tendem a coincidir com a probabilidade são mais capazes de detectar mudanças no ambiente do que as pessoas que acham a opção mais altamente recompensada e mantêm-se com ela.

Uma maneira de pensar sobre isso é que sempre há uma compensação entre explorar o mundo e explorá-lo. A exploração é o processo de busca de coisas novas. O potencial benefício da exploração é que você pode descobrir novas e ricas fontes de recompensa. O perigo de exploração é que você pode gastar muito tempo e energia e vir com as mãos vazias. A exploração é o processo de desenhar recompensas do mundo em locais conhecidos. O benefício da exploração é que você tem uma boa idéia do que você vai conseguir. O perigo é que você pode perder outras oportunidades que são mais gratificantes do que a que você está explorando atualmente.

Esse tradeoff de exploração de exploração ocorre em quase todas as facetas de nossas vidas. Se você assistir o mesmo programa de TV rotineiramente, você está explorando esse show. Se você provar restaurantes diferentes na cidade onde você mora, você está explorando. Se você tocar um instrumento musical e ficar com o mesmo conjunto de músicas que você já aprendeu, você está explorando. Se você deliberadamente agendar suas férias para que você sempre visite novos lugares, você está explorando.

Sempre foi um pouco desconcertante que as pessoas continuassem a explorar em experimentos que demonstrem compatibilidade de probabilidades. O comportamento ideal é explorar a opção que compensa mais frequentemente. E, de forma restrita, no contexto do experimento, é verdade que explorar a melhor opção no estudo é a melhor coisa a fazer. No entanto, o mundo é dinâmico. As coisas no mundo mudam. Um restaurante que costumava ser terrível poderia ter um novo chef e, de repente, ser excelente. Um programa de TV que começou nervoso e radical pode entrar na mediocridade.

Se você avaliar o mundo ao mesmo tempo e depois explorar depois disso, corre o risco de perder mudanças no mundo. O sistema cognitivo está estruturado para encontrar uma maneira razoável de resolver o tradeoff entre exploração e exploração. Se existe uma opção que é muito superior a todas as outras, então você tenderá a escolhê-lo na maioria das vezes e a selecionar outras opções de vez em quando, apenas para se certificar de que o mundo não mudou radicalmente. Se uma opção for apenas um pouco melhor do que outra, então você seleciona a melhor opção apenas um pouco mais do que a pior. Esse comportamento é útil, porque uma pequena diminuição na qualidade da melhor opção (ou aumento na qualidade da pior opção) pode virar o valor relativo das opções. E porque você está fazendo um bom trabalho de gerenciar o tradeoff entre exploração e exploração, você notará. Portanto, a imprevisibilidade do comportamento humano é realmente uma virtude.