Usando grandes dados para estudar psicologia

Amazon
Fonte: Amazon

Há muita discussão sobre o valor dos grandes dados para as empresas. Por exemplo, a Amazon combina suas compras e visualizações de página com as de outros compradores e tenta encontrar pessoas com interesses semelhantes. Então, a Amazon sugere compras de produtos que as pessoas gostaram sob o pressuposto de que você também irá gostar deles.

Podem ser utilizados grandes dados para responder a questões de interesse para a comunidade de pesquisa em psicologia? Seth Stephens-Davidowitz explorou essa questão com detalhes em seu fascinante livro, Everybody Lies .

O que eu gosto do livro de Stephens-Davidowitz é o quão claro é sobre o que podemos aprender com dados importantes, bem como algumas das coisas difíceis de usá-lo com sucesso.

Os dados importantes são particularmente bons ao abordar questões que as pessoas podem, de outra forma, estar relutantes em responder em pesquisas. Muitas vezes, a forma como as pessoas interagem com os computadores revela aspectos de seus interesses que não expressariam em uma entrevista ou mesmo em uma pesquisa anônima.

Por exemplo, Stephens-Davidowitz explora dados relacionados à orientação sexual. Ele ressalta que existem grandes diferenças regionais em quantos homens relatam que são homossexuais. Por exemplo, muito mais homens em Rhode Island se identificam como homossexuais em pesquisas do que os homens no Mississippi. Pode ser que os homens homossexuais se movam para estados que são mais tolerantes, mas também pode ser que homens gays em estados menos tolerantes tenham menos probabilidades de responder com sinceridade a pesquisas.

Stephens-Davidowitz usou dados do Facebook sobre onde os homens que se auto-identificaram como gay nasceram e onde se mudaram. Havia alguma tendência para o movimento de lugares menos tolerantes para mais tolerantes. Mas, esse movimento por si só não explicaria as grandes diferenças regionais observadas em pesquisas.

Ele então usou dados do Google, que rastreiam os tipos de pesquisas que as pessoas fazem e fornecem informações sobre os locais nas quais essas pesquisas foram originadas. Em particular, ele analisou a proporção de pesquisas de pornografia que buscavam especificamente pornografia gay-masculina. Aproximadamente 5 por cento de todas as pesquisas de pornografia por homens eram para pornografia gay-masculina. Isso foi verdade em basicamente em todos os estados nos EUA, independentemente de quão tolerante seja o estado. Isso sugere que cerca de 5% da população masculina é atraída pelos homens e que isso é verdade em todos os estados.

Dados importantes também podem ser usados ​​para abordar questões que podem ser difíceis ou impossíveis de responder de outras maneiras. Meu exemplo favorito no livro vem de uma exploração de sonhos. Freud sugeriu que os sonhos podem revelar desejos sexuais inconscientes simbolicamente. Uma banana ou pepino em um sonho, então, pode ser um stand-in para um pénis.

É difícil refutar uma teoria como essa porque os desejos que Freud discutiu deveriam ser inconscientes. Isso significa que, mesmo que as pessoas falem sobre seus sonhos, por definição não podem saber o que o sonho significa.

Stephens-Davidowitz tomou dados de um aplicativo que coletou descrições de sonhos dos usuários e analisou as descrições dos sonhos e encontrou todos os alimentos que foram mencionados. Ele analisou os fatores que prevêem a frequência com que um alimento particular aparece nos sonhos e, em seguida, descobriu que a frequência com que esses alimentos foram consumidos era um grande preditor de sua aparência nos sonhos, bem como a sensação dos alimentos.

Então, há alimentos em forma de falo em sonhos – como pepinos e bananas – mas parecem aparecer mais com a freqüência que eles são comidos do que qualquer outra coisa. Por exemplo, os pepinos são o sétimo vegetal mais popular nos sonhos, e eles também são o sétimo vegetais mais populares em geral. Isso sugere que não há nenhuma razão para acreditar que uma banana em um sonho é algo mais do que uma banana.

Finalmente, Stephens-Davidowitz faz um bom trabalho de explorar alguns dos fatores que podem tornar a análise de dados grandes não confiável. Suponha que você tenha algum traço complexo, como inteligência, e você quer saber se existem preditores genéticos de inteligência. Você pode tentar correlacionar pontuações em testes de QI com os genes das pessoas que tomam esses testes. Agora que os cientistas têm dados sobre sequências de genes para tantas pessoas, essa análise foi realizada várias vezes em vários conjuntos de dados diferentes.

Toda vez que essa análise foi feita, genes específicos aparecem como bons preditores de pontuação de QI dentro desse conjunto de dados. O problema é que diferentes genes surgiram em diferentes análises. Acontece porque, mesmo quando você tem muitos dados se você tiver um grande número de preditores potenciais (como genes) e você tem muitas oportunidades para notar uma correlação que é apenas o resultado da variação aleatória nesse conjunto de dados. Como resultado, se você ouvir um relatório de que um gene específico foi encontrado que predisse algum traço como inteligência, você deve tratá-lo com cético até que tenha sido validado em vários conjuntos de dados diferentes.

Os grandes dados não substituirão as formas tradicionais de psicologia. Em última análise, grandes dados nos proporcionam oportunidades para ver como diferentes aspectos do meio ambiente estão relacionados, mas eles não podem nos dizer quais fatores causam comportamentos específicos. Para fazer isso, a psicologia precisa continuar fazendo o tipo de experimentação que tem sido central no campo para o século passado. Mas, grandes dados têm um grande potencial para ser uma ferramenta importante para entender o comportamento das pessoas.

Siga me no twitter.

E no Facebook e no Google+.

Aqui está a informação sobre o meu mais novo livro Brain Briefs .

Confira meus livros Smart Thinking and Habits of Leadership e Smart Change .

Ouça meu programa de rádio no rádio KUT em Austin Two Guys on Your Head e siga 2GoYH no Twitter e no Facebook. O programa está disponível no iTunes e Stitcher.