Correlação espúria por Tyler Vigen: uma revisão do livro

O livro de Tyler Vigen, Spurious Correlations , é caloroso, engraçado e faz vários pontos muito importantes. De acordo com Vigen, seu livro é baseado em dezenas de correlações entre conjuntos de dados completamente diferentes. Ele dependia de um computador para gerar correções aleatórias do produto-momento de Pearson (r) entre variáveis ​​tão insignificantes como a matrícula do ensino médio e o consumo de creme azedo. E, de fato, a correlação entre a matrícula do ensino médio e o consumo de creme azedo é bastante alta, r = .95. Não só isso é aleatório e sem sentido, mas o problema maior é que vemos absurdo como esse todos os dias e as pessoas baseiam conclusões sobre essas correlações. Por exemplo, estou preocupado com a matrícula escolar. Esta alta correlação significa que, se eu comer creme mais azedo, mais crianças ficarão na escola?

O livro de Vigen é muito divertido porque ele tem quase duzentas dessas correlações sujas e aleatórias que são derivadas de bases de dados sérias. Por exemplo, quando os dados do Centro de Controle de Doenças, CDC, estão correlacionados com dados da Internet Movie Database, ele descobriu que as aparências do filme de Ben Affleck têm uma correlação muito alta com intoxicações acidentais por pesticidas, r = .92. Isso significa que os filmes de Ben Affleck causam intoxicações acidentais por pesticidas? Claro que não. Como todos os professores de graduação de graduação conhecem, a correlação não implica causalidade. Uma correlação é simplesmente uma relação matemática entre dois conjuntos de dados. Isso significa que duas variáveis ​​vão juntas ou covárias.

Embora divertido e bobo, este livro demonstra muitos princípios importantes. Junto com 1) seja cauteloso em sua interpretação de dados e 2) a correlação não implica que a causação é o terceiro conceito de correlação espúria. Na verdade, o livro de Vigen é intitulado Correções espúrias. Estritamente falando, uma correlação espúria é quando a relação entre variáveis ​​com uma forte correlação é explicada por uma terceira variável. É aí que o livro de Vigen fica ainda mais interessante. Aqui está outro exemplo. March Madness TV receita de anúncios e Breweries nos Estados Unidos correlacionam .94. Assim como a receita de anúncios aumenta, também as cervejarias. Podem ambos ser explicados por uma economia em expansão? Uma economia melhor leva a gastar mais dinheiro em tudo, incluindo anúncios de TV e cervejarias. E isso sugere outro princípio de ciência social, The Law of Parsimony. A Lei da Parsimonia sustenta que, quando as coisas são ambíguas, a explicação mais simples que explica a maioria das observações é a melhor.

Hmmm …., Agora as coisas ficam complexas. Não é suficiente observar uma relação correlacional entre variáveis ​​e pular para uma conclusão. Infelizmente, isso acontece o tempo todo e é por isso que este livro é um ótimo complemento para uma aula formal em estatísticas. De qualquer forma, começa a tornar-se óbvio que a ciência social é sobre raciocínio, lógica e não apenas correções geradas por computador aleatórias. Usamos o raciocínio dedutivo para formar hipóteses, raciocínio indutivo para testar as hipóteses e replicar cuidadosamente nossas descobertas antes de saltar para conclusões. A pesquisa em ciências sociais é fundamentalmente um exercício de lógica. Infelizmente, na era dos grandes dados, isso não está acontecendo o suficiente. Diariamente, estamos sobrecarregados com os dados. Eu não posso nem comer um chocolate de Sees sem saber quantas calorias vai me custar. Os cientistas correm para publicar resultados e resultados negativos nem sequer são publicados. Os meios de comunicação e os professores entendem a conclusão mais rápida e se espalham como fofocas ou crianças tocando no telefone. Tudo acontece muito rapidamente sem muito pensamento crítico ou exame. E, é exatamente por isso que o livro de Vigen é tão importante. Ao se divertir com correlações sem sentido, ele chama a atenção para o pensamento descuidado. Leia este livro para a diversão e depois pare e pense nas implicações para todas as conclusões sem sentido que formamos todos os dias.