As mulheres negras não são (avaliadas) menos atraentes! Nossa análise independente do conjunto de dados Add Health

[Esta publicação foi co-autor com Jelte Wicherts]

Em sua publicação de blog bem lida, originalmente intitulado "Por que as mulheres negras são menos fisicamente atraentes do que outras mulheres", o psicólogo Satoshi Kanazawa da London School of Economics (LSE) concluiu que descobriu que as mulheres afro-americanas eram "objetivamente" menos atraentes que as mulheres americanas européias, asiáticas americanas e nativas americanas. As respostas imediatas e de longo alcance a suas controversas conclusões levaram a Psychology Today a mudar primeiro o título do blog e depois retraí-lo completamente.

Dentro de alguns dias após o post aparecer no site, uma tempestade ocorreu. Bloggers de todo o mundo expressaram sua indignação na postagem. As respostas de muitas pessoas foram carregadas emocionalmente, e com razão. Muitas mulheres afro-americanas, que devem sofrer discriminação durante toda a vida, ficaram chateadas e feridas. Outras críticas tentaram ser analíticas, mas não abordaram as questões-chave, ou atacaram todo o campo da psicologia evolutiva por causa de um membro da disciplina (veja meus pensamentos sobre isso aqui). A maior organização estudantil em Londres (que representa 120 mil alunos) exigiu a quitação de Kanazawa da LSE. De acordo com seu porta-voz, a LSE iniciou uma investigação interna sobre o blog, embora o porta-voz da LSE tenha enfatizado a liberdade acadêmica de seus pesquisadores.

Nós concordamos que os cientistas não devem ser demitidos por fazer declarações descortês que possam ofender as pessoas. No entanto, a liberdade acadêmica não implica o direito (1) de interpretar mal os dados e (2) ignorar os achados empíricos que vão contra reivindicações declaradas.

Nós recuperamos os dados de Add Health em que Satoshi Kanazawa baseou suas conclusões para ver se seus resultados levantam o escrutínio. Add Health é um estudo realizado em uma amostra nacionalmente representativa de adolescentes de 7 a 12 anos, que foram seguidas até a idade adulta. O estudo inclui muitas variáveis ​​(mais de 8000 nos conjuntos de dados publicamente disponíveis), incluindo medidas de bem-estar social, econômico, psicológico e físico. Quando abrimos o conjunto de dados, ficamos sobrecarregados com variáveis! (Uma coisa para a qual podemos agradecer Kanazawa é até mesmo levantar esta questão em primeiro lugar, pois provavelmente nunca teríamos examinado as variáveis ​​que ele fez. Além disso, deve-se notar que, com tantas variáveis, é necessário que seja muitos resultados estatisticamente significativos no conjunto de dados simplesmente devido ao acaso [1].)

Uma vez que finalmente localizamos as variáveis ​​relevantes, realizamos as análises relevantes e aqui está o que encontramos:

1. Kanazawa menciona várias vezes que seus dados sobre atratividade são pontuados "objetivamente". As classificações de atratividade feitas pelos entrevistadores mostram diferenças extremamente grandes em termos de quão atraentes encontraram o entrevistado. Por exemplo, as classificações coletadas das Ondas 1 e 2 são correlacionadas em apenas r = 0,300 (uma correlação varia de -1,0 a +1,00), sugerindo que um pouco de 9% das diferenças nas avaliações de segunda onda do mesmo indivíduo podem ser preditos com base nas classificações feitas um ano antes [2]. As classificações tomadas nas ondas 3 e 4 correlacionaram-se entre os avaliadores ainda mais baixos, apenas 0,136, mesmo que os entrevistados tenham alcançado a idade adulta até então e, portanto, não se espera que mudem no desenvolvimento físico tão forte quanto os adolescentes. Embora essas classificações não tenham sido tomadas ao mesmo tempo, se as classificações de atratividade têm menos de 2% de variância comum, é difícil pressionar o lado da afirmação de Kanazawa de que a atratividade pode ser classificada de forma objetiva.

A baixa convergência de classificações encontradas sugere que, neste conjunto de dados muito grande e representativo, a beleza é principalmente no olho do observador. O que estamos vendo aqui são classificações simples de atratividade por entrevistadores cujos gostos diferem muito fortemente. Por exemplo, um entrevistador (nº 153) classificou 32 mulheres como "em média", enquanto outro entrevistador (nº 237) encontrou quase todas as 18 mulheres que classificou como "pouco atraentes". Como os avaliadores diferem fortemente em termos de como eles avaliar a atratividade do entrevistado e porque a maioria deles fez inúmeras entrevistas e classificações, essa fonte de variação precisa ser levada em consideração ao testar as diferenças médias de corrida nas classificações de atratividade. Kanazawa não indica que ele fez isso.

2. Kanazawa interpreta suas descobertas em termos de atratividade de adultos, mas a maioria de seus dados foram baseados nas classificações de atratividade dos participantes quando eram adolescentes . Se muitos de nós (incluindo os autores desta postagem) foram julgados ao longo de nossas vidas com base em nossa atratividade física como adolescente, muitos de nós estariam em problemas!

Adicionar Saúde atualmente tem quatro "ondas", ou fases. Aqui está um gráfico das quatro ondas e os grupos etários das quatro ondas:

Note-se que apenas a Onda IV consiste de "Adultos". Na verdade, a faixa de idades para Wave I e Wave II é 12-22, com uma idade média de aproximadamente 16 para ambas as ondas.

Imagine o cenário. Os pesquisadores adultos (infelizmente não conseguimos descobrir informações sobre os próprios entrevistadores reais) entraram nas casas desses participantes e avaliaram sua própria visão subjetiva da atratividade física dos participantes do estudo em uma escala de 1 a 5 (variando de "muito pouco atraente "para" muito atraente "). Para as Ondas I e II, em particular, as classificações não poderiam (esperamos!) Referindo-se a classificações da atratividade sexual dessas crianças. Então as discussões deste tópico usando dados do site namoro OK Cupid realmente não são apropriadas aqui.

Somente nas ondas 3 e 4 foram os participantes com idade suficiente em média (M = 22,2, SD = 1,9 e M = 29,00 SD = 1,8, respectivamente) para serem realmente chamados de "mulheres" e "homens" em vez de meninas e meninos. Se alguém analisa os dados das ondas (3 e 4) em que todos os entrevistados atingiram a idade adulta legal, o padrão de resultados não suporta mais a principal conclusão de Kanazawa.

Na onda 3, encontramos uma diferença muito pequena em classificações de atrativo em favor das mulheres europeias, mas isso é efeito não é mais significativo depois de levar em consideração a variação aleatória devido aos avaliadores.

No entanto, apenas os dados da Onda 4 são relevantes para a questão que Kanazawa quer abordar, simplesmente porque esta é a única onda que consiste de adultos (eles foram coletados quando todos os participantes eram adultos com idade entre 25-34). Infelizmente, Kanazawa não inclui a apresentação desses resultados da Wave 4, apesar de ele usar dados de Add Health na maioria dos seus estudos e esses dados estão disponíveis há mais de um mês.

Concentrando-se apenas na Onda 4, é óbvio que entre as mulheres na amostra, não há diferença entre as etnias em termos de classificação de atratividade física . As diferenças nas distribuições para as mulheres quando testadas com um teste de independência regular (e ligeiramente liberal) não são significativas e, portanto, podem ser atribuídas ao acaso (Chi-Square de Pearson = 15,6, DF = 12, p = 0,210). Aqui está o gráfico que mostra a distribuição de classificações (em porcentagens) para 1564 europeus americanos, 553 afro-americanos, 97 nativos americanos e 96 fêmeas asiáticas americanas (com meios aritméticos abaixo de cada grupo):

Também analisamos os dados para os homens na amostra e a mesma onda e descobrimos que as diferenças de grupo racial para os machos eram apenas significativas (Chi-Square de Pearson = 21,2, DF = 12, p = 0,048), com machos negros mostrando uma classificação de atratividade geral ligeiramente maior que as outras etnias ( Nota : este resultado não é estatisticamente sólido, embora não leve em consideração a dependência dos pontos de dados devido ao uso dos mesmos avaliadores). Aqui está esse gráfico:

Uma vez que esta diferença muito pequena não apareceu na onda 3, não faremos muito disso.

Kanazawa afirma estar apenas interessado nas verdades "difíceis" na natureza humana. E a verdade da questão é: como adultos, as mulheres negras na América do Norte não são classificadas como menos atraentes pelos entrevistadores do estudo Add health, que é uma das amostras mais representativas do país disponíveis para investigação .

Note-se que os dados poderiam ter saído de qualquer maneira, e não importa como acontecesse, teríamos relatado o que encontramos. Nós pensamos que este é um tópico interessante e importante de investigação. Outras pesquisas rigorosas pesquisadas com revisão pelos pares (envolvendo uma amostra muito menos representativa e menor dos Estados Unidos) mostraram diferenças significativas estatisticamente significativas nas classificações de atratividade com base na etnia.

No entanto, é nossa opinião que tal pesquisa deve ser realizada em um padrão mais elevado do que outros tópicos de pesquisa, tanto no rigor científico quanto na apresentação (veja aqui um argumento semelhante). Isso deve ser tão especial para tópicos que potencialmente podem causar danos e sofrimentos a indivíduos dentro de um determinado grupo. A ciência não opera no vácuo. A coleta de ciência rigorosa e o relatório científico responsável são essenciais não apenas para o progresso da ciência, mas também para o melhoramento da sociedade (não é esse o ponto da psicologia?).

Mesmo que seja bom, pesquisas rigorosas mostram, eventualmente, que as mulheres negras são classificadas de forma diferente, em média, nas características relevantes (embora seja altamente improvável considerando a representatividade desse conjunto de dados), pode haver implicações para o racismo. Contudo, a maneira de combater o racismo não é ignorá-lo (veja aqui para um argumento relacionado), mas compreenda como e por que ele desenvolve, entreter toda a gama de explicações causais potenciais , desde a aprendizagem biológica até a cultura, até bio-sociocultural Aprendendo.

Earl Hunt e Jerry Carlson oferecem 10 princípios de design, análise e relatórios que devem ser considerados com cuidado ao fazer ou avaliar pesquisas sobre diferenças de grupo (eles se concentram em diferenças de inteligência, mas seus princípios também se aplicam à investigação de diferenças de atratividade). O documento completo pode ser baixado aqui e esperamos poder oferecer um conjunto de diretrizes para pesquisadores que decidem realizar pesquisas sobre este tópico, bem como blogueiros que decidem que querem comunicar essas descobertas a uma audiência geral.

Como os pesquisadores colocaram:

"Quando os cientistas lidam com investigações que têm relevância para políticas sociais imediatas, como estudos de diferenças de grupo podem ter, é dever dos cientistas exercer um nível mais alto de rigor científico em suas pesquisas do que seria necessário quando o objetivo da pesquisa é unicamente para avançar a exploração dentro da própria ciência. Nós, em nenhum momento, argumentamos que certos conhecimentos devem ser proibidos com base em que ele pode ser usado de forma incorreta. Nós argumentamos que, quando houver uma chance de que as descobertas particulares sejam rapidamente traduzidas para debates públicos e decisões políticas, é dever do cientista ter certeza de que essas descobertas são da mais alta qualidade ".

Kanazawa não segue estas diretrizes em todas as suas publicações. Por exemplo, em um artigo sobre diferenças de raça no QI ele não só cometeu vários erros teóricos, mas também não considerou explicações alternativas. Aliás, nesse papel particular, ele também assumiu que a Terra era plana!

A ciência, quando feita corretamente, é auto-corretiva. A má ciência e as interpretações são substituídas por uma ciência de melhor qualidade e conclusões mais sensatas e precisas. Se você quiser analisar o conjunto de dados Adicionar Saúde, você pode! Você pode solicitar sua própria cópia do conjunto de dados aqui. Estamos ansiosos para uma discussão mais aprofundada sobre esses temas importantes, que afetam de forma importante a vida de muitas pessoas.

Você pode baixar um resumo mais completo e técnico da nossa análise aqui.

© 2011 por Scott Barry Kaufman e Jelte Wicherts

Siga Scott no Twitter ou no Facebook . Entre em contato com ele aqui !

[1] Alguns podem esquivar com o uso da palavra "magro" aqui para se referir a uma correlação de .30. Devemos notar que essas correlações não são as correlações típicas encontradas na psicologia diferencial (por exemplo, QI com alguma variável de personalidade), mas sim uma análise do acordo entre avaliadores. Com base nas tabelas transversais, o Kappa de Wave1-Wave2 de Cohen para mulheres é de .196. De acordo com Landis e Koch, isso deve ser interpretado como "ligeiro acordo". Kappa para Wave3-Wave4 é 0,0099, pior ainda.

[2] Nosso raciocínio aqui é retirado da teoria padrão de decisão de Pearson-Neyman. Se alguém pressupõe que a hipótese nula seja verdadeira para, por exemplo, 1000 testes potenciais, então 50 desses testes devem ser significativos em alfa = 05. Se concluirmos com base em p <.05 nesses 50 casos, de fato, há um efeito, estamos cometendo erros de Tipo 1. Seus resultados podem ser chamados de descobertas de "chance" porque não esperamos que sejam replicáveis ​​simplesmente porque a hipótese nula é verdadeira.