Um viés de média

O amor pelo preconceito não é correspondido – novamente.

Παν μέτρον άριστον. [Tudo com moderação.] ”- Kleoboulos de Lindos, atribuído no século VI aC

A capacidade de calcular a média de dados ruidosos é essencial para uma cognição e tomada de decisões eficazes. Alunos introduzidos na distribuição de erro gaussiana são estragados porque essa distribuição não é apenas normal, mas também bonita. O fato de existirem diferentes medidas de ” tendência central ” ainda não atingiu o lar, porque, com Gauss, elas são todas iguais: a média (a média aritmética), o modo (o pico) e a mediana (o percentil 50). ). Quando o skew é introduzido, os três caminhos de parte. Para uma distribuição negativamente distorcida (com a cauda fina à esquerda) e com números subindo da esquerda, o modo é maior que a mediana, que é maior que a média.

Quando os pesquisadores apresentam aos participantes uma série de números e os pedem para estimar a média, eles explicam bem os três tipos de tendência central e deixam claro qual deles eles buscam. Muitas vezes, os pesquisadores parecem supor que pedir uma ‘média’ será entendido como ‘média aritmética’, e quando as estimativas médias se afastam das médias verdadeiras, os pesquisadores concluem que algo interessante está acontecendo.

Se as estimativas médias sempre atingirem bem as médias verdadeiras, não haveria muita psicologia (Peterson & Beach, 1967). As discrepâncias levantam questões sobre o que as pessoas realmente fazem para resolver a tarefa e como modelar isso. Parducci (1965) apresentou um relato simples e elegante da média. De acordo com a sua teoria da frequência de alcance (RFT), as estimativas de médias surgem de um compromisso entre um princípio de alcance e um princípio de hierarquia . O princípio do intervalo leva o ponto médio entre o menor e o maior valor observado, e o princípio de classificação toma a mediana. Se os dois diferirem, divida a diferença. A RFT tem sucesso em prever o desempenho humano em tarefas de média em uma ampla variedade de contextos (Wedell & Parducci, 2000).

De tempos em tempos, os pesquisadores tentam reinventar o RFT ou melhorá-lo – com sucesso limitado. Em um ensaio anterior (Krueger, 2018), descrevi os esforços de uma equipe de Harvard para introduzir um novo conceito de expansão de categoria , apenas para descobrir que a RFT descreve bem os dados sem exigir um novo processo psicológico, muito menos “preconceito”.

Agora, pesquisadores de Yale e Cornell nos falam sobre uma binária binária , uma suposta heurística de média que produz erro sistemático (Fisher & Keil, 2018; Fisher et al., 2018). O pecado psicológico do dia é a dicotomização. A média é difícil, e os entrevistados dividem o intervalo de valores observados em uma metade esquerda e uma metade direita (lembre-se do princípio da variação), e então estimam o número de observações em cada metade e subtraem uma contagem da outra para chegar em uma pontuação de desequilíbrio. Isso se parece muito com o RFT, porque ele adota o princípio do alcance (usando o meio intervalo como critério de dicotomização) e o princípio de classificação (usando variações no desvio da distribuição). De fato, a medida dependente crítica, o escore de desequilíbrio , prevê estimativas da média em todo o intervalo. Surpreendentemente, porém, o modelo computacional para o viés binário é mudo sobre como o escore de desequilíbrio se traduz em uma média estimada; ele apenas prevê que os dois estão correlacionados em pares de distribuições.

J. Krueger

Um conto de 2 menus

Fonte: J. Krueger

Para testar a hipótese de tendência binária, os autores constroem pares de distribuições onde as duas médias são as mesmas, mas a inclinação é diferente. Agora, o desvio afeta tanto o escore de desequilíbrio quanto a mediana, confundindo assim os dois. Considere o exemplo dos dois menus (mostrados na primeira figura inserida). Existem 10 itens no menu. Os preços variam de US $ 12 a US $ 20 no menu 1, e de US $ 10 a US $ 17 no menu 2. Assim, o midrange é US $ 16 no menu 1 e US $ 13,5 no menu 2. No menu 1, 7 itens são mais baratos que o midrange e 3 são mais caro. Isso produz uma pontuação de desequilíbrio de 4 (7 – 3). No menu 2, 2 itens são mais caros que o midrange e 8 são mais baratos. Isso produz uma pontuação de desequilíbrio de -6 (2 – 8). A previsão é que os entrevistados irão estimar um preço médio menor para o menu 1 do que para o menu 2 e, de fato, o fazem. Et voilà , viés produz erro.

No entanto, a mediana mostra a mesma desigualdade. A distribuição de preços para o menu 1 é positivamente inclinada (com a maioria dos pratos sendo barata), enquanto a distribuição para o menu 2 não é distorcida. O preço médio no menu 1 é de $ 14, e o preço médio no menu 2 é de $ 16. Esta parte do RFT está indo bem. Se, no entanto, os entrevistados dessem a mediana e o preço médio do preço igual ao estimar as médias, a média estimada para o menu 1 seria ligeiramente superior à média estimada para o menu 2.

A possibilidade de que os entrevistados simplesmente considerem a mediana quando estimam os teares médios como uma alternativa psicológica plausível. Os autores repetidamente observam a confusão entre o preconceito binário e o julgamento mediano, mas fazem pouco para quebrá-lo. O teste mais direto é encontrado no estudo 7 de Fisher et al. (2018) Aqui, encontramos 3 tipos de pares de distribuição. Nos três pares, a distribuição com o enviesamento positivo tem uma média ligeiramente menor que a distribuição com o enviesamento negativo. Como os números apresentam valor neste experimento, todos os entrevistados devem escolher da última distribuição; ainda a maioria não, o que é consistente com o viés binário. As descobertas são praticamente as mesmas quando as 5 caixas são rotuladas de “muito ruim” a “muito boa”. Aqui, o meio intervalo coincide com o rótulo neutro. Na terceira condição, no entanto, os entrevistados encontram uma escala univalente que vai de “justo” (1) a “extremamente bom” (5). Cerca de metade desses entrevistados ainda prefere a distribuição com a menor média, mas com inclinação positiva. Os autores concluem que se o skew for a origem do erro, a introdução de rótulos não deve importar.

Essa é uma maneira curiosa de tentar separar hipóteses concorrentes. A introdução de rótulos de ‘justo’ (1) a ‘extremamente bom’ (5) gera nova competição tanto para o viés binário quanto para a conta de inclinação. Nessa condição, o limite de categoria sugerido semanticamente passou de 3 para 1.5. Existe agora uma forte demanda para agrupar todas as classificações contendo a palavra “bom”. E, como se vê, a distribuição com a menor média tem menos itens “justos” do que a distribuição com a média mais alta. Este teste não é forte porque se baseia na ideia de que qualquer efeito significativo refuta a hipótese que prevê nenhum efeito (Krueger & Heck, 2017). Ao implantar uma manipulação forte, sugerindo a demanda, o deck é empilhado. Com o significado em mãos, é facilmente esquecido que, mesmo sob essas circunstâncias urgentes, a maioria das respostas era semelhante, e não diferente, das respostas nas outras duas condições.

J. Krueger

Que haja bife!

Fonte: J. Krueger

Embora esse teste possa não ser terrível, ele deve ser considerado fraco quando é solicitado que ele faça todo o trabalho. Não é difícil encontrar outra maneira complementar de colocar a hipótese do viés binário contra a hipótese da distorção. Vamos voltar ao paradigma de menu e adicionar um item caro (bife de lombo por US $ 30) a cada lista. A segunda figura mostra que as médias subiram e que a segunda lista mantém um preço mediano mais alto. Criticamente, a pontuação do desequilíbrio está agora equilibrada, portanto, não é previsto viés binário. O RFT, usando informações de meio intervalo e classificação, prevê uma pequena diferença.

Com um pouco mais de pesquisa, podemos aprender se precisamos do novo conceito de viés binário. Parte do – enganoso – apelo desta pesquisa é que ela usa a observação não controversa de que as pessoas categorizam espontaneamente os estímulos contínuos (Krueger & Clement, 1994; Tajfel, 1969) para afirmar que essa tendência compromete a cognição categórica cruzada, como grandiosa média.

Referências

Fisher, M., & Keil, FC (2018). O viés binário: uma distorção sistemática na integração da informação. Ciência psicológica . DOI: 10.1177 / 09567718792256

Fisher, M., Newman, GE, & Dhar, R. (2018). Vendo estrelas: como o viés binário distorce a interpretação das classificações dos clientes. Jornal de Pesquisa do Consumidor . DOI: 10.1093 / jcr / ucy017

Krueger, JI (2018, 16 de julho). Problemas sociais e cognição humana. Psicologia hoje online . https://www.psychologytoday.com/intl/blog/one-among-many/201807/social-problems-and-human-cognition

Krueger, J., & Clement, RW (1994). Julgamentos baseados em memória sobre múltiplas categorias: Uma revisão e extensão da teoria de acentuação de Tajfel. Journal of Personality and Social Psychology, 67 , 35-47.

Krueger, JI, & Heck, PR (2017). O valor heurístico de p na inferência estatística indutiva. Fronteiras na Psicologia: Psicologia Educacional [Tópico de Pesquisa: Aspectos Epistemológicos e Éticos da Pesquisa nas Ciências Sociais] . https://doi.org/10.3389/fpsyg.2017.00908

Parducci, A. (1965). Julgamento de categoria: um modelo de frequência de intervalo. Psychological Review, 72 , 407-418.

Peterson, CR, & Beach, LR (1967). O homem como estatístico intuitivo. Boletim Psicológico, 68 , 29-46.

Wedell DH, & Parducci A. (2000). Comparação Social. In: J. Suls, & L. Wheeler (eds.), Manual de comparação social: Teoria e pesquisa (pp. 223-252). Nova York: Plenum / Kluwer.

Tajfel, H. (1969). Aspectos cognitivos do preconceito. Journal of Social Issues, 25 , pp. 79–97.