Dividir e conquistar

J. Krueger
A razão de ouro
Fonte: J. Krueger

Eu escrevi este ensaio com Patrick Heck.

Na proporção inicial . ~ St. John, pseudepigraphical

Este ensaio trata de uma questão matemática aparentemente simples, que, acreditamos, tem implicações psicológicas de longo alcance. Antes de entrar no assunto, comentemos sobre São João, que abre o seu evangelho ao equiparar o Logos com Deus. Logos é um conceito grego antigo de enorme gravidade. Pode referir-se a palavras, frases, significado ou comunicação, mas também à ordem divina da natureza e da lei natural. Poderíamos até ver semelhanças entre o Logos grego antigo e o Tao do Oriente. No Ocidente moderno, o Logos é reduzido a A Palavra, uma rejeição que começou com o testamento da Vulgata (latino), que faz Logos como Verbum. Imagine, Deus é um verbo. Fora da Bíblia, os latinos tornaram Logos como Ratio, e lá entramos no meio das coisas. A partir da razão, obtemos racionalidade e racionalidade, o padrão-ouro do pensamento, o maior alcance do funcionamento psicológico.

Outro significado de relação refere-se ao resultado da divisão, o que você obtém do fracionamento. Mas, como é diferente esse significado matemático estreito do psicológico cognitivo? Após Posner (1973), que definiu o pensamento como imaginando o que não é imediatamente dado (o estímulo) e considerando suas relações, Dawes (1988) diagnosticou o pensamento relativo, comparativo e fracionário como o coração da racionalidade. Dawes incorporou assim a criação de ratios na conquista da racionalidade. Na psicologia do julgamento e da tomada de decisões, os ratios e a sua racionalidade presumida, em sua maioria, são parte de um maior argumento bayesiano. O Reverendo Bayes ensinou como ter uma mente bem comportada, uma mente que não se contradizia.

Lembro-me como foi antes de ontem, quando um colega de classe na escola de pós-graduação resumiu um artigo de McCauley e Stitt (1978), que pretendia mostrar que os estereótipos sociais são bayesianos, ou seja, que são relativos. Considere o japonês. Eles têm – graças a Deus – uma baixa taxa de suicídio, mas essa taxa pode ser – e pode ser percebida como sendo – um pouco maior que no resto do mundo, ou em seu próprio país se não for o Japão. Digamos que a prevalência de suicídio percebida no Japão é de 3%, enquanto que é de 1% no Luxemburgo. Segundo McCauley & Stitt, este diferencial de percepção torna o estereótipo suicida dos japoneses e contra estereotipados dos luxemburgueses e deve ser expresso como uma relação diagnóstica ; aqui 3/1. McCauley & Stitt argumentou que a relação diagnóstica é uma medida melhor e mais verdadeira dos estereótipos do que o bom valor de porcentagem antiquado obtido para os japoneses. Com certeza, eles descobriram que os índices de diagnóstico estão correlacionados com as classificações de tipicidade ("Como é típico o suicídio dos japoneses?"), Mas em uma busca sustentada de uma década, meus colegas e eu mostramos que o numerador (% japonês) faz tudo o trabalho, enquanto o denominador (% luxemburguês) degrada a medida em vez de a afiar (revisado em Krueger, 2008). As estimativas de porcentagem simples para um grupo estão mais altamente correlacionadas com as classificações de tipidade de características do que as razões de diagnóstico. Podemos ver isso mesmo nos próprios dados de McCauley & Stitt.

Por que McCauley & Stitt pensou que os índices de diagnóstico são superiores? Eles começaram a partir da premissa – uma crença prévia que você poderia dizer – que toda cognição e, portanto, cognição social, é bayesiana. Isso significa que as crenças podem ser expressas de forma probabilística e que um conjunto de crenças é – ou pelo menos deve ser – consistente na maneira de Bayes. No teorema de Bayes, a proporção da probabilidade de que uma pessoa japonesa morra por suicídio, p (S | J), dividida pela probabilidade de que um luxemburguês morra por suicídio, p (S | L), é igual à razão de classificação posterior, ou seja, a probabilidade de um suicídio ser japonês, p (J | S), sobre a probabilidade de um suicídio ser luxemburguês, p (L | S), se for multiplicado pela proporção da probabilidade anterior de que uma pessoa é Japonês, p (J), com a probabilidade anterior de que uma pessoa seja luxemburguês, p (L). Em outras palavras, o teorema de Bayes exige o cálculo de uma proporção de probabilidades condicionais para que uma pessoa possa ser classificada como japonesa ou luxemburguesa, considerando suas probabilidades diferenciais de suicídio. Elegante como o método de Bayes é, não é uma boa descrição de como as pessoas percebem a tipicidade de vários traços em grupos sociais.

McCauley e outros mais tarde passaram de índices para diferenças, sem muitos comentários. De qualquer forma, eles provavelmente pensaram que, levando em consideração a forma como um grupo de comparação está sendo percebido, só pode melhorar a medição e a previsão. No entanto, os índices e os escores de diferença diferem de maneiras importantes. Primeiro, as proporções são delimitadas por 0 no chão, mas não têm teto. Enquanto 1.0 é o ponto médio, diminuir o numerador não pode fazer a relação negativa, ao passo que diminuir o denominador pode mover a proporção para o infinito. Essa assimetria produz distribuições altamente distorcidas. Em contraste, os escores de diferença fazem com uma distribuição modesta e simétrica em torno de 0, onde o máximo é X max – Y max . Segundo – e relacionado – o tamanho da relação nos permite estimar o tamanho do denominador. Se a proporção for muito grande, o denominador provavelmente é muito pequeno. Uma diferença de diferença muito grande, no entanto, nos diz que ambos, numerador e denominador estão próximos dos pontos finais de suas escalas, mas em extremidades opostas. No nível conceitual intuitivo, os ratios parecem "relativizar" a variável no numerador, enquanto as diferenças de diferença parecem "corrigi-lo".

O fascínio com as pontuações "relativas" ou "corrigidas" é profundo, pelo menos por duas razões. Uma razão é que o teorema de Bayes fornece um padrão para o pensamento racional. O pensamento racional é coerente, e o teorema de Bayes garante que as peças se encaixam. Se uma probabilidade é negligenciada ou ignorada por completo, o ajuste coerente não pode mais ser garantido e todo inferno mental pode se soltar (Thomas Bayes era um clérigo). A outra razão é a intuição diária. Essa intuição é algo engraçado. Diz, por exemplo, que "mais informações são sempre melhores", mas tende a ignorar seus próprios conselhos ao fazer julgamentos intuitivos. Os bayesianos e outros corretores e relativizadores utilizam a intuição mais-melhor-se ao dizer aborrecimento ao pensar que as simples sugestões heurísticas podem ser excelentes como ferramentas de decisão. Em sua filosofia, o julgamento racional deve dividir (ou subtrair) porque, ao fazê-lo, deixaria informações sobre a mesa – e isso, mais cedo ou mais, resultaria em caos.

Os índices relativos, como os índices ou as diferenças, são úteis se forem melhores do que qualquer um dos seus componentes simples na previsão de uma terceira variável. Uma das razões pelas quais eles não podem fazer isso é que eles estão confundidos com seus componentes. A pontuação de diferença é mais fácil de entender do que os índices. Então vamos começar por lá. Livros de texto de estatísticas nos ensinam que as diferenças estão positivamente correlacionadas com a variável a partir da qual nós subtraimos e estão correlacionadas negativamente com a variável subtraída (McNemar, 1969). A correlação, r , é positiva entre X e X-Y, e é negativa entre Y e X-Y.

J. Krueger
Fonte: J. Krueger

Deixando de lado as variações, ou assumindo que elas sejam as mesmas para X e Y, podemos ver que o numerador provavelmente será positivo e que será mais positivo à medida que a correlação entre X e Y cair ou se tornar negativa.

P. Heck
Ratios conspirados contra o numerador
Fonte: P. Heck

O que, entretanto, pode ser dito sobre os índices? A relação X / Y será positivamente correlacionada com o seu numerador X? Como não pode ser assim? Como X aumenta, então, ceteris paribus , X / Y também deve aumentar. Bem, parece que não parece funcionar de uma a outra maneira. Nós executamos simulações de computador permitindo que X e Y variassem em uma distribuição uniforme de 0 a 1. Também variamos a correlação entre X e Y, mas isso não importava muito. Em cada simulação, a maioria dos valores de X / Y era perto de 1, enquanto alguns eram muito maiores e ainda menos são extremamente grandes. Este resultado confirma a idéia de que a divisão produz uma distribuição altamente distorcida. Inclinação em um

P. Heck
Inclinação positiva (direita) quando X e Y estão negativamente correlacionados.
Fonte: P. Heck

variável deprime as correlações com outras variáveis. Para os valores correlacionados positivamente de X e Y ( r = .5), encontramos uma correlação entre X e a relação X / Y de -0,021, e para X e Y negativamente correlacionados, encontramos .152. Os gráficos à esquerda mostram os dois gráficos de dispersão onde X / Y é mostrado como uma função de X. A maioria das proporções estão na seção mais baixa da escala, enquanto existe uma aspersão de outliers. Quando X e Y estão positivamente correlacionados, a distribuição de X / Y é desviada; Quando a correlação é negativa, é inclinada à direita.

Pode-se considerar que a falta de correlação proporciona prova de independência. Tal conclusão seria precipitada porque a inclinação pode mascarar a verdadeira associação. Uma correção padrão é log-transformar uma variável distorcida antes de correlacioná-la com outras variáveis. Quando log-transformamos os valores, eliminamos a influência desordenada de grandes distantes, e surge uma associação positiva entre o numerador, X e a relação total X / Y. O segundo conjunto de duas figuras mostra isso. Para valores positivamente correlacionados de X e Y ( r = .5), encontramos uma correlação entre X e a relação X / Y de. 514, e para X e Y com correlação negativa, encontramos .831. Essas correlações são bastante amplas, dando credibilidade à visão de que a divisão acrescenta pouco ao que o numerador já realiza. A divisão acrescenta mais quando a correlação entre X e Y torna-se cada vez mais positiva. Isso é interessante porque significa que "relativizar" uma variável X dividindo-a pela variável Y é mais informativo, na medida em que as diferenças entre eles (entre um valor amostrado de X e um valor amostrado de Y) tornam-se menores.

P. Heck
Relacionamento linear emergente após a transformação logarítmica
Fonte: P. Heck

A inclinação da distribuição da razão tem outra conseqüência problemática. Sabemos que a média aritmética provavelmente será maior do que o ponto central conceitual de 1.0, o que obteríamos quando X = Y. Uma vez que é possível obter uma proporção de X / Y> 2, mas impossível obter um <0, a maioria dos meios da amostra será> 1. Em uma distribuição simétrica, a média é uma estimativa imparcial da média verdadeira (ou seja, a média de uma amostra infinitamente grande); não é sistematicamente muito pequeno nem muito grande, e não varia sistematicamente em função do tamanho da amostra. Isto não é tão em uma distribuição distorcida. Em uma distribuição distorcida, a média

P. Heck
Forte associação linear entre X e X / Y.
Fonte: P. Heck

O tamanho da amostra N aumenta porque as amostras maiores tornam mais provável que os valores muito raros, mas muito grandes (aqui, ratios) serão capturados. Se eles são capturados, eles puxam o meio. Uma vez que sabemos que uma proporção pode derivar para o infinito, já que o denominador fica infinitamente pequeno, também sabemos que uma amostra muito grande provavelmente renderá um significado praticamente, praticamente ou moralmente infinito. Nós não queremos que isso aconteça porque o resultado não seria interpretável.

Para ilustrar o aumento da média como função de N, realizamos uma série

P. Heck
O efeito de polarização do tamanho da amostra na proporção média esperada.
Fonte: P. Heck

de simulações. A figura final mostra os meios de amostra de X / Y calculados em 1.000 simulações para cada um dos 7 tamanhos de amostras ao longo de uma escala logarítmica. Observe que a razão média aumenta, assim como a precisão com a qual é estimada (as barras ao redor de cada uma expressam o erro padrão, que é o desvio padrão dos meios amostrados divididos pela raiz quadrada de seu número).

Não há motivo para abandonar toda esperança e todos os índices. Mas, em muitos contextos psicológicos, é uma boa prática perguntar se tanto quanto foi obtido como se esperava. Não seria desejável racionalizar o uso de índices após o fato. Recomendamos proporções de relatórios, juntamente com as variáveis ​​de seus ingredientes, para que se possa apreciar os níveis absolutos dos quais as proporções surgiram. E é claro, alguns índices são lindos, como o dourado na imagem no topo. Fechando o círculo – se você permitir uma metáfora geométrica – Fra Luca Pacioli, o grande matemático do renascimento, observou que "Como Deus, a Proporção Divina é sempre semelhante a si mesma".

Krueger, JI (2008). A beleza robusta de associações simples. Em JI Krueger (Ed.), Racionalidade e responsabilidade social: Ensaios em homenagem a Robyn M. Dawes (pp. 111-140). Nova York, NY: Psychology Press.

McCauley, C., & Stitt, CL (1978). Uma medida individual e quantitativa de estereótipos. Jornal de Personalidade e Psicologia Social, 36 , 929-940.

McNemar, Q. (1969). Estatística psicológica (4ª ed.). Nova Iorque, NY: Wiley.

Posner, M. (1973). Cognição: uma introdução . Glenview, Ill: Scott, Foresman.