Mais evidências para uma descrição relacionada com dor do dACC

[Nota: certifique-se de ler o terceiro parágrafo que aclara o que parece ser uma fonte importante de confusão sobre nosso artigo]

Desde a nossa última resposta ao blog para Tal Yarkoni (TY), houve três novas respostas de TY, Tor Wager (TW) e Alex Shackman (AS). Essas respostas nos deram muito para pensar e nos levaram a realizar análises adicionais que nós (Lieberman & Eisenberger, a seguir L & E) acreditamos esclarecer, estender e, em última análise, fortalecer nossas reivindicações originais. Enquanto aguardamos todas as análises no documento PNAS, desejamos ter pensado em fazer essas análises anteriormente e incluí-las no documento.

muitos discordos em alguns dos mais recentes blogs, mas, como estamos interessados ​​em avançar, queremos começar, novamente, com áreas onde parece haver algum acordo, depois passar para nossas novas análises e, em seguida, em uma discussão de quatro questões: (a) A relação da dor e do medo na base de dados Neurosynth (b) Os escores z em Neurosynth nos informam sobre inferência reversa? (c) Priores empíricos e (d) Podemos dizer que uma região do cérebro tem uma função? Queremos ser claros que este blog será o nosso último comentário sobre tudo isso. Entre a publicação anterior e esta, sentimos que esclarecemos tudo o que precisamos para demonstrar que nossas conclusões são sólidas. Nós antecipamos que aqueles que escreveram postagens já continuarão a discordar de nós, mas esperamos que outros acham isso útil.

Mas antes de saltar para o texto principal deste blog, queríamos esclarecer um ponto importante que será elaborado mais adiante neste blog. A partir das análises em nosso artigo PNAS, não pensamos que, quando vejamos a atividade do DACC, isso implica necessariamente que a pessoa esteja sofrendo dor . Para fazer essa afirmação, seria necessário gerar probabilidades posteriores baseadas em priores empíricos do mundo real que não existem (nem o Neurosynth anterior de .50 ou a prevalência de dor de 3,5% nos resumos de Neurosynth fornecem essa informação, uma vez que esta reflete o que é estudou freqüentemente, não o que ocorre freqüentemente em geral). Mas esse não era o tipo de reivindicação que fazíamos. Nossa reivindicação foi muito mais simples: há evidências confiáveis ​​com base em escores z de mapas de inferência reversa que a dor está associada a grande parte do dACC . Em contraste, na maior parte do dACC há muito menos evidências, com base em escores z de mapas de inferência reversa, que processos executivos, conflitos e saliência estão associados de forma confiável ao dACC . Esses resultados sugerem que uma conta da função dACC deve se concentrar mais nos processos de dor do que os processos cognitivos geralmente focados. Nossa reivindicação é sobre a construção da melhor conta da função dACC, não prevendo o processo presente em um estudo particular ou assumindo que cada neurônio dACC faz a mesma coisa. Abaixo, consideramos várias contas adicionais da função dACC para tornar essa afirmação mais abrangente.

Áreas de acordo

Embora TY aponte que ele discorda de quase tudo o que dissemos em nosso primeiro blog, ele também pimenta sua última postagem no blog com citações de nós ou reafirmações de reivindicações de nós com as quais ele concorda explicitamente (ou não tem problema). Pensamos que vale a pena destacar porque pensamos que estas são algumas das reivindicações mais importantes do nosso trabalho.

Nós escrevemos: "A conclusão dos mapas de inferência reversa da Neurosynth é inequívoca: o dACC está envolvido no processamento da dor. Quando apenas os dados de inferência direta estavam disponíveis, era razoável fazer a afirmação de que talvez o DACC não estivesse envolvido na dor por si só, mas que o processamento da dor poderia ser reduzido à função "real" do dACC, como processos executivos, detecção de conflitos ou respostas salientes a estímulos dolorosos. Os mapas de inferência reversa não suportam nenhuma dessas contas que tentam reduzir a dor para processos cognitivos mais genéricos ".

TY escreveu em resposta: "Esta afirmação realmente parece-me amplamente inabalável".

Nós escrevemos: "Para os termos executivo e conflito, nossa Figura 3 no artigo PNAS mostra um pouco de dACC. Pensamos que os números mais abrangentes que incluímos aqui continuam a contar a mesma história. Se alguém quiser contar a história de conflito de por que a dor ativa o dACC, pensamos que deve haver evidências de mapeamentos de inferência reversa robustos generalizados do dACC para o conflito. Mas a evidência de tal reivindicação apenas não está lá. Seja lá o que você pensa sobre o resto de nossas estatísticas e reivindicações, isso deve fazer muita pausa pausar, porque isso não é o que quase todos esperariam ver nesses mapas de inferência reversa (incluindo nós) ".

TY escreveu em resposta: "Não há objeções aqui"

Houve alguns outros casos parafrasantes de acordo também. Por exemplo, TY escreveu:

E "Se L & E tivesse me perguntado", ei, você acha que o Neurosynth suporta dizer que a ativação do DACC é um bom marcador de "saliência"? ", Eu teria dito" não, claro que não ".

E em uma seção separada ele escreveu:

"Se o que eles significam é algo como" em média, tomando a média de todos os voxels no dACC, há mais evidências de uma associação estatística entre dor e dACC do que a dor e o monitoramento de conflitos ", então estou bem com isso". [Nota : assumimos que a última frase é escrita de forma errada e que TY significava "monitoramento de conflitos e dACC"]

Dado que todas essas reivindicações, onde existem áreas de acordo, dependem de interpretar os mapas de pontuação z fornecidos por Neurosynth como evidência (ou ausência de evidência) de que um termo é um alvo de inferência inversa razoável, nós levamos como áreas importantes de acordo:

  1. Os escores z de Neurosynth fornecem evidências sobre se determinados voxels podem ser plausivelmente atribuídos, por inferência reversa, a uma função particular. Pode haver vários termos que mostram pontuações z significativas para um voxel e todos esses termos são funções plausíveis para atribuir a esse voxel.
  2. Há pouca evidência dos escores z de inferência inversa de que os processos executivos, de conflito e de saliência são bons alvos de inferência reversa para a ativação de dACC. Note-se que dizemos "pouca", não evidência "não", tal como fizemos em nosso artigo, porque há algumas evidências inversas de conflito, mas é modesta.
  3. Há evidências de escores z que os processos de dor são bons alvos de inferência reversa para uma grande parcela de voxels de DACC.

Se pudermos concordar com esses pontos, penso que concordamos com a maioria do que nos preocupou em nosso artigo.

Novas análises Neurosynth

A última declaração do TY acima ("Se o que eles significam é algo como …") nos fez perceber que havia uma maneira diferente de abordar as conclusões que tínhamos alcançado no documento PNAS. Como dissemos, parte do que nos assustou quando olhamos os mapas de inferência reversa para a dor, o executivo, o conflito e a relevância há alguns anos atrás foi a amplitude da cobertura do DACC para a dor em relação aos outros termos. Tentamos capturar isso ao olhar para 8 voxels distribuídos no dACC. Talvez essa não fosse a melhor maneira de quantificar o que estávamos vendo e não era sensível a duas questões razoáveis ​​levantadas por TY e AS. Primeiro, nós só olhamos para a linha média, um problema mencionado por TY. Em segundo lugar, definimos os nossos limites dACC usando um atlas não probabilístico e, portanto, não podemos indicar a confiança de que os voxels em consideração eram realmente voxels dACC, uma questão levantada pelo AS.

O que fizemos em nossas novas análises é definida como uma máscara dACC usando o atlas probabilístico de Harvard-Oxford (a seguir HO) e depois examinou a porcentagem de voxels no dACC para o qual diferentes termos são um alvo de inferência inversa razoável com base na inferência inversa de Neurosynth mapas. Para criar o atlas HO, eles tomaram imagens pontuadas em T1 de dezenas de cérebros (bit.ly/1RMTAzp). Várias regiões de interesse (por exemplo, ACC) foram identificadas em cérebros individuais antes de quaisquer transformações. Então, cada varredura foi registrada no espaço MNI. Neste ponto, eles poderiam determinar para cada voxel no espaço MNI, quantos cérebros individuais tinham sido marcados com um rótulo particular no primeiro passo. Então, se 75% dos cérebros tivessem uma coordenada específica rotulada como ACC, então esse voxel seria classificado como tendo uma probabilidade de 75% de ser ACC em qualquer nova varredura registrada no espaço MNI.

Matthew Lieberman
Fonte: Matthew Lieberman

Usando este atlas conseguimos definir máscaras dACC (-8 ≤ x ≤ 8; 0 ≤ y ≤ 30) para as quais os voxels eram 25%, 35%, 50% ou 75% provavelmente no dACC (veja figura acima). Pode-se argumentar que apenas os voxels que são, no mínimo, 50% ou 75% de probabilidade de ser realmente os voxels do DACC devem entrar em nossos ROIs, mas a inspeção visual sugeriu que essas máscaras ROI se parecessem muito semelhantes ao que já usamos no papel PNAS que levou ao resposta da AS, então fomos com uma máscara liberal de 35% para as nossas análises apresentadas aqui.

Observe que os resultados são qualitativamente os mesmos em todas as máscaras diferentes. A única grande diferença que vimos é que, à medida que passamos de máscaras dACC de menor confiança (25%) para máscaras de dACC de maior confiança (75%), a porcentagem de voxels de DACC associados, via inferência reversa, com termos afetivos aumentados (por exemplo, dor +9 %; medo + 12%; afeto negativo + 6%) e a porcentagem de voxels de DACC associados a termos cognitivos diminuiu (por exemplo, conflito -12%; erro -6%). Assim, à medida que aumentamos a nossa confiança de que um voxel particular está realmente no dACC, é mais provável que seja associado a um processo afetivo e menos propensos a estar associado a um processo cognitivo. Para colocar isso de outra forma, aqueles voxels que estão associados com processos cognitivos no dACC tendem a ser os voxels que devemos ter a menor confiança estão realmente no dACC.

As análises apresentadas abaixo estão usando a máscara de 35%. Inicialmente, pensamos em olhar para as quatro principais categorias de interesse no papel do PNAS (dor, executivo, conflito, saliência), juntamente com aqueles criados por TY como alternativas que devemos ter considerado (medo, autonomia, recompensa). Em última análise, decidimos incluir mais termos em nossas análises para que possamos atender ao padrão de seletividade dado por TY em seu último blog:

"Uma região do cérebro pode ser dita como" seletiva "para uma função específica se (i) mostrar uma associação robusta com essa função, (ii) mostra uma associação insignificante com todas as outras alternativas prontamente disponíveis e (iii) os autores têm fez uma diligência adequada para garantir que as principais funções candidatas propostas na literatura estejam bem representadas em suas análises ".

Nós pensamos que esta definição vai além da maneira em que muitos pesquisadores usaram esse termo no passado (ou seja, em documentos MVPA), mas achamos que valeria a pena ver o que acontece quando aplicamos essa definição às nossas análises. Devemos notar que interpretamos a palavra "associação" nesta definição para se referir apenas a associações identificadas nos mapas de inferência reversa, e não o que é observado nos mapas de inferência direta. Como resultado, tentamos fazer nossa "diligência devida para assegurar que as principais funções candidatas propostas na literatura estejam bem representadas na análise". Assim, agora temos uma lista de 14 termos que cobre todas as contas do DACC de que nos conhecemos ao longo dos anos. Nossa lista de termos inclui:

dor, atenção, autonomia, evasão, conflito, emoção, erro, executivo, medo, afeto negativo, inibição de resposta, seleção de resposta, recompensa e saliência.

Acreditamos que esta seja uma lista bastante abrangente de termos e espero que, se perdimos alguma, eles têm um sinônimo razoável na lista que provavelmente produzirá efeitos semelhantes.

Sobre as análises. A primeira coisa que fizemos foi realizar uma contagem do número de voxels na máscara de 35%. Havia 1110 voxels que o atlas da HO tinha pelo menos 35% de confiança eram os voxels dACC. Destes, 947 voxels (ou 85,3%) aparecem no mapa de inferência reversa para dor (usando o nível de significância de Neurosynth padrão de p <0,01, corrigido de FDR). Dos 13 outros termos, nenhum cobriu até 20% dos voxels dACC (veja a figura abaixo). A comparação do qui-quadrado de dor versus qualquer outro termo foi altamente significativa. Todos os X 2 > 975.278, p <.00001, d 's> 5.38. Estes nos dizem que a dor é muito mais onipresente de uma explicação de inferência reversa em voxels dACC do que qualquer um dos outros 13 termos.

Matthew Lieberman
Mostra a percentagem de voxels de dACC que aparecem no mapa de inferência inversa de cada termo. O mesmo voxel pode aparecer no mapa por vários termos
Fonte: Matthew Lieberman

A análise acima não chega ao cerne da questão de seletividade como caracterizada na definição de TY porque o mesmo voxel pode aparecer aparece por múltiplos termos e, portanto, não indica seletividade de um termo em relação a outros. Assim, avaliamos quantos voxels no dACC pareceram seletivos para qualquer coisa tal que eles apareceram para o mapa de inferência reversa de qualquer um dos termos, mas não apareceram em nenhum dos outros 13 mapas de inferência reversa dos termos. Pode-se imaginar que com 14 termos, que quase nenhum voxels no dACC mostraria seletividade por esta definição – qualquer voxel significativo para apenas dois dos termos é eliminado dessa análise. Apesar do alto obstáculo para a seletividade, 477 voxels do 1110 (43%) no dACC apareceram em apenas um dos 14 mapas de inferência reversa. Esses 477 voxels pareceriam então encontrar a barra de seletividade definida pela definição de TY. Dos 477 voxels de DACC que são seletivos para um único termo (dos 14 termos considerados), 91,2% foram seletivos para o termo dor .

Matthew Lieberman
Dos voxels de DACC que são seletivos para 1 de 14 termos, mostra porcentagem para cada termo.
Fonte: Matthew Lieberman

No total, 435 dos 477 voxels seletivos estavam presentes apenas no mapa de inferência inversa da dor e não em nenhum dos mapas de inferência reversa para os outros 13 termos. O único outro termo que teve> 10 voxels seletivos associados a ele foi recompensa, em 30 voxels (aludimos a isso no documento original). O medo é o próximo em 8 voxels, com erro em 3 voxels e conflito em 1 voxel. Os voxels de dACC seletivos para a dor são mais do que uma ordem de grandeza mais comum do que qualquer outro tipo de voxel de dACC seletivo. A comparação do qui-quadrado de dor versus qualquer outro termo para o número de voxels seletivos no dACC foi altamente significativa. Todos os X 2 > 446.203, p <.00001, d 's> 1.64. Esses resultados nos dizem que entre os voxels de dACC que mostram evidência de seletividade, eles são muito mais prováveis ​​de estar relacionados à dor do que a qualquer um dos outros 13 termos.

Duas advertências muito importantes aqui:

1) Uma vez que 477 voxels foram seletivos por um termo, isso significa que 633 voleis de DACC não eram seletivos para nenhum termo. Embora pensemos que agora estamos usando uma barra muito alta para a seletividade aqui, mais alta do que qualquer outra que vimos na literatura, é claro que com esta barra alta, menos da metade dos voxels de dACC estão mostrando seletividade. Nesta perspectiva, é um excesso dizer que "o dACC" é uniformemente seletivo para a dor em relação a todas as outras 13 contas da função dACC que estamos considerando atualmente. Duas respostas a esta ressalva. Primeiro, usando apenas os quatro termos que inicialmente consideramos (dor, executivo, conflito e saliência), 823 voxels foram seletivos sob a definição atual (ou seja, 74,1% dos voxels de DACC) e destes, 811 eram seletivos para a dor (o que teria Foram 98,5% dos voxels seletivos). Assim, no contexto das categorias consideradas em nosso artigo do PNAS, nossa reivindicação de seletividade para a dor em relação aos processos executivos, de conflito e saliência foi razoável. Em segundo lugar, considerando todas as respostas que vimos sobre o dACC ser muito genérico ou multifacetado, pensamos que é bastante impressionante que quase metade dos voxels de DACC sejam seletivos e, quase todos eles são seletivos para a dor.

2) Pode-se olhar para essas análises e achar que não é justo comparar cada termo com os outros 13 porque algumas delas estão em categorias sobrepostas. Por exemplo, incluímos conflitos e erros, que são contas distintas, mas sobrepostas de dACC. Se eles apareciam nos mesmos voxels uns dos outros, eles derrubariam esses voxels da análise de seletividade acima. Para abordar isso, abaixo, temos uma figura que mostra a comparação dos mapas para a dor e cada outro termo sozinho – então cada termo pode demonstrar quantos voxels se apresentam para o mapa de inferência reversa, mas não para a dor. As barras de laranja em cada par de duas barras abaixo mostram a porcentagem de voxels de dACC associados a cada termo quando somente os voxels associados à dor são removidos. Assim, termos como erros e conflitos não estão competindo um contra o outro aqui. (As barras azuis mostram quantos voxels aparecem no mapa de inferência reversa da dor, mas não para o outro termo na comparação)

Matthew Lieberman
Fonte: Matthew Lieberman

Como é evidente, esta análise não mostra que qualquer outro termo seja particularmente bom quando pitted 1-on-1 contra a dor. Além da recompensa, para o qual 2,7% dos voxels de DACC aparecem em seu mapa, mas não no mapa da dor, nenhum outro termo é superior a 1,1%. Em contraste, nessas análises, a dor permanece consistentemente acima de 65% de todos os voxels de dACC depois de remover aqueles para qualquer outro termo. Enquanto indicamos no papel do PNAS que a recompensa realmente mostra efeitos mais fortes do que a dor na porção anteroventral do dACC, achamos que valeria a pena mostrar isso um pouco mais claramente. Se usássemos um limite angulado (linha verde tracejada), como alguns outros, para distinguir dACC do rACC, o mapa de inferência reversa da recompensa pode estar em grande parte ausente do dACC. É bastante claro nesta figura que o efeito de inferência inversa para a recompensa é em grande parte parte de um cluster rostral mais ACC.

Matthew Lieberman
Fonte: Matthew Lieberman

As conclusões de nossas análises atuais reafirmam o ponto geral feito no documento PNAS. Se vamos falar sobre a função do DACC, como inúmeros trabalhos ocorreram nos últimos 20 anos, a dor é a única função que o dACC parece seletivo por mais de um punhado de voxels. Utilizamos a definição de seletividade de TY (com o pressuposto de que a associação se refere à associação de inferência reversa). Assim, tentamos criar uma lista mais exaustiva de termos que são contas razoáveis ​​do dACC. Determinamos qual porcentagem de voxels de dACC mostrou associação de inferência reversa com cada um dos 14 termos. Determinamos, a partir desses voxels, quantos apenas mostraram uma associação de inferência reversa com 1 termo e nenhum dos outros 13 termos. Para resumir nossas descobertas:

  1. Dos 11×10 voxels dACC, 43% (ou seja, 477 voxels) preencheram os critérios acima para seletividade (aparecendo em apenas 1 dos 14 mapas de inferência reversa).
  2. Dos 477 voxels que eram seletivos, 91,2% (ou seja, 435 voxels) eram seletivos para a dor.
  3. Assim, uma parte considerável do dACC pode ser descrita por um único termo entre essa grande lista de termos historicamente plausíveis.
  4. Da grande parte dos voxels de DACC que podem ser descritos por um único termo a partir desta longa lista de contas razoáveis, quase todos estes aparecem no mapa de inferência reversa para dor e para nenhum dos outros 13 termos.

Dor e medo

Argumentamos que afecções relacionadas ao aflição podem ser a conta guarda-chuva dos processos de DACC, com o dACC tratando os aspectos da dor relacionados à dor (Rainville et al., 1997). O trabalho antigo de lesões de décadas sugere que o DACC desempenha um papel fundamental na angústia da dor física, bem como na ansiedade (Foltz & White, 1962; Tow & Whitty, 1953). Como foi apontado, há um número não trivial de voxels de DACC que aparecem no mapa de inferência reversa por medo (12,2% em nossa máscara de dACC). Acreditamos que a dor eo medo estão conceitualmente relacionados porque a maioria do que tememos são coisas que podem nos causar dor (fisicamente, socialmente ou emocionalmente). Mas no contexto da Neurosynth, a relação é muito mais direta. Muitos estudos de neuroimagem do medo são estudos de condicionamento do medo que usam dor (por exemplo, choque) como o estímulo incondicionado. Esses estudos quase nunca usam a palavra "dor" em qualquer lugar e, portanto, não são marcados para dor em Neurosynth, mas podem estar introduzindo efeitos específicos da dor nos mapas de inferência reversa por medo.

Para examinar esta possibilidade, inspeccionámos manualmente os primeiros 50 estudos de fMRI que aparecem em Neurosynth para o termo medo. Descobrimos que 50% desses estudos usaram manipulações de dor. Para ver se essas manipulações de dor podem estar conduzindo o sinal dACC no mapa de inferência reversa por medo, contamos quantos estudos com ativações de DACC tiveram manipulações de dor e quantos estudos sem ativações de DACC tiveram manipulações de dor. Como pode ser visto na figura abaixo, uma grande maioria de estudos de medo (71%) que produzem uma resposta de DACC usam manipulações de dor, enquanto que uma maioria considerável de estudos de medo (69%) que não produzem resposta de DACC não usam dor manipulações. A comparação do qui-quadrado deste 2 × 2 foi altamente significativa; X 2 > 8,013, p <0,006, d = 0,87. Este resultado sugere que estudos de medo que incluem uma manipulação de dor são mais propensos a produzir uma resposta dACC.

Matthew Lieberman
Fonte: Matthew Lieberman

Se considerarmos a possibilidade de que a resposta do DACC ao medo no mapa de inferência inversa de Neurosynth seja (a) associada conceitualmente às respostas de DACC à dor ou seja (b) literalmente devido a manipulações de dor ativando o dACC em estudos de medo, então é razoável combinar As respostas do DACC à dor e ao medo. Embora não desejemos fazer muitas dessas análises, quando a dor e o medo são combinados em um único ROI combinado (doravante, dor + medo), descobrimos que 566 dos 11×10 voxels dACC mostram seletividade para um dos 13 termos . Assim, 51% dos voxels de DACC são seletivos nestas condições. Além disso, 532 dos 566 voxels seletivos são seletivos para dor + medo. Em outras palavras, 94% dos voxels seletivos de dACC nesta análise são seletivos para dor + medo. Além disso, 48% de todos os voxels de DACC são seletivos para dor + medo.

Em resumo, se tratarmos a dor e o medo como sendo parte de uma construção única no que diz respeito ao dACC, vemos que quase metade de todos os voxels de DACC são seletivos para esta construção e quase todos os voxels de dACC que são seletivos para qualquer coisa são seletivos para esta construção. Como em nossas principais análises na seção anterior, nenhum outro termo além da recompensa (5% dos voxels seletivos aqui) garante até 1% dos voxels seletivos no dACC.

Os escores z em Neurosynth nos informam sobre inferência reversa?

Nós pensamos que é inequivocamente o caso de os escores z em Neurosynth dizer algo importante sobre inferência reversa. Assim, um dos aspectos mais inesperados do intercâmbio em relação ao nosso documento PNAS é que TY e TW, criadores de Neurosynth, parecem sugerir que quase nada pode ser aprendido sobre a inferência reversa dos escores z e que devemos focar principalmente em as probabilidades posteriores. Por exemplo, TY escreveu:

"Eu expliquei por que não se pode obter apoio para uma inferência reversa usando z-scores ou p-values. A inferência inversa é inerentemente uma noção bayesiana, e só faz sentido se você estiver disposto a falar sobre probabilidades anteriores e posteriores ".

Achamos isso estranho porque quando se usa a interface da web Neurosynth e olha para qualquer termo, há um único botão na tela com a etiqueta "inferência reversa". Quando você clica neste botão, ele traz um mapa de calor que, dado o esquema de rotulagem, nós podemos assumir apenas que nos diga algo sobre inferência reversa. Este mapa de calor é um mapa de calor da inferência inversa, escores z, e não probabilidades posteriores. Da mesma forma, se você baixar o mapa de inferência reversa para qualquer termo, é um mapa de pontuação z, e não probabilidades posteriores. Apesar de serem não-bayesianos, esses escores z são o que TY e TW usaram para preencher seus mapas de "inferência reversa". Se estes não nos dizem sobre a inferência reversa, então é muito estranho que o único botão de inferência inversa na interface leve a esses escores z.

TY também escreveu sobre o valor dos escores z de Neurosynth em vários lugares que parecem contrariar a reivindicação acima ("não se pode obter suporte …"). Primeiro, temos o texto do Neurosynth FAQ:

"Mapa de inferência reversa: escores z correspondentes à probabilidade de que um termo seja usado em um estudo, dada a presença de ativação relatada (ou seja, P (termo | ativação))"

Isso nos parece que o z-score está nos dizendo algo sobre inferência reversa. Aqui estão os trechos do que TY escreveu no Google+ onde ele graciosamente responde muitas perguntas dos usuários sobre Neurosynth:

"O escore z é uma medida de confiança na associação estatística; a probabilidade posterior é uma medida do tamanho do efeito. Em geral, recomendo prestar mais atenção ao primeiro , porque este último está sujeito ao ruído relacionado ao tamanho da amostra. Um termo com menos estudos incluídos na meta-análise terá maior variabilidade, o que se traduzirá em probabilidades posteriores mais extremas. No entanto, um termo com menos estudos também produzirá * menos * valores extremos de p / z, sendo outras coisas iguais. Então, se você está tentando fazer uma reivindicação do formulário "é provável que a função F esteja associada à atividade na região R", você provavelmente será melhor baseando-se na pontuação Z. [enfase adicionada]"

Esta declaração é inconsistente com sua reivindicação acima de que "um canhão obtém suporte para uma inferência reversa usando z-scores". Em seu blog, ele também escreveu isso de z-scores:

"Tudo o que nos diz é que, dado todos os dados que temos, é muito improvável que haja exatamente associação zero entre um termo e uma região".

Apesar do fraseio pejorativo, pensamos que "tudo isso nos diz" é bastante surpreendente, já que não tínhamos como fazer isso antes de bancos de dados como Neurosynth. Esta é uma coisa muito importante para saber, especialmente quando é combinada com outras análises, sugerindo que, para outros termos, não há evidências de associação entre o termo e a região. Finalmente, TY escreve:

"Se o objetivo de alguém é simplesmente dizer algo como" nós pensamos que a junção temporoparietal está associada ao movimento biológico e à teoria da mente ", ou" a evidência sugere que o córtex para-hipocampo está associado à navegação espacial "Não vejo nada errado com base nessa reivindicação nos mapas Neurosynth z-score. "

Nós pensamos que esta é exatamente a reivindicação que estamos fazendo junto com mostrar que estamos mais justificados em fazer reivindicações relacionadas à dor sobre a função dACC do que reivindicações para outros termos. No papel do PNAS, fizemos isso comparando termos que tinham pontuações z não significativas (executivo, conflito, saliência) a um termo que fez (dor). Embora estes não mostrem que os tamanhos de efeito são maiores para dor do que os outros termos (o que nunca foi nosso objetivo), eles mostram que podemos ter mais confiança de que existe alguma associação real entre dor e dACC do que entre os outros três termos e dACC. Nós pensamos que esta é uma contribuição valiosa. Nas análises atuais, tomamos uma abordagem diferente, contando o número de voxels que mostram alguma associação de inferência reversa para um e apenas um de 14 termos. Novamente, a maioria dos voxels no dACC que atendem a esses critérios eram seletivos para a dor.

TW dá alguns detalhes agradáveis ​​na resposta do seu blog sobre como o escore z é calculado, realmente começando como um qui-quadrado:

"Compara a freqüência de ativação para um termo alvo (" dor ") contra a taxa básica de ativação para os outros estudos (" não dor "). Formalmente, ele compara P (A | dor) a P (A | não dor) usando um teste de qui-quadrado. Assim, nos diz sobre preferência, mas não especificidade em relação a outros estados potenciais ".

Nós concordamos que o z-score para dor não faz o trabalho sozinho. Mas se também conhecemos P (A | motor) e P (A | não motor) para as mesmas coordenadas, isso nos permite avaliar se essa ativação é mais seletiva para a dor do que o motor. Quanto maior a pontuação z, mais confiança nós temos que P (A | termo) é maior do que P (A | não termo). A comparação desses escores z em termos (z pain versus z motor ) nos diz algo sobre se devemos ter maior confiança de que um desses termos está associado à atividade na região de interesse do que o outro termo.

Finalmente, agora comparamos as probabilidades posteriores dos termos dor, executivo, conflito e saliência usando os 8 voxels em que nos concentramos em nosso papel PNAS. Por exemplo, comparamos as probabilidades posteriores de dor (usando as 8 probabilidades posteriores de dor que vieram de 8 pontos de ativação diferentes) com as probabilidades posteriores para o executivo (usando as 8 probabilidades posteriores para o executivo) utilizando um teste t de medidas repetidas. Para a dor versus cada um dos outros três termos, as probabilidades de dor posterior foram significativamente maiores, t> 5,92, p <.0003, d 's> 4,47. Além disso, mesmo quando se compara a dor ao medo e a autonomia, as probabilidades posteriores de dor são significativamente maiores, t> 2,92, p = 0,03, ds> 2,21. Nunca pensamos que a comparação de probabilidades posteriores fosse essencial para fazer o nosso ponto de vista, mas isso é pelo menos alguma evidência de que o efeito está lá.

Talvez não seja surpreendente que vejamos a mesma coisa com probabilidades posteriores que vimos com escores z, dado que, pelo menos com os dados que estávamos observando, os dois conjuntos de estatísticas estavam altamente relacionados. Especificamente, a correlação de todas as probabilidades posteriores e pontuações z para os termos de interesse nos 8 locais examinados em nosso artigo PNAS foi r = 0,86 . Assim, embora possa haver alguma luz natural conceitual entre essas medidas, funcionalmente eles estavam fornecendo aproximadamente a mesma informação em nossas análises. Esta semelhança pode ser observada na figura abaixo que traça z-pontuação contra probabilidades posteriores de dor, executivo, conflito e saliência das 8 localidades em nosso papel PNAS. Pode-se também ver que as 7 probabilidades posteriores mais altas e as 7 maiores pontuações z resultam de dor. Note-se que a relação curvilínea é provável devido a probabilidades posteriores serem limitadas a um limite superior de 1,0.

Matthew Lieberman
Fonte: Matthew Lieberman

Seletividade

Já dissemos um pouco sobre a seletividade em nosso blog anterior. Nós só queremos dizer mais algumas coisas. Um deles não existe uma definição universalmente acordada de seletividade (TW descreve-o como "vagamente definido"). As pessoas têm definições, mas nem todos têm o mesmo. A implicação é que cada um precisa dizer o que queremos dizer por seletividade quando usamos o termo (algo que quase não há documentos que usam este termo, incluindo o nosso documento PNAS). Certamente, teremos mais cuidado com isso no futuro, mas devemos respeitar as definições dos diferentes pesquisadores quando lhes damos e não tratá-los como tendo uma definição ruim ou incoerente, simplesmente porque é diferente do nosso. Já vimos pelo menos três definições de seletividade em voxels dACC, tudo isso é razoável:

Seletividade L & E : os voxels de dACC são seletivos para a dor, se a dor é uma fonte de ativação dACC mais confiável do que os outros termos de interesse (executivo, conflito, saliência).

Seletividade TY : os voxels do dACC podem ser considerados "seletivos" para uma função particular, se ele (i) mostrar uma associação robusta com essa função, (ii) mostra uma associação insignificante com todas as outras alternativas prontamente disponíveis e (iii) os autores fizeram a devida diligência para garantir que as principais funções candidatas propostas na literatura estejam bem representadas em suas análises.

Seletividade TW : os voxels dACC são seletivos para uma função específica se o voxel for ativado por essa função e "não ativado por outras coisas"

Nós pensamos que a definição de TW é defensável, mas provavelmente exclui chamar qualquer coisa seletiva das análises de fMRI, pois provavelmente há poucos ou nenhum voxels no cérebro que mostram a ativação para um e apenas um processo (ou seja, apenas aparecendo em um único mapa de inferência direta ). Nós pensamos que nossa definição e a definição de TY são ambas mais práticas. Nós pensamos que o nosso é implícito na maioria dos estudos MVPA que discutem a seletividade até à data e achamos que o TY representa uma barra mais alta, mas uma barra interessante, e que realmente requer ferramentas como a Neurosynth, e não o MVPA, para considerar.

Priores empíricos

No último blog de TY, ele sugere que um dos problemas com nossas conclusões é que nosso uso de probabilidades posteriores é enganador. As probabilidades posteriores de dor são em torno de .80 enquanto as probabilidades posteriores para outros termos examinados no papel tendem a estar entre 0,50 e 0,60 (onde 0,5 é essencialmente um efeito nulo). Nós pensamos que essas diferenças (e especialmente as diferenças de z-score associadas) nos dizem algo sobre as funções prováveis ​​do dACC. No entanto, TY implica que pensamos que com base nesses efeitos, se um novo estudo de Neurosynth com atividade de DACC foi selecionado aleatoriamente, poderíamos prever que seria um estudo de dor. Enquanto podemos ver por que TY poderia pensar que acreditamos nisso, nunca fizemos essa afirmação e de fato não acreditamos nisso.

TY aponta que a probabilidade posterior de .80 para dor depende de começar com o .50 anterior que Neurosynth assume para cada termo. De nenhuma maneira, uma probabilidade posterior de .80 em Neurosynth implica que 80% dos estudos com ativações de DACC foram estudos de dor. Na verdade, já apontou isso em nosso artigo PNAS:

"Uma probabilidade posterior é semelhante a um tamanho de efeito, embora não diretamente interpretável, porque o prioritário bayesiano para cada termo foi normalizado para 0,50. Assim, uma probabilidade posterior de 0,82 é provavelmente um tamanho de efeito significativamente maior do que outro de 0,56; no entanto, devido à normalização, não se pode dizer que o 0.82 implica que há 82% de chance de que uma ativação veio de um estudo com um termo psicológico particular ".

Então, vamos discutir os priores empíricos para a dor e outros termos. Como a dor aparece no resumo de 3,5% de todos os estudos na base de dados Neurosynth e o motor aparece no resumo de 18% de todos os estudos na base de dados Neurosynth, se estes (.03 e .18) forem utilizados como priores empíricos para cada termo (em vez de .50), o motor acaba com probabilidades posteriores mais altas do que a dor.

Concordamos que, se você ver um estudo na base de dados Neurosynth com uma ativação dACC, é mais provável que venha de um estudo motorizado do que um estudo de dor. No entanto, pensamos que isso é quase inteiramente além disso. Não estamos interessados ​​na distribuição de estudos no banco de dados Neurosynth per se. Estamos interessados ​​em tentar tirar conclusões sobre a (s) função (s) provável (s) do dACC no mundo real. Que há mais estudos motores do que estudos de dor na base de dados Neurosynth falam apenas para as prioridades de pesquisa anteriores dos cientistas e talvez a maior facilidade com que um estudo motorizado pode ser executado em comparação com a dificuldade de realizar um estudo de dor.

Para deixar claro o quão irrelevante é essa diferença no pré-baseado em Neurosynth, considere o seguinte exemplo. Imagine um banco de dados com apenas estudos sobre dor e motor. Suponha que existam 100 estudos de dor e 1.000.000 de estudos motores no banco de dados. Imagine ainda que 100% dos estudos de dor produzem atividade de dACC em um voxel particular e que apenas 1% dos estudos motores produzem atividade de dACC no mesmo voxel. Se formássemos aleatoriamente um estudo deste banco de dados que mostrava atividade nesse voxel dACC, seria 100 vezes mais propensos a ser um estudo motor que um estudo de dor. No entanto, qualquer pessoa razoável analisaria esses resultados e conclui que este ponto no dACC provavelmente está envolvido na dor, mas não envolvido com os processos motores. O qui-quadrado apoiaria esta conclusão.

Nós entendemos que 3,5% e 18% são, em certo sentido, priores empíricos para a dor e o motor, respectivamente, no contexto de Neurosynth, mas não são primários empíricos do mundo real (e TY mostra isso mais tarde em seu blog). Nós pensamos que a decisão da TY de definir todos os priores para .50 quando ele criou a Neurosynth foi uma boa idéia porque evita que os efeitos sejam conduzidos pelos tipos de estudos que estão mais representados no banco de dados.

No primeiro blog de TY, ele deu uma ótima explicação de como realmente pensar sobre probabilidades posteriores. Ele escreveu:

"A interpretação estrita de uma probabilidade posterior de 80% para a dor em um voxel de dACC é que, se tomássemos 11.000 estudos publicados de fMRI e pretendemos que exatamente 50% deles incluíam o termo" dor "em seus resumos, a presença de a ativação no voxel em questão deve aumentar nossa estimativa da probabilidade de o termo "dor" ocorrer de 50% a 80% ".

Então, vamos jogar um pouco esse exemplo. Suponhamos que temos 2.000 estudos em uma hipotética base de dados Neurosynth, em vez de 11.000. Ao definir o anterior para a dor para .50, estamos dizendo "imaginar que 1.000 dos 2.000 estudos tenham o termo dor no resumo e os outros 1.000 não". Imagine ainda que, através desses 2.000 estudos, 1.000 deles têm atividade DACC em um voxel de interesse (por exemplo, coordenadas 0, 18, 30). Uma probabilidade posterior de dor de 0,81 neste voxel implicaria que deveríamos esperar cerca de 810 dos 1000 estudos com dACC nesta amostra (ou um novo conjunto de estudos com a mesma distribuição de dor / não-dor) para ter dor como um termo e cerca de 190 dos 1000 estudos com dACC nesta amostra para não ter dor como termo. Em contraste, se o motor tiver uma probabilidade posterior de .51 para este voxel, então devemos esperar cerca de 510 dos 1000 estudos com dACC nesta amostra para ter o motor como termo e cerca de 490 dos 1000 estudos com dACC neste amostra para não ter motor como um termo. Embora a dor e o motor não tenham sido comparados diretamente nessas análises, pensamos que essas duas análises sugerem que a dor é uma melhor conta da atividade neste voxel do que os processos motores. Isso também se reflete nos escores z em 0, 18, 30 para dor (Z = 9,90) e motor (Z = 0,21).

TY também escreve o seguinte:

"O interessante sobre tudo isso é que, independentemente do que você escolher antes de qualquer termo, o resultado da Neurosynth z nunca irá mudar. Isso ocorre porque o escore z é uma medida freqüente de associação estatística entre ocorrência de termo e ativação de voxel. Tudo o que nos diz é que, com todos os dados que temos, é muito improvável que haja exatamente uma associação zero entre um termo e uma região. Isso pode ou não ser interessante (eu diria que não é, mas é para uma postagem diferente), mas certamente não autoriza uma inferência reversa como "ativação de DACC sugere que a dor está presente". Para traçar a última reivindicação, você deve usar uma estrutura bayesiana e escolher alguns priores sensíveis. Sem priores, sem inferência reversa ".

Isso ainda faz pouco sentido para nós. Primeiro, na medida em que podemos dizer, nunca escrevemos as palavras TY parece atribuir-nos aqui ("a ativação de DACC sugere que a dor está presente") e isso é porque não temos e não endossamos essa visão. Além disso, entendemos que, sem uma estrutura bayesiana, você não obtém probabilidades posteriores, o que fornece uma estimativa da força do efeito de inferência reversa. No entanto, o score z parece certamente nos dizer se existe um efeito de inferência reversa não-zero. Assim, o z-score está realmente nos dizendo algo de interesse sobre inferência reversa. Se houver 14 contas do dACC e apenas 1 das 14 contas tiver um escore z significativo em seus mapas de inferência reversa para um voxel particular, então definitivamente aprendemos algo sobre a função desse voxel sem se referir a probabilidades posteriores.

Podemos dizer que uma região do cérebro tem uma função?

TW questionou a premissa do nosso documento, sugerindo:

"Não devemos procurar uma explicação unificada para a atividade do DACC, a menos que seja para descrever uma coleção de processos diversos. Tentando encontrar a "melhor interpretação" para uma coleção de 550 milhões de neurônios é enganosa, porque nos convida a fazer inferências psicológicas baseadas na atividade cerebral que não são garantidas. Por analogia, é como tentar adivinhar se uma pessoa é republicana ou democrata com base em seu estado natal. A "melhor interpretação" dos eleitores que vivem no Texas é que eles são republicanos. Você teria razão ao adivinhar o republicano, mas você seria apenas 57 por cento do tempo ".

Esta é realmente uma questão de filosofia da ciência em relação às unidades / níveis de análise. O mesmo problema surge na psicologia social quando dizemos "sob condições particulares, as pessoas tendem a mostrar efeitos de conformidade". Isso não implica que cada pessoa colocada nessa situação mostre esses efeitos, mas sim que existe uma tendência central que pode ser estatisticamente distinto do ruído. Só porque há pessoas que não se conformam, isso não significa que não podemos falar sobre o que as pessoas em geral fazem, de uma maneira útil.

A posição de TW é filosóficamente defensável, no entanto, leva em grande parte à conclusão de que a IRMF pode praticamente nunca identificar qualquer função psicológica em qualquer região do cérebro, porque cada voxel contém cerca de 5,5 milhões de neurônios (Logotetis, 2008) e provavelmente não há região onde 100% destes neurônios são invocados por uma única função / processo e por nenhuma outra função / processo. Mas os cientistas descobriram claramente utilidade na tentativa de descrever, digamos, o hipocampo em termos de uma função particular apesar de ter milhões de neurônios que nem todos fazem o mesmo. Não estamos sugerindo que nenhuma função específica seja a descrição final da função do hipocampo, mas estamos sugerindo que não é um esforço inútil postular uma função geral para o hipocampo que será debatido, refinado e atualizado ao longo do tempo.

Vamos voltar para o exemplo de TW de adivinhar se um texano selecionado aleatoriamente é um republicano com base no fato de que 57% dos texanos votaram em Romney em 2012 (contra 41% para Obama). Nós pensamos que este é um ótimo exemplo, mas não capta a questão em que realmente nos interessamos. Se estamos equiparando texanos individuais com neurônios DACC e o estado do Texas com o dACC como um todo, então nossa questão real não é se podemos adivinhar se uma pessoa em particular é republicana (embora ficasse louco por não adivinhar republicano se for forçado a apostar). Em vez disso, nossa questão é mais parecida com "O Texas funciona como um estado republicano, apesar do fato de que muitos indivíduos nesse estado não são republicanos?" A resposta a esta pergunta é um sim embevente. Aqueles 57% que votaram republicanos asseguraram o domínio dos republicanos em todos os braços do governo: no Senado dos Estados Unidos (100%); Câmara dos Deputados dos EUA (69%); Senadores estaduais do Texas (68%); Representantes do Texas (65%); e Tribunal Supremo do Texas (100%). Esses números são facilmente altos o suficiente para garantir que o Texas funcione como um estado republicano. Com 65% ou mais em ambas as casas da legislatura estadual, os republicanos podem votar em 100% de legislação favorita republicana e a Suprema Corte do Estado pode tomar decisões amistosas republicanas, uma e outra vez. Talvez o maior significado seja que aqueles 57% dos texanos que votaram republicanos enviaram 100% dos votos eleitorais do Texas para o candidato republicano ao presidente nas últimas 9 eleições seguidas. Portanto, por enquanto, achamos que é sensato descrever o Texas como um estado republicano, pois isso possui um ótimo valor prático. Cada cidadão não precisa ser um republicano para que este seja o caso, nem o fato de que existem enclaves urbanos que se inclinem demoníacos prejudicam essa descrição do estado. (Para aqueles que são mais experientes em computação, basta considerar uma rede conectora. Se uma representação tiver uma pequena vantagem nos pesos que conectam alguns nós, os processos de satisfação de restrições iterativas transformarão essa pequena vantagem em uma grande vantagem funcional nos resultados.)

Conclusão

Os escores z dos mapas de inferência reversa nos dizem a força dos efeitos de inferência reversa? Não, mas estão correlacionados .86 em nossas análises com as probabilidades posteriores que o fazem. Os escores z dos mapas de inferência reversa nos dizem onde no cérebro existem evidências confiáveis ​​de uma associação de inferência reversa não-zero? Absolutamente. Os escores z podem, portanto, ser usados ​​como uma ferramenta para inferência reversa se identificarmos voxels que mostrem pontuações z significativas por um termo, mas não para outros de interesse? Absolutamente.

Pensamos que cada neurônio ou voxel no dACC é seletivo ou mesmo ativado pela dor? Não. Pensamos que isso significa que não pode haver discussão sobre a função do dACC? Não. A maioria dos voxels no dACC é seletivo usando a definição de TY? Não, mas cerca de 43% dos voxels de DACC mostram seletividade usando os 14 termos que consideramos (o que significa que esses voxels apareceram em um e somente um dos 14 mapas de inferência reversa em consideração).

Desses voxels de DACC que são seletivos, 91% são seletivos para a dor . O dACC é seletivo para a dor em relação aos processos executivos, de conflito e de saudade como discutimos no documento PNAS? Absolutamente – apenas 1 voxel dos 477 voxels que mostram seletividade é seletivo para qualquer um desses três processos. Com base na evidência de Neurosynth, é mais o dACC seletivo para dor do que para atenção, autonomia, evasão, conflito, emoção, erro, executivo, medo, afeto negativo, inibição de resposta, seleção de resposta, recompensa e saliência? Absolutamente. Dado que poucos, incluindo nós, teriam adivinado que muito mais do dACC é seletivo para a dor do que todas essas outras contas, achamos que nossas descobertas são um contributo significativo para a neurociência afetiva e cognitiva.