Más evidencia para una descripción relacionada con el dolor de dACC

[Nota: asegúrese de leer el tercer párrafo que aclara lo que parece ser una gran fuente de confusión sobre nuestro artículo]

Desde nuestra última respuesta en el blog a Tal Yarkoni (TY), ha habido tres respuestas nuevas de TY, Tor Wager (TW) y Alex Shackman (AS). Estas respuestas nos han dado mucho en qué pensar y nos han llevado a realizar análisis adicionales que nosotros (Lieberman y Eisenberger, en adelante L & E) creemos que aclaran, amplían y, en última instancia, fortalecen nuestras afirmaciones originales. Si bien respaldamos todos los análisis en el documento PNAS, deseamos haber pensado hacer estos análisis previamente e incluirlos en el documento.

Hay muchos puntos en los que no estamos de acuerdo en algunos de los últimos blogs, pero como estamos interesados ​​en avanzar, queremos comenzar, nuevamente, con áreas donde parece haber algún acuerdo, luego pasar a nuestros nuevos análisis, y luego a una discusión de cuatro cuestiones: (a) La relación de dolor y miedo en la base de datos de Neurosynth (b) ¿Los puntajes z en Neurosynth nos informan sobre la inferencia inversa? (c) Prioces empíricos y (d) ¿Podemos decir alguna vez que una región del cerebro tiene una función? Queremos dejar claro que este blog será nuestro último comentario sobre todo esto. Entre la publicación anterior y esta, creemos que hemos aclarado todo lo que necesitamos para demostrar que nuestras conclusiones son sólidas. Anticipamos que quienes ya han escrito publicaciones seguirán en desacuerdo con nosotros, pero esperamos que a otros les resulte útil.

Pero antes de saltar al texto principal de este blog, queríamos aclarar un punto importante que se desarrollará más adelante en este blog. De los análisis en nuestro documento PNAS, no creemos que cuando vemos la actividad de DACC, eso necesariamente implica que la persona está experimentando dolor . Para hacer esa afirmación, uno necesitaría generar probabilidades posteriores basadas en precedentes empíricos del mundo real que no existen (ni el Neurosynth previo de .50 ni el 3.5% de prevalencia de dolor en los resúmenes de Neurosynth proporcionan esta información ya que este último refleja lo que es estudiado con frecuencia, no lo que ocurre con frecuencia en general). Pero este no era el tipo de reclamo que estábamos haciendo. Nuestro reclamo fue mucho más simple: existe evidencia confiable basada en los puntajes z de los mapas de inferencia inversa de que el dolor está asociado con gran parte del CADC . Por el contrario, en la mayor parte del CADC hay mucha menos evidencia, basada en los puntajes z de los mapas de inferencia inversa, de que los procesos ejecutivo, de conflicto y de relevancia están asociados de manera confiable con el CADAC . Estos resultados sugieren que una descripción de la función de DACC debería centrarse más en los procesos de dolor que los procesos cognitivos generalmente enfocados. Nuestro reclamo es acerca de construir la mejor explicación de la función de DACC, no predecir el proceso presente en un estudio en particular o suponer que cada neurona de DACC hace lo mismo. A continuación, consideramos varias cuentas adicionales de la función de DACC para hacer que este reclamo sea más completo.

Áreas de acuerdo

Aunque TY señala que no está de acuerdo con casi todo lo que dijimos en nuestro primer blog, también muestra su última publicación en el blog con citas nuestras o reiteraciones de nuestras afirmaciones con las que acepta explícitamente (o no tiene ningún problema). Creemos que vale la pena destacarlos porque creemos que estas son algunas de las afirmaciones más importantes de nuestro documento.

Escribimos: "La conclusión de los mapas de inferencia inversa de Neurosynth es inequívoca: el dACC está involucrado en el procesamiento del dolor. Cuando solo se disponía de datos de inferencia directa, era razonable afirmar que quizás el DACC no estaba involucrado en el dolor per se, pero que el procesamiento del dolor podía reducirse a la función "real" del dACC, como procesos ejecutivos, detección de conflictos o respuestas de excelencia a estímulos dolorosos. Los mapas de inferencia inversa no admiten ninguna de estas cuentas que intentan reducir el dolor a procesos cognitivos más genéricos ".

TY escribió en respuesta: "Esta afirmación me parece en gran medida inobjetable".

Escribimos: "Para los términos ejecutivo y de conflicto, nuestra Figura 3 en el documento PNAS muestra un poquito de DACC. Creemos que las cifras más completas que hemos incluido aquí continúan contando la misma historia. Si alguien quiere contar la historia de conflicto de por qué el dolor activa el DACC, creemos que debería haber evidencia de grandes correspondencias de inferencia inversa robustas desde el CADAC al conflicto. Pero la evidencia de tal afirmación simplemente no está allí. Independientemente de lo que piense sobre el resto de nuestras estadísticas y afirmaciones, esto debería dejar a mucha gente en pausa, porque esto no es lo que casi ninguno de nosotros hubiera esperado ver en estos mapas de inferencia inversa (incluidos nosotros) ".

TY escribió en respuesta: "No hay objeciones aquí"

Hubo algunas otras instancias parafraseantes de acuerdo también. Por ejemplo TY escribió:

Y "Si L & E me hubiera preguntado," oye, ¿crees que Neurosynth admite que la activación de DACC es un buen marcador de 'relevancia'? ", Hubiera dicho" no, por supuesto que no ".

Y en una sección separada, escribió:

"Si lo que quieren decir es algo así como" en promedio, tomando el promedio de todos los vóxeles en DACC, hay más evidencia de una asociación estadística entre dolor y DACC que el dolor y el control del conflicto ", entonces estoy de acuerdo con eso". [Nota : suponemos que la última frase está mal escrita y que TY significa "control de conflictos y dACC"]

Dado que todas estas afirmaciones donde hay áreas de acuerdo dependen de la interpretación de los mapas z-score proporcionados por Neurosynth como evidencia (o ausencia de evidencia) de que un término es un objetivo de inferencia reversa razonable, tomamos como áreas importantes de acuerdo:

  1. Los puntajes z de Neurosynth sí proporcionan evidencia acerca de si determinados vóxeles se pueden atribuir de manera plausible, por inferencia inversa, a una función particular. Puede haber varios términos que muestren puntuaciones z significativas para un vóxel y todos esos términos son funciones plausibles para atribuir a ese vóxel.
  2. Hay muy poca evidencia de los puntajes z de inferencia inversa de que los procesos ejecutivo, de conflicto y de relevancia sean buenos objetivos de inferencia inversa para la activación de CADC. Tenga en cuenta que decimos 'poco', no 'no' evidencia, tal como lo hicimos en nuestro documento, porque hay alguna evidencia inversa de DACC para el conflicto, pero es modesto.
  3. Existe evidencia de los puntajes z de que los procesos de dolor son buenos objetivos de inferencia inversa para una gran porción de voxels dACC.

Si podemos ponernos de acuerdo sobre estos puntos, creo que estamos de acuerdo con la mayoría de lo que nos importa en nuestro documento.

Nuevos análisis de Neurosynth

La última declaración de TY anterior ("Si lo que quieren decir es algo así como …") nos hizo darnos cuenta de que había una forma diferente de abordar las conclusiones a las que habíamos llegado en el documento PNAS. Como dijimos, parte de lo que nos sobresaltó cuando analizamos los mapas de inferencia inversa para el dolor, el ejecutivo, el conflicto y la relevancia hace algunos años, fue cuán extendida estaba la cobertura de DACC para el dolor en relación con los otros términos. Tratamos de capturar esto mirando 8 vóxeles distribuidos a través del dACC. Quizás esta no era la mejor manera de cuantificar lo que estábamos viendo y no era sensible a dos cuestiones razonables planteadas por TY y AS. Primero, solo miramos la línea media, un problema mencionado por TY. En segundo lugar, definimos nuestros límites de dACC utilizando un atlas no probabilístico y, por lo tanto, no pudimos indicar la confianza de que los vóxeles bajo consideración fueran realmente vóxeles de DACC, un problema planteado por AS.

Lo que hemos hecho en nuestros nuevos análisis es definir una máscara dACC usando el atlas probabilístico de Harvard-Oxford (en adelante HO) y luego examinar el porcentaje de vóxeles en el dACC para los cuales diferentes términos son un objetivo de inferencia inversa razonable basado en la inferencia inversa de Neurosynth mapas. Para crear el atlas HO, tomaron imágenes ponderadas en T1 de docenas de cerebros (bit.ly/1RMTAzp). Se identificaron varias regiones de interés (por ejemplo, ACC) en cerebros individuales antes de cualquier transformación. Luego, cada escaneo se registró en el espacio MNI. En este punto, podrían determinar para cada vóxel en el espacio MNI, cuántos cerebros individuales habían sido etiquetados con una etiqueta particular en el primer paso. Entonces, si el 75% de los cerebros tenía una coordenada particular etiquetada como ACC, entonces ese voxel tendría una probabilidad del 75% de ser ACC en cualquier nuevo escaneo registrado en el espacio MNI.

Matthew Lieberman
Fuente: Matthew Lieberman

Usando este atlas pudimos definir máscaras DACC (-8 ≤ x ≤ 8; 0 ≤ y ≤ 30) para las cuales los vóxeles tenían un 25%, 35%, 50% o 75% de probabilidad de estar en el dACC (vea la figura encima). Se podría argumentar que solo los vóxeles que tienen al menos un 50% o 75% de probabilidad de ser vóxeles dACC deberían incluirse en nuestro ROI, pero la inspección visual sugirió que estas máscaras de ROI eran muy similares a las que ya usamos en el documento PNAS que condujo al respuesta de AS, así que optamos por una máscara más liberal del 35% para nuestros análisis presentados aquí.

Tenga en cuenta que los resultados son cualitativamente los mismos en todas las máscaras diferentes. La única diferencia importante que vimos es que a medida que pasamos de máscaras de DACC de confianza baja (25%) a máscaras de DACC de confianza superior (75%), el porcentaje de vóxeles de dACC asociados, mediante inferencia inversa, con términos afectivos aumentó (por ejemplo, dolor +9 %; miedo + 12%; afecto negativo + 6%) y el porcentaje de voxels dACC asociados con términos cognitivos disminuyó (por ejemplo, conflicto -12%; error -6%). Por lo tanto, a medida que aumentemos nuestra confianza en que un vóxel en particular se encuentra en el DACC, es más probable que se asocie con un proceso afectivo y sea menos probable que esté asociado con un proceso cognitivo. Para decirlo de otra manera, los vóxeles que están asociados con procesos cognitivos en el CADC tienden a ser los vóxeles que deberíamos tener la menor confianza en realidad están en el CADAC.

Los análisis presentados a continuación usan la máscara del 35%. Inicialmente pensamos ver nuestras cuatro categorías principales de interés en el documento PNAS (dolor, ejecutivo, conflicto, saliencia) junto con las planteadas por TY como alternativas que deberíamos haber considerado (miedo, autonomía, recompensa). Finalmente, decidimos incluir más términos en nuestros análisis para que podamos cumplir con el estándar de selectividad dado por TY en su último blog:

"Se puede decir que una región del cerebro es 'selectiva' para una función particular si (i) muestra una asociación robusta con esa función, (ii) muestra una asociación insignificante con todas las otras alternativas fácilmente disponibles, y (iii) los autores tienen se hizo la debida diligencia para asegurar que las principales funciones candidatas propuestas en la literatura estén bien representadas en su análisis ".

Creemos que esta definición va más allá de la forma en que muchos investigadores han usado este término en el pasado (es decir, en documentos de MVPA), pero pensamos que valdría la pena ver qué sucede cuando aplicamos esta definición a nuestros análisis. Deberíamos notar que interpretamos la palabra 'asociación' en esta definición para referirnos solo a las asociaciones identificadas en los mapas de inferencia inversa, no a lo que se observa en los mapas de inferencia directa. Como resultado, intentamos hacer nuestra "debida diligencia para asegurarnos de que las principales funciones candidatas propuestas en la literatura estén bien representadas en su análisis". Por lo tanto, ahora tenemos una lista de 14 términos que cubre cada cuenta de DACC que conocemos a lo largo de los años. Nuestra lista de términos incluye:

dolor, atención, autonomía, evitación, conflicto, emoción, error, ejecutivo, miedo, afecto negativo, inhibición de respuesta, selección de respuesta, recompensa y relevancia.

Creemos que esta es una lista bastante completa de términos y esperamos que si hemos omitido alguno, tengan un sinónimo razonable en la lista que probablemente produzca efectos similares.

En el análisis. Lo primero que hicimos fue realizar un recuento del número de voxels en la máscara del 35%. Hubo 1110 vóxeles que el atlas HO tenía al menos un 35% de confianza eran vóxeles de dACC. De estos, 947 vóxeles (o 85.3%) aparecen en el mapa de inferencia inversa para el dolor (usando el nivel de significancia Neurosynth estándar de p <.01, corregido FDR). De los otros 13 términos, ninguno cubrió incluso el 20% de los voxels dACC (ver la figura a continuación). La comparación de chi cuadrado del dolor versus cualquier otro término fue altamente significativa. Todos X 2 > 975.278, p's <.00001, d 's> 5.38. Estos nos dicen que el dolor es mucho más omnipresente de una explicación de inferencia inversa a través de voxels dACC que cualquiera de los otros 13 términos.

Matthew Lieberman
Muestra el porcentaje de voxels dACC que aparecen en el mapa de inferencia inversa de cada término. El mismo voxel puede aparecer en el mapa por varios términos
Fuente: Matthew Lieberman

El análisis anterior no llega al corazón del problema de la selectividad como se caracteriza en la definición de TY porque el mismo voxel puede mostrarse aparecer para múltiples términos y, por lo tanto, no indicar selectividad de un término sobre otros. Por lo tanto, seguidamente evaluamos cuántos vóxeles en el DACC parecían selectivos para cualquier cosa tal que aparecieran en el mapa de inferencia inversa de cualquier término, pero no aparecían en ninguno de los otros 13 mapas de inferencia inversa de términos. Uno podría imaginar que con 14 términos, casi ningún vóxel en el DACC mostraría selectividad según esta definición: cualquier vóxel que sea significativo para solo dos de los términos se elimina de este análisis. A pesar del alto obstáculo para la selectividad aquí, 477 vóxeles de los 1110 (43%) en el DACC aparecieron en solo uno de los 14 mapas de inferencia inversa. Estos 477 vóxeles parecen cumplir con la barra de selectividad establecida por la definición de TY. De los 477 voxels dACC que son selectivos para un solo término (de los 14 términos considerados), el 91.2% fueron selectivos para el término dolor .

Matthew Lieberman
De los voxels dACC que son selectivos para 1 de 14 términos, muestra el porcentaje de cada término.
Fuente: Matthew Lieberman

En total, 435 de los 477 voxels selectivos estaban presentes solo en el mapa de inferencia inversa dolor y no en ninguno de los mapas de inferencia inversa para los otros 13 términos. El único otro término que tenía> 10 voxels selectivos asociados fue recompensa, a 30 vóxeles (aludimos a esto en el documento original). El miedo es el siguiente en 8 vóxeles, con un error de 3 vóxeles y el conflicto en 1 vóxel. Los voxels dACC selectivos del dolor son más que un orden de magnitud más comunes que cualquier otro tipo de voxel dACC selectivo. La comparación de chi cuadrado del dolor frente a cualquier otro término para el número de voxels selectivos en el dACC fue altamente significativa. Todos X 2 > 446.203, p's <.00001, d 's> 1.64. Estos resultados nos dicen que entre los voxels de dACC que muestran evidencia de selectividad, es mucho más probable que estén relacionados con el dolor que con cualquiera de los otros 13 términos.

Dos advertencias muy importantes aquí:

1) Dado que 477 voxels fueron selectivos para un término, esto significa que 633 voxels dACC no fueron selectivos para ningún término. Aunque creemos que ahora estamos utilizando una barra muy alta para la selectividad, más alta que cualquiera de las que hemos visto en la literatura, está claro que con esta barra alta, menos de la mitad de los voxels de dACC muestran selectividad. Desde esta perspectiva, es una extralimitación decir que "el DACC" es uniformemente selectivo para el dolor en relación con los otros 13 recuentos de funciones de DACC que estamos considerando actualmente. Dos respuestas a esta advertencia. En primer lugar, utilizando solo los cuatro términos que inicialmente consideramos (dolor, ejecutivo, conflicto y saliencia), 823 voxels fueron selectivos bajo la definición actual (es decir, 74.1% de los voxels dACC) y de estos, 811 fueron selectivos para el dolor (que tendrían sido el 98.5% de los voxels selectivos). Por lo tanto, en el contexto de las categorías consideradas en nuestro documento PNAS, nuestro reclamo de selectividad por el dolor en relación con los procesos ejecutivo, de conflicto y de relevancia fue razonable. En segundo lugar, dadas todas las respuestas que hemos visto sobre el hecho de que el CADC es demasiado genérico o multifacético, creemos que es bastante impresionante que casi la mitad de los vóxeles DACC sean selectivos y, de estos, casi todos son selectivos para el dolor.

2) Uno podría ver estos análisis y pensar que no es justo comparar cada término con el otro 13 porque algunos de ellos están en categorías superpuestas. Por ejemplo, incluimos conflicto y error, que son cuentas distintas pero superpuestas de dACC. Si aparecían en los mismos vóxeles como el uno al otro, eliminarían esos vóxeles del análisis de selectividad anterior. Para abordar esto, a continuación tenemos una figura que muestra la comparación de los mapas para el dolor y para cada otro término en solitario, de modo que cada término puede mostrar cuántos vóxeles aparecen para su mapa de inferencia inversa pero no los de dolor. Las barras naranjas en cada par de dos pares a continuación muestran el porcentaje de voxels dACC asociados con cada término cuando solo se eliminan los vóxeles asociados al dolor. Por lo tanto, términos como error y conflicto no compiten entre sí aquí. (Las barras azules muestran cuántos vóxeles aparecen en el mapa de inferencia inversa del dolor, pero no para el otro término en la comparación)

Matthew Lieberman
Fuente: Matthew Lieberman

Como es evidente, este análisis no muestra ningún otro término que lo haga particularmente bien cuando se enfrentó a uno contra uno contra el dolor. Además de la recompensa, para la cual el 2.7% de los voxels dACC aparecen en su mapa pero no en el mapa del dolor, ningún otro término supera el 1.1%. Por el contrario, en estos análisis, el dolor supera constantemente el 65% de todos los voxels de CADC después de eliminarlos para cualquier otro término. Si bien indicamos en el documento PNAS que la recompensa realmente muestra efectos más fuertes que el dolor en la porción anteroventral de CADAC, pensamos que valdría la pena mostrar esto con más claridad. Si hubiéramos utilizado un límite en ángulo (línea verde discontinua), como lo han hecho otros, para distinguir DACC de rACC, el mapa de inferencia inversa de la recompensa podría estar ausente en gran parte de dACC. Es bastante claro en esta figura que el efecto de inferencia inversa para la recompensa es en gran parte parte de un grupo ACC más rostral.

Matthew Lieberman
Fuente: Matthew Lieberman

Las conclusiones de nuestros análisis actuales reafirman el punto general hecho en el documento PNAS. Si vamos a hablar sobre la función de DACC como lo han hecho innumerables trabajos en los últimos 20 años, el dolor es la única función que el DACC parece ser selectivo en más de un puñado de vóxeles. Utilizamos la definición de TY de selectividad (suponiendo que la asociación se refiere a la asociación de inferencia inversa). Por lo tanto, intentamos crear una lista más exhaustiva de términos que sean cuentas razonables de dACC. Determinamos qué porcentaje de voxels dACC mostró una asociación de inferencia inversa con cada uno de los 14 términos. Luego determinamos, de estos vóxeles, cuántos solo mostraron una asociación de inferencia inversa con 1 término y ninguno de los otros 13 términos. Para resumir nuestros hallazgos:

  1. De los 1110 voxels dACC, el 43% (es decir, 477 vóxeles) cumplió los criterios de selectividad anteriores (que aparecen en solo 1 de los 14 mapas de inferencia inversa).
  2. De los 477 vóxeles que fueron selectivos, el 91.2% (es decir, 435 vóxeles) fueron selectivos para el dolor.
  3. Por lo tanto, una parte considerable del CADC se puede describir con un solo término de entre esta gran lista de términos históricamente plausibles.
  4. De la porción considerable de vóxeles de DACC que se pueden describir con un solo término de esta larga lista de cuentas razonables, casi todos aparecen en el mapa de inferencia inversa para el dolor y para ninguno de los otros 13 términos.

Dolor y miedo

Hemos argumentado que el afecto relacionado con la angustia podría ser la cuenta general para los procesos de CADC, con el CADC manejando los aspectos del dolor relacionados con la angustia (Rainville et al., 1997). Décadas de trabajo con lesiones antiguas sugieren que el CADAC juega un papel clave en la angustia del dolor físico así como también en la ansiedad (Foltz & White, 1962; Tow & Whitty, 1953). Como se ha señalado, hay un número no trivial de voxels dACC que aparecen en el mapa de inferencia inversa para el miedo (12.2% en nuestra máscara dACC). Creemos que el dolor y el miedo están relacionados conceptualmente porque la mayoría de lo que tememos son cosas que pueden causarnos dolor (física, social o emocionalmente). Pero en el contexto de Neurosynth, la relación es mucho más directa. Muchos estudios de neuroimagen de miedo son estudios de condicionamiento del miedo que usan el dolor (por ejemplo, shock) como el estímulo incondicionado. Estos estudios casi nunca usan la palabra "dolor" en ninguna parte y, por lo tanto, no están etiquetados como dolor en Neurosynth, pero pueden estar introduciendo efectos específicos del dolor en los mapas de inferencia inversa para el miedo.

Para examinar esta posibilidad, inspeccionamos manualmente los primeros 50 estudios de fMRI que aparecen en Neurosynth para el término miedo. Encontramos que el 50% de estos estudios usaron manipulaciones del dolor. Para ver si estas manipulaciones del dolor podrían estar impulsando la señal de DACC en el mapa de inferencia inversa por miedo, contamos cuántos estudios con activaciones de dACC tenían manipulaciones del dolor y cuántos estudios sin activaciones de dACC tenían manipulaciones del dolor. Como se puede ver en la figura siguiente, una gran mayoría de los estudios de miedo (71%) que producen una respuesta dACC usan manipulaciones del dolor, mientras que una mayoría considerable de los estudios de miedo (69%) que no producen una respuesta DACC no usan dolor manipulaciones. La comparación de chi cuadrado de este 2 × 2 fue altamente significativa; X 2 > 8.013, p <.006, d = 0.87. Este resultado sugiere que los estudios de miedo que incluyen una manipulación del dolor tienen más probabilidades de producir una respuesta de DACC.

Matthew Lieberman
Fuente: Matthew Lieberman

Si se considera la posibilidad de que la respuesta de DACC al miedo en el mapa de inferencia inversa de Neurosynth esté (a) vinculada conceptualmente a las respuestas de dACC al dolor o (b) literalmente debido a manipulaciones de dolor que activen el dACC en estudios de miedo, entonces es razonable combinar las respuestas dACC al dolor y al miedo. Aunque no queremos hacer demasiado de estos análisis, cuando el dolor y el miedo se combinan en un solo ROI combinado (en adelante, dolor + miedo), encontramos que 566 de los 1110 voxels dACC muestran selectividad para uno de los 13 términos . Por lo tanto, el 51% de los voxels dACC son selectivos en estas condiciones. Además, 532 de los 566 voxels selectivos son selectivos para el dolor + miedo. En otras palabras, el 94% de los voxels selectivos de DACC en este análisis son selectivos para el dolor + miedo. Además, el 48% de todos los voxels de dACC son selectivos para el dolor + miedo.

En resumen, si tratamos el dolor y el miedo como parte de un solo constructo en lo que respecta al dACC, vemos que casi la mitad de todos los voxels de dACC son selectivos para este constructo y casi todos los voxels de dACC que son selectivos para nada son selectivos para esta construcción. Como en nuestros análisis principales en la sección anterior, ningún otro término además de la recompensa (5% de los vóxeles selectivos aquí) acumula incluso el 1% de los vóxeles selectivos en el CADAC.

¿Los puntajes z en Neurosynth nos informan sobre la inferencia inversa?

Creemos inequívocamente que los puntajes z en Neurosynth dicen algo importante sobre la inferencia inversa. Por lo tanto, uno de los aspectos más inesperados del intercambio sobre nuestro documento PNAS es que TY y TW, creadores de Neurosynth, parecen sugerir que no se puede aprender casi nada sobre la inferencia inversa de los puntajes z y que debemos centrarnos principalmente en las probabilidades posteriores. Por ejemplo, TY escribió:

"Expliqué por qué uno no puede obtener soporte para una inferencia inversa usando puntuaciones z o valores p. La inferencia inversa es intrínsecamente una noción bayesiana, y tiene sentido solo si estás dispuesto a hablar de probabilidades anteriores y posteriores ".

Nos parece extraño porque cuando uno usa la interfaz web de Neurosynth y mira cualquier término, hay un solo botón en la pantalla etiquetado como "inferencia inversa". Cuando haces clic en este botón, aparece un mapa de calor que, dado su esquema de etiquetado, solo podemos suponer que está destinado a decirnos algo sobre la inferencia inversa. Este mapa de calor es un mapa de calor de puntajes z de inferencia inversa, no probabilidades posteriores. De manera similar, si descarga el mapa de inferencia inversa para cualquier término, es un mapa de puntajes z, no de probabilidades posteriores. A pesar de ser no bayesianos, estos puntajes z son lo que TY y TW solían poblar sus mapas de "inferencia inversa". Si estos no nos dicen acerca de la inferencia inversa, entonces es muy extraño que el único botón de inferencia inversa en la interfaz conduzca a estos puntajes z.

TY también ha escrito sobre el valor de los puntajes z de Neurosynth en múltiples lugares que parecen contradecir la afirmación anterior ("uno no puede obtener soporte …"). Primero tenemos el texto de las preguntas frecuentes de Neurosynth:

"Mapa de inferencia inversa: puntajes z correspondientes a la probabilidad de que un término se utilice en un estudio dada la presencia de activación informada (es decir, P (Término | Activación))"

Eso nos parece que el puntaje z nos dice algo sobre la inferencia inversa. Aquí hay extractos de lo que TY escribió en Google+, donde responde graciosamente muchas de las preguntas de los usuarios sobre Neurosynth:

"El puntaje z es una medida de confianza en la asociación estadística; la probabilidad posterior es una medida del tamaño del efecto. En general, recomiendo prestar más atención al primero , ya que este último está sujeto al ruido relacionado con el tamaño de muestra. Un término con menos estudios incluidos en el metanálisis tendrá mayor variabilidad, lo que se traducirá en probabilidades posteriores más extremas. Sin embargo, un término con menos estudios también producirá * menos * valores p / z extremos, en igualdad de condiciones. Por lo tanto, si intenta hacer un reclamo del formulario "es probable que la función F esté asociada con la actividad en la región R", probablemente sea mejor basarlo en el puntaje z . [énfasis añadido]"

Esta afirmación es completamente inconsistente con su afirmación anterior de que "un cañón obtiene apoyo para una inferencia inversa usando puntuaciones z". En su blog, también escribió esto de puntajes z:

"Todo lo que nos dice es que, dada toda la información que tenemos, es muy poco probable que exista una asociación cero entre un término y una región".

A pesar del fraseo peyorativo, creemos que "todo esto nos dice" es bastante sorprendente ya que no teníamos forma de hacerlo antes de bases de datos como Neurosynth. Esto es algo realmente importante de saber, especialmente cuando se combina con otros análisis que sugieren que para otros términos no hay evidencia de asociación entre el término y la región. Finalmente, TY escribe:

"Si el objetivo es simplemente decir algo como" creemos que la unión temporoparietal está asociada con el movimiento biológico y la teoría de la mente "o" la evidencia sugiere que la corteza parahipocampal se asocia con la navegación espacial ", no veo nada mal basando esa afirmación en los mapas z-score de Neurosynth ".

Creemos que este es exactamente el reclamo que estamos haciendo junto con la demostración de que estamos más justificados para realizar reclamos relacionados con el dolor sobre la función de DACC que para otros términos. En el documento PNAS lo hicimos comparando los términos que tenían puntajes z no significativos (ejecutivo, conflicto, saliencia) con un término que sí lo hizo (dolor). Si bien estos no muestran que los tamaños del efecto sean más grandes para el dolor que los otros términos (que nunca fue nuestro objetivo), sí demuestran que podemos estar más seguros de que existe una asociación real entre dolor y DACC que entre los otros tres términos y dACC. Creemos que esta es una contribución valiosa. En los análisis actuales, tomamos un enfoque diferente, contando el número de vóxeles que muestran alguna asociación de inferencia inversa para uno y solo uno de los 14 términos. Una vez más, la mayoría de los vóxeles en el DACC que cumplen estos criterios fueron selectivos para el dolor.

TW da algunos detalles agradables en la respuesta de su blog sobre cómo se calcula el puntaje z, en realidad comenzando como un chi-cuadrado:

"Compara la frecuencia de activación para un término objetivo (" dolor ") con la tasa de activación básica para los otros estudios (" no dolor "). Formalmente, compara P (A | dolor) a P (A | no dolor) usando una prueba de chi-cuadrado. Por lo tanto, nos dice acerca de la preferencia, pero no de la especificidad relativa a otros estados potenciales ".

Estamos de acuerdo en que el puntaje z para el dolor no hace el trabajo por sí mismo. Pero si también conocemos P (A | motor) y P (A | no motor) para las mismas coordenadas, esto nos permite evaluar si esta activación es más selectiva para el dolor que para el motor. Cuanto mayor es el puntaje z, más confianza tenemos de que P (A | term) es mayor que P (A | no term). La comparación de estos puntajes z entre términos ( dolor z frente a z motor ) nos dice algo sobre si deberíamos tener mayor confianza de que uno de estos términos está asociado con la actividad en la región de interés que el otro término.

Finalmente, ahora hemos comparado las probabilidades posteriores para los términos dolor, ejecutivo, conflicto y saliencia usando los 8 vóxeles en los que nos centramos en nuestro documento PNAS. Por ejemplo, comparamos las probabilidades posteriores para el dolor (usando las 8 probabilidades posteriores para el dolor que provenía de 8 puntos de activación diferentes) con las probabilidades posteriores para ejecutivo (usando las 8 probabilidades posteriores para el ejecutivo) usando una prueba t de medidas repetidas. Para el dolor frente a cada uno de los otros tres términos, las probabilidades posteriores de dolor fueron significativamente mayores, t's> 5.92, p's <.0003, d' s> 4.47. Además, incluso cuando se compara el dolor con el miedo y el autonómico, las probabilidades posteriores de dolor son significativamente más altas, t's> 2.92, p = .03, d 's> 2.21. Nunca pensamos que comparar las probabilidades posteriores fuera esencial para expresar nuestro punto de vista, pero esta es al menos alguna evidencia de que el efecto está ahí.

Quizás no debería sorprender que veamos lo mismo con las probabilidades posteriores que vimos con puntajes z dado que, al menos con los datos que estábamos viendo, los dos conjuntos de estadísticas estaban altamente relacionados. Específicamente, la correlación de todas las probabilidades posteriores y los puntajes z para los términos de interés en las 8 ubicaciones examinadas en nuestro documento PNAS fue r = .86 . Por lo tanto, si bien puede existir cierta luz de día conceptual entre estas medidas, funcionalmente proporcionaron aproximadamente la misma información en nuestros análisis. Esta similitud se puede ver en la siguiente figura que traza los puntajes z contra las probabilidades posteriores para el dolor, el ejecutivo, el conflicto y la prominencia de las 8 ubicaciones en nuestro documento PNAS. También se puede ver que las 7 probabilidades posteriores más altas y las 7 puntuaciones z más altas provienen del dolor. Tenga en cuenta que la relación curvilínea es probable debido a las probabilidades posteriores que se limitan a un límite superior de 1,0.

Matthew Lieberman
Fuente: Matthew Lieberman

Selectividad

Ya dijimos bastante sobre la selectividad en nuestro blog anterior. Solo queremos decir algunas cosas más. Una es que no hay una definición de selectividad universalmente aceptada (TW la describe como "vagamente definida"). La gente tiene definiciones, pero no todos tienen la misma. La implicación es que cada uno de nosotros necesita decir lo que queremos decir con selectividad cuando usamos el término (algo que casi no hacen los documentos que usan este término, incluido nuestro documento PNAS). Ciertamente tendremos más cuidado con esto en el futuro, pero debemos respetar las definiciones de los diferentes investigadores cuando los dan y no tratarlos como si tuvieran una definición mala o incoherente simplemente porque es diferente a la nuestra. Ahora hemos visto al menos tres definiciones de selectividad en voxels dACC, todas las cuales son razonables:

Selectivity L & E : los voxels dACC son selectivos para el dolor, si el dolor es una fuente más confiable de activación de DACC que otros términos de interés (ejecutivo, conflicto, saliencia).

Selectividad TY : puede decirse que los voxels de dACC son "selectivos" para una función en particular si (i) muestra una asociación robusta con esa función, (ii) muestra una asociación insignificante con todas las otras alternativas fácilmente disponibles, y (iii) los autores han hecho la debida diligencia para asegurar que las principales funciones candidatas propuestas en la literatura estén bien representadas en su análisis.

Selectividad TW : los voxels dACC son selectivos para una función particular si el vóxel se activa con esa función y "no está activado por otras cosas"

Creemos que la definición de TW es defendible, pero probablemente descarta llamar a algo selectivo de los análisis de fMRI ya que probablemente haya pocos o ningún voxel en el cerebro que muestren activación a uno y solo un proceso (es decir, que solo aparezca en un solo mapa de inferencia ). Creemos que nuestra definición y la definición de TY son más prácticas. Creemos que el nuestro está implícito en la mayoría de los estudios de MVPA que analizan la selectividad hasta la fecha y creemos que TY representa una barra más alta, pero una barra interesante, y que realmente requiere herramientas como Neurosynth, en lugar de MVPA, para considerar.

Priores empíricos

En el último blog de TY, él sugiere que uno de los problemas con nuestras conclusiones es que nuestro uso de probabilidades posteriores es engañoso. Las probabilidades posteriores para el dolor están alrededor de .80 mientras que las probabilidades posteriores para otros términos examinados en el artículo tienden a estar entre .50 y .60 (donde .50 es esencialmente un efecto nulo). Creemos que estas diferencias (y especialmente las diferencias de puntaje Z asociadas) nos dicen algo acerca de las funciones probables de DACC. Sin embargo, TY implica que creemos que, de acuerdo con estos efectos, si se seleccionara al azar un nuevo estudio de Neurosynth con actividad dACC, podríamos predecir que sería un estudio de dolor. Si bien podemos ver por qué TY podría pensar que lo creeríamos, nunca formulamos esta afirmación y de hecho no creemos en esto.

TY señala que la probabilidad posterior de .80 para el dolor depende de comenzar con los .50 previos que Neurosynth asume para cada término. De ninguna manera una probabilidad posterior de .80 en Neurosynth implica que el 80% de los estudios con activaciones dACC fueron estudios de dolor. De hecho, ya lo señalamos en nuestro documento PNAS:

"Una probabilidad posterior es similar a un tamaño de efecto, aunque no directamente interpretable, porque el bayesiano anterior para cada término se normató a 0,50. Por lo tanto, una probabilidad posterior de 0.82 es probablemente un tamaño de efecto significativamente más grande que otro de 0.56; sin embargo, debido a la norma, no se puede decir que el 0,82 implica que hay un 82% de posibilidades de que una activación provenga de un estudio con un término psicológico particular ".

TY continúa para analizar los antecedentes empíricos del dolor y otros términos. Porque el dolor aparece en el resumen del 3.5% de todos los estudios en la base de datos de Neurosynth y el motor aparece en el resumen del 18% de todos los estudios en la base de datos Neurosynth, si estos (.03 y .18) se usan como los antecedentes empíricos para cada término (en lugar de .50), el motor termina con probabilidades posteriores más altas que el dolor.

Estamos completamente de acuerdo en que si ve un estudio en la base de datos de Neurosynth con activación de DACC, es más probable que provenga de un estudio motor que de un estudio de dolor. Sin embargo, creemos que esto es casi completamente al margen. No estamos interesados ​​en la distribución de estudios en la base de datos Neurosynth per se. Estamos interesados ​​en tratar de sacar conclusiones acerca de la (s) función (es) probable (s) del CADAC en el mundo real. El hecho de que haya más estudios de motor que de dolor en la base de datos de Neurosynth se refiere únicamente a las prioridades de investigación anteriores de los científicos y quizás a la mayor facilidad con la que se puede realizar un estudio motor en comparación con la dificultad de realizar un estudio de dolor.

Para dejar en claro cuán irrelevante es esta diferencia en el previo basado en Neurosynth, considere el siguiente ejemplo. Imagine una base de datos con solo dolor y estudios motores. Supongamos que hay 100 estudios de dolor y 1,000,000 de estudios de motor en la base de datos. Además imagine que el 100% de los estudios de dolor producen actividad de DACC en un vóxel particular y que solo el 1% de los estudios de motor producen actividad de DACC en el mismo vóxel. Si tuviéramos que dibujar aleatoriamente un estudio de esta base de datos que mostrara actividad en este voxel de dACC, sería 100 veces más probable que fuera un estudio motor que un estudio de dolor. Sin embargo, cualquier persona razonable miraría estos resultados y concluiría que esta mancha en el DACC probablemente esté involucrada en el dolor, pero no involucrada en los procesos motores. El chi-cuadrado apoyaría esta conclusión.

Entendemos que el 3.5% y el 18% son en cierto sentido antecedentes previos para el dolor y el motor, respectivamente, en el contexto de Neurosynth, pero no son antecedentes previos empíricos del mundo real (y TY lo señala más adelante en su blog). Creemos que la decisión de TY de establecer todos los niveles previos de .50 cuando creó Neurosynth fue una muy buena idea porque evita que los efectos sean determinados por los tipos de estudios que están mejor representados en la base de datos.

En el primer blog de TY, él dio una gran explicación de cómo pensar realmente sobre las probabilidades posteriores. El escribio:

"La interpretación estricta de una probabilidad posterior del 80% para el dolor en un voxel dACC es que, si tuviéramos que tomar 11,000 estudios fMRI publicados y pretender que exactamente el 50% de ellos incluye el término 'dolor' en sus resúmenes, la presencia de la activación en el vóxel en cuestión debería aumentar nuestra estimación de la probabilidad de que el término "dolor" ocurra del 50% al 80% ".

Así que juguemos un poco a este ejemplo. Supongamos que tenemos 2.000 estudios en una base de datos hipotética de Neurosynth, en lugar de 11.000. Al establecer el valor anterior para el dolor en .50, estamos diciendo "imaginemos que 1,000 de los 2,000 estudios tienen el término dolor en abstracto y los otros 1,000 no". Además imagina que a través de estos 2,000 estudios, 1,000 de ellos tienen actividad de DACC en un vóxel de interés (por ejemplo, coordenadas 0, 18, 30). Una probabilidad posterior de dolor de .81 en este vóxel implicaría que deberíamos esperar que aproximadamente 810 de los 1000 estudios con DACC en esta muestra (o un nuevo conjunto de estudios con la misma distribución de dolor / sin dolor) tengan dolor como un término y alrededor de 190 de los 1000 estudios con DACC en esta muestra para no tener dolor como término. Por el contrario, si el motor tiene una probabilidad posterior de .51 para este vóxel, entonces deberíamos esperar que aproximadamente 510 de los 1000 estudios con DACC en esta muestra tengan motor como término y aproximadamente 490 de los 1000 estudios con DACC en este muestra para no tener motor como un término. Aunque el dolor y el motor no se compararon directamente en estos análisis, creemos que estos dos análisis sugieren que el dolor es una mejor indicación de la actividad en este vóxel que los procesos motores. Esto también se refleja en los puntajes z en 0, 18, 30 para el dolor (Z = 9.90) y el motor (Z = 0.21).

TY también escribe lo siguiente:

"Lo interesante de todo esto es que, sin importar qué prioridad elija para un término determinado, el puntaje z de Neurosynth nunca cambiará. Esto se debe a que el z-score es una medida frecuentista de asociación estadística entre la ocurrencia del término y la activación del voxel. Todo lo que nos dice es que, dada toda la información que tenemos, es muy poco probable que exista una asociación cero entre un término y una región. Esto puede o no ser interesante (yo diría que no lo es, pero eso es para una publicación diferente), pero ciertamente no autoriza una inferencia inversa como "la activación dACC sugiere que el dolor está presente". Para dibujar el último reclamo, debe usar un marco bayesiano y elegir algunos antecedentes sensibles. Sin antecedentes, sin inferencia inversa ".

Esto todavía tiene poco sentido para nosotros. En primer lugar, por lo que podemos decir, nunca escribimos las palabras que TY parece atribuirnos aquí ("la activación dACC sugiere que el dolor está presente") y eso se debe a que no respaldamos esta opinión y no la respaldamos. Además, entendemos que sin un marco bayesiano no se obtienen probabilidades posteriores, lo que proporciona una estimación de la intensidad del efecto de inferencia inversa. Sin embargo, la puntuación z ciertamente parece indicarnos si hay un efecto de inferencia inversa distinto de cero. Por lo tanto, el puntaje z nos está diciendo algo de interés sobre la inferencia inversa. Si hay 14 cuentas del DACC y solo 1 de las 14 cuentas tiene un puntaje Z significativo en sus mapas de inferencia inversa para un voxel particular, entonces definitivamente hemos aprendido algo sobre la función del voxel sin referirnos a las probabilidades posteriores.

¿Podemos decir alguna vez que una región del cerebro tiene una función?

TW cuestionó por completo la premisa de nuestro documento, sugiriendo:

"No deberíamos buscar una explicación unificada para la actividad de DACC, a menos que sea para describir una colección de diversos procesos. Tratar de encontrar la "mejor interpretación" para una colección de 550 millones de neuronas es engañoso, porque nos invita a hacer inferencias psicológicas basadas en la actividad cerebral que no están justificadas. Por analogía, es como tratar de adivinar si una persona es republicana o demócrata en función de su estado natal. La "mejor interpretación" de los votantes que viven en Texas es que son republicanos. Tendría razón al adivinar el republicano, pero solo estaría bien el 57 por ciento de las veces ".

Esta es realmente una cuestión de filosofía de la ciencia con respecto a las unidades / niveles de análisis. El mismo problema surge en la psicología social cuando decimos "bajo condiciones particulares, la gente tenderá a mostrar efectos de conformidad". Esto no implica que cada persona puesta en esa situación muestre esos efectos, sino que hay una tendencia central que se puede distinguir estadísticamente del ruido. El hecho de que haya personas que no se conforman no significa que no podamos hablar de lo que hacen las personas en general de una manera útil.

La posición de TW es filosóficamente defendible, sin embargo, lleva a la conclusión de que la fMRI casi nunca puede identificar ninguna función psicológica en ninguna región del cerebro, porque cada voxel contiene alrededor de 5,5 millones de neuronas (Logothetis, 2008) y probablemente no haya ninguna región donde El 100% de estas neuronas son invocadas por una única función / proceso y por ninguna otra función / proceso. Pero los científicos han encontrado utilidad al tratar de describir, digamos, el hipocampo en términos de una función particular a pesar de tener millones de neuronas que no hacen todas la misma cosa. No estamos sugiriendo ninguna función particular es la descripción final de la función del hipocampo, pero estamos sugiriendo que no es un esfuerzo inútil para postular una función general para el hipocampo que será debatida, refinada y actualizada con el tiempo.

Veamos el ejemplo de TW de adivinar si un texano seleccionado al azar es republicano debido al hecho de que el 57% de los tejanos votaron por Romney en 2012 (frente al 41% de Obama). Creemos que este es un gran ejemplo, pero no capta la pregunta en la que realmente estamos interesados. Si estamos equiparando a tejanos individuales con neuronas dACC y el estado de Texas con el dACC como un todo, entonces nuestra verdadera pregunta no es si podemos adivinar si una persona en particular es republicana (aunque sería una locura no adivinar el republicano si se viera obligado a apostar). En cambio, nuestra pregunta es más similar a "¿Funciona Texas como un estado republicano, a pesar del hecho de que muchas personas en ese estado no son republicanos?" La respuesta a esta pregunta es un sí rotundo. Esos 57% que votan republicanos han asegurado el dominio de los republicanos en cada brazo del gobierno: en el Senado de los Estados Unidos (100%); Cámara de Representantes de los Estados Unidos (69%); Senadores del estado de Texas (68%); Representantes de Texas (65%); y el Juez de la Corte Suprema de Texas (100%). Estas cifras son lo suficientemente altas como para garantizar que Texas funcione como un estado republicano. Con un 65% o más en ambas cámaras de la legislatura estatal, los republicanos pueden votar a través de una legislación amistosa 100% republicana y la Suprema Corte del Estado puede tomar decisiones amistosas republicanas, una y otra vez. Tal vez lo más significativo es que el 57% de los tejanos que votaron republicanos han enviado el 100% de los 38 votos electorales de Texas al candidato republicano a presidente en las últimas 9 elecciones consecutivas. Entonces, por el momento, creemos que es sensato describir a Texas como un estado republicano, ya que tiene un gran valor práctico. No es necesario que cada ciudadano sea republicano para que así sea, ni tampoco el hecho de que existan enclaves urbanos que se inclinen por la Democracia socavan esta descripción del estado. (Para aquellos que son más entendidos computacionalmente, simplemente consideren una red conexionista. Si una representación tiene una pequeña ventaja en los pesos que conectan algunos nodos, los procesos iterativos de satisfacción de restricciones convertirán esa pequeña ventaja en una gran ventaja funcional en los resultados).

Conclusión

¿Los puntajes z de los mapas de inferencia inversa nos dicen la fuerza de los efectos de inferencia inversa? No, pero se correlacionan .86 en nuestros análisis con las probabilidades posteriores que sí lo hacen. ¿Los puntajes z de los mapas de inferencia inversa nos dicen dónde en el cerebro hay evidencia confiable de una asociación de inferencia inversa no nula? Absolutamente. ¿Pueden los puntajes z ser utilizados como una herramienta para la inferencia inversa si identificamos vóxeles que muestran puntajes z significativos para un término pero no para otros de interés? Absolutamente.

¿Creemos que cada neurona o vóxel en el DACC es selectiva o incluso activada por el dolor? No. ¿Creemos que esto significa que no puede haber discusión sobre la función del dACC? No. ¿La mayoría de los vóxeles en el DACC son selectivos usando la definición de TY? No, pero aproximadamente el 43% de los vóxeles de dACC muestran selectividad usando los 14 términos que consideramos (lo que significa que esos vóxeles aparecieron en uno y solo uno de los 14 mapas de inferencia inversa considerados).

De esos voxels dACC que son selectivos, el 91% son selectivos para el dolor . ¿El DACC es selectivo para el dolor en relación con el ejecutivo, el conflicto y los procesos de relevancia, como argumentamos en el documento PNAS? Absolutamente: solo 1 vóxel de los 477 vóxeles que muestran selectividad es selectivo para cualquiera de estos tres procesos. Con base en la evidencia de Neurosynth, ¿el DACC es más selectivo para el dolor que para la atención, autonomía, evitación, conflicto, emoción, error, ejecutivo, miedo, afecto negativo, inhibición de respuesta, selección de respuesta, recompensa y relevancia? Absolutamente. Dado que pocos, incluyéndonos a nosotros, habrían adivinado mucho más de que el DACC es selectivo para el dolor más que todas estas otras cuentas, creemos que nuestros hallazgos son una contribución significativa a la neurociencia afectiva y cognitiva.