Relaciones espurias

La causalidad es un asunto serio. Se trata de ese impulso humano de conocer por qué suceden las cosas en el mundo. Y constituye el requerimiento cognitivo básico para desplegar nuestro impulso por transformar ese mundo. Habitualmente, cuando queremos modificar algo, buscamos las causas de que eso suceda de cierto modo, y procuramos cambiarlas. Desde variaciones en los hábitos alimenticios, cuando deseamos producir una modificación en nuestro estado de salud, hasta cambios en las políticas sociales cuando queremos modificar las condiciones de vida de una población. Cuando cambio el tipo de combustible que pongo en el auto para producir una mejora en el rendimiento del motor. En las más diversas situaciones.

De modo que errores en la atribución de causalidad pueden tener –y de hecho tienen– consecuencias negativas no sólo en los modos de razonar sino también de actuar.

Proposiciones

Consideramos atribuciones de causalidad que involucran proposiciones empíricas (dejamos de lado otro tipo de enunciados como los juicios de valor, los analíticos o los metafísicos). Las proposiciones empíricas refieren a algo que sucede en el mundo sensible (o físico). Más estrictamente, una proposición es empírica cuando su carácter de verdad o falsedad puede ser puesto a prueba mediante un acto de indicación de algo que sucede en el mundo, siempre que esta prueba pueda ser replicada por otros (no se agote en la experiencia de quien la enuncia).

Afirmaciones del tipo A es causa de B constituyen un subtipo de proposición empírica. Para conocer de qué van, conviene describir brevemente los restantes subtipos.

En primer lugar, tenemos proposiciones descriptivas. Estas afirman la existencia de algo en el mundo, típicamente de una propiedad que puede asumir distintos valores (o estados) en distintas entidades de una misma clase. Afuera llueve es ejemplo de proposición descriptiva. María está engripada, otro.

Se trata del subtipo más simple en términos formales, aunque no por ello su puesta a prueba resulta siempre sencilla. La obtención de prueba acerca de la veracidad o falsedad del enunciado afuera llueve no ofrece mayores problemas: puedo realizar esa afirmación a una persona con la que estoy dentro de la casa y basta que esta persona se acerque a la ventana para confirmar su veracidad al observar el agua mojando las plantas del jardín. Pero muchas veces debemos recurrir a procedimientos sofisticados para medir el valor o estado que la afirmación enuncia. O sólo podemos conocerlo por sus efectos. Poner a prueba la afirmación María está engripada no puede hacerse por observación directa como con la lluvia. En este caso, o bien debo contar con el resultado de un test que identifique la presencia de cierto virus causante de la gripe, o bien estimar que los estornudos, la congestión y la fiebre de María son efectos de la gripe. Ninguna de las dos alternativas es tan sencilla como correr la cortina para ver la lluvia cayendo. En la primera debo disponer de un conocimiento especializado (microbiología). En la segunda, dar por bueno que eso que veo es consecuencia de una gripe, no de otro estado de María.

En segundo lugar, tenemos las proposiciones clasificatorias. Son similares a las anteriores, pero en este caso describen algo en el mundo por sus semejanzas con otras. La gripe es una patología viral es, por ejemplo, una proposición que involucra dos clasificaciones. La que agrupa a ciertos estados físicos como el reuma, la gastritis, las migrañas y la gripe, en la clase de las patologías. Y la que agrupa a un conjunto de entidades biológicas en la clase de los virus. Las proposiciones clasificatorias se encuentran a medio camino entre las empíricas y las analíticas: si bien obtienen su prueba de la presencia o ausencia de ciertos datos en el mundo sensible, el que esos datos y no otros den lugar a una clase particular (como la de las patologías o la de los virus) es una cuestión (en última instancia) de definiciones. En cualquier caso, la prueba para determinar el carácter de verdad o falsedad de este subtipo de proposiciones empíricas tampoco puede obtenerse tan directamente como cuando uno ve el piso mojado.

En tercer lugar, las proposiciones correlacionales: María se mojó anoche con la lluvia y hoy amaneció con gripe. Aquí el vínculo entre dos estados no es de semejanza sino de conjunción: sucedió tal cosa y luego sucedió tal otra. Como puedes apreciar en el ejemplo, no se trata más que de dos proposiciones descriptivas, conectadas por la constatación de su ocurrencia simultánea o (como en este caso) consecutiva.

En cuarto lugar, están las proposiciones explicativas o causales: María amaneció con gripe porque se mojó anoche con la lluvia. Aquí damos un salto de mayor importancia respecto del subtipo anterior. No sólo afirmamos que luego de suceder algo sucedió otra cosa, sino que postulamos que esa cosa sucedió como consecuencia de aquella otra que la antecedió. El término porque marca la diferencia. Poner a prueba una proposición explicativa o causal requiere formalmente demostrar:

a) Que ambas cosas (la supuesta causa y el supuesto efecto) covarían o correlacionan. Una proposición explicativa supone una proposición correlacional.

b) Que la supuesta causa antecede temporalmente al supuesto efecto. En el caso de María y la lluvia no parecen existir inconvenientes en este sentido. Primero María se mojó, luego se engripó. Adicionalmente la afirmación contraria resulta inverosímil: Amaneció lloviendo porque María se engripó anoche. Sin embargo, muchas veces no resulta sencillo probar la antecedencia temporal de la supuesta causa: ¿algunos adolescentes abandonan los estudios porque comienzan a trabajar?, ¿o comienzan a trabajar porque abandonan los estudios?

c) Que no existen otras posibles causas del supuesto efecto que compitan con la causa postulada en la proposición. La eventual intervención de terceras variables constituye el problema crucial de la atribución de causalidad. La intervención de variables ocultas puede asumir formas diversas. La más clara es aquella en que afecta de manera independiente tanto a lo que erróneamente postulamos como causa como a lo que consideramos su efecto. Es decir, cuando es la verdadera causa de ambas cosas. El caso de María y la lluvia no aplica para esta situación. Si lo hiciera tendríamos que postular que existe algo en el mundo que produce, de manera independiente, tanto lluvia como gripes. Pero las intervenciones pueden ser de otros tipos. Por ejemplo, A puede ser la causa de C, y C la causa de B. Si no consideramos C, cometemos el error de afirmar que A es causa de B. Quizás los humanos, como María, cuando son sorprendidos por un chaparrón en la calle (A) tienden a buscar refugio, entrando en contacto directo con otros humanos, por ejemplo, debajo del techo de una parada de ómnibus (C). Y quizás la gripe (B) se contagie cuando entro en contacto cercano con personas infectadas, por ejemplo, en una parada de ómnibus (C). Durante la pandemia se han suspendido muchos eventos públicos, como los bailes en discotecas, no porque la música electrónica fuera la causa de la covid-19.

Llegamos aquí a nuestro problema de las relaciones espurias. Pero antes de abordarlo mencionamos un quinto subtipo de proposición empírica al que volveremos sobre el final: las predictivas. María llegó toda mojada por la lluvia. Seguro mañana amanece engripada. A primera vista este enunciado requiere para su puesta a prueba resolver los tres problemas de la causalidad y, además, abrazar la esperanza de que el futuro se comportará como el pasado (la apuesta a la condición de salud de María mañana obtiene su fundamento en pasadas observaciones de la sucesión de mojaduras y gripes que exhibe la biografía de María). Lo segundo es cierto, lo primero no.

El término espurio proviene del latín spurius, que significa falso, ilegítimo o –lo que es más ajustado al problema que tratamos aquí– algo que no es lo que parece ser. Una relación espuria es una correlación entre dos o más variables que no implica la determinación causal de una sobre la otra, sino el resultado de la covariación con terceras variables que no consideramos en el análisis. Veamos un caso de manual y tres de la vida real.

Caso 1: “Las cigüeñas traen a los bebés”

Se trata del ejemplo al que con más frecuencia recurren los manuales de metodología y estadística cuando abordan el problema de la espuriedad. Sabemos que a mayor número de cigüeñas más nacimientos se producen (pensemos en las ciudades europeas donde sus cigüeñas suelen hacer sus nidos). La idea fue propuesta por el matemático polaco Jerzy Neyman en 1952 y no hemos dejado de recurrir a ella. Recientemente Robert Matthews, físico graduado en la Universidad de Oxford, publicó los resultados de un estudio que confirma la hipótesis. El título de este apartado reproduce, en español, el de su artículo de 2016.

Matthews trabajó con datos de 17 países europeos, no de ciudades. Obtuvo una correlación r = 0,62 entre número de cigüeñas y número de nacimientos contabilizados por país. No es un valor demasiado alto para el coeficiente r de Pearson, que puede variar entre -1 y 1, pero es significativo: Matthews obtuvo para su correlación un valor p = 0,008, que indica que es altamente improbable que la hipótesis contraria (no existe relación entre número de cigüeñas y número de nacimientos) sea cierta.

La solución al problema es sencilla: existe una tercera variable, no considerada en el análisis, que es la causa tanto del número de cigüeñas como del número de nacimientos en una ciudad (o en un país, en el estudio de Matthews). Se trata del número de habitantes en cada unidad. A mayor número de habitantes, más cigüeñas, ya que existen más chimeneas donde las aves pueden hacer sus nidos. Y, de manera independiente, a mayor número de habitantes, más bebés, porque son más los eventos de reproducción.

En este ejemplo de manual puede apreciarse con claridad cómo de la constatación de covariación de dos variables (A y B) no puede saltarse a la imputación de causalidad (A es causa de B). En el ejemplo C (el número de habitantes) es causa tanto de A como de B, de manera independiente. Al no observar C, caemos en el error.

Los ejemplos de manual tienen la virtud de hacer comprensibles asuntos formales a primera vista complejos. Pero pueden aparecernos como juegos de argumentos sin consecuencias prácticas (al fin de cuentas, todos sabemos que a los bebés no los traen las cigüeñas, sino que nacen de los repollos). En la vida real perdemos muchas veces esa claridad para la comprensión, pero sus consecuencias prácticas pueden llegar a ser de magnitud.

Caso 2: los estudiantes de institutos privados aprenden más

Uno de los principales objetivos de la educación formal es conseguir que los estudiantes incorporen conocimientos y habilidades (competencias). Para medir el grado en que lo hacen, se llevan adelante en el país, como en buena parte del mundo, mediciones de aprendizajes o desempeños. Se trata de pruebas complejas, tanto en su diseño como en su administración y análisis de resultados. La idea es obtener medidas de desempeño (típicamente en lengua y matemática, aunque suelen abordarse otras áreas de conocimiento, así como habilidades no cognitivas) comparables en distintos contextos. Llevan en ese sentido el nombre de pruebas estandarizadas, tienen carácter cuantitativo (puntajes obtenidos por los estudiantes en la respuesta a ítems definidos y validados para toda la población) y son aplicadas por un actor externo al centro educativo (no vale la nota de cada maestra).

Uruguay participa en pruebas estandarizadas internacionales, como PISA, y tiene sus propias pruebas, realizadas por el Instituto Nacional de Evaluación Educativa, que llevan el nombre de Aristas y se aplican en alumnos de tercero y sexto de primaria y en tercero de enseñanza media.

Las pruebas Aristas reportan diferencias importantes en los promedios de desempeño entre estudiantes de centros de educación privados y públicos, en favor de los primeros. Para decirlo de modo simple: en promedio, los estudiantes de colegios y liceos privados obtienen mayor puntaje en las pruebas de aprendizaje que sus pares en escuelas y liceos públicos. Esto es cierto. Ahora, ¿lo es afirmar que el tipo de centro en que estudio es la causa del nivel de desempeño que obtengo? No.

Sucede que los estudiantes no se distribuyen aleatoriamente entre centros públicos y privados (imaginemos que la asignación a uno u otro tipo de centro al momento de la matriculación se realizara por sorteo). Un sesgo de selección importante se vincula con el nivel socioeconómico de sus hogares: los niños y adolescentes pertenecientes a hogares de mayores recursos tienen más probabilidad de terminar en un colegio privado. ¿Será entonces esta característica del hogar nuestra tercera variable?

Para saber cuánto afecta la relación original tipo de centro-desempeños debemos controlar la variable nivel socioeconómico de los hogares. La idea de control es clave para la determinación de causalidad. Está en la base de la lógica experimental y de los modelos estadísticos multivariados que buscan establecer causalidad en condiciones no experimentales. Una forma sencilla de hacerlo es la siguiente: comparemos los promedios de desempeños en centros públicos y privados que en promedio tengan estudiantes provenientes de hogares de similar nivel socioeconómico. O lo que es lo mismo: la diferencia de medias de desempeño entre estudiantes de centros públicos y privados, a igual nivel socioeconómico. Cuando se procede de ese modo, sistemáticamente en Aristas (como en otras pruebas internacionales) las diferencias por tipo de centro desaparecen.

Caso 3: en Reino Unido las mujeres son más conservadoras que los hombres

Este problema constituyó un dolor de cabeza para politólogos y políticos ingleses durante al menos cuatro décadas. Elección tras elección, se observaba que en la isla las mujeres votaban en mayor proporción que los hombres al Partido Conservador.

Las mujeres son más conservadoras que los hombres. O quizás, como relata John Goldthrope “esta ‘brecha de género’ revelaba que los laboristas no mostraban preocupación por los intereses de las mujeres, que les preocupaban las desigualdades y la explotación asociadas con la clase social más que con el género. Se afirmó que, si los laboristas hubieran atraído a las mujeres en la misma medida que a los hombres, el partido habría ganado todas las elecciones de ese período en cuestión. En otras palabras, la brecha de género se explicaba específicamente por un efecto de género provocado por lo que Hart (1989) denominó las ‘anteojeras masculinistas’ de los políticos laboristas”.

El propio Goldthrope aportó la solución al problema. El voto en Inglaterra, como en muchos otros países, se encuentra fuertemente determinado por la generación y por la clase. Sabemos que existe una tendencia a mantener a lo largo de la vida la opción política de partida. Para plantearlo con términos locales: si comenzaste votando al Partido Colorado es más probable que continúes votando al Partido Colorado en las siguientes elecciones. Lo mismo para el Partido Nacional y para el Frente Amplio. Esto no significa que no existan movimientos de partido, sólo que la probabilidad de mantener el voto es mayor que la de cambiarlo. Sabemos también que entre las clases acomodadas es mayor la proporción de los que optan al inicio y continúan optando por el Partido Conservador. ¿Y dónde entra el género? Sucede que la esperanza de vida de las mujeres es más alta que la de los hombres. Y es aún más alta (debido a las mejores condiciones de vida) entre las mujeres de clases acomodadas. Al controlar la relación entre género y voto, por edad y clase social, las diferencias desaparecían. O lo que es lo mismo: a igualdad de edad y clase, no existen diferencias en las preferencias políticas de mujeres y hombres ingleses.

Caso 4: el consumo de tabaco reduce los riesgos de complicaciones por covid-19

Un artículo publicado en Nature el 26 de febrero de 2021 comienza afirmando que “Varios estudios recientes han encontrado un bajo porcentaje de fumadores entre los pacientes con covid-19, lo que hace que los científicos concluyan que los fumadores pueden estar protegidos contra la infección por SARS-CoV-2”. ¡Vaya! Al fin una buena noticia para las tabacaleras y para quienes continuamos siendo sus clientes. El artículo se centra en realidad en refutar esa hipótesis. Pero efectivamente en 2020 circularon resultados de varios estudios que lo sostenían.

A esta altura no es necesario profundizar en los datos para observar el error: la condición de “paciente covid-19” se adquiere habiendo sido infectado por el SARS-CoV-2 y habiendo desarrollado síntomas de tal gravedad que requieran hospitalización. A esa subpoblación hacían referencia los estudios. Las complicaciones por covid-19 se producen mayormente en edades avanzadas (al inicio de la pandemia, en algunos países el promedio de edad de los hospitalizados por covid-19 rondaba los 70 años). La probabilidad de que un fumador se mantenga vivo a los 70 años es sensiblemente inferior a la de un no fumador. Cuando los autores del artículo mencionan “han encontrado un bajo porcentaje de fumadores” la pregunta que se impone es: ¿bajo con respecto a qué? Si la respuesta es: con respecto al porcentaje de fumadores en la población total, la trampa queda a la vista. En definitiva, existe menor porcentaje de fumadores entre los pacientes con complicaciones por covid-19 que el porcentaje de fumadores en el total de población, porque esta subpoblación tiende a morir antes de que el SARS-CoV-2 devenga en covid-19 con complicaciones.

Podría proponerse un estudio más sofisticado. Descartada la pertinencia de comparar la prevalencia del tabaquismo en la población total y en la población con covid-19, podríamos seleccionar al azar una muestra de pacientes que son fumadores y una de pacientes que no lo son. Y observar qué porcentaje en cada muestra desarrolla complicaciones o muere. No sería de extrañar que el porcentaje fuera menor entre los fumadores. Pero este eventual resultado, en lugar de conducir a la conclusión de que el consumo de tabaco reduce las chances de complicaciones por covid-19, constituiría una oportunidad para identificar las características de esta población que determinan tanto la supervivencia al tabaquismo hasta alcanzar los 75, los 80 o los 85 años, como a sobrevivir a la covid-19. Como la población de sobrevivientes al tabaquismo a esas edades no es representativa del total de población fumadora, la variable oculta debiera buscarse (en este ejemplo) en las características genéticas, los hábitos de vida o cualquier otra circunstancia que hace a estos fumadores en particular tan excepcionales.

Azar

Otra fuente de relaciones espurias es el simple azar. Tyler Vigen, estudiante de criminología en Harvard, es el creador del sitio spurious correlations. Allí presenta correlaciones tan disparatadas como el número de personas que se ahogaron al caer en una piscina con el número de películas en las que apareció Nicolas Cage (r = 0,998), la tasa de divorcio en Maine con el consumo per cápita de margarina (r = 0,992), o la edad de Miss América con el número de asesinatos por vapor, vapores calientes y objetos calientes. En todos los casos se trata de datos reales, obtenidos de múltiples bases de datos.

En las correlaciones de Vigen, como en muchas otras (y la creciente explotación automatizada de grandes bases de datos constituye un riesgo en ese sentido) nos encontramos frente a covariaciones por azar. ¿Cómo suceden?

Una correlación es el ajuste de un patrón de variación de los valores de una variable con el patrón de variación de los valores de otra. Dos series de valores (como las edades de las Miss América y el número de asesinatos por vapores y objetos calientes) pueden correlacionar casi perfectamente, simplemente porque entre las miles de series que Tyler Vigen hizo correlacionar, todas con todas, casualmente exhibieron el mismo patrón de variación. Lanza una moneda diez veces y registra la secuencia de caras y cruces que obtienes. Si 500 personas hacen lo mismo, encontrarás que algunas de estas otras series mostrarán la misma o una muy similar secuencia de caras o cruces que la tuya. Tanto tú como Alejandra obtuvieron una cara, luego otra cara, luego una cruz, luego otra cara... ambas series correlacionan por simple azar.

Predecir y causar

La denominación de espuria para una correlación que no implica causalidad puede llevar a malentendidos. Una correlación es o no es. Estrictamente no existen correlaciones “falsas” (claro está, siempre que los datos se hayan obtenido correctamente y los cálculos se hayan realizado del mismo modo). La falsedad, eventualmente, se encuentra en el salto a la atribución de causalidad. No es falso que a mayor número de cigüeñas exista mayor número de bebes, así como no lo es que los promedios de desempeño en centros privados sean superiores a los de los públicos, que mayor proporción de mujeres en Inglaterra vote a los conservadores o que una menor proporción de fumadores se contabilice entre los hospitalizados por covid-19 respecto de la proporción observada en la población en general. Tampoco es falsa la asociación entre consumo de manteca y divorcios.

Bien, no son falsas, pero ¿qué utilidad tienen? Si son fuertes (coeficiente r de Pearson cercano a -1 o 1), significativas (se obtienen de grandes muestras aleatorias, lo cual minimiza el error de las estimaciones) y constantes (sucesivas mediciones confirman la fuerza y significación de esa correlación), conociendo el valor de una de las variables involucradas podemos predecir el valor de la otra. La predicción no requiere causalidad, sólo covariación.

Si se cumplieran aquellas condiciones, conociendo el número de cigüeñas en una ciudad es posible predecir el número de bebés en esa ciudad. No es una utilidad menor, especialmente cuando la variable que se busca predecir no se ofrece tan fácilmente a la vista como los registros de nacimientos. Sin embargo, por más que aumentemos el número de cigüeñas en esa ciudad (imaginemos la introducción masiva de aves), no variará la natalidad. Es aquí donde radica la diferencia entre las posibilidades de la predicción y de la causalidad. Y es en el salto espurio de una cosa a la otra donde puede rastrearse el origen de muchos errores en las decisiones humanas, que conducen a intervenir sobre causas que no son tales.