En 1932 la madre superior de la American School Sisters of Notre Dame decidió que todas las monjas debían escribir unas notas con su autobiografía. Esas notas fueron guardadas y 60 años más tarde clasificadas en función de los sentimientos positivos que contenían. De las monjas que aún permanecían vivas en 1991, solo el 21% de las más felices falleció en los próximos 9 años, mientras que de las monjas menos felices, el 55% falleció en los próximos 9 años. American Nuns Study (citado en Layard 2005)
La pandemia de la covid-19 ha supuesto uno de los mayores desafíos que la humanidad ha debido enfrentar en las últimas décadas. Aunque la aparición de las vacunas agrega un nuevo elemento en el combate a la enfermedad, hasta la llegada de éstas una gran cantidad de gobiernos han debido recurrir a medidas tendientes a reducir la movilidad de su población como principal estrategia para frenar los contagios. Sumado a la tragedia sanitaria, esto ha afectado diversas dimensiones del bienestar de las personas como la economía y el empleo, el uso del tiempo libre, la educación y la salud mental de las personas. Aunque es a veces mencionada como un gran ecualizador, resulta evidente que no todos transitan la tormenta en el mismo barco: edad, nivel educativo, lugar de residencia y sexo son algunas de las variables que determinan en gran medida el nivel de exposición que uno tendrá frente a la pandemia y a sus diversas consecuencias. En particular en lo referido a la organización del hogar, creciente evidencia señala que el cuidado de niñas, niños y adolescentes, producto de la suspensión de la presencialidad en la educación y el cierre de centros educativos, no ha sido distribuido de forma uniforme entre hombres y mujeres, recayendo sobre estas últimas en gran medida dicha responsabilidad.
En este contexto, la estrategia adoptada en Uruguay apeló en gran medida a reducir la movilidad social en forma voluntaria sin imponer un confinamiento obligatorio de la población. Así, por ejemplo, mientras escuelas, liceos y demás centros educativos debieron permanecer cerrados durante semanas, empresas, comercios y oficinas (a excepción de las públicas) no tuvieron obligación de hacerlo. La suspensión de la presencialidad en la educación decretada el 13 de marzo del 2020 implicó un desafío para madres y padres, que de forma inesperada debieron combinar el trabajo remunerado y el doméstico con el cuidado de niñas, niños y adolescentes durante las semanas en que los centros educativos permanecieron cerrados.
En esta columna busco mostrar que en el caso de Uruguay también la suspensión de la presencialidad y el cierre de escuelas supuso un impacto mayor en mujeres que en hombres. No obstante, mientras la evidencia en otros países se basa principalmente en encuestas o registros, aquí busco hacerlo mediante el análisis de tuits de cuentas uruguayas recolectados durante el 2020. Esta idea se basa en la creciente evidencia que señala el uso, consciente e inconsciente, que las personas hacen de sus redes sociales para reflejar una gran variedad de emociones o sentimientos, como pueden ser estrés, enojo, tristeza o alegría. La principal estrategia para ello consiste en la utilización de lo que se conoce como análisis de sentimientos, una herramienta aplicada generalmente a grandes volúmenes de documentos (por ejemplo, texto o audio) con el objetivo de extraer información subjetiva de estos, como pueden ser opiniones, emociones o sentimientos propiamente dichos. Por ejemplo, un tweet que diga Me gusta trabajar en casa será etiquetado como positivo, mientras un tweet diciendo No tengo paciencia suficiente para trabajar toda la semana en casa lo será como negativo.
A partir del análisis de cerca de 55 millones de tuits de cuentas uruguayas se encuentra que durante el período en que la presencialidad en la educación fue suspendida, el sentimiento promedio extraído de los tuits de mujeres difiere significativamente del extraído de los tuits de hombres.
Como complemento al análisis de sentimientos, se utiliza una segunda estrategia consistente en identificar los principales temas que son abordados en Twitter por hombres y mujeres. De esta forma se observa que una vez que las clases fueron suspendidas, las mujeres hacen mayor referencia a temas vinculados a la educación, niños y niñas, que los hombres.
Una mirada al 2020 en Twitter
El gráfico 1 muestra el número de tuits enviado desde cuentas uruguayas entre el 1º de enero y el 31 de diciembre de 2020. Para la construcción del mismo se utilizaron 54.900.093 tuits. Estos fueron enviados por 166.681 usuarios, 99.038 (59.4%) hombres y 67.643 (40.6%) mujeres. Para identificar el sexo del usuario se observó el nombre que éste utiliza en Twitter y se le asignó el sexo en función de un diccionario de nombres y sexos creado con datos de partidas del registro civil de Montevideo y complementado con datos de registros similares de la ciudad de Buenos Aires y de España. En el caso de apodos o nombres que no fueron encontrados, la asignación del sexo se hizo de forma manual.
A efectos de reducir variaciones y mostrar mejor las tendencias, para la construcción del gráfico se hizo un promedio móvil de siete días. Las áreas en gris señalan los períodos en que no hubo actividad presencial en la educación. El primer caso corresponde al período en que la presencialidad fue suspendida en el marco de la declaración de emergencia sanitaria. Las fechas consideradas para ello son del 14 de marzo al 29 de junio, fecha en que se retoma la presencialidad en Montevideo y el área metropolitana. La segunda área gris corresponde a las vacaciones de julio, entre el 20 de julio al 2 de agosto.
El período de mayor actividad en Twitter durante el 2020 se dio durante las dos semanas posteriores a la declaración de emergencia sanitaria, alcanzando un promedio superior a los 210.000 tuits por día. Este período es interrumpido el fin de semana largo que comenzó el viernes 1.º de mayo. Una caída similar sucede al comenzar la segunda semana de las vacaciones de julio. Otros picos de actividad fueron el 25 de setiembre (elecciones municipales), el 25 de noviembre (Día Internacional para la Eliminación de la Violencia contra las Mujeres), el 13 de diciembre (fecha en que el programa de radio Justicia Infinita organizó su Bajada, evento que se desarrolló principalmente en Twitter) y la noche del 24 de diciembre.
El gráfico 2 muestra la relación entre la cantidad de tuits enviados por hombres y mujeres. Durante el 2020 dicha relación tuvo un promedio cercano al 0.7, es decir por cada 10 tuits enviados por cuentas de hombres en promedio se enviaron 7 tuits desde cuentas de mujeres. Al igual que en el gráfico anterior, la línea del gráfico 2 muestra un promedio móvil de 7 días y los puntos el valor exacto registrado en determinados días. Estos puntos muestran un aumento de la actividad de las mujeres en fechas que revisten de alguna significatividad para el país. Días como el de la asunción del nuevo gobierno y el Día Internacional de la Mujer, así como el día en que se retomó la presencialidad en la educación y el día en que falleció el expresidente Tabaré Vázquez registraron un aumento de la actividad de las mujeres en comparación a la de los hombres, superando en algunos casos la relación de 8 tuits de cuentas de mujeres por cada 10 de cuentas de hombres.
Análisis de sentimientos en textos
Existen diversas herramientas para analizar sentimientos en texto, imágenes o audio. En esta columna se presentan resultados utilizando una de ellas, llamada Vader, de código abierto y libre acceso. Vader (Valence Aware Dictionary and sEntiment Reasoner) está basada en un diccionario de léxico y reglas gramaticales sensible tanto a polaridad (es decir si una palabra implica un sentimiento positivo o negativo) como a intensidad (por ejemplo “mucho”, “poco”, “muy” o “casi”). Palabras como “gustó”, “feliz” o “disfruté” implican sentimientos positivos, pero “no me gustó” es etiquetado como un sentimiento negativo. Cada oración es analizada y recibe un valor que va de -1 (negativo) a 1 (positivo). Dado que fue diseñada especialmente para análisis de textos cortos, Vader es una de las herramientas más utilizadas para extraer sentimientos en tuits. Por otro lado, al igual que muchas de las herramientas más populares para análisis y procesamiento de texto, Vader fue diseñada para trabajar con texto en inglés. En tal sentido, una alternativa común en estos casos consiste en la traducción del texto a analizar previamente. Si bien este fue el camino elegido aquí, debe notarse que el traducir todos los tuits al inglés implica en ciertos casos una pérdida de información (en español por ejemplo los sustantivos tienen género y hay palabras o expresiones propias del idioma cuya traducción no siempre es sencilla o posible). El recuadro técnico que acompaña a este artículo aporta detalles de esta y otra herramienta utilizada para analizar sentimientos.
El cambio de humor con la suspensión de la presencialidad
El gráfico 3 presenta la evolución del sentimiento de los tuits de hombres y mujeres y el efecto que tuvo la suspensión de la presencialidad en la educación sobre éste. Para la construcción del gráfico se calculó primero el sentimiento promedio de tuits de hombres y mujeres para cada día del año y luego nuevamente se hizo un promedio móvil de siete días.
El sentimiento promedio marca tres de sus valores más altos con el comienzo del año, carnaval y la asunción del nuevo Gobierno, destacándose a su vez la similitud de los valores promedios registrados para hombres y para mujeres en esos días. No obstante, dichos valores comienzan a divergir, primero a partir de que la covid-19 se instala en la agenda del país y segundo a partir de la declaración de emergencia sanitaria y la consecuente suspensión de la actividad presencial en la educación. Recién pocos días antes de que se complete la vuelta a la presencialidad se observa que la brecha en el sentimiento promedio de hombres y mujeres disminuye. Las dos semanas posteriores a que se retome la presencialidad muestra por primera vez en la serie al sentimiento promedio en los tuits de mujeres por encima del de los hombres. Esta “sobrerreacción” posterior a la vuelta a la presencialidad es detenida con la llegada de la primera semana de las vacaciones de julio.
La Tabla 1 resume los resultados principales de este análisis. En el caso de los hombres, el sentimiento promedio registrado durante el período en que la presencialidad estuvo suspendida fue 37.0% menor respecto al registrado durante enero y febrero. Por otro lado, el sentimiento promedio en el período en que la actividad educativa funcionó de forma presencial (29 de junio al 30 de noviembre) fue un 20.2% mayor en comparación al período en que la presencialidad estuvo suspendida. En el caso de las mujeres, el sentimiento promedio cae 68.8% comparando el período de suspensión de la presencialidad con enero y febrero y aumenta 64.0% al comparar el período en que la presencialidad estuvo suspendida con el período de normal funcionamiento educativo.
Asimismo, la parte inferior de la tabla 1 incluye la variación del sentimiento promedio comparando un período considerado “normal” como fue diciembre 2019 - febrero 2020 con respecto a otras fechas que presentaron una variación importante en el sentimiento promedio: 8 de marzo, día internacional de la mujer, 2 de noviembre, día de los muertos y 6 de diciembre, fecha en que fallece el expresidente Tabaré Vázquez.
Que exista una brecha en el sentimiento de hombres y mujeres únicamente durante el período en que la presencialidad de la educación fue suspendida no es necesariamente sencillo de explicar con los datos utilizados en este análisis. Sin embargo, lo hecho hasta ahora permite aventurar la existencia de al menos un elemento a considerar: esta situación era lógicamente inesperada para los hogares implicando que los mismos no pudieran ajustar de forma rápida su organización y funcionamiento a este nuevo escenario. Lo observado durante la suspensión de la presencialidad a raíz de la emergencia sanitaria no se observa cuando la presencia de las niñas, niños y adolescentes en el hogar es anticipable. La diferencia en el sentimiento promedio de hombres y mujeres comparando sábados y domingos con los restantes días de la semana es insignificante. De la misma forma tampoco se observa una diferencia considerable en el período comprendido entre el 20 de diciembre de 2019 y el 29 de febrero de 2020, cuando la mayoría de los centros de enseñanza permanecen cerrados.
¿De qué temas hablaron los hombres y mujeres durante la pandemia?
En forma adicional, es posible identificar los principales temas que fueron tratados durante el período en que los centros educativos permanecieron cerrados a raíz de la emergencia sanitaria. De esta forma también vemos que los temas vinculados a educación, suspensión de clases y niñez estuvieron más presentes en tuits provenientes de mujeres que de hombres. Para ello recurrimos a una técnica llamada “modelado de temas”. El modelado de temas (topic modeling) es una forma sencilla de analizar grandes volúmenes de texto con el fin de identificar cuáles son precisamente los temas o tópicos tratados. Estos textos pueden provenir de tuits, emails, libros, decisiones judiciales o portales de noticias. Un “tema” consiste en un grupo de palabras que suelen ocurrir juntas.
La Tabla 2 presenta los 5 temas principales encontrados durante el período en que las clases presenciales permanecieron suspendidas.
En el caso de las mujeres, algunas de las principales palabras del Tema 4 son “clases - escuela - volver - niños - semanas - estudiantes - casa”. Si bien es posible asignarle un tema a cada tweet, dado que en el caso de los hombres no se encontró un tema que refiriera de forma clara a la educación o a la suspensión de la presencialidad en el análisis anterior, se puede alternativamente considerar una lista de palabras vinculadas a la educación o la suspensión de la presencialidad (basándonos en las palabras que aparecen en el tema 4 de las mujeres) y ver en cuantos tuits de hombres y mujeres aparece al menos una de esas palabras. El gráfico 4 presenta para cada mes, la proporción de usuarios hombres y mujeres que tuvieron al menos un tweet que incluía al menos una de las palabras pertenecientes a dicha lista.
La diferencia entre hombres y mujeres es pequeña en enero y febrero donde menos de un 3.1% y 3.8% de hombre y mujeres realizaron al menos un tweet referido al tema educativo y a la presencia de niños y niñas en el hogar. Durante marzo, 27.8% de las mujeres y 19.2% de los hombres hicieron referencia al tema. En el caso de las mujeres este porcentaje se mantuvo siempre por encima del 23% hasta julio, mientras que en el de los hombres luego de transcurrido marzo, el porcentaje oscila entre 13% y 16%. Además del fin de cursos en por ejemplo la educación inicial y primaria, el aumento observado en diciembre es explicado por una importante cantidad de tuits que a raíz del fallecimiento del ex presidente Tabaré Vázquez incluyeron palabras como “plan”, “ceibal”, “laptop” o “niño”.
Comentarios finales
Si bien el debate sobre qué es lo que uno mide al realizar por ejemplo un análisis de sentimientos está abierto, abundante evidencia sustenta la idea de que estas herramientas contribuyen en la medición de emociones, estados de ánimo e incluso de algo tan abstracto como la felicidad de las personas. Este concepto, lejos de ser algo nuevo, ya se encuentra en obras de filósofos o economistas como Aristóteles o Bentham, Smith y Mills. Aunque hoy es común encontrar preguntas sobre la satisfacción personal con la vida y el bienestar en encuestas, la intención en esta columna fue aproximarse al estudio de la temática de forma alternativa, utilizando big data como principal punto de apoyo.
En tal sentido la extracción de información a partir de textos, imágenes, videos o audios constituye un apasionante desafío que están enfrentando hoy las ciencias sociales en general y la economía en particular. La variedad de herramientas existentes para análisis de texto permite de forma precisa y automática obtener información cuantitativa de grandes volúmenes de datos resultando en un valioso complemento a los análisis que tradicionalmente se hacen, por ejemplo, a partir de encuestas.
De esta forma, resulta importante mencionar al menos tres limitaciones de este artículo. Primero, los análisis de sentimientos no funcionan con la misma precisión siempre. Extraer sentimientos de textos que reflejan por ejemplo humor o ironía no es siempre fácil para humanos y tampoco lo es para algoritmos. Como ya fue mencionado a ello debe sumársele el hecho de que los tuits debieron ser traducidos al inglés para su análisis.
Segundo, a diferencia de las encuestas, cuyo diseño busca representar a una determinada población, debe considerarse que Twitter es una red social cuyo uso no es homogéneo en toda la sociedad. Por ejemplo, estudios para Uruguay muestran que su uso es más común en personas jóvenes, con nivel educativo terciario y de ingresos alto.
Por último, a diferencia de variables como el salario, al preguntar sobre la felicidad o la satisfacción que uno tiene con respecto a la vida se utilizan herramientas esencialmente ordinales: por ejemplo, no es claro que se puede concluir de comparar a una persona que del 1 al 10 dice estar satisfecha un 8 con su vida o su salud, con otra persona que en la misma escala le asigna a su vida o a su salud un puntaje de 4. De forma similar, que dos usuarios de Twitter tengan distintos puntajes promedios en el análisis de sentimientos de sus tuits no necesariamente indica que estén atravesando por situaciones mejores o peores. Si bien una impresionante cantidad de datos sobre la existencia de regularidades en el comportamiento humano sugiere que comparar niveles de satisfacción, felicidad o sentimientos es posible, este tipo de comparaciones deben hacerse con precaución y son al día de hoy objeto de apasionantes debates en la economía del bienestar.
Con centros educativos y de cuidados cerrados y abuelas y abuelos desaconsejados de proveer cuidado debido al riesgo de exposición al virus, muchas personas debieron enfrentar el desafío de combinar su trabajo remunerado con el trabajo doméstico y el cuidado de niñas, niños y adolescentes. En tal sentido la división del trabajo doméstico durante la covid-19 parece haber seguido un patrón similar al que ocurría antes de la pandemia, con tareas de cuidados recayendo sobre las mujeres en forma desbalanceada.
Este artículo buscó aportar evidencia en dicha dirección mostrando que el impacto y la preocupación por la suspensión de la presencialidad en la educación que las personas reflejan en Twitter es distinta en hombres y mujeres. Mientras no parece existir evidencia concluyente sobre el efecto que abrir centros educativos tiene sobre la propagación del virus en un contexto en que padres y madres continúan con sus actividades laborales de forma normal, abundante evidencia está poniendo en cuestión el daño académico, social y emocional que dicha política implica.
Recuadro técnico
Análisis de sentimientos: las conclusiones presentadas en este artículo se basan en Vader (Hutto & Gilbert (2014)). Como alternativa, se utilizó Stanza, un paquete para procesamiento de lenguaje natural de la Universidad de Stanford (Peng, Yuhao et al (2020)). Mientras que Vader es un paquete construido en base a reglas gramaticales, sensible tanto a polaridad como a intensidad, Stanza es un paquete para análisis y clasificación basado en redes neuronales recursivas (RNN). Las conclusiones presentadas en este artículo se mantienen incambiadas cuando se utiliza Stanza en lugar de Vader.
Modelado de temas: el modelado de temas se hizo utilizando el paquete MALLET (McCallum, 2002), que presenta muy buenos resultados cuando se trabaja con grandes volúmenes de datos y una importante cantidad de temas. Si bien se presentaron resultados para 5 temas, se realizaron ensayos con un mayor número de temas. El score de coherencia, utilizado para seleccionar el número óptimo de temas a modelar, se maximiza en 25.
Datos: los tuits fueron recolectados utilizando la API de Twitter para acceso académico. Toda la información descargada, incluyendo el texto y su traducción estarán disponibles a la brevedad on-line. Entre otros pasos, previo a su análisis, cada tweet fue limpiado. Esto implicó, eliminar links, lematizar palabras y llevarlas a una raíz común (“caminar”, “caminé” y “caminó” fueron agrupados en tanto conjugaciones del mismo verbo, lo mismo que por ejemplo “niños” y “niña” al ser distintas formas del mismo vocablo). La traducción de los tuits se realizó con Google Translate.
Resultados: la mayoría de los resultados presentados en esta columna fueron presentados a partir de promedios de tuits enviados indiferentemente de la cantidad de tuits que envió cada usuario. En el caso del análisis de sentimientos, es posible por ejemplo considerar promedios diarios por usuario y luego hacer un promedio simple entre usuarios. Los resultados presentados aquí se mantienen si se utiliza dicha alternativa.