Buscando que la Inteligencia Artificial detecte cuándo un texto es humorístico, investigadores dan con diferencias del género y la edad en lo que nos parece ofensivo y gracioso a los humanos

“La inteligencia artificial seguimos siendo nosotros”, nos dijo el matemático francés Jean-Michel Morel en febrero de 2018, horas después de haber recibido el título honoris causa de la Universidad de la República. “Tenemos más potencial de cálculo si utilizamos ordenadores. O si uso un bulldozer tendré superfuerza, pero la gente no va a decir que un operario de un bulldozer es un superhombre. Todo lo que vemos ahora es tecnología, no inteligencia artificial”, desafiaba luego. Sus palabras quedaron adheridas a la tapa de la carpeta en la que archivo el tema en mi cabeza. Saltamos ahora a diciembre de 2022.

No puedo ocultar mi sorpresa cuando, buscando artículos publicados por nuestra comunidad científica, doy con uno que me deja boquiabierto. En español se titularía algo así como “No lo tomes como algo personal: analizando las diferencias de género y edad en las calificaciones del humor en línea”. Firmado por Julie Anne Meaney, Steven Wilson y Walid Magdy, de la Escuela de Informática de la Universidad de Edimburgo, Reino Unido, y Luis Chiruzzo, del Grupo de Procesamiento de Lenguaje Natural del Instituto de Computación de la Facultad de Ingeniería de la Universidad de la República, el trabajo dice cosas interesantísimas sobre lo que nos sucede a la hora de calificar cuándo algo es humor y cuándo ese humor además resulta ofensivo.

Que nuestras investigadoras e investigadores produzcan cosas interesantísimas no es sorprendente. Lo que me descoloca, debo confesarlo, es haber encontrado algo tan maravilloso sobre esa cosa tan humana que es hacer chistes en una publicación llamada Social Informatics. Pero claro, el objetivo de esa publicación, que recoge trabajos presentados en conferencias anuales es “crear un lugar de debate para los investigadores de ciencias computacionales y sociales, actuando como un puente entre estas dos comunidades académicas diferentes y, a menudo, separadas”. Y entonces el círculo se cierra: dado que la inteligencia artificial somos nosotros, es lógico que, tratando de desarrollarla, en realidad nos estemos conociendo más a nosotros mismos.

¿Es cierto que los jóvenes de hoy se ofenden más fácilmente por cualquier cosa? ¿Hay diferencia entre lo que hombres y mujeres entienden como un texto humorístico? ¿Si ese texto humorístico es ofensivo, eso reduce su apreciación como pieza de humor? ¿Esas cosas cambian con la edad o el género? Sobre todas esas preguntas habla el trabajo de Luis Chiruzzo y sus colegas de la Universidad de Edimburgo. Así que salimos hacia el Instituto de Computación (INCO) de la Facultad de Ingeniería más rápido que pescado congelado hacia un comedor luego de una filtración de whatsapp.

¿Por qué estudiar el humor?

¿Por qué en el INCO hay un grupo de investigadores que estudian el humor? Uno puede tener alguna idea: la inteligencia artificial carece del deseo de aprender, por lo que debemos empujarla. Los humanos tenemos que enseñarles a las máquinas a distinguir algunas cosas. Y en un mundo donde hay muchas redes sociales con millones de usuarios la moderación hecha por personas es imposible, por lo que tenemos que enseñarles a las máquinas a detectar cuándo algo es humorístico y, en especial, cuándo eso que se supone que es humorístico puede ser ofensivo.

“Hay como un gran movimiento en tratar de detectar todo eso, que es como un clúster de cosas que llamamos 'análisis de subjetividad del texto', que es cómo la gente interpreta los textos”, dice Chiruzzo. “El humor es una de esas cosas que sabemos que la gente puede identificar. Por más que te pueda parecer gracioso o no, detectás que alguien intentó hacer un chiste”, agrega, y vale la pena aclarar que si bien el humor puede manifestarse de muchas maneras, aquí estamos hablando de textos que se postean en redes, por ejemplo, en Twitter. Que se puede detectar que algo es humorístico por parte de una máquina ya es algo suficientemente interesante. Pero además hay un atractivo extra: “también se utiliza el humor como vehículo para ofender, para hacer algún comentario ofensivo pero diciendo que es en tono de chiste”, señala Chiruzzo, y cualquiera que haya estado unos segundos en una red social seguramente estará de acuerdo en que es algo que sucede con alta frecuencia.

“Todas estas cosas tienen que ver con lo que es el área de procesamiento del lenguaje natural, que es como una subdisciplina de la inteligencia artificial que combina la computación con la lingüística y otras disciplinas y trata de hacer que las computadoras entiendan o generen el lenguaje humano”, dice entonces Chiruzzo. ¿Generar? ¿Peligran los humoristas? “Peligramos todos. Peligran los programadores, peligran los humoristas, peligra todo el mundo”, dice ríendo.

“En realidad, por ahora no peligra el trabajo de nadie. Pero sí se trata de que las computadoras desarrollen esas capacidades, un poco por eso de tratar de moderar automáticamente los millones de mensajes que existen hoy en día en las redes sociales”, nos tranquiliza luego. “Esa moderación es muy difícil, entonces se intenta tener por lo menos algunas herramientas automatizadas que hagan parte del trabajo y luego jueces humanos verán los casos más finos”, señala.

Competencias humorísticas

“Una de las formas de lograr estas herramientas automatizadas es con este tipo de competencias que organizamos, que tienen el fin de detectar la intención humorística en textos. La competencia de 2021 en inglés en la que colaboramos, y que abordamos en la publicación, se llamó HaHackathon. Las que organizamos nosotros en español se llaman HAHA”, cuenta Chiruzzo.

La idea general de estas propuestas es recopilar un conjunto de posteos, por ejemplo, de Twitter, algunos de ellos humorísticos, otros no, y que distintas personas los califiquen como humorísticos o no, y en caso afirmativo, qué tanta gracia les dan. Luego, parte de ese grupo de datos ya calificado por humanos es entregado a grupos que competirán por entrenar a sus máquinas a detectar cuándo un texto es humorístico. Al analizar el resto de los datos, la performance de las máquinas se compara con las calificaciones de los humanos, de manera de ver qué tan hábiles son para distinguirlo. Y en eso el grupo del INCO ya tiene una amplia experiencia.

“Santiago Castro comenzó con esta línea de trabajo allá por 2015. Él inició la idea acá en Uruguay de empezar a analizar el humor y, como estamos en Uruguay, empezó trabajando con el español”, reconoce Chiruzzo. Hoy Santiago Castro está en la Universidad de Michigan haciendo su doctorado. De esa manera, realizaron el primer trabajo sobre detección automática de humor en textos en español.

“Ese primer trabajo tuvo muy buena recepción, por lo que decidimos profundizar esa línea de trabajo y organizamos una de estas competencias en las que creamos un conjunto de datos bastante curado, en el que sabemos que hay cierto porcentaje de textos que son chistes y que la gente califica qué tan bueno o tan malo es el chiste puntuándolo del 1 al 5. Con base en eso les decimos a equipos que vengan y desarrollen un sistema con todos estos datos que sea capaz de agarrar un tuit cualquiera y decir si es un chiste”, señala Chiruzzo.

Y entonces, con el objetivo de que las máquinas hagan lo que nosotros podemos hacer, terminamos prestando atención tanto al qué como al cómo hacemos algunas cosas. “Una vez que uno tiene un montón de votos lo que pasa es que puede empezar a hacer algunos análisis estadísticos como de qué tan de acuerdo están los anotadores en si un texto es un chiste o no”, dice Chiruzzo. “Lo primero que hemos visto en todos estos años de estas competencias es que el humano es bastante bueno detectando cuándo un texto es humorístico o no. Sin embargo, los anotadores no están tan de acuerdo a la hora de evaluar qué tan bueno es ese chiste. Obviamente, eso es mucho más subjetivo: a un tuit al que una persona le ponía una estrella, otra le ponía cinco”, señala. Y esa subjetividad es precisamente parte del nudo central del trabajo que ahora nos convoca.

“Una rama vital de esta investigación es que se sabe que el humor varía según las características demográficas. Factores como la edad, el sexo, la personalidad y otras variables demográficas modulan las respuestas al humor”, señala el artículo. “Las competencias de humor computacional han tenido problemas para incorporar dicha conciencia demográfica en sus tareas y, en cambio, tienden a promediar todas las calificaciones de humor, lo que elimina los matices y la subjetividad de los datos, además de posiblemente disminuir la generalización de los sistemas de detección de humor”, prosiguen. A eso le sumaron el problema de la ofensa, por lo que su competencia, la HaHackatón de 2021, “fue la primera competencia de detección de humor que comodeló humor y ofensa”.

La HaHackatón de 2021

En esta competencia, que fue en inglés, se trabajó con 10.000 textos que fueron evaluados por 1.821 anotadores humanos. Cada texto fue puntuado en promedio por 20 anotadores y ninguno tuvo menos de 17 evaluaciones. De esos 10.000, 2.000 formaban parte de una base de datos de bromas breves (la Kaggle Short Jokes Dataset).

De los 2.000 textos humorísticos, la mitad tenía una peculiaridad: “se seleccionaron porque se referían a uno de los objetivos comunes del discurso de odio en redes, por ejemplo, mujeres, miembros de la comunidad LGBT, minorías religiosas/raciales, y ese objetivo era el blanco de la broma”, por lo tanto, se esperaba que pudieran obtener “calificaciones de ofensa de algunos anotadores”. La otra mitad de los textos seleccionados de esa base de datos de bromas breves “se refería a un objetivo del discurso de odio, pero ese no era el blanco de la broma”. Los restantes 8.000 textos fueron seleccionados de Twitter, “de un mix de cuentas humorísticas y no humorísticas”.

Los participantes debieron entonces decir si el texto les parecía humorístico y, en caso afirmativo, calificar de 1 a 5 qué tan gracioso les parecía. En caso de que fuera percibido como humorístico, debían también calificar entre 1 y 5 qué tan ofensivo les resultaba para alguna comunidad o grupo, y qué tan ofensivo les resultaba, de 1 a 5, en lo personal.

También tenían la opción de hacer otra anotación: podían poner “No entiendo” cuando “el texto se identificaba como humorístico, pero no se entendía el humor”. “Las personas pueden ver que la intención era hacer un chiste a pesar de que no lo entiendan, porque tal vez haya algo que no sepan que es necesario para entenderlo”, comenta Chiruzzo sobre este aspecto.

Los resultados de los anotadores humanos fueron analizados en cuatro grupos etarios: de 18 a 25, de 26 a 40, de 41 a 55 y de 56 a 70. También tenían el autorreporte de género de cada anotador (masculino o femenino, hubo muy pocas personas que declararon un sexo no binario y fueron excluidas del análisis justamente por ser demasiado pocas para realizar observaciones con peso estadístico).

“En las primeras versiones de estas competencias que realizamos aquí en Uruguay los anotadores se ofrecieron voluntariamente, y llegaban a través de las redes sociales y nuestros círculos personales. Por tanto, no teníamos mucho control sobre quiénes participaban. Probablemente había muchos anotadores uruguayos, y en particular muchos de la Facultad de Ingeniería, debido a nuestra llegada en las redes”, comenta Chiruzzo. “Eso se podía ver porque el chiste que salió mejor puntuado fue uno que decía que existen diez clases de personas en el mundo: los que entienden los números binarios y los que no”, se ríe Chiruzzo. El chiste es bueno. Y ciertamente tiene cierto sesgo nerd: en la notación binaria, donde cada número se representa empleando ceros y unos, el dos se anota escribiendo “10”.

Para evitar esos sesgos, en este trabajo la recolección de anotadores se hizo de otra manera. “Se utilizó una plataforma mediante la que se contrata el servicio de anotadores, que a cambio de cierta cantidad de dinero, tienen la tarea de hacer anotaciones sobre determinada cantidad de tuits”, dice Chiruzzo. De hecho, cada anotador terminó evaluando un promedio de 111 textos. El anotador que evaluó más –y cobró más– evaluó 307. Al repasar las anotaciones, ciertas diferencias en las puntuaciones de acuerdo al género o la edad comenzaron a emerger.

Diferencias

“Lo primero que hicimos fue preguntarnos si sería cierto que hombres y mujeres les ponían distinta cantidad de puntos a los chistes machistas u ofensivos. Intentamos hacer un montón de pruebas de eso y no parecía que anotaran diferente, por lo menos, en cuanto a puntaje. Entonces, para el momento de la competencia, esos análisis los dejamos afuera y realizamos una competencia clásica tomando el promedio de las puntuaciones”, explica Chiruzzo.

“Pero luego de la competencia se hizo un análisis estadístico un poco más profundo. Y ahí es que se descubrió en este trabajo, cuya autora principal es Julie Anne Meaney, que hay un montón de correlaciones interesantes”, dice fascinado. “Una es esto de que está como cruzado qué tan ofensivo te parece algo y qué tan gracioso te parece. Hay como una especie de correlación inversa: a medida que algo te parece más ofensivo, también te parece menos gracioso. También se vieron diferencias por edades o por género”, cuenta.

Partiendo de la idea de cómo hacer que las máquinas entiendan cuándo un texto es humorístico y, más aún, cuándo siendo humorístico es también ofensivo, llegan a conclusiones que nos hablan del humor y la ofensa en los humanos. Eso es lo que me parece maravilloso. “Sí, este es un artículo de análisis de anotaciones de usuarios humanos”, dice Chiruzzo.

No lo entiendo

Por ejemplo, en el trabajo reportan algunas diferencias que encontraron al ver el género y las veces que los anotadores decían que, pese a darse cuenta de que el texto era humorístico o pretendía serlo, declaraban que no entendían el chiste.

“No hubo diferencias por sexo o grupos de edad en cuanto a la detección del humor. Sin embargo, en lo que respecta a la comprensión del humor, las mujeres seleccionaron “No lo entiendo” con más frecuencia que los hombres”, comunica el trabajo. “Más mujeres que hombres indicaron que no entendieron una broma, y las mujeres de todos los grupos de edad tuvieron tasas más altas de uso de la etiqueta ‘No lo entiendo’ que los hombres de todos los grupos de edad”, agregan. Esto se dio en mayor medida con los chistes de la base de datos de Kaggle, pero “al mirar los datos de Twitter, las mujeres aún admiten que no entienden la broma más que los hombres, pero el efecto es menos pronunciado”.

“Eso se relaciona con otros trabajos sobre el entendimiento del humor, en los que se dice que puede ser que las mujeres fueran más capaces de aceptar que no entendían algo y que los hombres, sin embargo, trataban igual de darle una explicación. Ahí puede haber una diferencia, pero para poder distinguir eso necesitás otros experimentos”, comenta Chiruzzo.

Así es. En el trabajo comentan que en un artículo de 2013, Bell y sus colegas reportan que “cuando se les mostraban chistes incomprensibles, las mujeres tendían a decir explícitamente que no lo habían entendido, mientras que los hombres lo señalaban implícitamente haciendo preguntas de verificación de conceptos”. En el artículo señalan que “no es posible saber si este fue el caso aquí”, pero para contextualizarlo, indican que “los resultados cualitativos revelaron que los hombres mencionaban textos no humorísticos como humorísticos y ofensivos”. ¿Será entonces que las mujeres tienden a no captar algunos chistes o que los hombres tienden a evitar decir “no lo entiendo”? No será este trabajo el que lo responda.

Y entonces hagamos la aclaración de rigor que corresponde: observar diferencias de género respecto del entendimiento de textos humorísticos en un conjunto de personas no necesariamente dice algo sobre si tenemos diferencias procesando el humor. Puede haber una gran cantidad de factores sociales y culturales que estén incidiendo en el asunto. Esto nada nos dice sobre un cerebro para el humor masculino o femenino, sino que nos muestra que hay diferencias en los comportamientos. “Lo que nosotros encontramos fue la evidencia estadística significativa de tal diferencia en las anotaciones. Pero por qué ocurren esas diferencias son cuestiones que habrá que investigar después. Lo mismo pasa con lo que observamos relacionado a la edad, que se consideran más ofensivas ciertas cosas a medida que aumenta la edad”, comenta Chiruzzo levantado el centro para lo que sigue.

Rescatando a los jóvenes

Uno de los resultados más sorprendentes del trabajo no tienen que ver con las diferencias de género sino con las de edad. Desde varios lugares se ha impulsado la idea de que las generaciones más jóvenes son demasiado sensibles, que por todo se ofenden. En inglés, se le dice “generación copo de nieve” (snowflake) por su supuesta vulnerabilidad ante situaciones que no sientan que son políticamente correctas. Pues lo que salta de este trabajo nos recuerda, una vez más, que hacemos mal en agarrárnosla con los jóvenes.

“Los grupos de mayor edad, de 40 a 55 años y de 56 a 70 años, otorgaron calificaciones de ofensa más altas que sus contrapartes más jóvenes, y nuestro análisis cualitativo indicó que los grupos de mayor edad otorgaron calificaciones de ofensa más altas a una variedad más amplia de temas”, reporta el artículo. “Esto contradice la idea tan promocionada de la generación copo de nieve, que sostiene que los nacidos después de 1995 tienden a ser los más reactivos al material ofensivo”, remarcan. El trabajo entonces restablece el orden en el Universo: los viejos nos avinagramos y nos ponemos cada vez más en guardia.

“Eso de que las generaciones más jóvenes tenderían a ofenderse por más cosas es una idea que se ve en la sociedad últimamente. Pero eso no es lo que ocurre en los datos que nosotros tenemos”, comenta Chiruzzo. “Efectivamente, hay una tendencia, las poblaciones más viejas tienden a poner que algo es más ofensivo que las más jóvenes. Eso se repite ajustando por género, lo que contradice esa creencia popular”, remarca Chiruzzo.

Nuevamente, no es algo ni bueno ni malo, sólo una tendencia vista en las respuestas. ¿Encontrar que un chiste es ofensivo, o pensar que puede serlo para otros, es algo deseable o no? ¿Cuánto incide en ello la experiencia de años viendo inequidades? ¿Cómo cambia la experiencia aquello que percibimos como gracioso? Una vez más, el trabajo dispara las preguntas. Las respuestas están en otra parte. Pero, por lo pronto, cuidado con ofendernos por la ofensibilidad de las generaciones más jóvenes que nosotros.

Ofendidas y ofendidos

Otra de las cosas que se observan en este trabajo es una diferencia a la hora de puntuar los textos humorísticos cuando consideran que también son ofensivos. Para las mujeres, tanto si ofende a un grupo lejano o a uno que las afecte personalmente, la puntuación del chiste baja. En el caso de los hombres, eso sólo sucede cuando los ofende personalmente.

“Cuando los hombres marcan algo como ofensivo, generalmente, no necesariamente eso afecta la puntuación de cuán humorístico es el texto. Pero si les resulta ofensivo personalmente, entonces al chiste lo puntúan peor. Las mujeres puntúan menos en ambos casos, tanto cuando es ofensivo en forma general como personal”, comenta Chiruzzo.

En el artículo lo ponen así: “Nuestros hallazgos indican que las mujeres vinculan negativamente el humor con la ofensa, mientras que los hombres sólo lo hacen si se sienten ofendidos personalmente”. Y entonces, vuelven a contexualizar los resultados con otros hallazgos del campo del estudio del humor.

Refiriéndose a la literatura humorística, comunican que “la tolerancia de los hombres al humor agresivo es uno de los hallazgos más consistentes en el campo del humor, con siete de ocho estudios mencionados que replican este resultado”. En cuanto a lo que observaron, “que en los textos en los que hombres y mujeres diferían más en cuanto a ofensas generales, la agresión ocupaba un lugar más destacado para las mujeres”, comentan que quizás pueda estar relacionado por lo reportado por otros investigadores (Proyer y Ruch), que dicen que “los hombres puntúan más alto en katagelasticismo, el placer de reírse de los demás”. Apuntan entonces que “esto puede estarse reflejando en el hecho de que la ofensa general no disminuye las calificaciones de humor de los comentaristas masculinos, sólo la ofensa personal lo hace”. Chiruzzo coincide: “En este set de datos también podría interpretarse que a los hombres, como tendencia, se rían más de las desgracias ajenas, o al menos de cuando la broma es para otros que no son ellos”.

¿Pueden las máquinas soñar con hacerlo mejor que nosotros?

Si bien el trabajo apunta a observaciones estadísticas de los observadores humanos, la preocupación inicial refiere a las máquinas y a la detección automática del humor y la ofensa. Entonces al final señalan que estas diferencias encontradas de género y edad deberían contemplarse.

“Dadas las diferencias de género y grupo de edad en las calificaciones de humor y ofensa, es evidente que los sistemas de detección de humor que promedian las calificaciones de todos los anotadores no logran modelar la subjetividad inherente a esta tarea”, puntualizan. “Es posible que estos sistemas no generalicen bien las tareas posteriores, como la moderación de contenido, y pueden no ser efectivos para moderar contenido agresivo si están adaptados a las preferencias de los hombres o, alternativamente, pueden ser más restrictivos si están ajustados a las preferencias de las mujeres”, complejizan.

Y ya que se trata de la publicación Informáticas Sociales, agregan: “Como han señalado los sociólogos, la línea entre el humor y la ofensa está continuamente bajo revisión en la mayoría de las sociedades, por lo tanto, estas respuestas no sólo son subjetivas, sino que son un objetivo en movimiento. Deberíamos centrarnos en incorporar marcos para incluir el conocimiento demográfico en nuestros sistemas, que se puede actualizar constantemente para reflejar las definiciones cambiantes de humor y ofensa de la sociedad”.

El trabajo llama entonces a prestar atención a los límites que ponemos, porque si hacemos caso a los promedios nos podemos estar quedando cortos o largos. El promedio puede estar cometiendo injusticias para cualquiera de las dos puntas. “Eso es algo que pasa. Cuando se entrenan estos sistemas, por ejemplo, para distinguir si algo es humor, si algo es discurso de odio, hay que tener mucho cuidado con esas cosas, porque se apunta siempre a un promedio y ese promedio puede no ser compartido por todos, por lo que hay que tener en cuenta distintos aspectos”, comenta Chiruzzo.

“Es bueno empezar a tener estos trabajos en los que se propone abrir la cancha y empezar a mirar segmentado por distintas cosas. Había muchas más variables que no tuvimos en cuenta o que no terminamos analizando, como filiación política, ocupación, nivel socioeconómico. Por una cuestión de tiempo se prefirió acotar el trabajo a estas”, dice Chiruzzo mostrando que hay más tela para cortar.

“Tratar de simular esos comportamientos típicamente humanos usando máquinas me parece algo superdesafiante. Hace unos años era casi impensable pensar que una máquina fuera a distinguir si algo es humor o no, o si algo es discurso de odio o si es ofensivo. Hoy en día no sólo es posible pensarlo, sino que hay aplicaciones que ya existen para hacerlo”, agrega. Entones uno le pregunta qué tan buenas son en eso, cómo le vienen pegando en las competencias.

“Todavía no es perfecto y no va a ser perfecto por mucho tiempo, capaz que nunca. Es difícil que las máquinas lleguen al nivel humano en ese sentido”, dice el humano Chiruzzo. También resulta que hoy somos unos 8.000 millones de humanos. Y no estamos muy de acuerdo en muchas de estas cosas.

“Hay que preguntarse también si las máquinas están detectando cosas sutiles del humor o si lo que sucede es que como hay chistes que tienen más o menos la misma estructura, entonces son fáciles de detectar. Por ejemplo, un texto que empiece con 'mamá, mamá' o algo así se detecta por un conjunto de reglas. Estos sistemas no usan reglas, utilizan principalmente redes neuronales y grandes modelos de lenguaje, pero uno sería capaz de escribir un conjunto de reglas para agarrar algunos de los tipos de chistes. No hemos hecho suficiente análisis todavía para saber si los sistemas están agarrando lo más fácil, si detectan el humor en lo más sencillo, si detectan que por la forma tiene que ser humor, o si logran encontrar algo un poco más complejo”, especula Chiruzzo.

“En la competencia de 2018, en esa primera tarea que es de reconocimiento de si los textos son humorísticos, el mejor sistema tuvo 79,7% de performance. En 2019 esa performance subió a 82,1% y en 2021, que fue la última edición, llegó a 88,5%. Es algo que viene subiendo, pese a que no son directamente comparables, porque en cada edición creamos un conjunto nuevo de testeo”, dice Chiruzzo.

¿Podrán las maquinas comenzar a escribir algunos chistes, al menos de esos más formulaicos y no esas piezas delicadas que leen la coyuntura como los de Marcós Morón en “El Faro del Fin del Mundo”? Ya hay máquinas que escriben artículos periodísticos, incluso de opinión. “Las computadoras que escriben artículos ya están. Qué tan buenos son esos artículos es dudoso. Cuando leés el primero decís 'wow, esto es el futuro'. Pero leés algunos más y te das cuenta de lo que está sucediendo”, confiesa Chiruzzo.

“Nosotros no apuntamos a que la máquina genere humor, pero sí ha habido algunos intentos en cosas medio básicas. Hubo una competencia que lo intentaba tomando un titular de prensa y cambiándole una o dos palabras aleatoriamente, luego humanos decían cuándo les parecía gracioso. Con eso intentaban generar un sistema que después agarrara un titular de prensa, le cambiara una palabra o dos, y generara un titular gracioso. No recuerdo qué resultados tuvieron, pero era un intento de generación de humor, aunque fuera de una forma un poco básica. Ahora, generación libre, que algo venga y te cuente un chiste que se le ocurrió de la nada, de eso estamos muy lejos. En vista de los últimos acontecimientos no te voy a decir que no va a pasar en algún momento, pero por ahora no lo veo”. Los dos nos miramos y reímos aliviados. Porque la risa, claro está, aunque las máquinas no lo sepan o sientan, también sirve para aliviar tensiones y reformular temores.

Artículo: “Don’t Take It Personally: Analyzing Gender and Age Differences in Ratings of Online Humor
Publicación: Social Informatics. SocInfo 2022. Lecture Notes in Computer Science (diciembre 2022)
Autores: Julie Anne Meaney, Steven Wilson, Luis Chiruzzo y Walid Magdy.