Si el título de esta nota te llamó la atención es posible que haya sido porque en estas páginas no solemos titular de esta manera. Es posible también que la forma en que está redactado haya tocado tu intrincado cableado cerebral.

La pregunta de qué es un clickbait no sólo tiene una respuesta –que el título sugiere que podrás obtener leyendo la nota–, sino que también podría haberte generado la necesidad de satisfacer la demanda de una información que previamente no tenías. Algo así como el clásico ejemplo de pedirte que no pienses en un elefante. Hecho el pedido, es imposible que un paquidermo no se instale en tu cabeza. Si bien el título informa que un uruguayo logró entrenar a una inteligencia artificial para detectar lo que quiera que sean los clickbaits –y eso puede generar la necesidad de saber cuál de todos los uruguayos lo hizo– también introduce el asunto del cómo. Y por más que no tengamos la más pálida idea de cómo se entrena una inteligencia artificial, es posible que la cosa, así formulada, nos lleve a leer el resto para volver a un equilibrio que la pregunta ha perturbado.

Más o menos, tenemos una idea de qué es un clickbait o, en español, un cebo, señuelo o anzuelo de clics. Más que nada en redes, se trata de una noticia (o su avance) presentada de una manera que busca que hagamos clic para ir a su desarrollo en el respectivo sitio del medio. Reconocerlas, empero, no siempre es sencillo, dada cierta subjetividad al evaluarlas.

Pongamos ejemplos. En el sitio web de El Observador de la mañana del jueves podían leerse algunas noticias que parecerían entrar dentro de la categoría clickbait: “Inumet emitió una alerta amarilla por ‘persistencia de lluvias abundantes’: mirá las zonas afectadas” o “Boom de shoppings en Montevideo: cómo han cambiado en el tiempo y la discusión de si ‘destrozan’ o ayudan a los comercios cercanos”. Otra es un poco más dudosa: “Ajustes de nafta y gasoil: ¿cómo influye la política de precios en las expectativas de inflación de las empresas?”. Tres de los primeros nueve títulos en el momento en el que accedí al sitio podrían etiquetarse como clickbaits. En el sitio de El País, a esa misma hora, pasó lo mismo con tres de las nueve primeras noticias: “Larrarte a prisión: qué dijeron los abogados y qué puede significar en los otros casos sobre fondos ganaderos”, “Horacio Carabelli: quién es el multicampeón uruguayo que está en la élite de las regatas mundiales” y “Uruguay no integra la nómina de países a los cuales Trump postergó aranceles, ¿qué opinan los analistas?”.

En ese mismo momento, en Montevideo Portal, entre las primeras nueve noticias, dos parecían ser clickbait: “FA propone declarar el ‘día del politólogo y la politóloga’: en cuál fecha sería y por qué” e “Inter Miami a semifinales de la Concachampions pese al insólito gol anulado a Luis Suárez”, aunque esta última podría ser dudosa para otras personas. Finalmente, por casa, entre las primeras nueve noticias del sitio de la diaria, había una que parecía cumplir a la perfección con lo que uno piensa que es un clickbait: “Los detalles de la maniobra por la que fue imputado Jairo Larrarte y cómo utilizaba el dinero de los inversores”. Otra, empero, era más dudosa: “Desindexación: ¿herramienta contra la inflación o golpe al poder de compra?

¿Qué es, entonces, un clickbait y qué no lo es? Eso es justamente lo que se propuso dilucidar una reciente publicación titulada algo así como Te ahorré un click: una definición revisada de clickbait y detección en noticias en español. El trabajo, que lleva la firma de Gabriel Mordecki y Guillermo Moncecchi, de la Facultad de Ingeniería de la Universidad de la República, y Javier Couto, del Programa de Desarrollo de las Ciencias Básicas (Pedeciba), como bien dice su título, no sólo define a los clickbaits sino que propone una forma de detección automatizada, es decir, mediante machine learning o inteligencia artificial.

Se trata de un trabajo delicioso. Así que más rápido de lo que uno cliquea en un posteo que dice “Sepa por qué a menudo terminamos haciendo cosas que no queremos hacer”, salimos disparados al encuentro de Gabriel Mordecki, primer autor del trabajo que fue publicado en el libro de resúmenes de la Conferencia Iberoamericana de IA (Iberamia) celebrada en Montevideo en noviembre de 2024 y que se desprendió de su tesis para obtener la maestría en Informática de la Facultad de Ingeniería y el Pedeciba.

El origen de la investigación que seguro no es el que te imaginás

Uno podría imaginar que esta investigación comenzó a gestarse en los corredores del Instituto de Computación de la Facultad de Ingeniería donde funciona el grupo de Procesamiento de Lenguaje Natural. Seguro la chispa inicial saltó por un interés académico. Pero no.

“Hace tiempo, allá por 2012, había visto una cuenta de Twitter de un estadounidense que se llamaba Saved You a Click”, cuenta Gabriel contento de estar una vez más en su facultad (hace tiempo que trabaja para una gran empresa instalada en nuestro país). “En esa cuenta agarraban un clickbait y te contaban la respuesta. Lo hacían de forma muy irónica con artículos de Buzzfeed y ese tipo de sitios en los que la noticia decía algo como ‘cuál es la modelo que hizo no sé qué’ y ellos posteaban, por ejemplo, Kim Kardashian. Esa cuenta me pareció espectacular”, sigue su relato. Lo que hacía y sigue haciendo esa cuenta de la actual red X es, en cierta manera, espoilear el clickbait.

“A raíz de eso empecé a prestar atención a ese tipo de títulos. Y al tiempo creé la cuenta de Twitter, Te ahorré un click, donde junto con mi pareja, Verónica, hacemos lo mismo que la cuenta Saved You a Click pero con cosas de Uruguay”, dice Gabriel.

Por ejemplo, si uno entra a Te ahorré un click puede ver que al clickbait de la cuenta FútbolUy que dice “La nueva prohibición de Conmebol a Peñarol para el partido de esta noche en el CDS”, la respuesta es “No sólo no puede ingresar público locatario, tampoco se puede colgar banderas”.

Foto del artículo '¿Qué son los clickbaits y cómo un uruguayo entrenó una inteligencia artificial para detectarlos y, tal vez, espoilearlos?'

O que al clickbait de la cuenta en X del diario El País que decía “Quién es Ximena Grignoli, la mujer que increpó a Mujica en evento por los 40 años de democracia”, el posteo de Te ahorré un click responde “Ximena Grignoli. Familiar de los exmilitares Alberto Grignoli, con pedido de procesamiento con prisión por torturas en el Batallón Florida durante 1972, y de su hermano Washington Grignoli, procesado por desapariciones forzadas. Es Vocal del Partido Colorado y milita con Ojeda”.

Foto del artículo '¿Qué son los clickbaits y cómo un uruguayo entrenó una inteligencia artificial para detectarlos y, tal vez, espoilearlos?'

¿Cómo terminó aquel vicio lúdico convirtiéndose en tema de investigación para una tesis académica? Cuando Javier Couto convenció a Gabriel para que hiciera una maestría. “Mientras estaba buscando tema para la tesis, en 2019, una persona contestó un tuit de Te ahorré un click, arrobando a otra persona y preguntándole si nuestra respuesta estaba generada por un bot”, cuenta Gabriel. Un bot es un programa que hace posteos imitando a un humano. “La persona arrobada contestó que seguro que nuestro posteo respondiendo al clickbait era generado por un bot y yo me maté de la risa, porque en la cuenta contestamos no solamente con extractos de texto, sino también con ironía o humor, cosas que no son fáciles de hacer artificialmente o automáticamente”, suelta volviendo a reír Gabriel. Pero luego de reírse, cuenta, se quedó pensando. “Y entonces se me vino la idea de la tesis, que originalmente consistía en contestar de forma automatizada los clickbaits en Twitter, no en detectarlos, que es lo que terminó siendo”. Tan epifánico fue aquel posteo, que en los agradecimientos de su tesis Gabriel pone “a la persona detrás de aquella cuenta anónima de Twitter que insinuó, allá por 2019, que la cuenta de @TeAhorre1Click era un bot sencillo de replicar, y de esa forma inspiró la temática de esta tesis”.

“Es que sí, mi idea era hacer exactamente lo que el tipo dijo que estábamos haciendo”, vuelve a reír Gabriel. Pero claro, tras aquella inspiración, vino la etapa de trabajo.

“Me puse a averiguar y no había nada hecho sobre el tema. Por otro lado, era muy difícil generar esa respuesta que yo buscaba. Entonces Javier Couto, uno de los tutores de mi tesis, me dijo que eso era tema para un doctorado y que hacer una maestría con ese tema no estaría bien”, cuenta reviviendo un poco de la frustración que lo invadió entonces. “Fui bastante terco, lo intenté y lo intenté, pero realmente estaba difícil lograrlo”, dice hoy con la sabiduría que permite la perspectiva temporal. “Así que terminé haciendo la tesis abarcando solamente la detección automática de los clickbaits”.

En todos los aspectos de la vida, el tiempo importa. Pero en el área en la que se mueve Gabriel parece importar más. O al menos, pasar vertiginosamente más rápido. “Sí, desde que comencé a ver esto a ahora la tecnología ha cambiado mucho”, reconoce. “Cuando tuvimos esa conversación con Javier, que fue dura para mí, una de las cosas fue ver qué tipos de respuestas había para los clickbaits. A veces precisás responder con un nombre, con una fecha, con un dato, con un sí o un no, a veces precisás responder con una lista y a veces precisás hacer un resumen de todo el artículo. Y hacer un resumen de un artículo, en 2020, era algo extremadamente difícil. Para Javier eso de hacer un resumen era ya de por sí una tesis de maestría por sí misma”, confiesa.

Pero el tiempo, en lo que refiere a modelos de lenguaje, vuela. “Hoy en día, le das el artículo a ChatGPT y te lo resume bárbaro. Y si lo decís que lo haga en 280 caracteres, que es lo que entra hoy en un posteo de X, lo hace de forma espectacular. Pero eso en el momento en que pensaba mi tesis no existía”, señala Gabriel.

Así que una especie de cuenta paródica, las ganas de jugar, divertirse, terminó dando forma a la investigación que consistió en ver si podría automatizarse la detección de clickbaits en cuentas de medios de prensa en la red Twitter (actual X). Y todo ello lo llevó a ver cosas que tienen que ver con el periodismo, con cómo leemos, la neurociencia de la curiosidad y el apetito de información.

Los insólitos contratiempos que obligaron a Gabriel a ir de adelante para atrás

Gabriel cuenta que tuvo que ir haciendo la tesis “de atrás para adelante”. ¿Cómo es eso? “Empecé con la idea de responder automáticamente a los clickbaits. Pero para hacer un programa que responda espoileando un clickbait, primero el programa tiene que detectar cuándo está ante uno. “Al ir a ver qué había sobre detección de clickbaits, cuando arranqué con esto, no había prácticamente nada. Ahora hay bastante más”, señala. Pero aun así, si de detección automatizada de clickbaits no había casi nada, sobre la detección en español Gabriel encontró un páramo.

“En español no había nada. Había bastante en inglés, como siempre, pero había cosas en búlgaro, en ruso, en varios idiomas de India, pero nada en español, al menos hasta que el año pasado salió un primer trabajo. Y eso me sorprendió porque el español, por lo general, es el tercer o el segundo idioma que sale cuando uno hace este tipo de búsquedas sobre detección automatizada. Así que mientras hacía la tesis tenía miedo de que alguien sacara algo sobre esto en español y me matara. Pero por suerte eso no pasó”, respira aliviado.

“Después, en esto de ir de adelante para atrás, me di cuenta de que para lograr una buena detección, primero había que definir bien qué era un clickbait. Me puse a leer definiciones y encontré que no tenían mucho que ver entre sí, así que caí en la cuenta de que iba a tener que proponer una. Y para proponer una definición me puse a leer más y más, y terminé en ese mundo de la psicología, el cerebro y demás”, reconoce Gabriel con entusiasmo.

Pero entonces ¿qué maldita cosa es un clickbait?

En su tesis lo define así: “El clickbait es un método para generar avances de noticias, especialmente online, que consiste en omitir deliberadamente parte de la información con el objetivo de generar curiosidad mediante una brecha de información y así atraer la atención de los lectores y conseguir que hagan clic”.

En el artículo señala que la definición propuesta “refiere a la creación deliberada de una brecha de información”. Pero dado que no se puede “discernir la intención del autor”, proponen una “definición operativa” con la que luego él y sus dos tutores etiquetarían el conjunto de datos con el que entrenarían al modelo de aprendizaje automático (sobre esto hablaremos con más detalle más adelante). Esa definición que deja de lado lo gris de adjudicar una intención al autor entonces pasa a ser “avances que omiten parte de la información no obvia por el contexto, lo que despierta la curiosidad e incita a los usuarios a hacer clic”.

Así las cosas, Gabriel se para en el hecho de que el clickbait en cierta manera crea la demanda que procura satisfacer. Y a veces esa demanda no es satisfecha, lo que genera cierta decepción. “Como el proceso de hacer la tesis fue largo, otra cosa que pasó también fue que cambió un poco el clickbait”, agrega.

“Hay muchas definiciones que están paradas en un momento en el que el clickbait lo hacían medios súper sensacionalistas y con noticias más de farándula y esas cosas, como Buzzfeed y demás. Entonces hay muchas definiciones del clickbait que dicen que son noticias basura. Pero eso cambió y lo que me empezó a molestar, por decirlo de alguna forma, fue empezar a ver clickbait no en noticias de esas, sino en las páginas de casi cualquier medio del mundo occidental”, sostiene. “Por lo menos de los que yo conozco, 70% de las cosas en redes son clickbait. Desde hace un tiempo no se usan sólo para hablar de modelos, de deporte u otras cosas que podrían considerarse soft news o información poco relevante. Son las noticias del día en modo clickbait”, apunta Gabriel. Y entonces muchas definiciones fueron quedando viejas. “Cuando me puse a hacer la tesis se estaba dando justo esa transición”.

Clickbait: malo de por sí o cómo no todo es blanco y negro

En el trabajo hay algo que refleja este cambio del que habla: según su definición, no necesariamente el clickbait es malo.

“Yo empecé pensando que sí. Pero en realidad hay discusiones que creo que vale la pena atender. Los periodistas cuando escriben una noticia quieren que la gente la lea y se difunda. Y eso está bien. En ocasiones, para eso el clickbait funciona. Parte de la explicación psicológica en la que me metí, que es la de la brecha de la información, explica por qué funciona”, apunta.

En el trabajo sostienen que “la teoría de la brecha informativa, que explica el surgimiento de la curiosidad, no sólo es relevante, sino que también constituye la diferencia fundamental entre el clickbait y otros fenómenos relacionados, como el sensacionalismo. Su esencia no reside en el contenido de las noticias, el lenguaje empleado ni en la generación de decepción: más bien, se trata de ocultar información para provocar curiosidad”.

Citando al investigador George Loewenstein, el trabajo señala que la curiosidad es “una forma de privación cognitivamente inducida que surge de la percepción de una brecha en el conocimiento o la comprensión”. Gabriel añade en el trabajo que, según la literatura, “es más intensa cuando sabemos algo sobre un tema, pero no todo, precisamente lo que el clickbait pretende generar”. Y así las cosas, “cuando surge la curiosidad, tiene efectos en nuestros mecanismos neurocognitivos, al igual que la búsqueda de comida o dinero, creando un fuerte impulso para actuar, incluso involuntariamente”, dice amparándose en investigaciones sobre la curiosidad. Y aún más: esa curiosidad “puede llevarnos a buscar información irracionalmente, incluso cuando no es instrumental, o es irrelevante, o incluso perjudicial, especialmente cuando podemos obtener las respuestas de inmediato y a bajo costo”.

“Esa brecha de información que se genera entre lo que te dice el titular y lo que no te dice genera una curiosidad tal que no podés evitar hacer clic. Cuando leí eso me sentí muy identificado”, confiesa. “Muchas veces me encuentro cliqueando y leyendo cosas que luego me pregunto por qué las estoy leyendo si eso no me interesaba. Capaz que la respuesta a tu pregunta de por qué estudiar esto, incluso de por qué iniciar Te ahorré un click, es que caigo mucho”, admite poniéndole el cuerpo a su ciencia.

“Originalmente pensaba que el clickbait era malo de por sí, pero hoy como que entiendo un poco más la necesidad que hay detrás. Aun así, como consumidor no me parece que sea algo bueno”, agrega.

“Pero también te encontrás con noticias que tienen más información que la que el clickbait te hace ver, y que al leer la noticia ves que está buena, que es información de calidad, simplemente está formulada en forma de clickbait y destaca un aspecto que es el que uno pondría en su tuit si fuera a hacerle el espoiler”, relativiza un poco.

“Igual yo lo siento como una especie de engaño, en el sentido de que están apelando a algo que no puedo evitar”. Le digo que de cierta manera uno se siente manipulado. “¡Esa es la palabra! Me siento manipulado, pero eso lo relativicé bastante en la lectura de posturas”, afirma.

Estos son los criterios que necesitás para detectar clickbatis

En el trabajo establecen una serie de criterios a usar a la hora de detectar un clickbaits. Los emplearon para la clasificación humana de su base de posteos en Twitter de medios en español. Y algunos de esos criterios van en contra de posturas más antiguas sobre qué era un clickbait y qué no. Por ejemplo, que “no todo sensacionalismo es clickbait”, que la “adjetivación intensa puede provocar clickbait” pero no siempre, que “las preguntas pueden generar clickbait” pero no todas lo son, que “algunas apelaciones al lector/a pueden generar clickbait” o que “algunos editoriales pueden ser clickbait”.

“La evaluación de qué es un clickbait o no sigue siendo subjetiva. Incluso con mi definición. De hecho, con Guillermo nos seguimos peleando cada tanto porque me dice que tal cosa no es clickbait y yo voy, me fijo en la clasificación que hicimos para este trabajo y le digo que a eso mismo hace un año lo etiquetó como uno. Y a mí me pasa también. De repente hoy veo algo que digo que no estoy seguro si es y capaz que lo miro mañana y digo que sí. Y después lo miro de nuevo y digo que no. En la gran mayoría no hay dudas, pero hay una zona gris donde es difícil marcar el límite”, comenta Gabriel.

“La búsqueda de la definición pasó por ver cuál era la clave. Que tenga una pregunta no es necesariamente parte de lo que define un clickbait. Obviamente miré muchísimos titulares y encontré varios ejemplos, muchos están en el trabajo, casos en los que es clarísimo que la pregunta no implica un clickbait”, sostiene. “Por ejemplo, me acuerdo de uno de Ovación que decía algo así como ‘¿Dónde estabas cuando Milton Wynans ganó la medalla?’. Ahí cualquier persona se da cuenta de que no va a estar la respuesta a esa pregunta. No es un clickbait, pero si tomás la mayoría de definiciones que había sobre lo que es un clickbait, ese ejemplo entraría de cabeza”, explica. En el trabajo señala que ese caso es diferente de aquellos en los que “la respuesta sí se puede obtener pero se oculta del titular, como en ‘¿Cuál es la forma correcta de acariciar a tu gato? La ciencia tiene la respuesta’”, que entonces sí es un clickbait.

Tres cosas importantes que tal vez no sabías del aprendizaje automático

Ya Gabriel habló de entrenar a su modelo. Y eso lleva a otra parte importantísima de su trabajo. Uno habla del aprendizaje automático, de machine learning, y tal vez haya quienes piensen que eso es algo que las máquinas hacen solas. Pero para entrenar un algoritmo es necesario curar un conjunto de datos. Y eso lo hacen los humanos. Al menos por ahora.

En su trabajo reporta que hicieron el primer conjunto de datos con clickbaits en español sobre la base de 3.500 entradas sospechosas de medios en español. Tres humanos los calificaron –Gabriel y sus dos tutores– y, gracias a su definición, obtuvieron un coeficiente Kappa de Fleiss de 0,825. Ese coeficiente mide el acuerdo al que llegaron los distintos evaluadores, y en este caso es de los más altos reportados a la hora de clasificar clickbaits (en la literatura esos coeficientes oscilan entre “0,36 y 0,73 para anotaciones binarias”). Y eso es un tema esencial de la inteligencia artificial: con un conjunto de datos con una discrepancia mayor entre los anotadores, la inteligencia artificial va a detectarlos con una menor resolución.

“Sí, o con otra definición distinta de la que vos tenés en tu cabeza. Eso tiene un nombre, sesgo de automatización, que es un sesgo que tenemos los seres humanos de pensar que las cosas automatizadas tienen razón. Lo veo muchísimo con esas notas del tipo ‘qué dice la inteligencia artificial sobre tal o cual cosa’”, cuenta Gabriel.

Sin ir más lejos, el día que hicimos la nota se había desatado la polémica por los dichos de un piloto de carreras argentino que dijo algo así como que el mate era algo argentino que los uruguayos habíamos copiado. Un diario de nuestro país sacó un artículo cuyo titular en el sitio era “¿Qué dice la inteligencia artificial sobre el origen del mate?”.

“La inteligencia artificial te va a repetir lo que haya en sus textos de entrenamiento. Y como los modelos de lenguaje son probabilísticos, capaz que si le preguntás tres veces, en dos te dice que el mate es argentino y en una uruguayo, o al revés. Estás confiando en una respuesta sola como si fuera la verdad absoluta, pero no es la verdad absoluta. Pero además, los modelos lo que hacen es aprender de su cuerpo de datos de entrenamiento”, explica Gabriel.

“ChatGPT se supone que se entrena con todo internet. Pero después te tenés que poner a pensar qué es todo internet. ¿Cuánto de ese texto está en inglés? ¿Cuánto viene de Estados Unidos y Europa? ¿Cuánto viene de África o de América del Sur? ¿Cuánto viene de Uruguay y cuánto de Argentina? Y como ese sesgo, hay millones”, detalla. “Un programa que aprenda, idealmente, lo que hace es repetir tu forma de etiquetar. Y tu forma de etiquetar depende de lo que vos estés etiquetando. El programa va a replicar lo que vos hiciste. Y por eso tener buenos sets de datos es crucial”, enfatiza.

El set de datos que armaron con noticias en español y clickbaits, llamado TA1C, está ahora disponible. Cualquiera lo puede bajar y usar como insumo para entrenar algoritmos de detección de clickbait, tanto para un trabajo académico como para chivear, tanto aquí como en España, Colombia o Argentina.

“Sí, bueno, nos estamos presentando a IberLEF 2025, una conferencia iberoamericana de competencia de sistemas de Procesamiento del Lenguaje Natural, para hacer un desafío y que gente se anime a empezar a usarlo. Y sí, el set es totalmente libre”, afirma Gabriel.

Los uruguayos que superaron a ChatGPT

En su trabajo de adelante para atrás, Gabriel y sus colegas definieron para detectar, después curaron un set de datos y después entrenaron a varios modelos de aprendizaje automatizado, toqueteando varios parámetros, para ver cuál obtenía los mejores resultados. Le digo que no sé cómo lo hará el nuevo ChatGPT, pero me alegró ver que en su trabajo la versión de entonces no logró identificar los clickbaits tan bien como otros modelos que ellos entrenaron. “A mí me alegró mucho también”, ríe Gabriel. “En eso también incide todo esto de que fue un proceso largo”, ataja, de todas formas.

“En Iberamia hubo una charla buenísima sobre generación de video de José Lezama, que es un fenómeno que trabaja en Google. Y yo me reía porque el tipo habló de un artículo que generó un video, lo mostraba y decía que no era muy bueno porque era un algoritmo medio viejo. Y vos mirabas el trabajo y era de 2023. ¿En qué otra área de la ciencia va una persona a pararse en una conferencia y decir que un artículo del año pasado es viejo? ¿Y más aún, que todo el mundo diga que sí, que es viejísimo? Pero sí, quedó viejo. Hay dos o tres trabajos posteriores que generaron videos que efectivamente se ven mejores. Es una locura. Entonces en ese tiempo pasaron muchas tecnologías”.

En el trabajo ChatGPT4 obtuvo una precisión promedio de 49% de detecciones correctas en el set de datos. Modelos entrenados por Gabriel y compañía, como el Modelo Afinado Beto, obtuvieron una precisión promedio de 90%.

“Lo que hice con ChatGPT se podría refinar muchísimo más; hice lo básico, que fue tirarle la tarea medio así nomás. Y en realidad le fue muy mal. Creo que eso tiene que ver con que el dataset de entrenamiento de esos lenguajes lee como clickbait cosas que no son lo que yo estoy diciendo que es clickbait. Esa diferencia de definición puede que sea lo que hace que no le vaya bien. Está buscando una cosa y yo estoy buscando otra y le estamos llamando igual a las dos”, explica Gabriel.

Le pregunto si hay una interfaz o aplicación que podamos usar para detectar automáticamente si estamos ante un clickbait. “Pensaba hacer una app pública que se pueda usar por cualquiera, pero no llegué. Lo que sí está es el código para generarla. No fue por falta de voluntad que no la hice, sino porque no sabía si alguien la iba a usar. Como hacer algo así lleva tiempo, me terminé centrando en escribir la tesis”, señala Gabriel.

Increíble: vea cómo los algoritmos entrenan a los humanos

Los medios están tratando de que les den clics. Y dado que el mundo de los algoritmos de las redes no es explícito en todos sus términos, hacen lo que pueden o entienden que les traerá más tráfico dadas las actuales circunstancias. Es decir, no alcanza con tener una noticia bien escrita, también hay que lograr que la gente llegue a ella a través de Google y sus algoritmos que le muestran contenidos a la gente, o de los que usan redes como X, Instagram, Tic Toc y demás. Dadas las “reglas” de lo que funciona para posicionarse en los buscadores, se da entonces una paradoja: los algoritmos de estas grandes corporaciones parecen estar entrenando a los medios sobre cómo dar a conocer sus contenidos. La inteligencia artificial entrenada por nosotros ahora nos entrena con el viejo sistema del premio y el castigo. Clic o morir podría ser la premisa que está detrás de este aumento del clickbaits que Gabriel, dice, viene notando en los últimos tiempos.

“Me encantaría que alguien que sepa del tema, algún sociólogo, periodista o alguien más de humanidades, haga un trabajo al respecto para leerlo, porque yo no me siento capacitado para hacerlo. Pero sí hay una cosa que vale aclarar: que los medios busquen llamar la atención no es algo nuevo ni de internet. Ya por el 1900 surgió la prensa amarilla y después los tabloides. De cierta manera se buscaba lo mismo, que cuando las personas iban caminando por la calle, miraran la portada de los diarios en el quiosco y el titular o la foto les llamaran la atención. Eso no es nuevo”, sostiene.

“Creo que en el medio hay un tema de incentivos económicos. Y hoy en día el incentivo económico es a que te cliqueen y a que vayan a tu sitio. Y además, hoy en día la competencia por la atención es brutal, y la gente consume mucho más noticias por agregadores, ya sean redes sociales o Google directamente, que entrando directamente en los sitios de los propios medios”, afirma Gabriel.

“Si vos supieras que la gente entra a la diaria y lee todas las noticias, no tendrías que hacer clickbait. La gente entra, ya está en tu sitio y va a elegir las noticias que más le interese leer, que es básicamente lo que hacían cuando leían el diario en papel. Pero hoy la gente en general no consume los medios así, los consume en Twitter, donde vos tenés la diaria, y abajo El País y arriba El País de Madrid. Y en ese mundo tu medio gana solamente si lo cliquean. Así que hay un gran incentivo para generar clics. Eso es muy claro. ¿Cómo cambiar estos incentivos? No lo sé”, se encoge de hombros Gabriel.

Somos lo que cliqueamos

Mientras conversamos con Gabriel, le tiro que a mí me resultaría profundamente interesante contar con un programa que entrara a un medio y automáticamente contara cuántos titulares son clickbaits. Sobre esa base uno podría poner algo así como octógonos de exceso de cebos de clics. “Sí, pero a veces comprás productos que tienen tres octógonos y te los comés igual. Eso está hecho para que te guste. Vos sabés que está mal, pero es rico”, ríe Gabriel.

Tiene toda la razón. A veces también queremos eso. Como decía el investigador sobre alimentos Gastón Ares, nadie come un chocolate pensando en que está ingiriendo un alimento altamente nutritivo. Y eso nos lleva a otro lado: aunque tengan una responsabilidad un poco limitada, también los clics que damos configuran el mundo en el que nos movemos. No es que los consumidores estén en pie de igualdad con las grandes tecnológicas que imponen sus reglas y algoritmos en las redes, pero quien cliquea tiene una diminuta parte del poder.

Lo de los octógonos y cosas hechas para que te gusten no está traído de los pelos: más en la tesis que en el artículo, las metáforas sobre alimentación y clickbait son abundantes, tanto en la literatura al respecto como en reflexiones del propio Gabriel. “Shin y Kim (2019) explican que ‘el hambre (incertidumbre) debida a falta de comida (información) estimula el apetito (curiosidad), lo que conduce a un comportamiento de búsqueda de alimentos (búsqueda de información) y saciedad (satisfacción) cuando se consume comida (se llena la brecha de información)”, dice el trabajo.

“Así como el apetito es el deseo de comida para reducir la incomodidad psicológica del hambre, la curiosidad es el deseo de información para reducir la incomodidad psicológica de la falta de certeza”, señala en el trabajo Gabriel. Y va más lejos: “Profundizando la metáfora, podría pensarse en el sensacionalismo como la comida chatarra del mundo de la información: son noticias de fácil consumo, seductoras a la vista y que calman el apetito sin dejar mucho valor (nutricional o informacional). De hecho, el término junk food news fue acuñado en 1983. Y en este contexto el clickbait se puede comparar con la publicidad de comida que apela a seducir al consumidor con imágenes tentadoras para generar apetito”.

En la tesis también se señala que “así como ver u oler comida que nos gusta puede generar apetito pese a ya haber comido suficiente, las brechas de información generan curiosidad sobre información que no nos es relevante”, y que “así como la comida es más atractiva cuando alguien tiene hambre, la información es más valiosa cuando es óptimamente incierta”. Y más aún: “desde el punto de vista neurobiológico, la investigación ha demostrado que el cerebro reacciona ante la información como ante una recompensa neuronal”. La información activa también los mecanismos de recompensa, como el azúcar, el sexo y otro puñado de cosas.

“Sí, es fascinante. Me metí a leer un montón de estudios que no eran sobre clickbaits sino sobre la curiosidad. Y al leerlos me decía que eso era exactamente lo que yo siento al leer clickbaits. Era muy obvio que estaban hablando de esa generación de curiosidad”, reconoce Gabriel.

“El apetito no es lo mismo que el hambre. Vos precisás comida para vivir y tenés hambre cuando precisás comida, pero podés tener apetito cuando no tenés hambre, por ejemplo al ver una comida atractiva que hace que segregues jugos gástricos. Nuestro cerebro evolucionó para buscar información porque la precisamos para vivir, pero la curiosidad no es el hambre, es el apetito. Se te puede despertar en momentos en los que no te reporte nada o cuando no necesites esa información”, apunta.

Y ahí es donde entra eso de la manipulación. Están usando nuestro cableado neuronal, desarrollado durante cientos de miles de años de evolución –si tomamos sólo la de nuestra especie– para que terminemos haciendo clic en cosas que en realidad no nos interesan. “Si para hacerme leer qué dice no sé quién que va a pasar mañana cuando ya sé que el tarot no funciona. ¿Por qué estoy leyendo qué dice que va a pasar mañana? No me interesa, pero lo estoy leyendo. Yo me sentía en esa situación y al leer sobre la brecha de curiosidad, decía que era justamente eso lo que estaba detrás, eso era lo que me hacía leer cualquier cosa”, resume Gabriel.

Por eso, siguiendo las metáforas alimenticias, podemos decir que en parte somos lo que cliqueamos. Trabajos como el de Gabriel, Guillermo y Javier nos permiten hacer clic no sólo en comida chatarra sin nutrientes. Gracias a su inquietud por entrenar inteligencia artificial, entendemos un poco más de la nuestra.

Artículo: Te Ahorré Un Click: A Revised Definition of Clickbait and Detection in Spanish News
Publicación: Advances in Artificial Intelligence – Iberamia 2024. Lecture Notes in Computer Science (febrero de 2025)
Autores: Gabriel Mordecki, Guillermo Moncecchi y Javier Couto.

Tesis: Te ahorré un click: caracterización y detección automática de clickbait en español (diciembre de 2024)
Autor: Gabriel Mordecki
Tutores: Guillermo Moncecchi y Javier Couto.

De acá en más

Gabriel sigue trabajando con los clickbaits procurando ahora una forma de responderlos automáticamente para hacer el espoiler que hacía en su cuenta Te ahorré un click. Uno podría pensar que lo hace como parte de su doctorado o de su carrera académica. Pero no. “Lo hago por amor a la ciencia”, dice feliz.

“Después de Iberamia estuve hablando con la gente del grupo de Procesamiento de Lenguaje Natural de la Facultad de Ingeniería, que los conozco a todos. Se venía IberLEF 2025, el Iberian Language Evaluation Forum que organiza la Sociedad Española para el Procesamiento del Lenguaje Natural, que realiza desafíos varios”, cuenta.

“En esos desafíos se presenta un set de datos y se abre un desafío para trabajar con ellos, al tiempo que se guarda un data set oculto al que se le realizó un etiquetado, en este caso, de respuestas a clickbaits. La gente se presenta, manda su modelo, los organizadores del desafío lo corren con el set oculto, y allí se ve qué modelos se aproximan más a ese etiquetado humano que se realizó. Luego sale una publicación con las estrategias empleadas por los participantes”, explica Gabriel.

“La semana pasada salieron dos desafíos basados en esto. Uno es de detección de clickbaits, para el que el dataset de entrenamiento son los 3.500 posteos que hice para mi tesis, más otro desafío de generar respuestas a clickbaits, para el que vamos a etiquetar unas 400 respuestas”, adelanta.

El desafío según aparece en la página de IberLEF se llama “TA1C: Te Ahorré Un Click - Detección y spoileado de clickbait en español” y es organizado por Gabriel Mordecki, Guillermo Moncecchi, Luis Chiruzzo, Santiago Góngora, Ignacio Sastre, Aiala Rosá, Juan José Prada y Rodrigo Laguna. Allí la tarea consiste en “detectar automáticamente instancias de clickbait en redes sociales y generar textos cortos que arruinen el clickbait”. ¿Qué se entiende por espoilear o arruinar el clickbait? Eso implica “satisfacer la curiosidad respondiendo a la falta de información. De esta forma, el lector tiene toda la información y puede decidir leer el artículo completo basándose en su interés y no en la curiosidad, como si el titular estuviera escrito de forma tradicional”.

“Todo esto es en parte porque me quedé con la espinita de concretar mi idea original, que era la de responder a los clickbaits. Llevaba tiempo, pero me quedé con la idea de hacer eso en algún momento”, confiesa Gabriel.

Tiemblen los redactores de clickbaits: del próximo IberLEF, que se realizará en setiembre en la ciudad española de Zaragoza, emergerá una inteligencia artificial entrenada por gente hastiada de los clickbaits para espoilearlos a mansalva. Entonces podremos ahorrarnos muchísimos clics.

.