Estandarización silenciosa

Detrás de cada texto generado por inteligencia artificial se esconde una firma invisible: el resurgimiento de estructuras retóricas que Cicerón habría reconocido al instante. Una estandarización silenciosa amenaza la diversidad lingüística.

¿Cómo identificar un texto generado por ChatGPT o cualquier otro programa equivalente? Docentes, editores o periodistas, entre otros profesionales, se ven cotidianamente enfrentados a esta pregunta. Una respuesta consiste en detectar las formas lingüísticas recurrentes que utilizan dichas herramientas. Hay formas que parecen estar inspiradas por el arte oratorio latino y cuya omnipresencia introduce el riesgo de alterar la diversidad del lenguaje, uniformizándolo.

De manera discreta pero generalizada, hay un ritmo singular que se impone en numerosos textos producidos y difundidos en el universo digital. Lo volvemos a encontrar en las redes sociales, en las entradas de los blogs y a veces incluso en los artículos periodísticos, en inglés, en francés y en muchas otras lenguas.

Esta nueva “firma” se apoya en el uso recurrente de dos figuras estilísticas elementales. La primera consiste en encadenar dos frases cuyo sentido contrasta según una estructura del tipo: “No es esto sino más bien aquello”, o incluso “No es sólo... sino también...”. Una instala una espera, una hipótesis o una creencia; la otra la derriba. Denominemos a esta figura un díptico pivote.

La segunda estructura descansa en un ritmo ternario: una secuencia de tres proposiciones que se intensifican o se completan. Se puede tratar de tres verbos, de tres frases breves o de un ascenso progresivo en tres etapas hacia una idea más densa: “es un sistema que constriñe, que refuerza, que acerroja...”. Denominémoslo simplemente tríptico rítmico.

Veamos por ejemplo una secuencia formada por dos dípticos pivote: “Figuras como Sam Altman, Elon Musk o Peter Thiel no se conforman con dirigir empresas tecnológicas; modelan activamente políticas públicas y visiones de futuro. Su poder no reside solamente en su riqueza, sino también en su capacidad de definir lo que se percibe como inevitable o deseable”. Este extracto proviene de un texto generado por el modelo de lenguaje GTP4o usado por ChatGPT, luego de la siguiente orden: “Escribir una entrada de blog a partir del contenido de un artículo de Evgeny Morozov que está en el siguiente link”¹. Por supuesto, estas frases no figuran en el texto original, que no contiene ningún díptico pivote.

Si reiteramos el pedido, el nuevo escrito generado por GPT implica desde la primera frase un díptico pivote y, algunas líneas más adelante, un tríptico rítmico: “Ellos ya no se conforman con financiar la innovación. Quieren escribir la historia. Y no cualquier historia: la suya. En Silicon Valley, un nuevo tipo de actores se impone en el debate intelectual global: los intelectuales-oligarcas. ¿Su ambición? Redefinir lo que significa vivir, trabajar, pensar... en la era de la inteligencia artificial”. Una tercera versión de la entrada incluye un díptico pivote que implica en sí mismo un tríptico rítmico: “No se trata de rechazar en bloque toda idea nacida en el ámbito de la tecnología, sino de reintroducir el pluralismo, el debate, el disenso”. Cada cual puede repetir esta sencilla experiencia y constatar por sí mismo la presencia constante de estas dos figuras estilísticas en la mayor parte de los textos generados.

Lenguaje (des)enriquecido

Estas estructuras, sin duda, parecen familiares, como las sucesiones de acordes escuchados desde la infancia. Suenan a la manera de un eslogan y se graban en la memoria. “Lo que cuenta no es el destino, es el camino”. “Vine, vi, vencí”.

Sus orígenes se remontan, al menos, a la retórica latina. Cicerón, por ejemplo, explicaba el uso de las estructuras compactas y simétricas que alternaban oposiciones tesis/antítesis, y de las enumeraciones ternarias denominadas tricolones. Ya en la Antigüedad, los dípticos pivote y los trípticos rítmicos constituían una gramática estilística mínima capaz de organizar discursos cortos y contundentes. Uno crea un balanceo narrativo; el otro instala un aumento de la intensidad.

En las plataformas digitales, algunos textos están casi totalmente construidos con estas dos estructuras, como si provinieran de un procedimiento combinatorio que se apoya en un conjunto restringido de operaciones: una introducción armada en base a un ritmo ternario, seguida de un díptico pivote, a su vez encadenado con un segundo díptico cuyo final integra un nuevo tríptico, y así sucesivamente. Esta sistematicidad mecánica constituye un indicio fiable de generación algorítmica. Porque semejante homogeneización formal se deriva del proceso mismo de aprendizaje de los modelos de lenguaje, que se basa en la compresión estadística de amplios corpus textuales a fin de optimizar la predictibilidad de las secuencias que siguen. Esta técnica tiende a producir formas lingüísticas recurrentes —denominadas “atractores”— hacia las cuales la máquina tiende a volver espontáneamente.

En este estadio de nuestra comprensión, sigue siendo todavía un misterio que la compresión y el tratamiento estadístico de las masas textuales utilizadas para el aprendizaje hagan resurgir estas formas retóricas. Como si la influencia del arte oratorio latino hubiera sido redescubierta por el modelo en miles de millones de extractos, una estructura subyacente, invisible, pero fundamental en el orden del discurso, y que hoy se puede usar como patrón para generar textos calibrados para interesar al lector.

Evidentemente, la ausencia de estas figuras no garantiza el origen humano de un texto. Es perfectamente posible obligar a un modelo lingüístico a evitar los atractores más visibles, prohibiéndole, por ejemplo, el uso de dípticos pivotes o de ritmos ternarios. Pero al hacerlo sólo se desplaza el problema: la secuencia producida recae de forma espontánea en otros atractores simplemente menos frecuentes. Ningún texto mediado por un modelo de lenguaje escapa a la influencia de los paisajes estadísticos.

Esta regularización de la lengua era previsible. Es el resultado de la lógica económica de acumulación, modelización y mediación propia del capitalismo lingüístico². El hecho de que se puedan identificar a simple vista estas dos figuras, ciertamente anecdóticas en sí mismas, tal vez sea indicativo de un proceso de recomposición textual de gran alcance.

El fenómeno resulta aún más preocupante en la medida en que los textos generados sirven ahora para entrenar futuros modelos de lenguaje. Estos últimos pronto dejarán de alimentarse, en lo principal, de recursos primarios producidos por humanos, e incluirán en sus insumos una proporción cada vez mayor de textos “contaminados” por la intervención de otros modelos. Este bucle amplificará así formas y ritmos específicos, orientando, iteración tras iteración, la evolución de las lenguas hacia un destino profundamente incierto.

Se inicia una carrera contrarreloj: identificar lo más rápido posible la firma de estos textos para excluirlos de los futuros conjuntos de datos de entrenamiento, una tarea en la que pueden contribuir los propios modelos de lenguaje. Y, más allá de eso, descubrir otros motivos más discretos, pero igualmente estructurantes, que subyacen a los textos generativos. Como escribiría GPT: “No es sólo una cuestión de retórica, es un desafío para la diversidad, el lenguaje, el pensamiento”.

Frédéric Kaplan, profesor de Humanidades Digitales en la Escuela Politécnica Federal de Lausana, Suiza. Traducción: Merlina Massip.

Punto uy

Utilizada con fruición por la ultraderecha argentina para redibujar la historia, la inteligencia artificial (IA) desembarcó en la comunicación oficial uruguaya. El gobierno de Luis Lacalle Pou (2019-2025, centroderecha) había dejado, como presente griego, una campaña que utilizaba una modelo generada con IA para promover el “Uruguay natural”. El gobierno actual de Yamandú Orsi (centroizquierda) redobló la apuesta. Para los feriados del 18 de mayo (batalla de Las Piedras) y del 19 de junio (natalicio de José Artigas) realizó verdaderas superproducciones en IA. Más allá de la pérdida de fuentes laborales para actores, vestuaristas, maquilladores y técnicos de filmación, la propia generación jerárquica y despersonalizada de la IA es un procedimiento “de derecha”. No sólo por el sesgo ontológico que implica, sino también por su oposición al carácter necesariamente colectivo de un proceso de creación “natural”. Porque la praxis de los actores una vez que están frente a la cámara, que tiene a alguien que la mueve de cierta manera movido por cierta conexión que se produce en ese momento entre quienes ahí están, actuando, vestidos gracias a la sinapsis que antes había hecho el vestuarista, incide, como mecanismo irrepetible y único, en la idea preconcebida de la guionista y van llegando a una síntesis final –que el director cree dirigir y quizá, un poco, lo hace– que es el tira y afloje de muchas miradas. Se llama dialéctica, y es de izquierda.

RLB

Evgeny Morozov, “Tecno-oligarcas”, parte 1 y parte 2, Le Monde diplomatique, edición Cono Sur, abril de 2025. ↩
“Palabras que valen oro”, Le Monde diplomatique, noviembre de 2011. ↩

Estandarización silenciosa

La retórica de la inteligencia artificial.

Lenguaje (des)enriquecido

Punto uy