Una de las últimas tendencias en las redes sociales es compartir lo que a simple vista parece una grilla de imágenes relativamente comunes, pero que al mirarlas detenidamente despiertan incomodidad. Personas y personajes famosos aparecen en actividades cotidianas o mezcladas entre sí, pero con algunas particularidades. Los rostros, por ejemplo, parecen salidos de un libro de pesadillas.
Detrás de estos miles y miles de ejemplos no hay una persona torturada sino una inteligencia artificial (IA) de bolsillo. Dall-E Mini, tal es su nombre, es capaz de generar nueve imágenes a partir de palabras clave. Por ejemplo, “Diego Maradona saltando a la cuerda” o “la Estatua de la Libertad comiendo una hamburguesa” (hay que escribirlo en inglés). Esta herramienta revisa internet y nos da resultados que pueden ser hilarantes, siniestros o una combinación de ambos.
Su rapidez (suele tardar menos de un minuto) y accesibilidad hicieron que Dall-E Mini explotara en popularidad, más allá de que sigue teniendo los sesgos de otros algoritmos, como mostrar una figura masculina si el género no está determinado, o privilegiar las figuras caucásicas en la mayoría de las ocasiones. Mientras esto se corrige, la inteligencia artificial no solamente está entreteniendo a los internautas, sino que consiguió su primer empleo.
Cabe explicar que Dall-E Mini es la versión “casera” de Dall-E, una IA creada por el laboratorio OpenAI (cofundado por Elon Musk), que utiliza 12.000 millones de parámetros a partir de un modelo de lenguaje autorregresivo, conocido como GPT-3, que produce y procesa textos que simulan la redacción humana. El nombre “Dall-E”, en inglés, suena muy parecido al apellido del artista surrealista Salvador Dalí, famoso por la yuxtaposición de conceptos en apariencia distantes.
La revista Cosmopolitan dedica su más reciente número a estos avances tecnológicos y en su tapa puede leerse “Conozcan la primera portada de revista generada por una inteligencia artificial”. Muestra a una mujer astronauta caminando por el planeta Marte, y en la suela de su bota dice: “Y solamente le tomó 20 segundos hacerla”.
Todo comenzó cuando editoras de la publicación, integrantes de OpenAI y una artista digital se unieron (virtualmente, en este caso) en busca del diseño perfecto para la tapa de la tradicional revista. Después de intentar con varias combinaciones de palabras y elementos, no solamente obtuvieron un resultado satisfactorio, sino que se fueron con muchas preguntas acerca del arte, la ética y el futuro de la humanidad.
Dall-E, en sus diferentes versiones, “aprende” de los objetos y cómo se relacionan a partir de analizar imágenes catalogadas por humanos. La encargada de productos del laboratorio, Joanne Jang, explicó a Cosmopolitan que si Dall-E “ve” una gran cantidad de fotos de koalas con el título “koalas”, aprenderá cómo se ven. Y si alguien escribe “koala andando en moto”, dibujará la interpretación lógica de lo que sabe sobre koalas, motos, y el concepto de andar en ellas. También entiende el contexto: “Darth Vader en la portada de la revista Cosmopolitan” no solamente coloca allí al personaje, sino que lo viste y lo maquilla para la ocasión.
La versión más completa (o compleja) de Dall-E se encuentra en etapa de preestreno, con apenas 1.000 nuevos usuarios por semana mientras se hacen ajustes. ¿Y las caras? Explicaron que esa imperfección es intencional. Dall-E es mala reproduciendo rostros realistas, y en lugar de eso cambia las facciones para que la tecnología no se utilice en la realización de los llamados deepfakes, es decir, fotos o videos que simulen a personas reales en actividades que podrían resultar hirientes, como la pornografía. La herramienta no permite imágenes explícitas ni tampoco resultados relacionados con discursos de odio, al tiempo en que “confía” en que los usuarios no compartirán resultados que accidentalmente sean fotorrealistas.
OpenAI tiene planes de monetizar a Dall-E (por supuesto), pero intentará posicionarla no como un reemplazo de los artistas sino como una herramienta más a su disposición. “Un copiloto creativo”, en palabras de Jang. En el caso de la portada en cuestión, el “alimento” del copiloto creativo fueron las palabras “toma de gran angular desde abajo de una mujer astronauta con un cuerpo atlético y femenino, caminando hacia la cámara con arrogancia en Marte en un universo infinito, arte digital, synthwave [en referencia al género de música electrónica con elementos retrofuturistas]”.
Karen X Cheng, la artista digital que participó en el concilio que diseñó la tapa, y que llegó a la combinación final de palabras, ya utilizó Dall-E en todo su potencial para generar un videoclip sobre el tema de Nina Simone “Feeling Good” y ahora está diseñando un traje que explota en formas geométricas al verlo a través de un filtro de realidad aumentada. Explicó que en el pasado había visto limitadas sus posibilidades como artista visual porque no puede dibujar. “Ahora tengo el poder de todas estas diferentes clases de artistas”.
“No quiero romantizar el asunto. Con la inteligencia artificial estamos a punto de entrar en un período de cambios masivos en todos los campos, no solamente en el arte. Muchas personas perderán sus empleos. Al mismo tiempo habrá una explosión de creatividad y posibilidades, y se crearán empleos nuevos, algunos de los cuales no podemos imaginar en este momento”, escribió en su cuenta de Instagram junto al mencionado videoclip.