El 30 de noviembre de 2022, el genio salió de la lámpara.

Así es como muchos investigadores, desarrolladores y usuarios expertos describen el día en que ChatGPT se lanzó al público. Esta interfaz conversacional, que utiliza inteligencia artificial (IA) para comunicarse en lenguaje natural, fue desarrollada por OpenAI, una organización sin fines de lucro con sede en California.

OpenAI recibió el generoso aporte de algo así como 10.000 millones de dólares por parte de Microsoft para lanzar el producto. Su historia reciente se remonta a 2010, cuando Demis Hassabis, Shane Legg y Mustafa Suleyman fundaron DeepMind, inspirados por el trabajo pionero de Alan Turing, publicado en 1950, sobre la inteligencia de las máquinas. Geoffrey Hinton, conocido como el padrino de la IA, se sumó al equipo.

Tras la liberación de ChatGPT, surgieron decenas de grandes modelos de lenguaje (LLM, por su sigla en inglés), como Gemini de Google y Llama de Meta. La evolución de ChatGPT, así como la de sus competidores y productos complementarios, incluyendo los especializados en generación de imágenes (como Midjourney o Stable Diffusion), ha sido vertiginosa.

Seguramente estemos siendo testigos de una de las mayores revoluciones tecnológicas en la historia de la humanidad. El periodista Andrés Oppenheimer inició una entrevista en 2023, citando a Lawrence Summers, quien parece haber afirmado que “esta podría ser la tecnología más importante desde la invención de la imprenta, la electricidad e incluso la rueda o el fuego”. Más allá de que no hayamos inventado el fuego ni la electricidad (en todo caso los descubrimos, y luego aprendimos a producirlos y controlarlos), la comparación me parece acertada. Oppenheimer la matiza: “No sé si desde la rueda o el fuego, pero he estado usando este chatbot desde que salió y no me cabe la menor duda de que es lo más impresionante que he visto, por lo menos desde la aparición de internet”. Yo aventuraría un poco más: desde la invención de la máquina a vapor.

La opinión es bastante generalizada, aunque también lo son aquellas que alertan sobre los riesgos de la expansión de esta tecnología: desde la pérdida de millones de puestos de trabajo hasta el fin de la humanidad.

No doy crédito a ninguna de estas últimas hipótesis. Es probable que no se pierdan puestos de trabajo, aunque sí cambiarán dramáticamente sus contenidos, por las razones que el antropólogo David Graeber expuso en su libro de 2018 Trabajos de mierda. Una teoría.

En cuanto al fin de la humanidad, uno de los efectos colaterales de tener conciencia es que nos percatamos de nuestra finitud. Esto ha llevado a extrapolar nuestra propia condición perecedera a la de toda la especie. Por eso, desde tiempos inmemoriales, los humanos han anunciado el fin de la humanidad. Hoy día sabemos dos cosas: que nunca esas predicciones han acertado (de lo que puedes dar fe, ya que estás leyendo este artículo) y que la abrumadora evidencia acumulada a favor de la teoría evolutiva lleva a concluir que algún día nuestra especie llegará a su fin, con o sin ChatGPT.

De todos modos, esos temores no son el resultado de teorías conspirativas, sino que han sido formulados por los propios creadores de esta tecnología. El 22 de marzo de 2023, algunos miles de científicos, informáticos y pensadores (como Yuval Harari) firmaron una carta titulada “Pausar experimentos gigantes de IA: una carta abierta”, en la que alertaban de que “los sistemas de IA con inteligencia humana competitiva pueden plantear riesgos profundos para la sociedad y la humanidad”. Dos meses más tarde, el Centro de Seguridad de la IA publicó un “Comunicado sobre el riesgo de la IA”, de sólo 22 palabras: “Mitigar el riesgo de extinción [de la humanidad] por la IA debería ser una prioridad mundial, junto con otros riesgos a escala social como las pandemias y la guerra nuclear”. Entre los firmantes de este comunicado se encontraban Geoffrey Hinton, Demis Hassabis (CEO de DeepMind), Dario Amodei (CEO de Anthropic), Kevin Scott (CTO de Microsoft) y el propio Sam Altman (CEO de OpenAI).

Si tanto las expectativas como los temores frente a una cosa son grandes, lo que seguro podemos concluir es que se trata de algo grande. De modo que, sin bombos ni dramatismos, comencemos a inspeccionar al genio. Tomemos distancia para observarlo. Alejémonos hasta la frontera entre la sociología y la filosofía.

Sapiens

Otro de los efectos colaterales de tener conciencia es la tendencia a darnos nombres a nosotros mismos. Existen muchos, pero uno destaca por su uso: somos Homo sapiens, una especie con capacidad de pensar. Es nuestro sobrenombre más popular, para beneficio editorial de algunos.

Nadie en su sano juicio dudaría de que pensar es una característica importante de nuestra especie (quienes no estén en su sano juicio pueden opinar lo contrario, claro está). Sin embargo, no es la única. Los humanos tenemos muchas características que nos definen como especie.

¿Por qué, entonces, muchos humanos abrazan con satisfacción el sapiens acuñado por el taxónomo sueco Carlos Linneo hace más de 250 años? Que tengamos muchas características no significa que todos las cultivemos con la misma diligencia. Típicamente, quienes escriben acerca de qué es importante en el ser humano (y concuerdan con que su rasgo más distintivo es pensar) tienen por oficio pensar y escribir sobre lo que piensan. Quienes cultivan el arte de hacer quizás opinen de manera distinta. Lo mismo puede suceder con quienes prefieren jugar. El ser humano es sapiens, pero también es faber. Y es ludens.

Faber

Otra cosa que nos caracteriza es nuestra costumbre de fabricar herramientas. No me refiero a utilizar objetos accesibles en la naturaleza para facilitar alguna tarea. Los delfines de nariz de botella utilizan esponjas marinas para procurarse alimentos (parece que también lo hacen en rituales de cortejo). Varios tipos de primates se auxilian con ramas o piedras para fines similares. Pero la fabricación humana implica un paso más. Una piedra afilada con la ayuda de otra para trabajar pieles y hacer abrigos, o para matar (volveremos a esta polivalencia con consecuencias morales antagónicas en una tercera entrega), es una herramienta. Una de estas piedras talladas, sujeta por una tira de cuero a una vara (una lanza), es una herramienta aún más elaborada. Prácticamente ninguna otra especie tiene esa capacidad (los cuervos de Nueva Caledonia parecen ser una excepción).

Muchos autores han destacado esa condición. Benjamin Franklin, por ejemplo, definió al hombre como “un animal que fabrica herramientas”. Karl Marx retomó esa definición en el tomo 1 de El capital.

Ser faber requiere capacidad de abstracción. Se trata de combinar y transformar elementos de la naturaleza para uno o más propósitos futuros, que por el momento se encuentran en nuestra imaginación. También requiere capacidad de inferencia y deducción, para concluir sobre los usos genéricos de determinados materiales y sus combinaciones, es decir, para su utilización en circunstancias que aún no han ocurrido. Y otras tantas habilidades mentales. Por tanto, faber presupone a sapiens. Lo inverso también es cierto: a medida que construimos herramientas y las utilizamos para intervenir en la naturaleza, acumulamos información acerca de cómo funciona el mundo y ampliamos nuestras capacidades de inferencia y deducción. Esto resulta evidente con las herramientas utilizadas en la investigación científica (como un microscopio o un telescopio), pero aplica a toda la tecnología. La intervención tecnológica en el mundo crea nuevos fenómenos que, a su vez, requieren ser “conocidos”.

Charles Sanders Peirce se preguntaba, por ejemplo, a fines del siglo pasado: “¿No significa la electricidad más ahora que en los días de [Benjamin] Franklin?”. Por supuesto que sí. Una vez que conocimos la electricidad (por sus efectos), comenzamos a experimentar con ella y a fabricar herramientas que hacían uso de sus propiedades, en el mundo. Descubrimos nuevos efectos y continuamos experimentando y actuando con ellos. ¡Cuánto más significa la electricidad en nuestros días que en la época en que escribió Peirce! Hemos continuado con la manipulación de la electricidad, o del electromagnetismo en un sentido más general. El texto de esta entrega fue enviado al editor a través de un correo electrónico, una herramienta basada en nuestros conocimientos acerca del electromagnetismo, algo que jamás podría haber imaginado Franklin, ni tampoco Peirce.

Hacemos con herramientas lo que podríamos hacer con nuestras propias manos, sólo que amplificado a niveles increíbles. Una grúa del puerto, o las “plumas” que ves en los edificios en construcción, permiten levantar y trasladar objetos, como lo hacemos los humanos sin necesidad de herramientas, pero lo pueden hacer a alturas y con pesos imposibles para un solo humano, incluso para muchos trabajando conjuntamente (en este punto levantan la mano los adoradores de los antiguos astronautas, haciendo referencia a las pirámides). Las herramientas llegan incluso a hacer cosas que ningún grupo de seres humanos podría hacer por su cuenta. Puedes lanzar una pelota con bastante velocidad, pero no puedes acelerar una partícula subatómica a casi la velocidad de la luz, como lo hace el colisionador de hadrones del CERN de Ginebra. Lo mismo vale para los sentidos. Si tu salud ocular es buena y el clima propicio, puedes ver a varios kilómetros, pero nunca a varios millones de años luz de distancia, como lo hace el telescopio James Webb.

Faber 2.0

Un salto dramático se produce cuando comenzamos a fabricar herramientas cuya función es fabricar otras herramientas. Aquí la capacidad de abstracción requerida es mucho mayor. Henri Bergson (1859-1941) definió la inteligencia como “la capacidad de crear objetos artificiales, en particular herramientas para hacer herramientas, y de modificarlos de modo ilimitado”. Para Bergson, entonces, sapiens es faber. La revolución industrial constituyó un hito en este aspecto, pero los antecedentes pueden rastrearse miles de años atrás.

Una fresadora es un buen ejemplo: se trata de una herramienta utilizada para fabricar partes de otras herramientas, como los motores de combustión. La retroalimentación entre faber y sapiens se potencia en este nivel que hemos llamado 2.0.

Faber > Sapiens

Hasta ahora hemos hecho referencia a objetos físicos como los contenedores en un puerto. ¿Y qué pasa con los objetos intelectuales? Las ideas también pueden mezclarse, combinarse y ordenarse. Así como existen leyes que determinan los modos en que podemos operar con objetos físicos (como la gravedad, la aerodinámica y otras), existen leyes que nos permiten operar con objetos intelectuales. Del mismo modo que aprendimos a valernos de “las propiedades mecánicas, físicas y químicas” del mundo material –como mostró Marx en su reflexión sobre la definición de Franklin– para fabricar herramientas físicas, podemos hacerlo con las propiedades de las ideas para fabricar estas otras.

Hace tiempo que interactuamos con herramientas que manipulan objetos intelectuales basándose en reglas matemáticas y lógicas. La aplicación de un conjunto de reglas para operar con números condujo a la fabricación de calculadoras. Esa herramienta tiene una historia muy larga, pero podemos retener la imagen de aquellas calculadoras Casio de bolsillo, para ilustrar. Estamos familiarizados con ellas, así como con las que en el liceo llamábamos calculadoras científicas. Con su auxilio podemos realizar, en segundos, operaciones realmente complejas, que requerirían mucho tiempo a un humano experto. Sin gastar un peso, podemos acceder a calculadoras mucho más potentes aún: las llamamos hojas de cálculo.

Consideremos ahora las leyes de la inferencia probabilística y de la deducción natural. Las que rigen la construcción de taxonomías y las de la causalidad. Podemos tratarlas como leyes, del mismo modo que la gravedad y las reglas para sumar y restar.

Avancemos en el desarrollo de sistemas que emulen el comportamiento de nuestras neuronas (llamamos a eso redes neuronales), tal como hicimos con grúas que emulan nuestros brazos. Sigamos avanzando hasta desarrollar los transformers(eso ocurrió en 2017). Aprovechemos las enormes capacidades de cálculo y almacenamiento de datos que se han desarrollado en los últimos años. Y utilicemos todo lo accesible en internet para entrenar una nueva herramienta. Hagamos que sea posible interactuar con ella utilizando lenguaje natural. Esta es una descripción muy básica de los actuales modelos de inteligencia artificial generativa, como ChatGPT: herramientas con capacidad de razonar.

El árbol talado

Hace algunos días subí a ChatGPT la siguiente imagen (tomada días antes con mi celular) y le pedí que la describiera.

Árbol talado.
Foto: Hugo de los Campos

Árbol talado. Foto: Hugo de los Campos

Su respuesta fue: “La fotografía muestra un área al aire libre donde se han talado varios árboles. En el suelo se pueden ver numerosos troncos y ramas cortados, con algunos de ellos apilados o dispersos. También hay una estructura de madera colapsada o parcialmente desmontada en el fondo. Las hojas verdes aún están adheridas a algunas de las ramas, lo que indica que la tala fue reciente. La escena tiene un aspecto desordenado, con restos de madera y vegetación esparcidos por el suelo”.

Es asombrosa la capacidad de esta tecnología para interpretar un conjunto de píxeles con tal detalle. Pero lo realmente asombroso es esta parte de su respuesta: “Las hojas verdes aún están adheridas a algunas de las ramas, lo que indica que la tala fue reciente”.

Conversamos largamente con la máquina luego de su respuesta inicial, acerca de cómo había llegado a esa conclusión y si para hacerlo había recurrido a una inferencia inductiva o a una deducción. Después de varios argumentos, la máquina concluyó acertadamente que había hecho una inferencia abductiva. En cualquier caso, lo que hizo fue razonar. Charles Sanders Peirce definió el arte de razonar (vuelvo siempre sobre las mismas citas) como “averiguar algo que no conocemos, a partir de lo que ya conocemos”. Y esto es exactamente lo que hizo ChatGPT en este caso. Y el resultado fue correcto.

Faber > Sapiens > Faber

Conectemos ahora una inteligencia artificial a un robot. Desde hace tiempo contamos con robots capaces de fabricar mercancías, incluida, claro está, la fabricación de nuevos robots. Le debemos a la industria automotriz japonesa su masiva incorporación en los procesos fabriles.

Un robot es una herramienta que opera con objetos físicos y ha sido programada con el auxilio de otra herramienta que opera con objetos intelectuales. Algo así como un martillo con una calculadora Casio integrada, aunque mucho más complejo.

Recapitulemos: comenzamos con herramientas que permitían intervenir en el mundo material, optimizando la fuerza física humana. Por ejemplo, un aparejo que reduce a la mitad el peso de un objeto con cada vuelta que le damos a una cuerda en un par de poleas. Llamamos polipasto a esta herramienta. Un humano utiliza su fuerza física para operarlo (girando una manija conectada a una de las poleas, por ejemplo), pero puede levantar pesos que sin la herramienta nunca podría.

Luego introdujimos los motores (a vapor, de combustión, eléctricos) para reemplazar la fuerza humana en la operación de tales herramientas, aunque todavía requirieran operación manual (como cuando conduces un coche).

Luego programamos herramientas, dando origen a los robots. Sus intervenciones en el mundo pueden ser dirigidas con mandos a distancia, como con esos joysticks que deseábamos de niños para dirigir autos de juguete. O directamente pueden no requerir intervención humana, siempre que se trate de tareas repetitivas. En esto último, los robots de la industria automotriz son especialmente buenos.

Gracias a los avances en la fabricación de dispositivos de observación, como los sensores, y las herramientas de machine learning, conseguimos que esos robots reconocieran cosas que sucedían en el mundo e intervinieran de manera autónoma. Los coches que se desplazan sin conductor son un ejemplo al que dedicamos algunas líneas anteriormente. Desde hace tiempo podemos enseñar a un robot que cuando vea determinada cosa, se comporte de un modo particular.

Con el desarrollo de la inteligencia artificial generativa, ahora podemos pedirle a un robot que actúe de determinada forma, de acuerdo a lo que infiera o deduzca a partir de algo que vea. Sí, los grandes modelos de lenguaje ya pueden “ver”. ChatGPT puede conectarse a la cámara de tu celular y observar en tiempo real lo que está sucediendo. Podemos conversar con ChatGPT y pedirle que cada vez que vea algo, diga algo. Conectado a un robot, podemos pedirle que al ver algo, haga algo. Además –y esto marca la gran diferencia–, que cuando vea algo que probablemente sea un elemento de un cierto conjunto (como un tronco que formaba parte de un árbol recientemente talado) o que sea el efecto de algo que probablemente sucedió antes (como los restos que se observan, de una tala reciente inferida), actúe de un determinado modo.

En una próxima entrega profundizaremos en cómo lo hace y cuáles son las consecuencias de esa capacidad. Por el momento, sólo considera la posibilidad de que alguien ensamble una metralleta a un robot y lo que sucedería cuando, en lugar de troncos y árboles talados, le pida a la IA integrada a ese robot que cuando vea personas que probablemente formen parte de un grupo “enemigo” o que probablemente hayan hecho algo “malo”, dispare.

Y al fin de cuentas, ¿ChatGPT es de temer?

Dejaremos la respuesta a esta pregunta para la tercera entrega.

Por lo pronto, no pierdes nada con probarlo. De hecho, puedes ganar mucho en conocimiento al hacerlo. Si aún no lo has usado, o sólo has recurrido a él para buscar recetas de cocina o planificar un viaje, te recomiendo que lo hagas de verdad. ¿Quién de nosotros no ha utilizado un destornillador para destapar un frasco? Está bien, pero prueba esa herramienta para atornillar tornillos. Es muy buena haciendo eso.

Operar con ChatGPT es más sencillo que hacerlo con una amoladora o una sierra circular. Y es, en ambientes domésticos, mucho menos riesgoso para el usuario y los humanos del entorno inmediato.

Y si te incomoda comprobar que ChatGPT piensa mucho mejor y más rápido que tú, sólo recuerda que el automóvil o el ómnibus que abordaste hace poco se traslada de un modo mucho más eficiente y rápido de lo que puedes hacerlo con tus pies. Estas herramientas son el producto de la creatividad humana, y has aprendido a sacarles provecho para llegar más rápido y cómodo a tu trabajo o a una reunión con amigos.

No estoy sugiriendo que dejes de caminar, lo cual es una práctica muy saludable, sólo que utilices herramientas para trasladarte cuando te resulte conveniente. Lo haces a la hora de comer, por ejemplo, utilizando cuchillo y tenedor. Puedes hacerlo también con esta nueva tecnología.

Las primeras ideas desarrolladas para esta entrega fueron elaboradas con el auxilio de la versión 3.5 de ChatGPT, tras su lanzamiento a finales de 2022. La versión final fue desarrollada y revisada con ChatGPT 4.0 omni, la versión actual disponible públicamente.