“La inteligencia artificial seguimos siendo nosotros”

Jean-Michel Morel es un referente mundial del procesamiento y análisis matemático de las imágenes. Dicho así puede no sonar todo lo atractivo que es: el análisis matemático de las imágenes está estrechamente ligado a la inteligencia artificial y al machine learning (el aprendizaje de las máquinas). Uno podría pensar que su presencia en Uruguay se debe a las bondades de un febrero caluroso y sin lluvias y a la intensa promoción de nuestro país como destino turístico. Pero no: Morel vino a Montevideo a trabajar en lo que le gusta –algoritmos que permiten analizar las imágenes y tomar decisiones– con la gente que le gusta –investigadores uruguayos del Instituto de Ingeniería Eléctrica de la Facultad de Ingeniería que se han formado con él en París–. En reconocimiento de este trabajo de décadas en conjunto, la Universidad de la República le entregó ayer el título de doctor Honoris Causa.

La gacetilla de prensa de la Universidad relataba que Morel desarrolló una teoría axiomática del análisis de imágenes que realizó cuantiosos aportes a la formalización matemática del procesamiento de las imágenes, que concibió una teoría estadística de la percepción inspirada en la escuela psicológica de la Gestalt, dando lugar a la Gestalt Computacional, y que sus algoritmos lograron un impacto considerable tanto en la academia como en la industria por medio de su uso en numerosos productos tecnológicos. Son tantos los méritos que uno podría sentirse empequeñecido y pensar que le está robando importantes minutos. Sin embargo, cuando abre la puerta del despacho que le cedieron en las entrañas de la Facultad de Ingeniería, uno se encuentra con una persona afable, cálida y risueña, deseosa de hablar tanto de algoritmos como del mundo que nos rodea.

La conexión uruguaya

¿Qué es lo que explica que un catedrático como Jean-Michel Morel se sienta tan a gusto en Uruguay? Es una historia larga de colaboración. “Puede que haya algo que sea fruto del azar”, dice sobre el primer uruguayo que conoció porque concurrió a realizar una maestría en su escuela en París. Y ese primer uruguayo lo puso en contacto con Gregory Randall, ahora ingeniero y docente de la facultad que lo recibe. “La nuestra es una pequeña escuela, pero el máster que damos sobre inteligencia artificial, tratamiento de imágenes y machine learning es global”, explica Morel, que además apunta a Randall como el “culpable” de que varios estudiantes uruguayos hayan ido a parar a París. Hoy cinco docentes de Ingeniería se formaron en el equipo de Morel en París, y muchos más hicieron su maestría o posdoctorado con él. “Nada de esto hubiera pasado si no hubieran sido excelentes estudiantes. Ellos han contribuido muchísimo a mi equipo, y de hecho allá bromean diciendo que hablamos castellano casi que la mitad del tiempo, porque entre los uruguayos y los españoles es el segundo idioma del equipo”, ríe Morel. “Obviamente, el idioma influye, pero además como siempre en el equipo hay alguien de Uruguay, eso hace más fácil que se decidan a estudiar allá”, agrega y luego amplía: “Porque es un salto muy duro pasar de una ciudad como Montevideo, que es grande, con aire, con mar, tranquila, y llegar a París, donde todo es muy apretado y ajetreado y es una vida más dura”.

Mi cara de perplejidad debió de ser evidente sin necesidad de analizarla con un algoritmo. Tenía enfrente a un experto mundial que me decía que salir de Montevideo hacia París era un salto muy duro por razones como el mar o el aire. Cuando traté de decirle que París probablemente sea de las ciudades que seduce a más gente a lo largo y ancho del globo, lo aceptó a regañadientes y espetó: “Sí, sí, pero el trabajo es trabajo. Y en París trabajar es duro; es un lugar competitivo, caro y las condiciones de vida, por ejemplo al alquilar un piso, no son las mejores. Encima, a los jóvenes investigadores no se les paga bien. Si van a Estados Unidos los estudiantes son bien pagados, pero si alguien va a París a estudiar seguro que no es por cuestiones de dinero”.

Matemáticas para ver

Hoy las imágenes digitales nos rodean casi que en todas partes. Pero cuando Morel estudiaba matemáticas, a mediados de los 80, dedicarse al análisis de las imágenes y a “enseñarles a ver a las máquinas” no debió ser una opción tan corriente. “Lo que pasa es que las ciencias evolucionan. Cuando yo empecé matemáticas estábamos todavía bajo la influencia de lo que podíamos llamar la Gran Formalización, momento en el que se establecieron fórmulas fundamentales que rigen inmensos campos y se realizaron grandes descubrimientos. Cuando llegué a las matemáticas veía que todos los campos estaban bien instalados y establecidos, y que si querías podías seguir por ese camino, pero de una forma un poco rutinaria. Y eso es algo que pasa en todas las ciencias, algo se abre y luego se corre el riesgo de que se vuelva rutinario y te obliga a volver a plantearte cuál es la definición de tu disciplina. Eso en matemáticas es difícil, porque la matemática no es una ciencia. Aunque las matemáticas sean el parangón de la exactitud, una ciencia debe tener un objeto, y el único objeto que la matemática puede tener es su propio razonamiento”, reflexiona el científico, que pestañea un par de veces como para refrescar los recuerdos. “En esa época lo que más me llamó la atención fue la inteligencia artificial. Parecía que era un campo muy abierto y además podías trabajar sin necesidad de depender de un dispositivo experimental complejo; bastaba con tener una computadora”.

Como es matemático, a Morel le gustan las definiciones. Así que define allí, mientras recuerda su elección: “La inteligencia artificial es el arte de, a partir de datos o teorías, concebir robots o sistemas inteligentes. Por otro lado vi que el área de la visión era fundamental para entender la inteligencia humana o animal, y entonces ahí había un campo que justo estaba empezando y que necesitaba de las matemáticas”. Todo cuadraba: “Si bien antes había computadoras e imágenes digitales, fue en los 80 cuando empezó a darse que un matemático cualquiera tuviera un computador medianamente potente para tener una imagen digital y pensar qué algoritmos pueden ayudar a entender las imágenes. Tuve la suerte de empezar cuando esto estaba comenzando entre los matemáticos, porque antes era un tema de ingeniería eléctrica; había que adquirir las imágenes, un montón de requisitos técnicos que hasta los 80 no estaban completamente resueltos. Luego, de los 80 en adelante, las imágenes digitales se expandieron muy rápido y se democratizaron”.

En un español casi perfecto, afirma que la imagen digital no es un objeto matemático, pero es objeto de todas las matemáticas que uno quiera utilizar. “La imagen digital son números, y procesar esos números, que tienen un valor por píxel, te permite plantear qué ve una persona en ella y, concibiendo los algoritmos adecuados, qué puede ver un ordenador en ella”. Al comienzo de su carrera trabajó en el problema de la segmentación, descomponiendo la imagen en zonas que fueran homogéneas. Para ello tuvo que axiomatizar: “Todo el reconocimiento, ya sea que te pidan identificar una marca específica de un auto o una persona, es un reconocimiento de forma. Y el modelo axiomático dice que una forma es algo que obedece a una serie de axiomas, de varianza, de robustez, etcétera. La forma la quiero reconocer aunque esté a la derecha o la izquierda, aunque se mueva, aunque haya varianza de la luz, y además la tengo que reconocer independientemente de la distancia. Entonces, al final, deduces exactamente qué es lo que vas a querer extraer de una imagen para reconocer una forma. Vas a extraer algo que a la vez pueda ser comparado con otras imágenes. Y con este método físico y matemático se han logrado grandes avances”, explica.

Algoritmos y terapeutas

Luego del modelo axiomático, Morel repasó lo que había hecho la escuela psicológica de la Gestalt: “La idea de los gestaltistas era identificar las leyes de la formación de las formas. Parece redundante, pero vemos formas a pesar de que lo que vemos por la retina es una información puntual, como son los píxeles de una cámara. Si uno se queda sólo con la retina, es como una pantalla de televisión, no hay ninguna forma sino puntitos. Ellos pensaban que tenía que haber una cristalización de la forma a partir de información local. Y partían de que tanto los humanos como los animales no veían puntos de luz, sino formas, y trataron de explicarlo. Trabajando con imágenes abstractas, llegaron a leyes de unificación abstracta, porque se dieron cuenta de que la formación de formas tenía sus leyes que no dependían de objetos concretos”. Pero claro, las leyes de la Gestalt no eran matemáticas. “Sin embargo, su cuerpo de ideas luego se retomó para la visión por ordenador y se empezaron a buscar algoritmos basados en eso”, afirma.

Y a eso Morel y los suyos le agregaron la probabilidad: “El algoritmo eficaz de detección de recta fue hecho por un equipo en el que la mitad eran uruguayos, porque estaban Gregory Randall y Rafael Grompone, junto a Jérémie Jakubowicz y yo. A ese algoritmo, en el que trabajamos mucho tiempo, le das una imagen y aclara los segmentos rectos, los bordes rectos entre objetos. Nada más. Y para determinar que una forma es un rectángulo ya tienes los elementos para determinar los lados. Tu algoritmo automáticamente va a detectarte los bordes. Luego tenemos otros algoritmos que deciden si esos lados son paralelos. Son algoritmos que calculan cosas y que terminan diciendo sí o no. Y a diferencia de los gestaltistas, nosotros lo hicimos apelando a la probabilidad. La decisión es probabilística, tú decides que es imposible que eso se haya producido al azar, y entonces hacemos probabilidad para cuantificar Gestalt”.

¿Inteligencia artificial?

Si bien Morel ha desarrollado algoritmos eficientes, reconoce que el camino es duro y lento, y aclara que “todavía queda mucho por hacer”. Me llama la atención que, en una sociedad que utiliza software de reconocimiento facial, en la que hay cámaras que vigilan personas y fiscalizan el tránsito, en esta especie de Gran Hermano de algoritmos, él diga que aún queda mucho por hacer. “Es que hay que relativizar un poco todo eso”. Y argumenta que el reconocimiento facial es un buen ejemplo. “Las caras son un caso muy especial, ya que probablemente hayan evolucionado justamente para eso, para ser reconocibles, para ser conspicuas. Recién en 2000 se creó el primer algoritmo, mediante machine learning, que aprendió a detectar caras. Y desde entonces todos los aparatos de vigilancia o las cámaras de foto o los celulares detectan las caras”, dice, pero advierte: “No porque podamos reconocer caras vamos a poder reconocer todo. Luego de que se logró la detección, ha habido muchos progresos para reconocer gente. Sin embargo, es muy poco lo que sabemos hacer”.

Mis pupilas se dilatan, delatando el interés que tengo en lo que plantea. Así que sigue: “Una cámara de tránsito puede detectar la velocidad media de los vehículos, con un algoritmo de detección de movimiento. Pero esa cámara es incapaz de hacer otras miles de cosas, todavía no entiende la escena. Hay muchos interesados en contar con una cámara que detecte que algo raro está pasando, pero esos son metas empíricas que quisiéramos tener; la verdad es que, por ahora, sólo detectan movimiento”. Y como buen docente, enseguida pone un ejemplo: “Si todo está parado, te puede dar una alerta, pero no te va a mandar un mensaje diciéndote: ‘Oye, hay alguien tirado en el medio de la calle, por eso el tráfico está interrumpido’. Hay algoritmos robustos y fiables, pero no hay, de momento, una inteligencia profunda de lo que está pasando en un video”. Y prosigue con el ejemplo de la Policía francesa. “Cuando ocurrieron los atentados terroristas en Francia, la Policía recogió cientos de miles de horas de video de los lugares donde podrían haber pasado los terroristas. Y para ilustrarte dónde estamos, te digo que todo eso se analizó a mano. Cuando uno quiere hacer una tarea muy básica, por ejemplo, reconocer a un señor que pasó por varios lugares, se hace con personas visionando todo. Puedes ganar un poco de tiempo, no hace falta que el policía vea todo, vas a filtrar para enseñarle sólo las imágenes en las que se ha detectado movimiento. Pero estamos muy pero muy en los comienzos de la llamada inteligencia artificial”.

Sigue siendo fantástico que lo que para nosotros resulte tan intuitivo y sencillo resulte tan arduo de enseñar a las máquinas. No en vano la visión ha evolucionado en los animales en el transcurso de millones de años. “Es que ahí ya estamos hablando de ‘máquinas biológicas’ que tienen una sofisticación completamente ajena a todo lo que podemos imitar con una computadora”, dice Morel. “Los seres biológicos nos pueden inspirar, podemos observarlos, pero no podemos imitarlos: son infinitamente más complejos. Podemos pensar que hay simplificaciones, que hay atajos, y eso es lo que busca la inteligencia artificial. Podemos intentar definir lo que hacen de una manera abstracta, como los gestaltistas, que luego permita definir lo que queremos hacer, sin que eso quiera decir que lo tenemos que hacer como ellos”. Y una vez más, demuestra que es un buen docente, apelando ahora al humor: “El ejemplo clásico es el de un industrial que no estaba contento con sus aviones y que nunca estaría contento hasta que no tuvieran plumas”.

Robots que andan solos

Los autos autónomos son casi una realidad. Morel reconoce que tenemos algoritmos robustos y eficientes, pero afirma que son más las cosas que nos faltan. ¿Es precipitado confiar en los algoritmos existentes y en sus decisiones tomadas mediante leyes de la probabilidad? Para contestar se refiere a un avance tecnológico previo: “Ahora hay ABS, el sistema que permite que el neumático nunca se bloquee y controla el grado de la frenada. Antes, un muy buen conductor lograba eso mismo con sus sentidos, pero el ABS lo vence fácilmente. La gente nunca va a decir que el ABS es inteligencia artificial, dirán que es un sistema de ingeniería. Y con los autos autónomos pasa como con el ABS”. Luego dispara aun más lejos: “Hay algo de inteligencia artificial en los vehículos, pero es sólo una pequeña parte de las mejoras que permiten hacer eso. La mayor parte es el GPS, que te dice exactamente dónde está, y la cartografía de las calles, como si fueran vías férreas, por gigantes como Google. La conducción automática en realidad es que ahora el vehículo sabe con más precisión que tú en dónde está, a qué velocidad está yendo, sabe qué hay en esa carretera no sólo a pocos metros sino a cientos, tiene sensores, que pueden ser radares y cámaras y que, contrariamente a un humano, están mirando permanentemente en todas direcciones. Entonces no es una cuestión metafísica decir que vamos a entregar nuestra vida a una inteligencia artificial de la que no nos podemos fiar. La verdad es que esto es ingeniería, es como el ABS, y vamos a aprovechar autos que tienen más información que tú, mucho más precisa, y con sistemas de control mucho más eficaces. Claro que eso tendrá fallas y habrá accidentes no humanos, pero es seguro que habrá menos accidentes que con los humanos”.

No obstante, Morel considera oportuno abrir el paraguas: tampoco se trata de que mañana todo será automático. Va a ser un cambio progresivo, y la gente va a darse cuenta de que “es mejor, como pasó con el ABS”. También denuncia que hay un poco de novelería en todo esto y no duda en compararlo con ciertos anuncios de la medicina: “Es como los médicos que anuncian que han descubierto una hormona nueva que detecta exactamente las células con cáncer y que pronto la veremos en acción. Y uno ve que anuncios así hay cada dos meses, y sin embargo el cáncer, si bien hubo progresos, no está vencido. Cuando se detectaron las caras, hubo gente que pensó que las computadoras eran inteligentes”. Morel dice que tenemos que apelar al sentido común, y enseguida ametralla con preguntas: “¿Tú ves algún robot acá donde estamos? ¿Ves robots en las calles? Se está anunciando desde hace 40 años que la humanidad va a ser sometida por robots, pero salís a la calle y no ves ninguno. ¿En tu cuarto de baño hay un robot limpiando? Creo que lo único que se ha visto son pequeños aspiradores, que navegan solos y aspiran casi decentemente. Pero el progreso principal no es la inteligencia artificial, sino la utilización de la autonomía eléctrica. Tienen sensores, pero nadie los llamaría robots”.

Pensar en robots estimula al matemático, y yo aprovecho a escuchar, azorado, hablar del tema a un Honoris Causa de lo que disfruto hablando con fanáticos de la ciencia ficción: “Para la gente los robots son cosas con dos brazos, dos piernas, que tienen ojos y que te hablan y que, por ejemplo, te pueden cocinar. Y sin embargo ya ves los robots de cocina... [risas]. Decís ‘que fantástico’, y luego te das cuenta de que estás con un montón de cacharros que hay que montar y desmontar, y que te lleva tanto tiempo armarlo y limpiarlo que lo utilizas sólo si hay mucho para hacer. Si es poco, lo terminas haciendo a mano. Cuando vas a una empresa o una fábrica grande hay robots, pero en realidad son máquinas. Ahora se llaman robots porque son más adaptables, reprogramables, pueden aprender gestos que les enseña un humano, pero son sólo máquinas”.

¿Inteligencia?

Morel reconoce que siempre le fascinó la idea de desarrollar algoritmos que pudieran reflejar la inteligencia, pero se lamenta de que es algo que avanza muy lento y de que él no llegará a ver la inteligencia artificial. “Es muy tentador trabajar con algoritmos y pensar que algún día serán inteligentes. Pero el problema es que no sabemos qué es la inteligencia. De hecho, una de las conjeturas es que nosotros no somos inteligentes tampoco”, arroja, desafiante. Y volvemos a la gestalt computacional: “Somos seres biológicos con capacidades muy sofisticadas, pero no sé si podemos asociar esas capacidades con la inteligencia. Por ejemplo, los gestaltistas veían que lo esencial lo compartíamos con los animales. Ellos entienden, aunque no lo formulen con frases, pero analizan la escena completa y la procesan. Y eso es algo que queremos imitar mediante los medios de concepción matemática, pero no sabemos hasta dónde vamos a ir. No sabemos definir bien qué es la inteligencia, y por eso me gustó tanto la teoría Gestalt, porque definieron bastante bien la visión, que es una parte muy importante del comienzo de la inteligencia. Vemos que el cerebro está muy dirigido a la visión: casi 60% se dedica a analizar una escena visual para tareas que en el fondo parecen de robótica: caminar, evitar obstáculos, reconocer, entender”.

La sensación de que pronto la inteligencia artificial nos superará está extendida. Pero el académico pone paños fríos: “La gente considera como una cosa peculiar del ser humano saber jugar al ajedrez. Ahora las computadoras les ganan a los seres humanos. ¿Cómo? Siendo apabullantemente más potentes haciendo cuentas. Pero es como un bulldozer que nos vence tirando un árbol, no es algo terrible para nosotros”. Una inteligencia artificial que nos supere no parece estar en el horizonte de lo probable para este afable francés: “Con todo lo que he investigado y los algoritmos que hemos hecho, sé que hay cosas que podemos hacer automáticamente con un algoritmo. Pero un algoritmo no es inteligencia artificial, es una aplicación tecnológica. De ahí a decir que podemos crear superhombres no tiene sentido. La gente imagina un hombre que a su disposición tendría un enorme potencial de cálculo, pero es lo que somos ahora. La inteligencia artificial seguimos siendo nosotros, sencillamente tenemos más potencial de cálculo si utilizamos ordenadores. Si uso un bulldozer tendré superfuerza, pero la gente no va a decir que un operario de un bulldozer es un superhombre. Todo lo que vemos ahora es tecnología, no inteligencia artificial”.

Uno podría hablar miles de horas con Morel. Sobre algoritmos, robots, inteligencia artificial y la vida en el siglo XXI. Tal vez quienes apelan al fantasma de la inteligencia artificial para prepararnos para el nuevo mundo del trabajo estén hablando más de desregularización y pauperización del trabajo que de una amenaza tecnológica. Tal vez andar en autos que se manejan solos no sea más trascendente que lo que hacemos todos los humanos que aprendemos a manejar: dejar que unas cuantas cosas rutinarias las haga un otro, ya sea una chatarra con sensores o un sistema nervioso que apela a automatismos y que percibe el mundo y reacciona velozmente sin incordiar demasiado a nuestro consciente. Por lo pronto sabemos que las cámaras nos pueden reconocer, pero sigue siendo más interesante y fantástico todo lo que aún nos falta reconocer en nosotros. Y el resto... apenas es tecnología.