En artículos anteriores publicados en este espacio se planteó que la evaluación de políticas públicas no debería entenderse como un trámite técnico ni como una obligación administrativa más, sino como una práctica democrática de aprendizaje, rendición de cuentas y mejora colectiva. También se advirtió que la inteligencia artificial (IA) puede ampliar capacidades públicas o reforzar automatismos tecnocráticos según cómo se la gobierne, con qué fines se la incorpore y qué controles se establezcan.
Este artículo retoma esa conversación, pero desplaza el foco. Ya no se trata solo de preguntar cómo usar IA en el Estado, ni cómo evitar sesgos, opacidad o dependencia tecnológica. La pregunta que queremos formular ahora es más profunda: ¿qué parte del juicio público no deberíamos delegar en sistemas algorítmicos?
La IA ya está entre nosotros: en la educación, la gestión pública, la investigación, la comunicación, la evaluación y la vida cotidiana. La cuestión es bajo qué condiciones puede contribuir al bien público sin empobrecer el juicio humano, borrar la singularidad de los contextos o debilitar la democracia.
Evaluar no es solo procesar datos
La IA puede ordenar, comparar, resumir y asistir. Puede procesar grandes volúmenes de información, detectar patrones, sistematizar entrevistas, revisar documentos, apoyar búsquedas bibliográficas y formular hipótesis. Todo eso importa. Sería ingenuo desconocerlo. Pero también sería ingenuo confundir esas capacidades con evaluación.
Evaluar no es solo procesar datos. Evaluar es comprender contextos, escuchar experiencias, interpretar sentidos, reconocer conflictos, identificar relaciones de poder y hacerse responsable por el juicio que se emite. La evaluación no ocurre en el vacío. Ocurre en territorios, instituciones, comunidades, biografías, intereses, temores y esperanzas.
Allí donde la IA encuentra patrones, las personas encuentran historias. Allí donde el algoritmo calcula probabilidades, la evaluación democrática debe preguntarse por derechos, responsabilidades y consecuencias.
Una metodología no es simplemente una secuencia de técnicas predefinidas. Es una forma de razonar en situación. A menudo, las preguntas iniciales cambian; los actores redefinen el problema; el contexto obliga a ajustar el diseño; lo que parecía marginal se vuelve decisivo; una entrevista abre un camino inesperado; una observación desarma una hipótesis. Ese movimiento no es un defecto del método. Es parte de su validez.
La libertad metodológica consiste precisamente en poder responder a lo imprevisto sin perder rigor. No se trata de improvisación caprichosa, sino de juicio situado. La buena evaluación no aplica un molde sobre la realidad: construye una relación inteligente con ella. Y esa inteligencia requiere presencia, escucha, sensibilidad ética, comprensión institucional y capacidad de acompañamiento.
La IA puede asistir, pero no acompañar
Aquí aparece una distinción central. La IA puede asistir una evaluación, pero no acompañarla. Puede ordenar documentos, sugerir categorías, resumir entrevistas o detectar patrones. Pero no habita el territorio, no construye confianza, no percibe la incomodidad de una reunión, no interpreta el peso de un silencio ni se hace responsable ante las personas que podrían ser afectadas por una decisión pública.
Acompañar no es producir una respuesta. Es estar presente en un proceso humano de construcción de sentido. Es moverse con otras personas en el tiempo y en el espacio, observar cómo emergen significados, cómo cambian las interpretaciones, cómo se expresan las tensiones, cómo aparecen las resistencias y cómo se negocian los sentidos de una experiencia.
La IA puede simular una conversación, producir interpretaciones o detectar regularidades. Pero no comparte incertidumbre, no vive la relación con quienes participan en una política, un programa o una evaluación, y no responde públicamente por lo que interpreta.
Por eso, el riesgo no es solamente que la IA cometa errores o “alucine”. El riesgo más profundo es que terminemos reduciendo nuestras expectativas sobre el conocimiento público para adaptarlas a lo que la IA puede producir. Que empecemos a valorar más lo rápido que lo justo, más lo calculable que lo significativo, más lo predecible que lo democrático, más lo estandarizable que lo situado.
Lo local no es un dato menor
La tensión entre lo local y lo global es decisiva. La IA opera a partir de grandes acumulaciones de información, lenguajes, patrones y supuestos. Sus respuestas suelen apoyarse en generalizaciones amplias, muchas veces producidas desde contextos culturales, institucionales y epistemológicos dominantes. Incluso cuando se le pide una respuesta “local”, el razonamiento que modela puede estar atravesado por supuestos globales que no siempre son visibles.
Pero las políticas públicas no ocurren en abstracto. Ocurren aquí y ahora: en barrios, escuelas, servicios de salud, cárceles, oficinas públicas, comunidades rurales, fronteras, municipios e instituciones concretas. Ocurren en culturas específicas, con memorias colectivas, desigualdades sedimentadas, formas de hablar y habitar, vínculos de confianza o desconfianza y relaciones de poder que no siempre aparecen en los datos.
La comprensión local no es un detalle pintoresco ni una anécdota metodológica. Es una condición de validez. Saber “qué funciona” no significa únicamente saber qué funcionó en promedio o qué predice un modelo general. Significa comprender qué ocurre en este contexto, con estas personas, bajo estas condiciones, con estas restricciones, estos significados y estas consecuencias.
Cuando la IA ofrece respuestas globalmente plausibles a problemas localmente complejos, puede producir una forma sutil de homogeneización. Puede imponer vocabularios, criterios de éxito, categorías de análisis o soluciones que parecen razonables en general, pero resultan pobres, inadecuadas o incluso dañinas en una realidad concreta.
Allí donde la inteligencia artificial encuentra patrones, las personas encuentran historias. Allí donde el algoritmo calcula probabilidades, la evaluación democrática debe preguntarse por derechos, responsabilidades y consecuencias.
Este punto es especialmente importante para América Latina. Nuestros estados, organizaciones y comunidades no son versiones incompletas de modelos globales. Tienen historias propias, desigualdades específicas, saberes territoriales, culturas políticas y memorias de exclusión que deben comprenderse en sus propios términos. Si la IA no se somete a esa comprensión situada, puede convertirse en un dispositivo de colonización metodológica: no porque venga necesariamente de afuera, sino porque traduce lo local a patrones generales sin escuchar su singularidad.
El problema no es solo el sesgo
Mucho se ha dicho, con razón, sobre sesgos algorítmicos. La IA no es neutral: es diseñada por personas, entrenada con datos producidos por sociedades desiguales y orientada por objetivos definidos desde determinados intereses. Si esos datos reflejan desigualdades de género, edad, territorio, discapacidad, nivel socioeconómico, origen étnico-racial o pertenencia cultural, la IA puede reproducirlas con apariencia de objetividad matemática.
Pero el problema no termina allí. El sesgo puede detectarse, auditarse y corregirse parcialmente. Lo más difícil es identificar cuándo una tecnología empieza a cambiar silenciosamente nuestra idea de conocimiento válido. Si solo cuenta lo que puede ser modelado, si solo importa lo que puede ser predicho, si solo se valora lo que puede ser escalado, entonces algo esencial de la evaluación democrática queda fuera.
El riesgo no es únicamente que una IA discrimine. El riesgo es que estreche el campo de lo pensable. Que transforme problemas políticos en problemas de clasificación. Que convierta experiencias humanas en datos descontextualizados. Que sustituya la deliberación por indicadores, la interpretación por correlaciones y la responsabilidad por automatismos.
Responsabilidad pública y libertad metodológica
La administración pública no puede reemplazar responsabilidad política por obediencia algorítmica. Las decisiones públicas que afectan derechos deben poder ser comprendidas, discutidas y apeladas. Si una persona pierde un beneficio, queda fuera de un programa o es clasificada como riesgo, tiene derecho a saber por qué. No alcanza con decir “lo indicó el sistema”.
Pero, además de transparencia, necesitamos proteger la libertad metodológica. La evaluación pública no debe quedar atrapada en diseños rígidos solo porque son más fáciles de automatizar. Lo medible importa, pero no agota lo valioso. Lo predecible ayuda, pero no reemplaza lo deliberativo. Lo generalizable puede orientar, pero no debe borrar la singularidad de los contextos.
Una estrategia responsable de IA en evaluación y políticas públicas debería partir de algunas condiciones mínimas: declarar cuándo y cómo se utiliza IA; asegurar responsabilidad humana final; auditar impactos y sesgos; garantizar participación ciudadana cuando se afecten derechos; y formar equipos híbridos, capaces de combinar saber técnico, conocimiento jurídico, sensibilidad ética, experiencia territorial y comprensión evaluativa.
Sin esas condiciones, la IA no fortalece la evaluación pública: la empobrece. Puede hacerla más rápida, más ordenada, más barata. Pero también menos democrática, menos situada y menos capaz de escuchar lo inesperado.
Lo que no se delega
En última instancia, gobernar la IA es gobernar una nueva forma de poder: poder para clasificar, priorizar, recomendar, excluir, visibilizar, ocultar y producir verdad administrativa. Por eso, la pregunta no es solo tecnológica. Es democrática.
¿Qué Estado queremos construir en tiempos de inteligencia artificial? ¿Uno que use la IA para ampliar su capacidad de escuchar, aprender y rendir cuentas, o uno que acelere decisiones sin discutir sus fundamentos y delegue en sistemas opacos aquello que debería deliberarse colectivamente?
La evaluación de políticas públicas puede ser una frontera decisiva en esta discusión. Si se la entiende como trámite, la IA probablemente la hará más rápida. Si se la entiende como control, la hará más eficiente. Pero si se la entiende como práctica democrática de aprendizaje, la pregunta cambia: cómo usar la IA sin perder aquello que hace que evaluar sea una actividad humana, pública y responsable.
No se trata de apagar la máquina. Se trata de domesticarla democráticamente. De ponerla al servicio de preguntas humanas, no de subordinar nuestras preguntas a sus respuestas. De usarla para ampliar capacidades, no para sustituir responsabilidades. De exigirle transparencia, pero también de exigirnos criterio.
Hay algo profundamente humano en evaluar: acompañar procesos, escuchar voces, comprender contextos, sostener tensiones, aceptar incertidumbre y responder por un juicio. Si la IA contribuye a proteger y ampliar ese espacio, será bienvenida. Si lo estrecha, lo empobrece o lo captura, habremos confundido innovación con renuncia.
Leopoldo Font es docente, consultor internacional en planificación estratégica y evaluación, y ha trabajado en evaluación de políticas públicas, derechos humanos, gestión por resultados y transformación del Estado. Saville Kushner es profesor emérito de la University of the West of England y referente internacional en evaluación de programas, evaluación democrática y metodología de la evaluación. Este artículo surge del diálogo entre el texto de Saville Kushner “Methodological freedom and Artificial ‘Intelligence’”, compartido por el autor en LinkedIn en junio de 2026, y las reflexiones previas de Leopoldo Font publicadas en la diaria sobre evaluación de políticas públicas, inteligencia artificial, capacidades estatales y calidad democrática.
