Economía Ingresá
Economía

Inteligencia Artificial DeepSeek. Imagen: Linkedin.

¿Un momento Sputnik para la IA?

4 minutos de lectura
Contenido exclusivo con tu suscripción de pago

Aunque se podría decir que la industria de inteligencia artificial de Estados Unidos necesitaba una reestructuración, la noticia de que una start-up china haya superado a las grandes tecnológicas en su propio terreno plantea algunas preguntas difíciles. Afortunadamente, si los líderes tecnológicos y los responsables de las políticas estadounidenses pueden aprender las lecciones correctas del éxito de DeepSeek, todos podríamos terminar mejor gracias a ello.

Contenido no disponible con tu suscripción actual
Exclusivo para suscripción digital de pago
Actualizá tu suscripción para tener acceso ilimitado a todos los contenidos del sitio
Para acceder a todos los contenidos de manera ilimitada
Exclusivo para suscripción digital de pago
Para acceder a todos los contenidos del sitio
Si ya tenés una cuenta
Te queda 1 artículo gratuito
Este es tu último artículo gratuito
Nuestro periodismo depende de vos
Nuestro periodismo depende de vos
Si ya tenés una cuenta
Registrate para acceder a 6 artículos gratis por mes
Este audio es una característica exclusiva de la suscripción digital.
Escuchá este artículo

Tu navegador no soporta audios HTML5.

Tu navegador no soporta audios HTML5.

Leído por Andrés Alba.
Llegaste al límite de artículos gratuitos
Nuestro periodismo depende de vos
Para seguir leyendo ingresá o suscribite
Si ya tenés una cuenta
o registrate para acceder a 6 artículos gratis por mes

Editar

Después del lanzamiento, el 20 de enero, de DeepSeek‑R1, seguido por la enorme caída de las acciones de la fabricante de chips Nvidia y marcados descensos en las valoraciones de otras empresas tecnológicas, algunos hablaron de un “momento Sputnik” en la carrera sinoestadounidense por la supremacía en inteligencia artificial. Aunque puede decirse que a la industria estadounidense de la IA le hacía falta una sacudida, lo sucedido plantea algunas preguntas difíciles.

La industria tecnológica estadounidense ha realizado enormes inversiones en IA y Goldman Sachs prevé que “en los próximos años, megatecnológicas, corporaciones y empresas de servicios públicos gastarán alrededor de un billón de dólares en capital de soporte a la IA”. Pero muchos observadores (entre los que me incluyo) llevamos tiempo cuestionando el rumbo de las inversiones y del desarrollo de la IA en Estados Unidos.

Parece que el sector tiene todos los huevos puestos en la misma cesta, ya que todas las empresas líderes siguen básicamente el mismo manual (aunque Meta se ha diferenciado un poco, con su modelo que en parte es de código abierto). Sin excepciones, todas las tecnológicas estadounidenses están obsesionadas con la escala. Aducen “leyes de escala” que todavía no están probadas, y dan por sentado que la clave para seguir extendiendo las capacidades de la IA es suministrar cada vez más datos y potencia de cálculo a sus modelos. Algunos llegan a afirmar que “lo único que se necesita es escala”.

Hasta el 20 de enero, las empresas estadounidenses no estaban dispuestas a considerar alternativas a los modelos fundacionales preentrenados con conjuntos de datos masivos para predecir la siguiente palabra de una secuencia. Sus prioridades las llevaron a centrarse casi exclusivamente en los modelos de difusión y en chatbots pensados para realizar tareas propias de los seres humanos (o similares). Y aunque en líneas generales DeepSeek sigue el mismo planteo, parece que le dio más importancia al aprendizaje por refuerzo, a la metodología de mezcla de expertos (donde se usan muchos modelos de menor tamaño y más eficientes), a la destilación de conocimiento y al razonamiento en cadena refinado. Esta estrategia, al parecer, ha permitido a la empresa china producir un modelo competitivo, por una fracción del costo de los otros.

Aunque todavía no está claro que DeepSeek nos haya contado toda la historia, lo sucedido pone de manifiesto un problema de pensamiento grupal dentro de la industria estadounidense de la IA. Su ceguera en relación con métodos alternativos más baratos y prometedores, en combinación con el bombo publicitario, es exactamente lo que habíamos predicho con Simon Johnson en Power and Progress, libro que escribimos justo antes de que comenzara la era de la IA generativa. La pregunta ahora es si la industria estadounidense no tendrá acaso otros puntos ciegos, todavía más peligrosos. Por ejemplo, ¿se están perdiendo las grandes tecnológicas estadounidenses la oportunidad de llevar sus modelos en una dirección más “prohumana”? Sospecho que sí, pero sólo el tiempo lo dirá.

Luego está la pregunta de si China le está quitando la delantera a Estados Unidos. De ser así, ¿implica que las estructuras autoritarias verticalistas (lo que James A Robinson y yo hemos llamado “instituciones extractivas”) pueden igualar o incluso superar, en cuanto motores de innovación, a los ordenamientos abiertos?

Tiendo a pensar que el control verticalista obstaculiza la innovación, como argumentamos con Robinson en Por qué fracasan las naciones. Aunque el éxito de DeepSeek pueda parecer un contraargumento, dista mucho de ser prueba concluyente de que la innovación con instituciones extractivas pueda ser tan poderosa o duradera como la innovación con instituciones inclusivas. No olvidemos que DeepSeek se basa en años de avances que tuvieron lugar en Estados Unidos (y en algunos casos, Europa). Todos sus métodos básicos nacieron en Estados Unidos. Los modelos de mezcla de expertos y el aprendizaje por refuerzo se desarrollaron en instituciones de investigación académicas, hace ya varias décadas; y fueron megatecnológicas estadounidenses las que introdujeron los transformadores, el razonamiento en cadena y la destilación de conocimiento.

Lo que ha hecho DeepSeek es una exhibición de capacidad ingenieril: combinar los mismos métodos con más eficacia que las empresas estadounidenses. Queda por ver si las empresas e instituciones de investigación chinas pueden dar el siguiente paso y presentar técnicas, productos y metodologías propios revolucionarios.

Además, DeepSeek no se parece a la mayoría de las empresas chinas de IA, que por lo general producen tecnologías para el gobierno o con financiación estatal. Si esta empresa, surgida de un fondo de cobertura, operaba bajo el radar, ¿mantendrá su creatividad y dinamismo ahora que está a la vista de todos? Sin importar lo que pase, los logros de una única empresa no pueden tomarse como prueba concluyente de que China puede vencer en innovación a las sociedades más abiertas.

Otra pregunta tiene que ver con la geopolítica. ¿Es el caso DeepSeek prueba de que los controles estadounidenses a las exportaciones y otras medidas pensadas para frenar la investigación china en IA han fracasado? La respuesta tampoco está clara. Aunque DeepSeek entrenó sus últimos modelos (V3 y R1) con chips anteriores, menos potentes, es posible que necesite los mejores chips disponibles para aumentar la escala y lograr nuevos avances.

Lo que está claro es que la estrategia estadounidense de suma cero era inviable y desacertada. Esa estrategia sólo tiene sentido suponiendo que nos acercamos a la inteligencia artificial general (IAG; modelos con capacidad para igualar a los seres humanos en cualquier tarea cognitiva), y que quien consiga primero la IAG tendrá una enorme ventaja geopolítica. Pero por aferrarnos a estos supuestos (inciertos en ambos casos) hemos impedido una colaboración fructífera con China en muchas áreas. Por ejemplo, si uno de los dos países crea modelos que aumentan la productividad humana o nos ayudan a regular mejor la energía, esa innovación beneficiará a ambos países, sobre todo si se generaliza su uso.

Como sus homólogas estadounidenses, DeepSeek aspira de hecho a desarrollar la IAG, y en esto, crear un modelo que se pueda entrenar a un costo significativamente menor podría ser un avance revolucionario. Pero reducir los costos de desarrollo con los métodos conocidos no implica que como por arte de magia vayamos a conseguir la IAG en los próximos años. Que la IAG sea factible a corto plazo es una cuestión todavía no resuelta (y que sea deseable es todavía más discutible).

Todavía no conocemos todos los detalles sobre cómo DeepSeek ha desarrollado sus modelos o qué significa su aparente logro para el futuro de la industria de la IA, pero una cosa parece clara: una advenediza china desinfló la obsesión de la industria tecnológica con la escala, e incluso es posible que al hacerlo la haya despertado de la autocomplacencia.

Daron Acemoglu, premio Nobel de Economía 2024 y profesor distinguido de Economía en el MIT, es coautor (con Simon Johnson) de Power and Progress: Our Thousand-Year Struggle Over Technology and Prosperity (PublicAffairs, 2023). Copyright: Project Syndicate, 2025. Traducción: Esteban Flamini.

¿Tenés algún aporte para hacer?

Valoramos cualquier aporte aclaratorio que quieras realizar sobre el artículo que acabás de leer, podés hacerlo completando este formulario.

¿Te interesa la economía?
Suscribite y recibí la newsletter de Economía en tu email.
Suscribite
¿Te interesa la economía?
Recibí la newsletter de Economía en tu email todos los lunes.
Recibir
Este artículo está guardado para leer después en tu lista de lectura
¿Terminaste de leerlo?
Guardaste este artículo como favorito en tu lista de lectura