Si hay algo que define a la inteligencia artificial (IA) son sus precios. Entrenar nuevos modelos es muy caro, reunir las bases de datos para hacerlo es muy caro, y ponerla a disposición de los usuarios es muy caro, debido a sus enormes requerimientos computacionales y energéticos. Lejos de intentar controlar esta escalada, Silicon Valley y Washington la han usado como filtro: sin unos cuantos cientos de millones de dólares en la cuenta y el sello para importar chips estás fuera de la carrera.

Desde 2022, cuando apareció ChatGPT, esa cadena de precios astronómicos ha impulsado el valor de los gigantes estadounidenses que se reparten el pastel. El de Microsoft ha aumentado un 85%. El de Google, un 105%. El de Meta, un 580%. El de Nvidia, un 840%. OpenAI está valorada en más de 150.000 millones de dólares tras la mayor entrada de capital riesgo en una sola firma de la historia, mientras que xAI, la empresa que Elon Musk se sacó de la manga con los datos de X, ha alcanzado los 50.000 millones. En el ámbito de las ayudas públicas, el baremo ahora son los 500.000 millones que Donald Trump ha puesto encima de la mesa para construir centros de datos.

Mientras el mundo se iba acostumbrando a esas cifras, una empresa china ha dado una patada al tablero. Este lunes su efecto ha volatilizado cientos de miles de millones en el valor de las grandes tecnológicas estadounidenses. Esa empresa china se llama DeepSeek y su órdago se llama R-1, una IA con capacidades muy similares a las de los últimos modelos de OpenAI, pero que asegura que sólo ha costado 5,5 millones de euros entrenar, un 90% menos que lo invertido por su máximo rival estadounidense.

El precio no es el único martillazo a los cimientos de la industria de la IA que ha dado DeepSeek. También está el de los componentes. Oficialmente, la empresa –fundada en 2023 y con unos 150 empleados– no ha tenido acceso a los chips más avanzados de Nvidia debido al veto a las exportaciones de Washington. Es decir, ha entrenado a su IA con un proceso mucho más barato y con menos recursos computacionales que los que emplea Silicon Valley.

Esto ha tenido un efecto devastador en la cotización de Nvidia, que ha dejado más de medio billón de dólares en una sola jornada, la mayor destrucción de valor bursátil de la historia. Un duro correctivo para la compañía liderada por Jensen Huang, que había escalado hasta ser la más valiosa del mundo gracias a su ventaja competitiva en sus chips para la IA. Ahora se abre la duda de si esos componentes súper avanzados son realmente necesarios para desarrollar algoritmos punteros.

Finalmente, la empresa china ha dado un último golpe a Trump y su corte de tecnólogos abriendo el código de su máquina casi por completo. Esto significa que cualquier otra persona u organización puede examinarlo, copiarlo y modificarlo en función de sus necesidades. En la práctica, significa que está dando gratis un producto por el que OpenAI cobra. La compañía de Sam Altman no cotiza en bolsa, por lo que ha impedido que el efecto DeepSeek suponga un correctivo automático a su valor.

Más barato, más eficiente, replicable

“El modelo razonador DeepSeek R-1 logra colocarse al nivel de los modelos razonadores o1-mini y o1 de OpenAI, de acuerdo a lo publicado en su artículo. Es capaz de superar a o1 en algunas de las tareas evaluadas y supera con creces las capacidades de o1-mini. La gran ventaja ahora mismo es que se trata de un modelo más eficiente, que responde más rápido, y además es de código abierto con licencia de uso comercial”, expone Mikel Galar, catedrático de Ciencia de la Computación e Inteligencia Artificial de la Universidad Pública de Navarra.

El especialista explica que DeepSeek ha utilizado 21 conjuntos de pruebas para testar sus IA y compararlas con las estadounidenses. Estos se dividen en diferentes tipos de tareas: diez pruebas de inglés, cinco de programación de código, tres de matemáticas y tres en chino. Aunque en algunas tareas queda por detrás, en la mayoría de ellas R-1 alcanza o rebasa en algunos puntos la puntuación de o1.

Técnicamente, el o1 no es el modelo más potente de OpenAI, pero sí el último que está disponible para el público. Los más modernos son más potentes, pero simplemente consumen demasiados recursos como para sacarlos al mercado. “OpenAI anunció su modelo o3 hace unas semanas, con una mejora clara frente a sus modelos de la familia o1, pero este no está disponible por el alto costo que conlleva su uso”, recuerda Galar.

DeepSeek se ha convertido este fin de semana en la aplicación más descargada en Estados Unidos, por delante de ChatGPT. La demanda ha sido tan alta que este lunes la compañía china tenía muchos problemas para registrar nuevos usuarios o dar servicio en países como España, aunque la empresa ha denunciado que se ha debido a “un ciberataque a gran escala”. A última hora de este lunes, la compañía china contraatacaba con otro as más, al publicar un modelo de IA que bate a sus rivales también en generación de imágenes, según sus pruebas.

Aplicación DeepSeek en un teléfono móvil en Pekín, el 27 de enero.

Aplicación DeepSeek en un teléfono móvil en Pekín, el 27 de enero.

Foto: Greg Baker, AFP

Según The Wall Street Journal, el trasvase a la IA de DeepSeek ya ha comenzado en Silicon Valley. Anthony Poo, cofundador de una startup que utiliza IA para predecir rentabilidades financieras, ha revelado que su empresa lo hizo en setiembre. Sus pruebas demostraron que DeepSeek ofrecía un rendimiento similar por una cuarta parte del coste. “El modelo de OpenAI es el mejor en rendimiento, pero tampoco queremos pagar por capacidades que no necesitamos”, afirma Poo.

“No es perfecto y tiene algunos tics. Por ejemplo, es un modelo que a veces, al hacerle una pregunta en inglés, te contesta una parte en chino”, dice Robert Clarisó, profesor de los Estudios de Informática, Multimedia y Telecomunicación de la Universitat Oberta Catalunya, sobre su modelo de generación de texto. “Las personas que están empezando a utilizarlo comentan que realmente la apariencia que da es que sí, que tiene una calidad parecida a los modelos de OpenAI”, continúa.

En cualquier caso, Clarisó pide prudencia y tiempo a la hora de evaluar el modelo chino. “La mayor innovación son las optimizaciones en la forma como se ha entrenado el modelo, para emplear menos recursos. Todavía falta ver si estos trucos han tenido alguna repercusión en su rendimiento y si se ha perdido algo por el camino”, destaca.

¿Un veto que ha espoleado la innovación?

Nvidia y los gigantes de la IA estadounidenses no son los únicos que han vivido una jornada negra por la irrupción de DeepSeek. Las políticas de mano dura con las exportaciones de chips de Joe Biden y que Donald Trump se ha mostrado partidario de mantener e incluso aumentar también han quedado en entredicho. Numerosos analistas señalan que son estas medidas las que han espoleado a las empresas de IA chinas a hacer más con menos.

“La verdad incómoda para los responsables políticos estadounidenses es que los estrictos controles a las exportaciones han obligado a las empresas tecnológicas chinas a volverse más autosuficientes, estimulando avances que de otra manera tal vez no habrían ocurrido”, dice en una tribuna del Financial Times Ángela Zhang, profesora de la Universidad del Sur de California y autora de High Wire: cómo regula China las grandes tecnológicas y gobierna su economía.

La experta recuerda que Pekín ha intentado espolear su industria de la IA desde hace años sin demasiado éxito. “Las iniciativas estatales suelen dar lugar a ineficiencia, corrupción y despilfarro”, afirma. “Lo que las restricciones estadounidenses consiguieron sin querer fue un poderoso incentivo comercial para que el sector privado chino ocupara el lugar que le correspondía. Y si bien Estados Unidos suele dominar en materia de investigación innovadora, las empresas chinas sobresalen en ejecución, asequibilidad y difusión de productos. En comercio electrónico, vehículos eléctricos, paneles solares y baterías, han demostrado una capacidad impresionante para crecer”, remarca.

Clarisó concuerda: “La industria china es muy buena tomando un producto y refinándolo para hacerlo más eficiente o más barato”. “Además, en esto también partían con un poco de ventaja, porque ellos ya sabían lo que estaban haciendo los estadounidenses y cuáles son los problemas de base”, añade.

“Reivindicaciones sospechosas”

DeepSeek encarna a la perfección el mito de David contra Goliat en el campo de la IA. Con todo, otros especialistas consultados destacan que algunas de sus explicaciones sobre cómo han entrenado a sus modelos son “sospechosas”.

Así lo expresa Julián Estévez, profesor de Robótica e Inteligencia Artificial en la Universidad del País Vasco. Una de esas aseveraciones es el hecho de que no hayan tenido acceso a los chips más avanzados. “China tiene sanciones para importar chips de Nvidia, como sabemos. Sin embargo, está empleando a terceros países como intermediarios. El principal de ellos es Singapur, y es un secreto a voces”, destaca.

“En el Foro de Davos entrevistaron al CEO de ScaleAI, y él declaró que sospechaba que DeepSeek entrenaba con unos 50.000 GPU de Nvidia, pero que no lo podían decir por las sanciones”, continúa el profesor, que tampoco da por sentado que esa cifra sea la real. En setiembre Financial Times reveló que había cientos de miles de chips avanzados de Nvidia en China, y que alquilar su potencia de cálculo era incluso más barato que en Estados Unidos.

Por último, Estévez destaca que las métricas para comparar inteligencias artificiales generativas de texto “han quedado inservibles desde hace un tiempo. Se pueden emplear para engañar con estadística, o incluso se puede entrenar al modelo para que se superen esos test”. Por ello, “hay que tomar con pinzas las reivindicaciones grandilocuentes” de las empresas de IA sobre sus modelos, tanto de DeepSeek como sus contrapartes estadounidenses.

Este artículo se publicó originalmente en elDiario.es.