El modelo de IA generativa DeepSeek-R1 ha sorprendido por lograr una gran potencia a muy bajo coste. Su desarrollo ofrece valiosas lecciones para Europa en la carrera de la inteligencia artificial.
La irrupción de DeepSeek, la nueva IA generativa china y low cost, ha sacudido los mercados tecnológicos occidentales. Nvidia, la primera firma de procesadores gráficos (GPUs) se desplomó un 17 % en un solo día. Nunca antes se había visto una pérdida tan importante en bolsa (casi 600.000 millones de dólares).
En los últimos años, Nvidia se había convertido en la empresa cotizada más valorada del mundo. Su crecimiento ha ido de la mano de la alta demanda de procesamiento gráfico requerido para el desarrollo de modelos de IA generativa. Una ola tecnológica que también ha venido espoleando las ventas de fabricantes de micropocesadores.
Con recursos limitados, China ha logrado desarrollar modelos que compiten con los mejores modelos americanos
Sin embargo, parece que DeepSeek ha llegado para cambiar el paradigma. “Con recursos limitados —alrededor de 10.000 GPUs y un costo estimado de 5 millones de dólares—, han logrado desarrollar modelos que compiten con los mejores modelos americanos”, explica el profesor de Esade Esteve Almirall, experto en innovación e inteligencia artificial.
En comparación, las firmas estadounidenses han estado desembolsando desde 100 hasta 1.000 millones de dólares para desarrollar sus grandes modelos de lenguaje (LLM). Aún más, la irrupción de DeepSeek llega apenas una semana después del anuncio de Trump para invertir 500.000 millones en infraestructura de IA en EEUU.
En conjunto, el modelo DeepSeek-R1 ofrece de manera gratuita un producto tan potente como la versión o1 de ChatGPT, a un coste mucho menor y con código abierto, de modo que cualquiera puede replicarlo. El equipo de desarrollo de DeepSeek también ha publicado el paper técnico explicando cómo funciona el modelo.
Innovación por escasez
Pese a la sorpresa que ha supuesto para muchos y su sacudida en los mercados, Almirall aclara que “al igual que ocurrió con ChatGPT, DeepSeek no es un fenómeno nuevo ni surgido de la nada”. Desde hace más de un año, los círculos especializados le han prestado mucha atención, así como a los modelos de Alibaba (Qwen 2.5-VL) y 01.ai (Yi-34B) que han estado mostrando rendimientos muy cercanos a los de sus homólogos estadounidenses.
La regulación también puede tener un impacto positivo, y China es un buen ejemplo de ello
El éxito que ha supuesto DeepSeek es el resultado de la estrategia de política industrial del país asiático. “El gobierno chino estableció como objetivo liderar determinadas industrias estratégicas, un propósito que se materializó con el programa Made in China 2025 en 2015 y, más recientemente, con diversas iniciativas relacionadas con la inteligencia artificial”, explica Almirall. Se trata de políticas que han dado resultados y le están permitiendo liderar en sectores críticos como baterías, coches eléctricos y, ahora también, IA.
Además, hay dos factores reseñables. Una es la innovación propiciada por las restricciones que enfrentan los ingenieros chinos. “Han innovado en el uso de los recursos, entre otras cosas, porque no los tienen”, explica el profesor. En los últimos años, EEUU ha limitado la venta de tarjetas gráficas y microchips de última generación a su rival geopolítico. Como resultado, se han visto obligados a explorar nuevas formar de lograr los mismos resultados partiendo con desventaja.
El papel de la regulación en DeepSeek
El otro aspecto importante es la regulación. “A menudo, la regulación se asocia con una limitación de la libertad y solo se destaca su aspecto negativo. Sin embargo, la regulación también puede tener un impacto positivo, y China es un buen ejemplo de ello”, comenta Almirall.
El país asiático ha impulsado regulaciones específicas para dotar a todas las universidades con miles de GPUs, promover proyectos para mejorar la calidad de la investigación, programas para repatriar figuras clave y establecer colaboraciones con grandes empresas como Alibaba, Tencent o Huawei.
La estrategia de regulación europea tiene un alcance limitado
La otra cara de la regulación ha sido su aspecto restrictivo, puesto que todos los modelos chinos de IA han de estar alineados con la ideología oficial del Partido Comunista Chino. Los usuarios de DeepSeek han podido comprobar cómo el modelo evita hablar de temas comprometidos para el régimen como las protestas de Tiananmen, Taiwan o la figura de Xi Jin Ping, aunque la censura no siempre es infalible.
Lecciones de DeepSeek para Europa
Para Almirall, este nuevo capítulo en el desarrollo de grandes modelos de lenguaje, “con modelos más baratos, más potentes, más pequeños y más sencillos”, ofrece a Europa una oportunidad para jugar un papel relevante. DeepSeek-R1 se ha desarrollado con unos 5 millones de dólares y un entrenamiento de solo dos meses, involucrando a un equipo joven de menos de 100 personas. “Esto demuestra que es perfectamente factible para Europa”, sugiere.
Sin embargo, también advierte que, para lograrlo, se necesitan políticas de innovación que creen el ecosistema necesario. “En Europa, la regulación parece estar orientada sobre todo a prohibir y censurar los modelos de otros países, una estrategia con un alcance limitado”, prosigue Almirall.
En cambio, el objetivo habría de ser alinear los mercados con el interés común. “Se trata de diseñar mercados en que los incentivos de todos los participantes estén en sintonía con objetivos compartidos, evitando comportamientos extractivos”, puntualiza.
Y añade que, además de la regulación, otros instrumentos como los estándares, la promoción de conductas, los proyectos, la disponibilidad de recursos o la participación directa del Estado (a través de empresas públicas o público-privadas) pueden contribuir a alcanzar mercados más eficientes.
Puede que, después de todo, el terremoto provocado por DeepSeek suponga buenas noticias para una Europa no quiere quedar rezagada en la carrera de la inteligencia artificial.
Fuente: Do Better