A Fondo

DeepSeek: la IA de China que ha puesto patas arriba el sector tecnológico

Publicado el

27 enero, 2025

por

DeepSeek: la IA de China que ha puesto patas arriba el sector tecnológico

Esta semana no ha comenzado demasiado bien para el sector tecnológico relacionado con la IA en los parqués. Para muestra, un botón: Nvidia caía con fuerza nada más abrirse la sesión en las bolsas estadounidenses, con sus acciones llegando a descender a mitad de sesión alrededor de un 17% y perdiendo alrededor de medio billón de dólares.

No es la única tecnológica relacionada con los chips que está experimentando caídas más que notables en este inicio de semana. A media sesión en las bolsas estadounidenses, Micron caía por encima del 12%, Marvell alrededor de un 17%, TSMC registraba un descenso cercano al 15%, Broadcom perdía más de un 18% y AMD casi un 6,5%. Incluso europeas como ASML han bajado con fuerza en la bolsa. ¿Qué ha causado este cataclismo? Pues nada menos que el lanzamiento de una familia de modelos de IA en China, y los resultados que ha obtenido con respecto a otros desarrollados por tecnológicas de Occidente. ¿De dónde ha salido? De una startup china llamada DeepSeek.

Todo empezó el pasado 20 de enero con el lanzamiento de un modelo de IA de razonamiento llamado DeepSeek-R1, con un chatbot asociado. Poco antes, a finales de 2024 había lanzado otro, DeepSeek V3, un modelo grande de lenguaje. Entonces ya levantó algunas suspicacias, puesto que sus creadores decidieron que fuese open source, además de asegurar que se desarrolló en menos de dos meses y que se invirtió en su desarrollo algo menos de 6 millones de dólares. Es, por tanto, una cantidad muchísimo menor que lo que las empresas e inversores occidentales invierten en desarrollar y entrenar este tipo de modelos.

Desde entonces, el runrún en el sector tecnológico relacionado con la IA sobre lo logrado con este modelo ha ido en aumento, llegando a su punto más alto a finales de la semana pasada al aparecer nuevos datos sobre el rendimiento de DeepSeek-R1 y otros modelos de la compañía, como V3. También sobre el hardware necesario para su creación, en principio chipsets y componentes mucho menos potentes que los utilizados por otras empresas estadounidenses para crear los suyos. Muchos no se explican todavía lo conseguido por DeepSeek y cómo lo han hecho, y la reacción de las bolsas no se ha hecho esperar más.

De ser cierto lo planteado por DeepSeek, no sería necesario crecer de forma infinita en consumo de energía y potencia de hardware para conseguir modelos de IA más potentes, así que los accionistas, por ahora, están castigando a los valores hardware relacionados con la construcción de equipo para trabajar con la IA. Por ahora, las compañías de software y desarrollo de IA que cotizan en bolsa, aunque muchas registran pérdidas, mantienen el tipo, aunque habrá que ver qué sucede en los próximos días.

¿De dónde sale exactamente DeepSeek?

Como hemos mencionado, DeepSeek es una startup de China, que tiene algo más de un año, y que asegura que con sus modelos de IA que pueden ofrecer un rendimiento similar, o incluso superior en algunos aspectos, a los chatbot y modelos más potentes desarrollados por entidades estadounidenses y europeas. Además, lo han hecho al parecer por un coste mucho menor que los desarrollados por otras empresas.

Por si esto fuera poco, los creadores de sus modelos, según Bloomberg, aseguran que los entrenamientos de los modelos han sido menos complejos, y que además en su desarrollo, entrenamiento y modelo se consume mucha menos energía que con modelos de otras compañías.

Fundada por el responsable del fondo de inversión centrado en la IA High-Flyer, Liang Wenfeng, hace sus modelos open source con el fin de que la comunidad de desarrolladores pueda examinar su código y mejorarlos. Las apps que han lanzado, con DEepSeek V3 integrado, han levantado gran interés, y la que ha desarrollando para iOS ya está en el primer puesto de las descargas para iPhone en Estados Unidos, China, Singapur, Canadá, Australia y Reino Unido en solo unos días.

En la tienda de Android también ocupa los primeros puestos en varios países. Entre ellos, en España, donde es la segunda aplicación en descargas en este momento. El 25 de enero ya se había descargado más de 1,6 millones de veces en todo el mundo. Su chatbot se diferencia de otros en que es capaz de articular su razonamiento antes de ofrecer una respuesta a un prompt, igualando e incluso superando a ChatGPT en algunos aspectos.

Ventajas que tendrían los modelos de DeepSeek con respecto a otros

Como hemos mencionado, el coste del desarrollo y el entrenamiento de los modelos de DeepSeek sería solo una parte de lo que se necesita para hacer lo mismo con los mejores y más potentes modelos y chatbots de OpenAI y Meta. Por tanto, su nivel de eficiencia energética es mucho mayor, y pone en duda la necesidad de que sea necesario invertir grandes cantidades de dinero para conseguir avanzar en el desarrollo de modelos de IA.

También, dado que en teoría no contaría con los últimos chips de las compañías desarrolladoras de componentes y aceleradores de IA de última generación por el embargo impuesto por Estados Unidos sobre la venta de chipsets y maquinaria para fabricarlos a China, demostraría que no se necesitan los últimos modelos de chips y aceleradoras para avanzar en IA. Tampoco los más potentes. Algo totalmente distinto de lo que aseguran las empresas dedicadas a la fabricación de hardware para IA, pero sobre todo las compañías encargadas del desarrollo de sistemas de IA generativa.

Según fuentes de la propia DeepSeek, R1 se acerca mucho, e incluso supera, los resultados de otros modelos de IA en diversos bancos de pruebas especializados. Entre ellos están AIME 2024 para tareas de matemáticas, MMLU para cultura general y AlpacaEval 2.0 para rendimiento con baterías de preguntas y respuestas.

Además, está en los primeros puestos en un índice de rendimiento afiliado a la Universidad de Berkeley, conocido como Chatbot Arena. En cuanto a V3, consiguió superar a modelos como GPT-4o o Llama 3.1 405B. Eso sí, su chatbot parece tener algunas lagunas importantes cuando se le pregunta por temas controvertidos en China, como por otro lado cabía esperar.

¿Hay motivos para la alarma en EEUU y entre los fabricantes de chips?

Al no haber necesitado supuestamente chips de última generación para avanzar en desarrollo de IA, DeepSeek ha puesto en solfa las restricciones que le ha impuesto Estados Unidos sobre la venta de semiconductores y de máquinas para el desarrollo de chips de última generación.

Los avances de DeepSeek, que ya tiene varios modelos disponibles, demostrarían también ha habilidad de los ingenieros de IA de China, que se las están ingeniando para superar, o saltarse, las restricciones. Lo habrían conseguido con una premisa muy simple: mejorar la eficiencia de los modelos con los recursos limitados disponibles.

Su modelo open source, además, está pensado para conseguir el mayor número de usuarios lo antes posible, posiblemente para después desarrollar estrategias de monetización para sacar partido a la base de usuarios que consiga. Y al ofrecer modelos más asequibles, ya ha conseguido rebajar los costes de los desarrolladores de IA en China, lo que ha hecho que muchos se unieran a esa base.

El éxito de DeepSeek puede llevar a que OpenAI y otros proveedores de IA, sobre todo estadounidenses, tengan que bajar notablemente sus precios para mantener su liderazgo. Además, abre un debate en torno a las ingentes cantidades de dinero que tanto empresas como instituciones gubernamentales están invirtiendo en IA para no quedarse atrás.

Hace menos de una semana, de hecho, Trump anunció una ingente inversión en la puesta en marcha del proyecto Stargate, que tiene como objetivo convertir a EEUU en el líder mundial en Inteligencia Artificial, y en el que tienen pensado invertir hasta medio billón de dólares. Meta, además, acaba de anunciar otra potente inversión en IA, sobre todo para infraestructura: 65.000 millones. Mucho más que lo que DeepSeek señala que se necesita para desarrollar y entrenar sistemas de IA.

A la vista de lo que promete esta startup, la reacción de las bolsas en cuanto se han hecho públicos tanto información como posibles resultados de los modelos de la compañía, ha sido de huida en desbandada de los valores relacionados con el desarrollo de chips para IA, así como de algunas de las compañías que están directamente relacionadas con su desarrollo, aunque en menor medida.

Habrá que ver cómo evolucionan los mercados en los próximos días para ver si las caídas de hoy se convierten en una crisis en el desarrollo de chips para IA, o si se queda todo en un susto para las tecnológicas.

Pero si se confirma lo que DeepSeek asegura sobre la creación y puesta a punto de sus modelos, todo apunta a que las voces que aseguran que hay que crecer de manera constante en potencia de computación e inversión para avanzar en el desarrollo de modelos y sistemas de IA van a tener mucho más complicado hacer que su mensaje cale en el mundo de la tecnología. Sobre todo, si hay otras compañías chinas que estén trabajando en modelos y sistemas de IA con un planteamiento similar, y que estén a punto de ver la luz.

Categorías relacionadas:DeepSeek DeepSeek V3 DeppSeek R1 IA IA china modelos de IA Principales

A continuación

15 años de los Apple iPad y la «revolución» del tablet

No te pierdas

La Comisión Europea, preocupada por la dependencia de Microsoft a nivel interno

Celia Valdeolmillos

Redactora de tecnología con más de 15 años de experiencia, salté del papel a la Red y ya no me muevo de ella. Inquieta y curiosa por naturaleza, siempre estoy al día de lo que pasa en el sector.