Noticias

DeepSeek vuelve a la carga con una familia de modelos multimodales: Janus-Pro

Publicado el

28 enero, 2025

por

DeepSeek vuelve a la carga con una familia de modelos multimodales: Janus-Pro

Después de provocar un auténtico cataclismo en las tecnológicas dedicadas sobre todo a la fabricación de chips para IA, con sus modelos V3 y R1, DeepSeek ha vuelto a la carga con una nueva familia de modelos multimodales. Los ha llamado Janus-Pro y asegura que sus resultados superan a los que pueden conseguir diversos modelos multimodales ya en uso, con un tamaño notablemente menor que ellos.

Disponibles para descargar a través de la plataforma de desarrollo de IA Hugging face, cuentan, en función de sus dimensiones, con entre 1.000 y 7.000 millones de parámetros. Al igual que el código de los otros modelos de la compañía, el de los de la familia Janus-Pro es también open source (licencia MIT), lo que quiere decir que se pueden modificar y adaptar para mejorarlos, incluso con fines comerciales, sin ningún tipo de restricción.

Los modelos de la familia Janus-Pro son, según la propia DeepSeek, un nuevo framework autorregresivo, capaces tanto de analizar imágenes como de crear otras nuevas. El modelo más potente de la familia, el Janus-Pro-7B, supera los resultados obtenidos por modelos como Dall-E3 de OpenAI, Stable Diffusion XL de Stability AI, Emu3-Gen o PixArt-alpha. Eso sí, los modelos más pequeños de la familia, los que tienen menor número de parámetros, solo son capaces de analizar imágenes pequeñas, con una resolución máxima de 384×384.

La compañía ha confirmado el lanzamiento a través de un post en la web de Hugging Face, en el que recalcan que Janus-Pro supera al modelo unificado precio, y cubre o supera las expectativas de DeepSeek en cuanto al rendimiento de modelos que se encargan de realizar tareas concretas.

Además, señalan que «la simplicidad, alta flexibilidad y efectividad de Janus-Pro convierte a sus modelos en candidatos para la próxima generación de modelos multimodales unificados de próxima generación«.

DeepSeek sigue por tanto empeñada en romper los esquemas de las compañías dedicadas a la IA en EEUU y Europa, que después de ver cómo los fabricantes de hardware para IA, y también varias de semiconductores, como Broadcom, TSMC o Nvidia; perdían miles de millones en bolsa en la sesión de ayer, empiezan a reaccionar. OpenAI, por ejemplo, ya ha señalado que lanzarán más y mejores modelos, y apunta hacia una aceleración en su hoja de ruta para competir con la startup china.

En Nvidia, a pesar de perder ayer cerca de 600.000 millones de dólares, aparentemente mantienen la calma, y califican a DeepSeek-R1 como «un excelente avance en IA y un ejemplo perfecto de prueba de escalado de tiempo, cuyo trabajo ilustra cómo se pueden crear nuevos modelos utilizando dicha técnica, aprovechando modelos disponibles y computación que cumple perfectamente con los controles de exportación«. Habrá que ver cómo evolucionan las bolsas, y el sector, en los próximos días.

A continuación

Ericsson impulsa la investigación en IA open source con la creación de Cognitive Labs

No te pierdas

La joint venture de fibra de Telefónica y Vodafone España ya tiene CEO: Pablo Ledesma

Celia Valdeolmillos

Redactora de tecnología con más de 15 años de experiencia, salté del papel a la Red y ya no me muevo de ella. Inquieta y curiosa por naturaleza, siempre estoy al día de lo que pasa en el sector.