Noticias
DeepSeek vuelve a la carga con una familia de modelos multimodales: Janus-Pro

Después de provocar un auténtico cataclismo en las tecnológicas dedicadas sobre todo a la fabricación de chips para IA, con sus modelos V3 y R1, DeepSeek ha vuelto a la carga con una nueva familia de modelos multimodales. Los ha llamado Janus-Pro y asegura que sus resultados superan a los que pueden conseguir diversos modelos multimodales ya en uso, con un tamaño notablemente menor que ellos.
Disponibles para descargar a través de la plataforma de desarrollo de IA Hugging face, cuentan, en función de sus dimensiones, con entre 1.000 y 7.000 millones de parámetros. Al igual que el código de los otros modelos de la compañía, el de los de la familia Janus-Pro es también open source (licencia MIT), lo que quiere decir que se pueden modificar y adaptar para mejorarlos, incluso con fines comerciales, sin ningún tipo de restricción.
Los modelos de la familia Janus-Pro son, según la propia DeepSeek, un nuevo framework autorregresivo, capaces tanto de analizar imágenes como de crear otras nuevas. El modelo más potente de la familia, el Janus-Pro-7B, supera los resultados obtenidos por modelos como Dall-E3 de OpenAI, Stable Diffusion XL de Stability AI, Emu3-Gen o PixArt-alpha. Eso sí, los modelos más pequeños de la familia, los que tienen menor número de parámetros, solo son capaces de analizar imágenes pequeñas, con una resolución máxima de 384×384.
La compañía ha confirmado el lanzamiento a través de un post en la web de Hugging Face, en el que recalcan que Janus-Pro supera al modelo unificado precio, y cubre o supera las expectativas de DeepSeek en cuanto al rendimiento de modelos que se encargan de realizar tareas concretas.
Además, señalan que «la simplicidad, alta flexibilidad y efectividad de Janus-Pro convierte a sus modelos en candidatos para la próxima generación de modelos multimodales unificados de próxima generación«.
DeepSeek sigue por tanto empeñada en romper los esquemas de las compañías dedicadas a la IA en EEUU y Europa, que después de ver cómo los fabricantes de hardware para IA, y también varias de semiconductores, como Broadcom, TSMC o Nvidia; perdían miles de millones en bolsa en la sesión de ayer, empiezan a reaccionar. OpenAI, por ejemplo, ya ha señalado que lanzarán más y mejores modelos, y apunta hacia una aceleración en su hoja de ruta para competir con la startup china.
En Nvidia, a pesar de perder ayer cerca de 600.000 millones de dólares, aparentemente mantienen la calma, y califican a DeepSeek-R1 como «un excelente avance en IA y un ejemplo perfecto de prueba de escalado de tiempo, cuyo trabajo ilustra cómo se pueden crear nuevos modelos utilizando dicha técnica, aprovechando modelos disponibles y computación que cumple perfectamente con los controles de exportación«. Habrá que ver cómo evolucionan las bolsas, y el sector, en los próximos días.
-
EventosHace 5 días
MCPRO Data Innovation Forum 2025: el evento clave para la gestión del dato y la ciberseguridad
-
NoticiasHace 6 días
Macron anuncia una inversión de 109.000 millones de euros en IA en Francia
-
EntrevistasHace 4 días
«La sostenibilidad y el cálculo de la huella de carbono en tiempo real son fundamentales en el contexto actual»
-
OpiniónHace 2 días
Cómo debe ser la IA de código abierto, según Red Hat