Noticias

Alibaba sube la presión: asegura que su modelo de IA Qwen 2.5-Max supera a DeepSeek

Publicado el

29 enero, 2025

por

Alibaba sube la presión: asegura que su modelo de IA Qwen 2.5-Max supera a DeepSeek

La guerra entre desarrolladores de IA no ha hecho más que empezar. Con rumores de que hay numerosos modelos en desarrollo en China que combaten por superarse unos a otros, y aparentemente ignorando lo conseguido por los desarrolladores estadounidenses y europeos hasta ahora, ya empiezan a aparecer las primeras muestras de que DeepSeek no es la compañía más avanzada del país en IA, sino que solo es una más. Para muestra, el modelo que Alibaba acaba de presentar: una nueva versión de su modelo de IA Qwen 2.5, que asegura que es más potente que uno de los últimos modelos de DeepSeek, el V3.

Según Reuters, Alibaba asegura que Qwen 2.5-Max, esta nueva versión, supera en rendimiento a GPT-4o, DeepSeek-V3 y Llama-3.1-405N. Se trata de un modelo de tipo MoE (Mixture of Experts) que se caracteriza por una arquitectura que permite un escalado más eficiente que los modelos tradicionales, activando solo un subconjunto de parámetros durante sus trabajos de inferencia. La incorporación de este tipo de arquitectura hace que Qwen 2.5-Max sea un modelo muy potente, sin que por ello consuma una gran cantidad de recursos.

Según apuntan desde Alibaba Cloud, han preentrenado este modelo con unos 20 billones de tokens, lo que hace que sea uno de los modelos más ricos en datos de la actualidad. Esto hace posible también que su rendimiento sea elevado en diversos tipos de tareas, que van desde la comprensión del lenguaje natural hasta el razonamiento complejo. Además de por su rendimiento, Qwen 2.5-Max destaca también por su escalabilidad y eficiencia.

La posibilidad que tiene, por tanto, de gestionar tareas cada vez más complejas, hace que pueda procesar grandes cantidades de información con rapidez y de manera bastante precisa. Por eso es útil para tareas como analítica en tiempo real, automatización de tareas o desarrollo de determinados tipos de bots.

Este modelo tiene una longitud de secuencia máxima de entrada de hasta 100.000 tokens, mucho mayor que los límites de otros modelos. Esto le permite mantener tanto la coherencia como la relevancia en conversaciones más largas o trabajando con documentos más extensos.

Pero como hemos mencionado, DeepSeek o Alibaba son solo algunas de las compañías de China que están preparando, o han lanzado ya, sus modelos de IA. Muy poco después de que DeepSeek presentase su modelo R1, ByteDance actualizó también su modelo de IA, y también asegura que supera a o1 de OpenAI en el banco de pruebas AIME, encargado de medir la comprensión y respuesta a instrucciones complejas de los modelos.

Moonshot, otra startup china que avanza en modelos de IA multimodales

Casi al mismo tiempo que ByteDance, otra startup de China, Moonshot, anunció Kimi 1.5, un modelo de razonamiento multimodal y aprendizaje reforzado con el que ha actualizado su asistente de IA, y que está disponible en su web.

Este modelo compite con modelos como GPT-4o o Claude Sonnet 3.5, sobre todo en tareas que requieren razonamiento complejo, como el trabajo con texto, imágenes y codificación. Su ventana de contexto es todavía mayor que la de Qwen 2.5, con hasta 128.000 tokens y puede gestionar tareas que requieran comprensión textual y visual. Por ejemplo, interpretación de diagramas o tablas.

Kimi 1.5 tiene dos versiones. La primera es Kimi 1.5 long-CoT, para razonamiento detallado. La segunda se llama Kimi 1.5 short-CoT, y sirve para conseguir respuestas breves y concisas. En ambos casos superan el rendimiento de OpenAI o1 y de DeepSeek-R1. Además, es compatibles con búsquedas en la web en tiempo real, gestionando hasta búsquedas en un centenar de webs y analizando de forma simultánea 50 archivos. Entre ellos PDFs, documentos de Word, imágenes y presentaciones de PowerPoint.

Cuentan con capacidad de razonamiento de tipo CoT (Chain of thought o Cadena de pensamiento), que mejoran la capacidad de resolución de problemas. También incide en una mejor comprensión de las imágenes. Kimi 1.5 es además compatible con inglés, aunque todavía no cuenta con soporte completo para el idioma y está en fase de mejora, ya que entre otras cosas tanto la interfaz como la compatibilidad con archivos están únicamente en chino.

Durante las próximas semanas es posible que se sucedan los lanzamientos de nuevos modelos de IA desde China, por lo que en Estados Unidos y Europa, las compañías dedicadas al desarrollo de sistemas de Inteligencia Artificial van a tener que ponerse las pilas si no quieren quedarse rezagados.

A continuación

ASUS presenta su nueva generación de portátiles Chromebook CR para el mercado educativo

No te pierdas

MuleSoft ilustra sobre el importante auge de los agentes de IA en las empresas

Celia Valdeolmillos

Redactora de tecnología con más de 15 años de experiencia, salté del papel a la Red y ya no me muevo de ella. Inquieta y curiosa por naturaleza, siempre estoy al día de lo que pasa en el sector.

EntrevistasHace 5 días

«Proporcionamos ciberseguridad de gama alta a nuestros clientes, sin importar su tamaño»

NoticiasHace 4 días

DEV presenta el Libro Blanco del Desarrollo Español de Videojuegos 2025

Virtual Cable y HPE colaborarán en puesto de trabajo inteligente con UDS Enterprise

NoticiasHace 4 días

Virtual Cable y HPE colaborarán en puesto de trabajo inteligente con UDS Enterprise

Cloudflare bloqueará los rastreadores web mixtos que presten servicio a las empresas de IA

NoticiasHace 5 días

Cloudflare bloqueará los rastreadores web mixtos que presten servicio a las empresas de IA

MuyComputerPRO

Alibaba sube la presión: asegura que su modelo de IA Qwen 2.5-Max supera a DeepSeek

Noticias

Alibaba sube la presión: asegura que su modelo de IA Qwen 2.5-Max supera a DeepSeek

Moonshot, otra startup china que avanza en modelos de IA multimodales

Bitdefender Sovereign Acceleration Program, soberanía europea también en ciberseguridad

Nextcloud lanza oficialmente su programa para ISV

Dell ampliará los centros de datos de Vodafone en España

Las ventas de ordenadores caen un 3,6%, lastradas por el precio de memoria y almacenamiento

«La clave no es la IA, es la confianza en el dato»

La mayoría de españoles cree que depender de tecnología ajena a la UE es peligroso para la seguridad

Anthropic suspende el acceso a sus modelos de IA, Fable 5 y Mythos 5

Vass prepara un ERE en España que puede afectar al 13% de sus empleados

ASUS lanza la supercomputadora de IA de escritorio, ExpertCenter Pro ET900N G3

Synology lanza DiskStation Manager 7.4

LineShine: China supera a EE.UU alcanzando el primer puesto del TOP500 de supercomputadoras

El Gobierno destina 719 millones a un proyecto español de desarrollo de una gigafactoría de IA

Bitdefender Sovereign Acceleration Program, soberanía europea también en ciberseguridad

El IoT satelital despegará con la llegada del 6G

Vass prepara un ERE en España que puede afectar al 13% de sus empleados

DEKRA crece en España con una inversión de más de 19 millones en 2025-2026

OpenAI abrirá una oficina en España en el segundo semestre de 2026

SpaceX marca el camino a OpenAI y Anthropic en la mayor salida a bolsa de la historia

Lo más leído

MuyComputerPRO

Alibaba sube la presión: asegura que su modelo de IA Qwen 2.5-Max supera a DeepSeek

Moonshot, otra startup china que avanza en modelos de IA multimodales

También te puede gustar

Bitdefender Sovereign Acceleration Program, soberanía europea también en ciberseguridad

Nextcloud lanza oficialmente su programa para ISV

Dell ampliará los centros de datos de Vodafone en España

Las ventas de ordenadores caen un 3,6%, lastradas por el precio de memoria y almacenamiento

«La clave no es la IA, es la confianza en el dato»

La mayoría de españoles cree que depender de tecnología ajena a la UE es peligroso para la seguridad

Anthropic suspende el acceso a sus modelos de IA, Fable 5 y Mythos 5

Vass prepara un ERE en España que puede afectar al 13% de sus empleados

ASUS lanza la supercomputadora de IA de escritorio, ExpertCenter Pro ET900N G3

Synology lanza DiskStation Manager 7.4

LineShine: China supera a EE.UU alcanzando el primer puesto del TOP500 de supercomputadoras

El Gobierno destina 719 millones a un proyecto español de desarrollo de una gigafactoría de IA

Bitdefender Sovereign Acceleration Program, soberanía europea también en ciberseguridad

El IoT satelital despegará con la llegada del 6G

Vass prepara un ERE en España que puede afectar al 13% de sus empleados

DEKRA crece en España con una inversión de más de 19 millones en 2025-2026

OpenAI abrirá una oficina en España en el segundo semestre de 2026

SpaceX marca el camino a OpenAI y Anthropic en la mayor salida a bolsa de la historia

Lo más leído