Noticias
Alibaba sube la presión: asegura que su modelo de IA Qwen 2.5-Max supera a DeepSeek

La guerra entre desarrolladores de IA no ha hecho más que empezar. Con rumores de que hay numerosos modelos en desarrollo en China que combaten por superarse unos a otros, y aparentemente ignorando lo conseguido por los desarrolladores estadounidenses y europeos hasta ahora, ya empiezan a aparecer las primeras muestras de que DeepSeek no es la compañía más avanzada del país en IA, sino que solo es una más. Para muestra, el modelo que Alibaba acaba de presentar: una nueva versión de su modelo de IA Qwen 2.5, que asegura que es más potente que uno de los últimos modelos de DeepSeek, el V3.
Según Reuters, Alibaba asegura que Qwen 2.5-Max, esta nueva versión, supera en rendimiento a GPT-4o, DeepSeek-V3 y Llama-3.1-405N. Se trata de un modelo de tipo MoE (Mixture of Experts) que se caracteriza por una arquitectura que permite un escalado más eficiente que los modelos tradicionales, activando solo un subconjunto de parámetros durante sus trabajos de inferencia. La incorporación de este tipo de arquitectura hace que Qwen 2.5-Max sea un modelo muy potente, sin que por ello consuma una gran cantidad de recursos.
Según apuntan desde Alibaba Cloud, han preentrenado este modelo con unos 20 billones de tokens, lo que hace que sea uno de los modelos más ricos en datos de la actualidad. Esto hace posible también que su rendimiento sea elevado en diversos tipos de tareas, que van desde la comprensión del lenguaje natural hasta el razonamiento complejo. Además de por su rendimiento, Qwen 2.5-Max destaca también por su escalabilidad y eficiencia.
La posibilidad que tiene, por tanto, de gestionar tareas cada vez más complejas, hace que pueda procesar grandes cantidades de información con rapidez y de manera bastante precisa. Por eso es útil para tareas como analítica en tiempo real, automatización de tareas o desarrollo de determinados tipos de bots.
Este modelo tiene una longitud de secuencia máxima de entrada de hasta 100.000 tokens, mucho mayor que los límites de otros modelos. Esto le permite mantener tanto la coherencia como la relevancia en conversaciones más largas o trabajando con documentos más extensos.
Pero como hemos mencionado, DeepSeek o Alibaba son solo algunas de las compañías de China que están preparando, o han lanzado ya, sus modelos de IA. Muy poco después de que DeepSeek presentase su modelo R1, ByteDance actualizó también su modelo de IA, y también asegura que supera a o1 de OpenAI en el banco de pruebas AIME, encargado de medir la comprensión y respuesta a instrucciones complejas de los modelos.
Moonshot, otra startup china que avanza en modelos de IA multimodales
Casi al mismo tiempo que ByteDance, otra startup de China, Moonshot, anunció Kimi 1.5, un modelo de razonamiento multimodal y aprendizaje reforzado con el que ha actualizado su asistente de IA, y que está disponible en su web.
Este modelo compite con modelos como GPT-4o o Claude Sonnet 3.5, sobre todo en tareas que requieren razonamiento complejo, como el trabajo con texto, imágenes y codificación. Su ventana de contexto es todavía mayor que la de Qwen 2.5, con hasta 128.000 tokens y puede gestionar tareas que requieran comprensión textual y visual. Por ejemplo, interpretación de diagramas o tablas.
Kimi 1.5 tiene dos versiones. La primera es Kimi 1.5 long-CoT, para razonamiento detallado. La segunda se llama Kimi 1.5 short-CoT, y sirve para conseguir respuestas breves y concisas. En ambos casos superan el rendimiento de OpenAI o1 y de DeepSeek-R1. Además, es compatibles con búsquedas en la web en tiempo real, gestionando hasta búsquedas en un centenar de webs y analizando de forma simultánea 50 archivos. Entre ellos PDFs, documentos de Word, imágenes y presentaciones de PowerPoint.
Cuentan con capacidad de razonamiento de tipo CoT (Chain of thought o Cadena de pensamiento), que mejoran la capacidad de resolución de problemas. También incide en una mejor comprensión de las imágenes. Kimi 1.5 es además compatible con inglés, aunque todavía no cuenta con soporte completo para el idioma y está en fase de mejora, ya que entre otras cosas tanto la interfaz como la compatibilidad con archivos están únicamente en chino.
Durante las próximas semanas es posible que se sucedan los lanzamientos de nuevos modelos de IA desde China, por lo que en Estados Unidos y Europa, las compañías dedicadas al desarrollo de sistemas de Inteligencia Artificial van a tener que ponerse las pilas si no quieren quedarse rezagados.
-
EventosHace 4 días
MCPRO Data Innovation Forum 2025: el evento clave para la gestión del dato y la ciberseguridad
-
A FondoHace 6 días
LG presenta sus novedades de señalización digital en ISE 2025
-
NoticiasHace 5 días
Macron anuncia una inversión de 109.000 millones de euros en IA en Francia
-
NoticiasHace 5 días
Elon Musk quiere controlar OpenAI