Noticias
La actualización de DeepSeek R1 impresiona por su alto rendimiento

DeepSeek R1, la solución estrella de la empresa china del mismo nombre que ha revolucionado el mercado de la inteligencia artificial, se ha actualizado con mejoras significativas, a la altura de modelos líderes de las principales empresas de IA, como OpenAI, Anthropic y Google.
A pesar de ser una startup china prácticamente desconocida, el DeepSeek R1 sorprendió al mercado por su alto rendimiento, combinado con una eficiencia notable al utilizar muchos menos recursos para el entrenamiento. Ello se logra mediante diversas técnicas, incluyendo una arquitectura refinada de mezcla de expertos (MoE), métodos avanzados de compresión, capacidades de predicción multitoken y una metodología de entrenamiento basada en aprendizaje de refuerzo.
Y todo ello con un modelo licenciado bajo código abierto lo que le otorga aún más interés, demostrando que puede jugar de tú a tú con los modelos cerrados, más grandes, pero mucho más caros y menos eficientes, y cumplir lo que algunas organizaciones consideran que es la clave para «una innovación de la IA justa y ética».
Actualización de DeepSeek R1
DeepSeek ha lanzado la primera actualización importante del modelo R1, DeepSeek-R1-0528. El modelo actualizado y sus pesos ya están disponibles en Hugging Face. Aunque DeepSeek aún no ha publicado benchmarks oficiales, varios entusiastas y desarrolladores de IA ya han comenzado a compartir resultados, que parecen ser impresionantes.
Según LiveCodeBench, un punto de referencia para evaluar las capacidades de codificación de modelos de lenguaje grandes, DeepSeek-R1-0528 ahora ocupa el puesto número 4, superando a modelos como o4 Mini (bajo), Grok-3-mini (alto) y Gemini 2.5 Flash Preview.
Además, la última actualización de DeepSeek R1 ahora razona profundamente, de manera similar a los modelos de Google, y puede «pensar» hasta 30-60 minutos dependiendo de la tarea. Uno y otro se encuadran en la nueva generación de «modelos pensantes», los que analizan recursivamente sus respuestas antes de proporcionar el resultado final.
Este tipo de modelos realizan un razonamiento multipaso y verifican la precisión de sus respuestas antes de generarlas. Puede ser que tarden algo más en responder, pero las respuestas serán más precisas y tendrá menos alucinaciones, un fenómeno que sigue siendo un gran problema a resolver incluso con el avance de los modelos de lenguaje de gran tamaño, producido cuando un modelo o chatbot de IA generativa percibe patrones u objetos inexistentes o imperceptibles para los humanos, creando respuestas que no tienen sentido o son completamente inexactos.
Queda comprobado que la batalla por la IA se intensifica por momentos y cada semana tenemos modelos nuevos que superan en capacidad a los anteriores. DeepSeek R1 quiere ser parte importante de la ecuación. Para aquellos interesados en probar esta última actualización R1, está disponible en OpenRouter o LMArena.
-
NoticiasHace 6 días
LibreOffice señala los «costes reales» de la migración a Windows 11
-
NoticiasHace 5 días
Intel despedirá hasta el 20% de su división Intel Foundry
-
EntrevistasHace 5 días
“Nuestro objetivo es que proteger y gestionar el acceso al hogar sea tan fácil como encender la luz”
-
EventosHace 3 días
Inteligencia Artificial, Virtualización y Open Source: Claves para la Transformación Digital