Conecta con nosotros

Noticias

Gemini 2.5: Google lanza su modelo más inteligente hasta la fecha y salpica todo de IA

Publicado el

Gemini 2.5

El mundo de la inteligencia artificial generativa está que arde y Google, uno de los actores más destacados de la escena, sigue pisando el acelerador con Gemini. En apenas unos días la compañía ha encadenado una batería de actualizaciones y mejoras que consolidan su apuesta de llevar la IA a todas partes -a todas sus partes, más bien- con más potencia y más contexto que nunca.

Entre todas esas novedades, sin embargo, hay una que brilla con luz propia: Gemini 2.5 Pro, el nuevo modelo que Google define sin titubeos como el “más inteligente” que han creado hasta ahora… Lo cual tampoco es decir mucho; lo raro hubiera sido no decirlo.

Gemini 2.5 Pro: experimental, pero con pensamiento

Lo que diferencia a Gemini 2.5 de la versión previa no es solo la correspondiente mejora incremental, sino la implementación predeterminada y sin advertir de lo que Google denomina un thinking model, un modelo diseñado explícitamente para razonar antes de generar una respuesta. No es una novedad en el funcionamiento de los LLM, pero como resulta ofrece  más precisión, mejores decisiones y una capacidad de comprensión que va más allá de lo habitual.

La mejora, presume Google, se nota en benchmarks clave como LMArena, donde Gemini 2.5 Pro lidera con diferencia, así como en pruebas exigentes como GPQA, AIME 2025 o Humanity’s Last Exam, donde el modelo destaca sin necesidad de técnicas adicionales como el majority voting. Esto no solo habla de una mejor arquitectura de base, sino también de un post-training más afinado, donde Google ha puesto especial foco en capacidades de razonamiento y codificación.

Uno de los saltos más notables lo encontramos en el terreno del desarrollo, donde Gemini 2.5 Pro supera ampliamente a la versión 2.0 en tareas de programación, con una puntuación destacada del 63,8% en SWE-Bench Verified (el estándar para evaluar IA capaces de actuar como agentes de programación). No se trata solo de escribir código, sino de transformarlo, depurarlo y hasta construir aplicaciones visuales desde cero con un simple prompt.

Gemini 2.5

Por último, otro de los grandes avances está en su ventana de contexto, que alcanza el millón de tokens y promete duplicarse próximamente. Esta capacidad permite a Gemini procesar información masiva -desde textos y vídeos hasta repositorios de código- y resolver problemas complejos que requieren múltiples fuentes y conexiones. En este aspecto, Gemini no tiene competencia.

De momento, pero, Gemini 2.5 Pro solo está disponible para los usuarios de Gemini Advanced, el plan de pago, tanto si se utiliza a través de Google AI Studio o de la aplicación de Gemini. Próximamente llegará también a Vertex AI y Google ya prepara una estrategia de precios que permitirá escalar su uso en producción.

Gemini hasta en la sopa… de Google

Si bien el lanzamiento de Gemini 2.5 es lo más destacado que nos ha dejado Google esta semana en el terreno de la IA, la compañía no ha dejado de desplegar pequeñas -y no tan pequeñas- actualizaciones que ponen de manifiesto que su hoja de ruta para Gemini es ponerlo allá donde pueda tener alguna utilidad, o donde se crea que puede tenerla.

Una de las más llamativas es la nueva capacidad de Gemini Live para “ver” en tiempo real en dispositivos Android. Gracias a la integración de Project Astra, algunos usuarios ya pueden compartir la pantalla o usar la cámara frontal para que Gemini interprete el entorno visual y responda en consecuencia. No es más que el primer paso de una función que dará mucho que hablar.

También destaca la llegada de los Gems a los usuarios gratuitos. Hasta ahora exclusivos para suscriptores de Gemini Advanced, estos Gems permiten configurar respuestas, tonos y objetivos específicos, de manera muy similar a como funcionan los GPT personalizados de ChatGPT, pero, al menos por el momento, sin su eficacia.

Otra novedad interesante es que, por primera vez, se puede usar Gemini en la web sin necesidad de una cuenta de Google. Accediendo desde el modo incógnito, cualquier usuario puede interactuar con el modelo 2.0 Flash, aunque funciones como carga de archivos o historial siguen siendo exclusivas para usuarios registrados.

Enfocado en las nuevas tecnologías empresariales y de usuario final. Especializado en Linux y software de código abierto. Dirijo MuyLinux y escribo en MC, MCPRO y MuySeguridad, entre otros.

Lo más leído