Noticias
Google se adentra en la era de los agentes de IA con Gemini 2.0
Google ha presentado la nueva versión de su gama de modelos de Inteligencia Artificial Gemini, al que ha dotado de mejoras en el terreno de la multimodalidad, como la salida nativa de imágenes y sonido, y el uso nativo de herramientas que permiten desarrollar experiencias de agentes de IA capaces de planificar, recordar y actuar a partir de las indicaciones que aporte el usuario del sistema. Gemini 2.0, por tanto, supone la entrada definitiva de la compañía en el mundo de los agentes de Inteligencia Artificial.
El primer modelo de la familia Gemini 2.0 , ya disponible, es una versión experimental de Gemini 2.0 Flash, un modelo de referencia centrado en la mejora del rendimiento y con una latencia baja. Los desarrolladores que quieran utilizarlo pueden hacerlo a través de la API de Gemini en Google AI Studio y Vertex AI.
Además, los usuarios de Gemini puede acceder a una versión experimental optimizada para chat de 2.0 Flash Experimental. Para ello basta con elegir su opción en el menú desplegable de modelos que aparece en su web de escritorio y móvil. Quienes sean usuarios de Gemini Advanced también podrán acceder a Deep Research, una especie de asistente de investigación que emplea IA para explorar temas complejos a partir de las peticiones de los usuarios, y que ofrece después los resultados a estas peticiones de manera detallada en un informe.
Por otro lado, Google está incorporando las capacidades de razonamiento avanzado de Gemini 2.0 a Vistas Creadas con IA, con el objetivo de abordar temas más complejos y facilitar la respuesta a preguntas de varios pasos. Entre este tipo de preguntas están las ecuaciones matemáticas avanzadas, las consultas multimodales y las relacionadas con programación.
Prototipos y experimentos de investigación: Astra, Mariner, Jules y otros agentes
Google ha querido demostrar cómo las experiencias de los agentes pueden funcionar de manera segura y en condiciones prácticas. Para ello ha desarrollado varios prototipos y experimentos de investigación, que ha puesto a disposición de la comunidad de probadores de confianza de la compañía.
El primero es el Proyecto Astra, un prototipo de investigación que explora las capacidades de un asistente universal de IA, que ha mejorado con la versión 2.0 y que ya está disponible para los probadores. Con Gemini 2.0, puede además emplear la búsqueda de Google, Lens y Maps; y cuenta con más capacidad para recordar cosas sin descontrolarse.
Ahora tiene hasta 10 minutos de memoria durante la sesión y puede recordar más sesiones previas en el pasado, por lo que ha mejorado en personalización. Con sus novedades en funciones de streaming y la comprensión nativa del audio, el agente es capaz de comprender el lenguaje con una latencia parecida a la de una conversación entre humanos.
En cuanto al Proyecto Mariner, es el primero diseñado con Gemini 2.0 que aborda el futuro de la interacción entre humanos y agentes, empezando por su navegador. También está disponible en pruebas para un grupo seleccionado de probadores. Es capaz de comprender y razonar a través de la información que aparece en la pantalla del navegador, incluso en píxeles y elementos web como texto, código, imágenes y formularios. Con esta información, utiliza una extensión experimental de Chrome para completar tareas por el usuario.
Para que sea seguro y solo permita un uso responsable, en Google identificaron nuevos tipos de riesgos que pueden surgir con su uso, y desarrollaton nuevas medidas para mitigarlos. Así, Proyecto Mariner solo puede escribir, desplazarse o hacer click en la pantalla activa del navegador, y pide a sus usuarios una confirmación final antes de realizar determinadas acciones, como una compra.
Un tercer agente experimental de Google impulsado por IA, pensado para desarrolladores, y generado a través de Gemini 2.0, Jules, se integra directamente en un flujo de trabajo de GitHub. Disponible para probadores, puede solucionar un problema o elaborar un plan o ejecutarlo. Eso sí, siempre bajo la dirección y supervisión de un humano. Se trata de un paso en la intención de Google de desarrollar agentes de IA que sean útiles en todos los ámbitos posibles. Entre ellos, en el desarrollo.
Además de estos tres agentes, Google ha creado otros con Gemini 2.0 pensados para facilitar la navegación por los mundos viruales de los videojuegos, además de otros que pueden ayudar aplicando las capacidades de razonamiento espacial de esta nueva versión de Gemini a la robótica.
-
Content4 días ago
La videoconferencia en las empresas: tecnología al servicio de la colaboración
-
Noticias5 días ago
La IA y el Futuro de los Empleos
-
Noticias7 días ago
El mercado del PC se recuperó en 2024
-
A Fondo4 días ago
Cómo transformar tu empresa gracias al impulso de la Inteligencia Artificial