Conecta con nosotros

Noticias

Google presenta Veo 3.1 con mejoras para desarrolladores de IA y creativos

Publicado el

Veo 3.1

Google ha presentado Veo 3.1, nueva versión del modelo de inteligencia artificial para generación de vídeo que promete mayor realismo y fidelidad, además de avances en la adherencia a las notificaciones, niveles de control y consistencia al generar los vídeos.

Los generadores de video con IA como Veo y Sora ponen de relieve el controvertido papel que desempeña la IA generativa en las industrias creativas. Muchos videógrafos, cineastas y creadores se preocupan por cómo se entrena la IA con su material existente y cómo la implementan los estudios y las plataformas de streaming. Los debates acalorados y las demandas están encima de la mesa, pero lo cierto es que las grandes de la IA siguen avanzando.

Veo 3.1 y Veo 3.1 Fast

Google afirma que estos nuevos modelos ahora pueden generar mejor audio nativo, que incluye conversaciones naturales y efectos de sonido sincronizados. Además, los desarrolladores ahora pueden aprovechar la mejor comprensión de los estilos cinematográficos. El gigante de Internet también afirma que estos modelos ahora mantienen una mayor consistencia de los personajes en múltiples escenas.

La nueva versión de Veo incluirá algunas funciones que quizás reconozcas si ya has usado Flow, el programa de creación de películas con IA de Google. La función «Ingredientes para video» te permitirá subir recursos separados que Veo combinará en el video final. También podrás agregar objetos a recursos existentes, y próximamente podrás eliminarlos, una función muy necesaria. 

La compañía también ha presentado nuevas formas para que los desarrolladores guíen mejor los modelos de Veo 3.1 . En primer lugar, pueden proporcionar hasta tres imágenes de referencia de un personaje, objeto o escena. Esto permitirá que el modelo mantenga una mayor consistencia del personaje en múltiples tomas.

En segundo lugar, la nueva función de extensión de escenas permitirá a los desarrolladores crear vídeos más largos generando nuevos clips que se conectan con el vídeo anterior. Anteriormente, los desarrolladores solo podían crear vídeos de 30 segundos. Crear dos vídeos de 30 segundos manteniendo la coherencia de los personajes era una tarea ardua y con esta nueva función, cada nuevo vídeo se genera a partir del último segundo del clip anterior para mantener la continuidad visual. Por último, los desarrolladores ahora pueden proporcionar una imagen inicial y una final y pedirle a Veo 3.1 que genere la transición entre ellas junto con el audio.

Los desarrolladores pueden acceder a los modelos Veo 3.1 y Veo 3.1 Fast a través de la API de Gemini en Google AI Studio y Vertex AI. Los usuarios pueden acceder a Veo 3.1 tanto a través de la app de Gemini como de Flow.

Lo más leído