Conecta con nosotros

Noticias

Tras dominar el Go, DeepMind está aprendiendo a jugar a videojuegos de Atari

Publicado el

Tras dominar el Go, DeepMind está aprendiendo a jugar a videojuegos de Atari

La filial de Google dedicada al desarrollo de sistemas de Inteligencia Artificial DeepMind, tras crear un sistema que ha conseguido dominar el juego Go, acaba de desarrollar un método para enseñar a jugar a videojuegos a una Inteligencia Artificial. Según The Next Web, el método no consiste en suministrar datos al sistema, sino en hacer que aprenda a base de “enseñarle” vídeos de YouTube.

Este método se ha desarrollado para solucionar un problema concreto que tiene la inteligencia artificial: la exploración de lugares nuevos o la toma de decisiones sobre hacia dónde dirigirse. Por eso están entrenando ahora a un sistema de Inteligencia Artificial a base de juegos de Atari como Montezuma´s Revenge o Pitfall. En ambos casos, los juegos requieren explorar lugares, y para una máquina es complicado decidir qué puede hacer en esos casos.

En el texto en el que lo desarrolladores del sistema hablan de la dificultad que tienen este tipo de algoritmos para tomar decisiones en base a lo que pueden percibir como obstáculos, algo que para los humanos es bastante sencillo: “estas tareas son prácticamente imposibles por medio de sistemas de exploración tan primitivos, dado que la cantidad de posibles trayectorias de acción crece de manera exponencial debido al número de frames que separan las recompensas. Por ejemplo, alcanzar el primer entorno de recompensa en Montezuma’s Revenge lleva aproximadamente 100 pasos de entorno, lo que equivale a 100 elevado a la 18º potencia posibles secuencias de acción“.

En la actualidad, los desarrolladores solucionan el problema suministrando a los sistemas de Inteligencia Artificial campos de datos ingentes con frames de información perfectamente formateados. Este enfoque no es muy útil en situaciones donde no hay campos tan etiquetados.

Pero con este nuevo método, ideado por DeepMind, la Inteligencia Artificial toma como referencia a formas e imágenes con ruido, y decide cómo darles formato para convertirlos en algo con lo que puedan generar información. Si se le muestra un vídeo de un humano jugando a dicho título de Atari, o a Pitfall, puede aislar los movimientos que hicieron que le humano haya tenido éxito, y tratar después de imitarle.

Esto permite a los investigadores establecer recompensas para la inteligencia artificial, como hacerlo más rápido o conseguir más puntos, además de poner en marcha unas bases para poder iniciar con ellas el entrenamiento de la Inteligencia Artificial. Por eso están suministrando vídeos de YouTube a la red neuronal, porque basta con que el sistema los vea una vez para aprender.

Una vez finalizado el entrenamiento, esta tecnología podría integrarse en robots que tengan que trabajar en determinados entornos, como en la superficie de Marte o de la Luna. O para poder emplearse para llevar a cabo determinadas acciones en fábricas.

Redactora de tecnología con más de 15 años de experiencia, salté del papel a la Red y ya no me muevo de ella. Inquieta y curiosa por naturaleza, siempre estoy al día de lo que pasa en el sector.

Top 5 cupones

Lo más leído

Suscríbete gratis a MCPRO

La mejor información sobre tecnología para profesionales IT en su correo electrónico cada semana. Recibe gratis nuestra newsletter con actualidad, especiales, la opinión de los mejores expertos y mucho más.

¡Suscripción completada con éxito!