Opinión

Cómo se fraguó Alexa, la Inteligencia Artificial de Amazon

Publicado el

18 mayo, 2018

por

En 2014, Srikanth Thirumalai se reunió con el CEO de Amazon, Jeff Bezos. Thirumalai, un informático que había dejado a IBM en 2005 para dirigir un equipo de Amazon, había llegado a proponer un nuevo plan para incorporar los últimos avances en Inteligencia Artificial en su división.

Llegó armado con un extenso documento explicativo, aunque Bezos había decretado hacía mucho tiempo que las propuestas de nuevos productos y servicios debían limitarse a un brevísimo papel explicativo. Sin embargo, lo que vio Bezos en el informe de Srikanth Thirumalai podía colocar a Amazon en la vanguardia de la Inteligencia Artificial.

Recomendaciones de productos de Amazon habían sido imbuidas de AI desde los primeros días de la empresa, pero en los últimos años ha habido una fuerte revolución y el Machine Learning se ha convertido en mucho más eficaz, especialmente en una forma sobrealimentada conocida como aprendizaje profundo. Ha llevado a aumentos fuertes en visión por computador, del habla y procesamiento del lenguaje natural.

En la primera parte de esta década, Amazon tenía todavía tiempo para aprovechar estos avances, pero Bezos reconoció que la necesidad de correr era urgente. La competencia más importante de esta época en AI eran Google, Facebook, Apple y Microsoft…. y Amazon fue quedando atrás.

¿Cómo imbuir de IA cada área de la empresa?

Thirumalai se lo tomó a pecho y ofreció a Bezos (para su reunión anual de planificación) ideas sobre cómo ser más agresivo en el Machine Learning. Pero Bezos quería más. El problema era que sus deseos requerían habilidades que su equipo no poseía, herramientas que no habían sido creadas y algoritmos que nadie había pensado todavía. Thirumalai rompió su papel y se puso a trabajar como vicepresidente de búsquedas de Amazon, convirtiéndose en uno de los líderes de la tarea de revisión de software con el Machine Learning más avanzado.

Thirumalai fue solo uno de una procesión de líderes de la compañía que proponían productos totalmente diferentes para muchos grupos de clientes. Pero esencialmente cada uno imaginó una variación del enfoque de Thirumalai: transformación de parte de Amazon con avanzado Machine Learning. Esto implicó repensar proyectos en curso, como los esfuerzos de robótica de la empresa y su negocio de grandes centros de datos, así como de Amazon Web Services (AWS).

Los resultados han tenido un impacto mucho más allá de lo esperado por Bezos. Thirumalai dice que las unidades de negocio de la empresa, en 2014, eran islas de AI en un vasto océano de ingeniería. El empuje para reformar la empresa con el Machine Learning cambió eso… radicalmente. Las unidades de negocio empezaron a trabajar juntas compartiendo la IA, al tiempo que Bezos insistía en que la cultura de la empresa exigía que las innovaciones se enmarcaran únicamente en el contexto de servir a sus clientes.

Amazon tiene una muy potente AI, procedente de Machine Learning. Los resultados de esta transformación pueden verse en toda la empresa, incluyendo un sistema de recomendaciones de productos que ahora funciona en una infraestructura de Machine Learning totalmente nueva. Amazon es más inteligente en lo que sugiere lo que debe leer el usuario a continuación, lo que se debería agregar a su compra, los artículos de la lista, y qué película usted puede ver esta noche. Y este año, Thirumalai comenzó un nuevo trabajo en el negocio de búsqueda de Amazon, donde él se prepone utilizar Machine Learning profundo en cada aspecto del servicio al cliente.

El efecto de Alexa

El producto estrella de empuje de Amazon es su altavoz elegante disidente, el eco y la plataforma de voz de Alexa que lo alimenta. Estos proyectos también surgieron de un memo entregado a Bezos en 2011 para un proceso de planificación anual llamado un “Plan Operativo”. El objetivo era crear «Un ordenador ubicuo de bajo coste, con todos sus cerebros en la nube, con el que se puede interactuar mediante voz “.

Pero ese sistema de construcción — literalmente un intento de realizar una obra de ciencia ficción, el ordenador hablador de Star Trek — requiere un nivel de destreza de la Inteligencia Artificial que la empresa no tenía a mano en el año 2011. Peor aún, de los pocos expertos que podrían construir un sistema, ninguno quería trabajar para Amazon, sino para Google y Facebook.

Amazon tenía un poco de una mala imagen, no agradable a las personas que provenían investigación orientada. Una empresa implacable con enfoque en el cliente y su cultura de dureza en el trato a los empleados, lo que daba cómodas ventajas a los competidores.

A falta de talento dentro, la compañía utilizó su músculo financiero para comprar empresas con experiencia en IA. «En los primeros días de Alexa, compramos muchas empresas», dice Bezos. En septiembre de 2011 acapararían Yap, una empresa de voz a texto con experiencia en la traducción de la palabra hablada en lengua escrita. En enero de 2012, Amazon compró Evi, Cambridge, compañía cuyo software podría responder a las solicitudes habladas como Siri. Y en enero de 2013, hizo lo propio con Ivona, una empresa polaca especializada en texto a voz, que proporciona la tecnología que permitió a Echo hablar.

También atrajo el mejor talento, como Alex Smola, una superestrella en el campo de la IA que había trabajado en Yahoo y Google.»Literalmente es uno de los padrinos del aprendizaje profundo«, dice Bezos.

La parte más delicada del Eco: el problema que obligó a Amazon para abrir nuevos caminos en el proceso de su Machine Learning de jugar para ganar era algo que se llama ahora «reconocimiento de voz de campo». Se trata de interpretar comandos de voz hablados a cierta distancia de los micrófonos, incluso cuando están contaminadas con ruido.

Un factor difícil era que el dispositivo no podía perder tiempo meditando sobre lo que había dicho. Había que enviar el audio a la nube y producir una respuesta con la suficiente rapidez para que pareciera una conversación y no como esos momentos difíciles cuando no estás seguro si todavía está respirando la persona con la que estás hablando. Construir un sistema de aprendizaje automático que pueda entender y responder a las preguntas en conversaciones en condiciones ruidosas requiere enormes cantidades de datos y tendría un montón de ejemplos de los tipos de personas las interacciones con sus ecos. No era evidente que Amazon podría obtener estos datos.

Varios dispositivos de Amazon y productos de terceros ahora utilizan el servicio de voz de Alexa. Datos recogidos a través de ella ayudan a mejorar el sistema y carga de esfuerzos más amplios de AI. La buena noticia es que todas las piezas estaban allí, en Amazon, un servicio en la nube sin precedentes, los centros de datos cargados con Machine Learning y nuevos algoritmos.

Las ramificaciones de Alexa

Equipos a través de la empresa comenzaron a darse cuenta de que Alexa también podría ser un servicio de voz útil para sus proyectos. «Así que todo lo que los datos y la tecnología aportan, vienen juntos, a pesar de son muy grandes sobre la propiedad de subproceso único«, añade Bezos. Otros productos de Amazon comenzaron a integrar Alexa: «Cuando usted habla en su dispositivo de Alexa, se puede acceder a música de Amazon, Prime Video, tus recomendaciones personales desde el sitio web de compras y otros servicios«. A continuación, la tecnología comenzó a saltos a través de otros dominios de Amazon.»Una vez que tuvimos la capacidad de discurso fundacional, hemos sido capaces de traer a Alexa productos como TV Fire, voz comercial, Amazon Fresh y, en última instancia, AWS», dice Bezos.

Bezos fue de los primeros en darse cuenta de las implicaciones de negocio de integración de Inteligencia Artificial en servicios en la nube de la compañía. El plan era agregar servicios de machine learning a AWS.

En cierto sentido, la oferta de máquina de aprendizaje a las decenas de miles de clientes de Amazon cloud era inevitable. «Cuando primero armamos el plan de negocio original para AWS, la misión era llevar la tecnología que estaba sólo al alcance de un pequeño número de organizaciones bien financiadas y se distribuye tan ampliamente como sea posible«, dice Wood, el gestor de machine learning y AWS. Amazon Machine Learning de AWS, primero ofrecido en el año 2015, permite a los clientes como C-Span configurar un catálogo privado de caras; Zillow lo utiliza para estimar el precio de la vivienda. Pinterest lo emplea para la búsqueda visual y varias startups de conducción autónoma están utilizando Machine Learning AWS aprendiendo a mejorar productos a través de millones de kilómetros de la prueba de carretera simulada.

En 2016, la nueva Machine Learning-AWS había lanzado servicios que más directamente se basaban en las innovaciones de Alexa: un componente de texto a voz se llama Polly y un motor de procesamiento de lenguaje natural llamado Lex. Estas ofertas permiten a los clientes, que van desde gigantes como Pinterest y Netflix hasta pequeñas empresas, construir su propio mini Alexa.

Estos servicios de aprendizaje automático son un generador de ingresos de gran alcance y clave para la AI de Amazon, con clientes tan dispares como la NASA y la NFL que están pagando miles de millones para conseguir el Machine Learning de Amazon.

El papel dominante de AWS en el éter también le da una ventaja estratégica sobre los competidores, en particular sobre Google, que había esperado utilizar su liderazgo en Machine Learning para arrasar a AWS en cloud computing. Hasta ahora, Amazon-AWS-Alexa está ganando la batalla. No solo en distribución, sino en todos los ámbitos. Con más datos. Con más clientes. Con más plataformas. Con más talento.

Tipo listo, Bezos. Aunque inspira mucho respeto.

Jorge Díaz-Cardiel. Socio director general de Advice Strategic Consultants. Economista, Sociólogo, Abogado, Historiador, Filósofo y Periodista. Autor de más de mil de artículos de economía y relaciones internacionales, ha publicado una veintena de libros.

Relacionados:alexa Amazon Inteligencia artificial Jorge Díaz Cardiel

A continuación

Nuestra vida en la economía digital, ¿cómo se mueven los engranajes que la hacen posible?

No te pierdas

Crónicas desde EE.UU.: la Inteligencia Artificial de Google

Elisabeth Rojas

Periodista especializada en tecnologías corporate, encargada de las entrevistas en profundidad y los reportajes de investigación en MuyComputerPRO. En el ámbito del marketing digital, gestiono y ejecuto las campañas de leads generation y gestión de eventos.