Conecta con nosotros

A Fondo

Inteligencia Artificial generativa: la evolución de la IA para convertirse en creadora

Publicado el

Inteligencia Artificial generativa: la evolución de la IA para convertirse en creadora

En los últimos días hemos escuchado la expresión Inteligencia Artificial generativa, o IA generativa, por todas partes. La culpa la tienen, sobre todo, las últimas novedades de OpenAI en su modelo GPT, las mejoras de Microsoft en sus productos o sistemas como Claude. Pero pocos se han parado a explicar con detalle qué es lo que implica la Inteligencia Artificial Generativa. O sus bases. A pesar de ello, cada vez está en más sistemas, desde ChatGPT hasta DALL-E.

Qué es la Inteligencia Artificial Generativa

A este tipo de Inteligencia Artificial se la conoce como generativa, porque es capaz de crear algo que no existe. Es su principal diferencia con respecto a la Inteligencia Artifiical discriminativa, que se dedica a hacer distinciones entre distintos tipos de entradas, e intenta responder preguntas cuya respuesta implique identificar algo a partir de una pregunta que implica una elección.

Por ejemplo, una de estas IAs será capaz de responder a una pregunta sobre una imagen, para responder si se trata de una cosa u otra. Pero no podrá crear una imagen a partir de unas instrucciones sencillas. Algo que sí puede hacer la IA generativa.

A pesar de haber sonado mucho últimamente, la IA generativa apareció ya hace bastante tiempo. Se remonta, de hecho, a la aparición de Eliza, un chatbot que fue bastante popular hace ya años, y que simulaba ser un terapeuta con el que hablar. Lo crearon en el MIT, y se lanzó en 1966. Entonces era una revolución, a pesar de ser bastante rudimentario. Y años de trabajo e investigación han hecho que la IA generativa haya evolucionado tanto que ahora Eliza parece algo desarrollado por principiantes.

La llegada de DALL-E, stable Diffusion, y sobre todo, de Chat GPT, han puesto patas arriba la Inteligencia Artificial, y también la percepción que el público en general tiene de ella. Las dos primeras permiten la generación de imágenes realistas a partir de instrucciones sencillas.

La tercera es capaz incluso de entablar una conversación a través de texto con humanos, y proporcionar determinados tipos de información. Es probable, incluso, que dentro de poco sea multimodal, gracias a la evolución del su modelo, GPT, a su versión 4. Por ahora, solo permite responder con texto, pero en el futuro puede que también pueda trabajar con elementos multimedia.

Habitualmente nos referimos a estos sistemas, y a otros similares, como modelos. Esta denominación no se ha hecho al azar. Se ha dado porque los tres son capaces de representar un intento de simular o modelar algún aspecto del mundo real basándose en un conjunto, a veces muy grande, de información sobre él.

¿Cómo funciona la Inteligencia Artificial generativa?

Este tipo de Inteligencia Artificial utiliza machine learning para procesar una gran cantidad de datos de imágenes o de texto. La mayoría de esta información está extraída de Internet. Tras procesarla, es capaz de determinar qué cosas son las que es más probable que vayan a aparecer junto a otras que ya han aparecido. Es decir, que generan texto prediciendo qué palabra es la más probable que pueda ir después de otras palabras que ya ha creado.

La mayoría del trabajo de programación de la Inteligencia Artificial generativa se dedica a la creación de algoritmos que puedan distinguir las cosas que interesan a los creadores de la Inteligencia Artificial que quieren desarrollar. En el caso de ChatGPT, serán las palabras y las frases. En el caso de DALL-E, gráficos y elementos visuales.

Pero sobre todo, hay que tener en cuenta que este tipo de IA genera respuestas y salidas con base en la valoración de un ingente conjunto de datos, que se han utilizado para entrenarla. Con ellos, responde a peticiones e instrucciones con imágenes o frases que, en función de lo que hay en ese conjunto de datos, la IA generativa apunta que tiene probabilidad de ser adecuado.

El autocompletado que aparece cuando escribes con tu smartphone, o en Gmail, que sugiere palabras o partews de frases, es un sistema de Inteligencia Artificial generativa de bajo nivel. ChatGPT y DALL-E son bastante más avanzadas.

El entrenamiento de modelos de IA generativa

El proceso por el que los modelos se desarrollan para captar y procesar todos los datos que necesitan para funcionar se conoce como entrenamiento. Para ello se suelen utilizar dos técnicas, que serán más o menos adecuadas en función del modelo. Por ejemplo, ChatGPT usa lo que se conoce como Transformador (de ahí la T en su nombre).

Un transformador deriva el significado de grandes trozos de texto. De esta manera, el modelo logra comprender cómo pueden ser los distintos componentes semánticos y palabras, y cómo pueden estar relacionados unos con otros. Además, puede determinar qué probabilidad hay para que aparezcan unos junto a otros. Estos transformadores se ejecutan sin supervisión sobre un amplio conjunto de de texto de lenguaje natural, mediante un proceso llamado entrenamiento previo (la P de ChatGPT). Una vez finalizado el proceso, los humanos encargados de trabajar con el modelo se ocupan de ajustarlo a través de interacciones con él.

Otra de las técnicas que se utilizan para entrenar los modelos de Inteligencia Artificial generativa se denomina Red adversaria generativa (Generative adversarial network, o GAN). Con ella se ponen dos algoritmos a competir entre ellos. Uno genera texto o imágenes con base en probabilidades derivadas de un gran conjunto de datos. El otro es una Inteligencia Artificial discriminativa, que ha sido entrenada por humanos para valorar si la salida es real o generada por Inteligencia Artificial.

La IA generativa intenta repetidamente engañar a la discriminativa, adaptándose automáticamente para producir respuestas que tengan éxito. Una vez que consigue ganar de manera habitual y sólida a la discriminativa, esta es ajustada de nuevo por humanos, y el proceso empieza otra vez.

En este tipo de entrenamiento hay que tener en cuenta que aunque en él intervienen humanos, la mayoría del aprendizaje y la adaptación se dan de manera automática. Esto lleva a que sea necesario hacer muchas repeticiones para conseguir que los modelos leguen al punto en el que producan resultados interesantes. Además, hay que tener en cuenta de que se trata de un proceso que requiere mucha potencia de computación.

Puntos negativos y casos de uso

Aunque los resultados de los modelos de Inteligencia Artificial generativa son impresionantes, no todo lo que está relacionado con ella es bueno o beneficioso. De hecho, además de presentar limitaciones, tiene muchos posibles impactos negativos en distintos sectores. Además, todavía son propensos, sobre todo los de texto, a lo que se ha llamado alucinaciones, que puede llevar incluso a que hagan afirmaciones falsas, e incluso se pongan chulos e insulten a los humanos.

En cuanto a sus impactos negativos, está bastante claro que la posibilidad de crear contenidos de manera sencilla y económica puede tener impacto en la redacción de contenidos que no sean particularmente creativos. Pero en muchos casos pueden engañar a los humanos que lean esos contenidos. Eso ha hecho que muchos estudiantes los hayan utilizado ya en sus tareas escolares. Incluso a nivel universitario. También los están utilizando los generadores de spam por email, para escribir sus correos electrónicos y enviarlos a miles de personas con el mínimo esfuerzo.

También ha surgido todo un debate relacionado con la propiedad intelectual de las imágenes o textos que genere una IA generativa. Hay muchas discusiones sobre a quién pertenece, y las cuestiones legales relacionadas con ellas todavía están empezando a debatirse.

Otro de los puntos negativos de estas IAs es que, en muchos casos, pueden estar sesgadas. Sobre todo porque sus respuestas están condicionadas por completo al tipo de datos con los que se las entrenó. Si están sesgados, y trabajan sin normas ni límites, podemos encontrar IAs machistas, racistas o clasistas, por ejemplo. Para evitarlo, OpenAI, por ejemplo, creadora de ChatGPT, ha dotado para evitar estos sesgos a su modelo de medidas de salvaguarda antes de dar acceso al público para que utilizasen el chatbot.

Pero a pesar de todo esto, la IA generativa tiene múltiples casos de uso. ChatGPT, por ejemplo, puede extraer información de conjuntos de datos muy grandes para contestar a preguntas hechas en lenguaje natural para dar respuestas útiles. Por eso, puede resultar muy útil para los motores de búsqueda, que ya se están apresurando a probar su integración. No solo los de propósito general, que han sido los primeros en acercarse a ellos. También pueden ser útiles para otros buscadores más específicos y sectoriales.

También se puede utilizar en el futuro para la generación de código. Los modelos de lenguaje grandes pueden comprender los lenguajes de programación, de la misma manera que entienden las lenguas que se hablan. Y aunque la Inteligencia Artificial generativa es poco probable que vaya a sustituir a los desarrolladores a corto y medio plazo, puede ayudar a mejorar su productividad, como asistentes.

Lo mismo sucede con la creación de contenidos. La llegada de estos modelos ha preocupado bastante a todos los que se dedican a crear textos y contenidos. Por ejemplo, a los redactores y los profesionales del marketing. Pero para ellos, estos modelos son una oportunidad para agilizar sus tareas y desprenderse de las más repetitivas. Por ejemplo, escribir mensajes de correo electrónico para campañas. O contenido descriptivo para una página web. Siempre que sean textos que no requieran mucha creatividad, y que tengan que elaborarse a partir de un conjunto concreto de instrucciones y datos, sistemas como ChatGPT pueden hacerse cargo de ello.

En el futuro, es probable que gracias a su avance, la Inteligencia Artificial generativa cambie casi por completo algunos sectores. O que llegue a acabar con ciertos trabajos. Pero por ahora, y no parece que a corto plazo, los trabajos los seguirán realizando los humanos. Aunque se apoyen en la Inteligencia Artificial.

Redactora de tecnología con más de 15 años de experiencia, salté del papel a la Red y ya no me muevo de ella. Inquieta y curiosa por naturaleza, siempre estoy al día de lo que pasa en el sector.

Lo más leído