Conecta con nosotros

Noticias

DALL-E 3 ya disponible como función nativa para usuarios de ChatGPT Plus y empresas

Publicado el

OpenAI ha anunciado recientemente la incorporación del sistema de IA, DALL-E 3 para los usuarios que cuentan con la versión ChatGPT Plus y empresas. Esta herramienta podrá crear imágenes con mayor precisión a partir de texto en lenguaje natural (prompt), recibiendo indicaciones extensas y detalladas. Además, cuenta con protecciones específicas que evitan que genere imágenes violentas o contenido dañino.

DALL-E 3, en comparación con la versión anterior, ha avanzado en la interpretación y comprensión de aspectos clave como la anatomía humana, de tal modo que ahora puede ofrecer una respuesta más acorde a lo que se le solicita. Se ha entrenado con una amplia biblioteca de fotografías, imágenes y obras de arte.

De este modo, en materia de precisión y de transformación de imágenes en ideas, mejora considerablemente a DALL-E 2 gracias al perfeccionamiento de su tecnología de subtitulado.

Además, DALL-E 3 permite cambiar proporción de aspecto en sus imágenes, es decir, se convierte en una herramienta más flexible que la versión anterior, limitada exclusivamente a la creación de contenido 1:1 (cuadrado). A partir de ahora, el usuario podrá indicar libremente la proporción horizontal o vertical en el prompt de ChatGPT.

El elemento diferenciador de DALL-E 3 es que se vale de GPT-4, que cuenta con más capacidades y avances que la versión gratuita de ChatGPT, que se sirve de GPT-3.5.

DALL-E 3 cuenta con infinidad de opciones de marketing y específicas para el terreno del diseño gráfico. Por ejemplo, permite crear imágenes en diferentes estilos, simular texturas o acuarelas, o bien, producir imágenes que nos recuerdan a otra época histórica.

Open  AI presentó DALL-E 3 a finales de septiembre y ahora ya se encuentra disponible para los usuarios de ChatGPT Plus, la versión de pago de dicha herramienta, así como para las empresas suscriptoras.

La apuesta de Microsoft

Microsoft ha conseguido convertirse en un férreo competidor en el terreno de la IA, pues DALL-E 3 se encuentra, en versión gratuita, disponible a través del buscador de Bing. Ahora cualquier usuario podrá tener acceso a esta herramienta y crear imágenes nunca vistas simplemente accediendo a Bing Chat.

La principal novedad de DALL-E 3 es la apuesta por un sistema de seguridad de varios niveles para evitar la creación de imágenes dañinas, contenido violento o exclusivo para adultos. Los controles de seguridad se realizan sobre las indicaciones de los usuarios en texto, pero también sobre las imágenes resultantes.

De este modo, DALL-3 evita problemas mediáticos como los sufridos por Midjourney y Satable Diffusion que han padecido numerosas críticas y demandas por derechos de autor por el contenido que difunden.

Aún así, Microsoft ha detectado como la presencia de DALL-E 3 en Bing ha generado que usuarios desarrollasen un reporte de 404 en el que se apreciaban imágenes de Bob Esponja u otros personajes pilotando un avión sobre Nueva York con miras a estrellarse contra las Torres Gemelas.

Con DALL-3 tampoco se podrán crear contenidos que afectasen a artistas vivos y supusiesen problemas legales importantes o críticas por infringir los derechos de autor sin consentimiento explícito. En los últimos días se ha hecho viral la creación de carteles de películas Píxar, aunque habrá que tener cuidado con los personajes protegidos por derechos de autor.

En materia de investigación y de mejora de la herramienta resulta esencial la labor de los usuarios de ChatGPT, aportando comentarios, para informar sobre resultados inseguros que no reflejan con exactitud la intencionalidad inicial. En principio, se calcula que la precisión de investigación para detectar si una imagen fue generada por DALL-E 3 es del 99%. Su precisión es superior al 95% si se trata de una imagen sujeta a aspectos comunes de modificaciones como recortes o cambios de dimensión.

Con el sistema de moderación de DALL-E 3 se logran evitar las malas prácticas que rozan la ilegalidad, por lo que podremos repetir la operación tantas veces quisiésemos si el resultado no nos interesa. La herramienta podrá generar nuevas imágenes y procesar todo el conjunto desde cero.

El clasificador de procedencia forma parte de un amplio conjunto de técnicas que ayudan a las personas a comprender mejor si el contenido visual o auditivo que presencian es real o generado por IA. No obstante, no permite extraer conclusiones definitivas. Para ello, se precisa de una mayor colaboración de la cadena de valor.

 

Lo más leído