La empresa OpenAI, especializada en inteligencia artificial, acaba de desarrollar una red neuronal capaz de generar imágenes fotorrealistas. Una simple oración de texto es suficiente para crear casi cualquier montaje imaginable.

también te interesará


[EN VIDÉO] Entrevista: ¿cómo nació la inteligencia artificial?
La inteligencia artificial pretende imitar el funcionamiento del cerebro humano, o al menos su lógica a la hora de tomar decisiones. Jean-Claude Heudin, director del laboratorio de investigación del IIM (Internet and Multimedia Institute), explica el origen de esta investigación.

OpenAI acaba de lanzar una segunda versión de su inteligencia artificial dedicada a la generación de imágenes. bautizado DALL-E 2 (pronunciado como el pintor Dalí), es capaz de transformar una simple oración de texto en una imagen fotorrealista. La primera versión se contentaba con un dibujo sobre fondo liso. Esta nueva IA hace composiciones mucho más complejas.

OpenAI es un competidor directo de Mente profunda de Google. Esta empresa dedicada a la IA fue fundada, entre otros, por Elon Musk y recibió inversiones de microsoft. Su DALL-E 2 se parece al GauGAN (pronunciado como el pintor Gauguin…) de Nvidia, primero capaz de convertir un boceto en un paisaje fotorrealista, luego hacer lo mismo desde un oración de texto.

Explicación de cómo funciona DALL-E AI con muchos ejemplos. (En inglés, habilite la traducción automática de subtítulos). © OpenAI

AI también puede producir variantes de una imagen existente

Sin embargo, DALL-E 2 es mucho más complejo que la competencia porque no se contenta con los paisajes. La IA es capaz de crear una imagen combinando varios elementos comunes, como » un osito de peluche patinando en Times Square «. El sistema está basado en CLIP, una red neuronal de OpenAI entrenado en una gran cantidad de imágenes con descripción. Esta IA fue diseñada para analizar una imagen y generar una descripción, pero aquí realiza la operación opuesta. Luego, una segunda etapa decodifica el resultado de la primera para crear una imagen coherente.

Este sistema de dos pasos también permite otras posibilidades. La IA puede tomar una imagen existente y reemplazar un elemento, o crear una variante inspirada en el original modificando el ángulo, la pose y el aspecto del sujeto. Sin embargo, para evitar abusos, la IA no puede generar imágenes fotorrealistas de rostros humanos, y la firma ha limitado su capacidad para producir imágenes con contenido para adultos o violencia.

¿Te interesa lo que acabas de leer?