GAN (Siglas en inglés) Redes Neuronales Generativas Antagónicas o Adversarias.

Las GANs son un tipo de IA muy interesante, a mi entender, dado que el esquema básico de operación de la misma se basa en realidad en dos IA que compiten entre sí. Cada una es una Deep Learning o red neuronal profunda. Estas redes neuronales reciben un vector de información de entrada y producen una salida.

Pero en este juego de dos, las redes generativas, como mencioné más arriba, compiten entre sí. Pongámoslo de esta manera con un ejemplo que ayude a comprender el concepto. Una de las redes se designa como Generadora y la otra como Juez. En el gráfico que voy a acompañar y dado que son redes Deep Learning, las identificaré con siglas, siendo DLG la red neuronal generadora y DLJ la red neuronal Jueza. 

Proceso

En este ejemplo que estamos haciendo, el objetivo es que la GAN produzca un rostro realista lo suficientemente preciso, detallado y perfecto que no podamos saber que es un rostro de una persona que no existe.
Bien, estas redes generativas deben ser entrenadas, y parte del ese entrenamiento es en este caso reunir grandes cantidades de imágenes de rostros reales. Al principio, la DLG comenzará a generar un rostro y lo envía a la DLJ, quien determina si es verdadero o falso. Al principio, la generación de la DLG será juzgada como falsa y descartada. Ahora, le enviamos a la DLJ una imagen de un rostro verdadero, determinará que es precisamente verdadero y la salida será Verdadera. Pero nosotros sabemos que ese rostro corresponde a una persona real.
Con el paso del tiempo, el entrenamiento y la propia competencia de la DLG y la DLJ perfeccionan a ambas redes neuronales.
Inevitablemente, en algún punto y después de mucho procesamiento y aprendizaje, la DLG generará un rostro que la DLJ clasifique como Verdadero. Vamos con el esquema en el gráfico que prometí.


Condicionantes

Es posible condicionar el diseño del Generador y del Juez. Salgamos del ejemplo de los rostros por un momento. Digamos que queremos que la IA basada en GAN diseñe algún elemento a partir de bocetos. Supongamos Relojes. Es necesario ingresar información de bocetos de relojes y de relojes reales que concuerden con esos bocetos. El entrenamiento y progresivo aprendizaje concluirá, con el tiempo, en el mismo resultado. Pero ese condicionante debe ser el mismo en ambas redes neuronales.
Y así con las aplicaciones y utilidades que sean necesaria.



Esta imagen de una mujer corresponde al procesamiento de una IA GAN muy avanzada. Es decir, esta persona no existe, no existió ni existirá. El desarrollo de esta IA del tipo GAN corresponde ni más ni menos que a Nvidia.
Los invito a visitar un sitio web muy simple (en diseño), solo muestra imágenes de personas falsas que tanto la DLG como la DLJ han avanzado tanto, que pueden brindar estos resultados. Dejo por acá el enlace para que prueben un poco si lo desean.


Imágenes y arte a partir de texto


Otra posibilidad y es acá a uno de los puntos que quería llegar también con esta entrada, es que el condicionante sea una cadena de texto. Por ejemplo, si siguiendo la línea del artículo, entrenamos Una GAN y el proceso de aprendizaje está avanzado se le incorpora la interface de ingreso del condicionante por medio de cadena de texto. Así yo podría escribir "Una montaña rodeada de nubes con verdes prados a sus pies". Ese condicionante va directamente a la DLG y a la DLJ, cuando la DLG cree el diseño que la DLJ considera es lo que yo ingresé como condicionante, se genera la montaña, las nubes, los verdes prados, etc. Tal vez no se parezca mucho a lo que me imaginé, pero va a ir por esos lados. Nosotros también tenemos que aprender a usar los condicionantes. 

VQGAN y CLIP


VQGAN, desarrollado por OpenAI es una IA GAN que ha venido a revolucionar el arte digital asistido por IA. En la barra lateral del Blog está el link a Night Café, una plataforma paga, pero que ofrece 5 créditos gratis por día (el crédito es el medio de intercambio de la plataforma) y que permite hacer creaciones de arte a partir de texto. Es bastante completa y tiene su especie de Red Social para exponer las creaciones (como si los humanos fuéramos grandes artistas al usar IA) Que sean valoradas por los usuarios de la comunidad y hasta comercializadas.
También es muy importante destacar a CLIP el software que permite ingresar condicionantes al proceso y modificadores como estilos de pintura, artistas, tipo de color, iluminación y muchísimos más.
De ahí que la denominación completa sería VQGAN+CLIP.

Como no dispongo de recursos para comprar un pack de créditos en dólares, fui juntando unos cuarenta y pico de a 5 por día e "hice" algunas imágenes a partir de texto. Voy a mostrar a continuación dos Videos, Sí, también se pueden hacer videos. He visto imágenes y videos realmente impresionantes. Pero la alta resolución y la duración (por ejemplo) cuestan muchos créditos. El procesamiento requerido y potencia de cómputo es muy elevado. Pero busquen en redes sociales creaciones hechas con VQGAN y verán cosas interesantes, si el arte conceptual o como se llame, les gusta. Y todo partiendo tal vez de un simple "Una montaña rodeada de nubes con verdes prados a sus pies"...






Fin de la Entrada. 😎

Comentarios

Entradas populares