Generar imágenes a partir de texto se ha vuelto el nuevo “arte” en el mundo digital, ya que si comprendes cómo debes redactar las indicaciones para que el modelo de inteligencia artificial (red neuronal) genere una o más imágenes adaptada a tus necesidades, y te tomará tan solo segundos o minutos quedar contento con los resultados versus los días o semanas que puede requerir el arte “hecho a mano” lo que nos lleva a la preguntra si hoy ¿ya podríamos hablar de arte humano y arte de inteligencia artificial (IA)? El arte generado por IA funciona según el nivel de complejidad del prompt (o indicaciones) que se indiquen.
Si bien existen diferentes soluciones como Shutterstock IA basado en Open AI, Stable Diffusion, Stability.AI de DreamStudio, Night Coffe, Deep Dream Generator, Dream by Wombo, Starryai, Lensa AI, Jasper AI (basado en Dall-e 2), entre otros, todas funcionan con GAN.
GAN Significa “Generative adversarial network” o “redes generativas antagónicas” porque trabajan 2 modelos de inteligencia artificial “en competencia” o como “enemigos” hasta que se terminan “amistando” al tener como resultado la generación de las imágenes que más se acercan a la solicitud del usuario.
Veamos una analogía para comprender rápidamente cómo funciona la tecnología detrás de estos generadores de imágenes a partir de texto, en donde se ha vuelto difícil identificar si es una imagen generada por una GAN o por un ser humano,
Analogía: Imagina la dupla “Artista” y “Crítico de Arte” que ayudará al artista a generar la obra de arte que se necesita crear.
Un cliente le pide al artista que plasme una idea, así que la dupla empieza a trabajar. Primero el artista empieza trazar sus primeros bocetos, y va desarrollando aquella en la que siente que podría calzar mejor para los requerimientos que le realizaron, luego se la presenta al crítico de arte, quien a su vez le da retroalimentación de forma contínua, y así hasta lograr encontrar el camino idóneo que conduzca a que el crítico indique “eureka lo has logrado”.
Ahora apliquemos la analogía
1.- En vez de la Artista o ilustradora colocamos a un modelo o red “generadora” de imágenes
2.- En vez del Crítico de arte: colocamos a un modelo o red discriminadora
El proceso será similar, con la diferencia que el proceso de iteración, de “prueba y error”, que se dará internamente entre las redes genarativas antogónicas pasará por cientos, miles y/o millones de intentos hasta que la red generativa discriminadora le indique a la red generativa que todo ha quedado listo.
Si deseas saber cómo empezar a utilizar el chat gpt para imágenes “Midjourney”, entonces sigue los siguientes pasos:
1.- Crea una cuenta en discord.com ¿Por qué en Discord? Porque Midjourney no funciona a través de una web o aplicativo, sino que utiliza los servidores de la plataforma https://discord.com/ (clic aquí).
2.- Una vez que ya tienes una cuenta registrada en discord, vas a la Página central de Midjourney con el siguiente enlace: -> https://www.midjourney.com/
Imagen N°5: Página central de Midjourney
3.- El siguiente paso es un consejo: si quieres aprender rápido, te sugiero que antes de ingresar para tu prueba gratuita en “Join The Beta” (1) (unirse a la versión beta de Midjourney en Discord.com en donde te dan créditos gratis por ser usuario nuevo) empieces por revisar las imágenes generadas en “Community Showcase” (2) pases el mouse sobre cada imagen y verás que emerge un cuadro de texto con las palabras claves (prompts) que cada usuario ha colocado para lograr obtener ese nivel de imagen, luego le das doble clic sobre el texto y con las teclas “CTRL + C” copias cada prompt, y así vas armando una base de datos de prompts extensa, para que luego puedas ir analizando la “nomenclatura” de cada prompt.
“Ejemplo:
Prompt ingresado por @MadgaMM > “the gradient of colour minimalistic biomechanical organism, cinematic lighting with early morning fog, twilight golden hour”
Y el resultado fue el que está señalado con la flecha:
Nota: los prompts funcionan mejor en inglés (si fuera un inconveniente, te sugiero utilizar Chat GPT para traducirlo de forma fácil, Google Translate, u otro equivalente).
4.- Cuando ya quieras ingresar a crear imágenes (Imagen N°5: Página central de midjourney) > le das clic en en “Join the beta” y te dirigirá a una web con este enlace https://discord.com/invite/midjourney (que no debes abrir en vista incógnito porque es posible que salga que la invitación ha caducado (recuerda tener tu cuenta de discord abierta)
5.- Ahora que estás dentro, debes ir y dar clic a algún canal que tiene el hashtag #newbie (que contiene un bot de Midjourney).
Nota: Si en caso no visualizas canales que digan “newbie” entonces reinicia tu navegador o la página.
6.- En la barra del chat del canal coloca la palabra (en inlgés) “imagine” y luego tu prompt (texto) y finalmente ”Enter”.
Nota: Es posible que si no has aceptado previamente los términos y condiciones de Midjourney, te salga un aviso donde debes colocar clic en “Accept ToS).
Luego de presionar “enter”, empezará la generación de 4 imágenes automáticamente que debes de estar monitoreando para evitar “perderlo” porque se irá combinando con otras solicitudes de diferentes usuarios.
El tiempo de espera es alrededor de 10 a 60 segundos, en donde tendrás la opción de elegir:
A.- Que lo vuelva a intentar (flecha giratoria)
B.- Elegir una variación de alguna de las 4 imágenes (botones: V1, V2, V3, V4)
C.- o una mejora de alguna de las 4 (botones: U1, U2, U3, U4).
Y listo, ya tienes tus imágenes que le solicitaste. Recuerda que al ingresar como usuario nuevo te obsequien créditos, pero con el tiempo te van a solicitar (una vez vencido el periodo gratuito de prueba) que accedas a un plan de suscripción mensual. Puedes seguir con esta plataforma, o utilizar otros modelos de generación de imágenes que anteriormente mencioné.