Cómo crear mejores caras con difusión estable
Stable Diffusion te permite crear prácticamente cualquier imagen basada en texto. Por ejemplo, su proyecto puede requerir que mejore una cara de IA, pero tiene problemas para mejorar el original. Si es así, puede usar algunos de nuestros consejos para mejorar su proceso de creación de rostros de difusión estable. Siga leyendo para obtener más información.
¿Cómo se crean mejores rostros con difusión estable?
Para crear mejores caras con Stable Diffusion, debe configurar un Google Colab llamado Deforum Stable Diffusion v0.5. Así es como puedes hacer eso:
- Abre tu navegador y ve a este sitio web.
- Presione el botón “Conectar” y haga clic en “GPU NVIDIA”. Dado que esta es la GPU del servidor de Google, no se preocupe, no necesita una tarjeta gráfica NVIDIA.
- Otorgue permisos del sistema para que el sitio web use su computadora.
- Presione en la sección debajo de la tarjeta GPU (“Modelo y rutas de salida”).
- Conecte su Google Colab con su Google Drive y espere a que aparezca la marca de verificación junto a “Modelo y rutas de salida”.
- Seleccione “Configurar entorno” y deje que el sistema conecte su cuenta. Haga lo mismo para las “Definiciones de Python”.
- Vaya a “Seleccionar y cargar modelo”. Esta sección requiere que tenga el modelo que desea cargar en su Google Drive. Para hacerlo, descargue el archivo .ckpt de este sitio web presionando “sd-v1.4.ckpt” en la sección “Descargar los Pesos”. Cargue este archivo en su carpeta AI de Google Drive que contiene los modelos que desea mejorar.
- Presione el botón “Reproducir” junto a la sección “Seleccionar y cargar modelo”. Espere la marca de verificación verde y su Google Colab estará en funcionamiento.
Ahora que su Google Colab está configurado, puede mejorar sus rostros de IA con Stable Diffusion. Este proceso también se conoce como mejorar los renderizados antiguos y se reduce a cambiar la resolución de sus imágenes:
- Recorta la cara que deseas mejorar y guárdala como una imagen separada.
- Cargue la cara arrastrándola a su unidad temporal de Google Colab (el panel de la izquierda).
- Haga clic derecho en la imagen y haga clic en el botón “Copiar ruta”.
- Pegue la imagen en el campo “init_image” en el menú de la derecha.
- Navegue a la ventana “Indicaciones” e ingrese las indicaciones que desee para su rostro. Asegúrate de escribir
en las indicaciones dentro de las comillas para obtener los mejores resultados. - Dirígete a la sección “Ejecutar” y busca el menú “Configuración de imagen”.
- Cambie la resolución de píxeles para mejorar la claridad de la cara. Por ejemplo, 800×800 funciona bien en la mayoría de los casos.
- Presione el botón rojo “Reproducir” debajo de la ventana “Ejecutar” para renderizar la imagen.
- Su imagen ahora se renderizará con una resolución diferente. Juega con el procedimiento hasta que obtengas el efecto deseado.
- Descargue la imagen de su unidad y superpóngala sobre el original.
¿Cómo se utilizan variaciones con difusión estable para crear mejores caras?
Además de mejorar los rostros directamente cambiando la resolución, también puede introducir variaciones para producir imágenes más nítidas. El primer paso es configurar sus preferencias de “Animación” en “ninguna”. Esto es lo que debe hacer:
- Conecte su Google Drive a Google Deforum Stable Diffusion 0.5 Colab con los pasos anteriores.
- Cargue la imagen de la cara en el panel izquierdo de Colab.
- Vaya al menú “Animación” y cambie la configuración “animation_mode” a “ninguno”.
- Haga clic en el botón “Reproducir” junto a la sección “Animación” para guardar los cambios.
Una vez que haya cambiado la configuración de “Animación”, puede ignorar la mayoría de las demás configuraciones, ya que no desea crear una animación. Sin embargo, deberá realizar algunos ajustes en la sección “Indicaciones”. Sigue estos pasos:
- Utilice el mensaje original como punto de partida.
- Realice las variaciones necesarias cambiando la línea, dependiendo de si desea agregar o eliminar las características de su rostro de IA. Trabaje en la sección “Mensajes” en lugar de la ventana “Mensajes de animación”.
- Coloque comillas al principio y al final de sus indicaciones.
- Ponga una coma al final del indicador (después de las comillas).
- Haga clic en el botón “Reproducir” en la esquina superior izquierda de la ventana “Indicaciones” para renderizar su imagen y guardar su progreso.
El siguiente menú que desea modificar es el menú “Ejecutar”. Más específicamente, debe ir a la ventana “Configuración de imagen” y realizar los siguientes cambios:
- Vaya a “Configuración de muestreo” y establezca la configuración “Semilla” en “-1”.
- Juega con el ajuste “Muestra” hasta que consigas el efecto deseado.
- Establezca tantos “Pasos” como desee. El valor de “Escala” también depende de usted.
- Si usó el renderizado “ddim” en la ventana “Muestra”, establezca “ddim_eta” en “1”.
- Desplácese hacia abajo hasta que encuentre “Configuración de lote” y diríjase a la línea “n_batch”. Escriba el número de variaciones que desea tener en el cuadro de texto.
- Vaya a “Configuración de inicio” y presione la casilla junto a la opción “use_init”. Ahora debería haber una marca de verificación junto a la configuración.
- Escriba “0.5” en el campo “fuerza” si desea reutilizar el 50% de la imagen original. Puede ingresar valores más altos o más bajos, dependiendo de cuánto desee reutilizar el material de origen.
- Haga clic en el icono “Archivo” en el panel de la izquierda. Vaya a la carpeta que contiene la imagen de la cara que desea optimizar y arrástrela a la sección de la izquierda. Espere a que el sistema cargue su imagen, haga clic con el botón derecho y presione el botón “copiar ruta”.
- Pegue la ruta en el campo “init_image” y haga clic en el botón rojo “Reproducir” en la esquina superior izquierda del menú “Configuración de imagen”.
- Deje que el programa renderice su imagen y agregue variaciones. Ahora debería ver la nueva cara en la parte inferior de la pantalla con sus variaciones.
Cómo mejorar la generación de imágenes con difusión estable
Al mejorar caras con Stable Diffusion, la mayor parte del trabajo se reduce a escribir indicaciones adecuadas. El sistema se basa en esta función para generar una imagen utilizando la tecnología “txt2img”. Utiliza el indicador de texto y otros parámetros para producir una imagen basada en su entrada.
Como se discutió anteriormente, debe ingresar el valor “semilla” en un punto para crear los resultados deseados. También puede cambiar el número de “pasos” al incorporar variaciones.
Sin embargo, es posible que estas características no hagan mucho en términos de mejorar las caras resultantes. En su lugar, deberá intensificar su juego de “indicaciones” para garantizar la generación de imágenes de alta calidad. Aquí hay algunos consejos que te ayudarán a hacerlo.
- Sea específico: sus indicaciones de texto deben ser muy detalladas, especialmente al comienzo, ya que el comienzo de su frase tiene más importancia que el final. Si omite información clave, es posible que no obtenga el aspecto deseado.
- Cíñete al inglés: los desarrolladores de Stable Diffusion utilizaron más de dos mil millones de pares de imágenes y texto en inglés. Los otros más de 100 idiomas representaron menos pares, lo que significa que la proporción de idiomas individuales es mucho menor que la del inglés. Como resultado, es posible que escribir indicaciones en idiomas que no sean inglés no le brinde el resultado correcto.
- Incluya el género y el tipo de arte: Stable Diffusion puede generar todo tipo de imágenes, incluidas pinturas acrílicas y al óleo, fotografías de moda, dibujos animados e impresiones. Por lo tanto, especificar la forma de imágenes que desea hace que el algoritmo sea más preciso.
- Sea moderno: si busca imágenes artísticas, puede agregar “tendencia en ArtStation” u otros nombres para ayudar a Stable Diffusion a estar lo más cerca posible de la imagen deseada.
- Juega con diferentes palabras: al escribir tus indicaciones, nunca puedes exagerar tus descripciones. Por lo tanto, juegue con diferentes propiedades técnicas, como “enfoque nítido” e “iluminación dramática” o adjetivos, como “impresionante”, “hermoso” y “impresionante”.
- Agregue el nombre de un artista: Stable Diffusion le permite producir imágenes al estilo de artistas famosos. Para lograr este efecto, agregue el nombre de sus artistas a su solicitud, como Andry Warhol, Caspar David Friedrich o Auguste Renoir.
- Use negativos: algunas versiones de su interfaz reaccionan a las indicaciones negativas. Estos le permiten indicar lo que su sistema debe evitar al producir imágenes.
Deje volar su imaginación y creatividad en una difusión estable
Dominar la difusión estable puede llevar un tiempo, especialmente cuando desea mejorar sus rostros de IA y otras imágenes. Una o dos líneas incorrectas pueden degradar fácilmente su proyecto, por lo que debe tener mucho cuidado al escribir sus indicaciones e ingresar parámetros de generación. Con unos pocos ajustes, debería poder embellecer las caras y cualquier otra parte de sus imágenes con facilidad.
¿Con qué frecuencia utiliza difusión estable? ¿Alguna vez ha agregado variaciones en sus imágenes? Si es así, ¿qué efectos produjeron? Comparta sus experiencias en la sección de comentarios a continuación.