Estabilidad IAla empresa responsable del modelo Difusión estable, ha anunciado el lanzamiento de Stable Cascade. Un modelo de generación de imágenes que, según la empresaEs más rápido y potente que su predecesor.

Por ahora, Stable Cascade solo está disponible en GitHub para investigadoresAdemás, su licencia no contempla el uso comercial.

Cómo funciona la cascada estable

Esta nueva IA presenta mayor capacidad en términos de calidad, flexibilidad, ajuste y eficiencia a la hora de crear imágenes. Como otros IA generadoras de imágenesLata en cascada estable generar imágenes a partir de una descripción textual, además de producir variaciones imágenes posteriores de esa misma imagen. Asimismo, con la función «imagen a imagen» Puede introducir nuevas indicaciones de texto para crear variaciones con nuevos matices.

Ejemplo de la función de variaciones en Cascada Estable.  La imagen de la izquierda es la original, las demás son variaciones.

Un atributo interesante de esta IA es la posibilidad de aumentar la resolución de las imágenes existentes en dos. Por ejemplo, puedes hacer que una imagen de 1024 x 1024 tenga una resolución de 2048 x 2048.

Otras funciones de edición de texto a imagen que incluye la herramienta son “en pintura” y “pintura exterior”con el que el modelo puede rellenar una parte concreta de la imagen.

Imagen que muestra las funciones de pintura interna y externa de Stable Cascade

Asimismo, es “Borde astuto”, con el que los usuarios pueden crear una nueva obra utilizando sólo los bordes de una imagen existente. También es capaz de ampliar bocetos.

Ejemplo de la función Canny Edge.  La imagen de arriba muestra un boceto y las de abajo son variaciones de imágenes generadas a partir de esa información.

Según la declaración de Estabilidad AI, Estas son sólo algunas de las características de Stable Cascadepor lo que suponemos que a medida que se presente al público en general, podremos descubrir más capacidades de la herramienta.

Cascada estable: tres modelos en uno

Lo que diferencia a Stable Cascade de otros modelos emblemáticos de Stable Diffusion es que este no es un modelo de lenguaje grande, sino más bien un tres modelos diferentes basados ​​en la arquitectura Würstchen.

Su funcionamiento se divide en tres etapasque han llamado A,B y C. Según Stability AI, «Esta arquitectura permite la compresión jerárquica de imágenes, logrando Resultados notables al utilizar un espacio latente altamente comprimido.».

La etapa C recopila la entrada de texto del usuario y la comprime en fragmentos de código más pequeños. Estos pasan a las etapas B y A para decodificar la solicitud y generar la imagen final. Esta división de solicitudes en bits más pequeños hace que sea requieren menos memoria y menos horas de entrenamiento en la GPU, pudiendo ejecutarse más rápido y permitiendo un mejor rendimiento.

Foto de : Cascada estable

Mantente informado de las noticias más relevantes en nuestro canal Telegrama

Leave a Reply

Your email address will not be published. Required fields are marked *