¡La versión más fuerte de Stable Diffusion está aquí!
Justo ahora, SDXL 1.0 se lanzó oficialmente, y puedes probarlo en línea de forma gratuita.
En términos de efecto, si se trata de un éxito de taquilla de la vida real:
Panda surrealista bebiendo cerveza:
O comics cyberpunk, ambos son muy buenos~
Según Stability AI, SDXL 1.0 produce colores más vivos y precisos, con mejoras en el contraste, la luz y las sombras, y puede producir imágenes de 1 megapíxel (1024×1024).
También admite la posedición de imágenes generadas directamente en la página web.
(Huele a pelea con Midjourney y Firefly)
Los internautas no pueden evitar probarlo~
En comparación con la difusión estable básica, SDXL 1.0 produce resultados más precisos y realistas.
Y el funcionario dijo que las palabras rápidas pueden ser más simples que antes.
Esto se debe a que los parámetros del modelo básico de SDXL 1.0 han alcanzado 3500 millones y la capacidad de comprensión es más sólida.
En comparación con la versión básica de Stable Diffusion, la cantidad de parámetros es de solo alrededor de mil millones.
Como resultado, SDXL 1.0 también se ha convertido en uno de los modelos de imagen abierta más grandes actuales. El funcionario incluso dijo directamente que este es el mejor modelo de imagen abierta del mundo.
No hay mucho que decir, empecemos~
Estampado Musk sobre porcelana azul y blanca
SDXL 1.0 es muy conveniente en la operación, puede ingresar directamente y también puede verificar los parámetros de estilo y tamaño desde la parte inferior.
El valor predeterminado es generar 4 imágenes a la vez. Si no está satisfecho, puede hacer clic en el "signo más" a continuación para permitir que continúe dibujando.
Según la presentación oficial, ahora que SDXL 1.0 puede generar obras maestras, no es necesario agregar la palabra "obra maestra".
Deje que genere una imagen de estilo japonés, el estilo de pintura es muy adecuado y el procesamiento de luces y sombras es más natural.
Pareja de captura de pantalla de baja resolución de anime de los años 90 caminando en la calle por la noche
¿O una foto de paisaje? También puede ser falso.
Incluso dejar que Musk se pare en un patio chino, mirando al cielo...
Elon Musk en un antiguo palacio chino
¿O compraste Apple?
En "WWDC", levantó el nuevo iPhone para mostrárselo a la gente, rodeado de reporteros y fanáticos (doge).
Elon Musk lanza nuevo iPhone en WWDC
Además de las noticias de cebolla de estos viejos caballos, el efecto de las obras de estilo de pintura también es bueno.
El de la izquierda es el estilo de tinta de Qi Baishi, mientras que el de la derecha es una caricatura.
左:Elon Musk dando un discurso, pintura en tinta, estilo Qi Baishi
Derecha: cómic de Elon Musk
Además de pintar, también puedes poner caballos viejos en nuestro Yuan Qinghua.
Almizcle de Elon en forma de porcelana azul y blanca de la dinastía Yuan
Las "historias de caballos viejos" que se muestran arriba son relativamente fáciles de usar.
Pero por el efecto, la entrepierna no se estira debido a las simples palabras rápidas, lo que también se confirma en el comunicado oficial.
Pero aún queremos ver, ¿cómo se vería si usáramos uno más complejo y refinado?
Encontramos una foto rara de un caballo viejo que trabajaba como trabajador de reparación de automóviles en la Unión Soviética creada por Midjourney, y se la volvimos a dar de comer a MJ para que la convirtiera en una nueva.
MJ generó lo siguiente, que usamos para probar SDXL:
Elon Musk (这里MJ生成的是un hombre) de pie en un taller, al estilo de la estética de la maquinaria industrial, Werkbund alemán, imágenes escenificadas uniformemente, soviet, índigo claro y bronce oscuro, nueva fotografía estadounidense en color, rasgos faciales detallados
El estilo es exactamente como esperábamos, y los detalles no están mal.
Hay otra imagen complicada como el final, que también es generada por MJ en base a trabajos anteriores y luego alimentada a SDXL.
elon musk comiendo comida con palillos, al estilo de peter coulson, cross-processing/processed, fotografía estenopeica, herb trimpe, james tissot, transavanguardia, medición puntual
A la izquierda está el trabajo de SDXL, y a la derecha está la versión original de MJ, puedes compararla.
Las palabras rápidas también son compatibles con el chino, pero parece que los resultados se inclinarán hacia el estilo nacional y la precisión también puede verse afectada.
Por ejemplo, después de ingresar "un tigre está en la playa", se da accidentalmente una chica de estilo nacional.
Todo el mundo ha visto el efecto, entonces, ¿a qué velocidad SDXL genera imágenes?
Para los usuarios gratuitos, el tiempo se dedica principalmente a hacer cola, pero no esperará demasiado.
En 5,5 segundos, la cola se redujo de 160 a 99.
Además de generar imágenes, SDXL también proporciona muchas funciones de edición posterior.
Específicamente, incluye eliminación de fondo, procesamiento de detalles, ampliación de fotogramas, etc.
Estas funciones ya están disponibles en la plataforma Clipdrop donde se encuentra SDXL, y SDXL puede transferir las imágenes generadas al módulo correspondiente con un solo clic.
Aquí elegimos la función de eliminación de fondo para mostrarlo, se puede ver que casi no hay fallas en los detalles de los bordes.
En la actualidad, la cuota de uso gratuito de SDXL sigue siendo relativamente alta.Después de iniciar sesión, cada cuenta puede generar 400 tarjetas por día (es necesario hacer cola).
El pago mensual es de $9 por mes y el pago anual es equivalente a $7 (alrededor de 50 RMB) por mes, incluidas 1500 cuotas SDXL por día, y no hay necesidad de hacer cola.
Sin embargo, los precios en diferentes regiones parecen ser diferentes, por ejemplo, el pago anual en Argentina es de 742 pesos (alrededor de 19,4 yuanes o 2,7 dólares estadounidenses) por mes.
Además, dado que la versión paga es en realidad una suscripción Pro a la plataforma Clipdrop, también se incluyen otras características de la plataforma.
Además de las cuentas Pro, hay versiones de API disponibles para desarrolladores (con acceso a Stability AI, Amazon, etc.).
** "Copa Máxima" en Modelo de Imagen Abierta**
En el último blog, Stability AI presenta más detalles técnicos de SDXL 1.0.
Primero, el modelo abre nuevos caminos tanto en escala como en arquitectura.
Utiliza de manera innovadora un modelo base + un modelo refinador.
Los tamaños de los parámetros de los dos son 3500 millones y 6600 millones respectivamente.
Esto también convierte a SDXL 1.0 en uno de los modelos de gráficos abiertos más grandes disponibles en la actualidad.
Emad Mostaque, fundador de Stability AI, dijo que una mayor cantidad de parámetros puede permitir que el modelo entienda más conceptos y le enseñe cosas más profundas.
Al mismo tiempo, también se realizó la mejora de RLHF en la versión SDXL 0.9.
Es por eso que SDXL 1.0 ahora admite indicaciones breves y puede distinguir entre el cuadrado rojo y un cuadrado rojo.
En el proceso de síntesis específico, en el primer paso, el modelo base genera ruido latente, y luego el modelo refinado realiza la eliminación de ruido.
El modelo básico también se puede utilizar como módulo independiente.
La combinación de estos dos modelos puede generar imágenes de mejor calidad sin consumir más recursos informáticos.
Según la presentación oficial, SDXL 1.0 puede ejecutarse en una GPU de consumo con 8 GB de VRAM o en la nube.
Además, SDXL 1.0 también se ha mejorado en el ajuste fino y puede generar puntos de control o LoRA personalizados.
El equipo de Stability AI ahora también está creando una nueva generación de controles estructurados, diseñados y combinados específicos para tareas, con T2I/ControlNet específicamente para SDXL.
Sin embargo, estas funciones aún se encuentran en la etapa de prueba beta y puede prestar atención a las actualizaciones oficiales en el futuro.
En resumen, los diagramas de Vincent son un proceso iterativo gradual y el objetivo de SDXL 1.0 es facilitar este proceso.
Mostak dijo que ahora solo se necesitan de 5 a 10 imágenes para ajustar rápidamente el modelo.
También se puede ver a partir de los comentarios de los usuarios que SDXL 1.0 es más satisfactorio que Stable Diffusion.
De hecho, desde abril de este año, Stability AI ha lanzado la primera versión beta de SDXL.
Las pruebas internas comenzaron en junio, y hace un tiempo se lanzó la versión 0.9. En ese momento, se anunció que se lanzaría una versión abierta, la última versión 1.0, en julio. En la actualidad, los pesos de código relevantes se han publicado en GitHub.
Y la persona a cargo del aprendizaje automático de Stability AI dijo que, en comparación con SDXL 0.9, la versión 1.0 reduce la demanda de poder de cómputo.
Si te interesan los zapatos para niños, pruébalos~
Entrada de prueba:
GitHub:
Link de referencia:
[1]
[2]
[3]
Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
¡La taza súper grande Stable Diffusion viene gratis! "El modelo abierto de gráfico Vincent más fuerte", las palabras rápidas también son más simples
Fuente: Qubit
¡La versión más fuerte de Stable Diffusion está aquí!
En términos de efecto, si se trata de un éxito de taquilla de la vida real:
También admite la posedición de imágenes generadas directamente en la página web.
(Huele a pelea con Midjourney y Firefly)
En comparación con la difusión estable básica, SDXL 1.0 produce resultados más precisos y realistas.
Esto se debe a que los parámetros del modelo básico de SDXL 1.0 han alcanzado 3500 millones y la capacidad de comprensión es más sólida.
En comparación con la versión básica de Stable Diffusion, la cantidad de parámetros es de solo alrededor de mil millones.
Como resultado, SDXL 1.0 también se ha convertido en uno de los modelos de imagen abierta más grandes actuales. El funcionario incluso dijo directamente que este es el mejor modelo de imagen abierta del mundo.
Estampado Musk sobre porcelana azul y blanca
SDXL 1.0 es muy conveniente en la operación, puede ingresar directamente y también puede verificar los parámetros de estilo y tamaño desde la parte inferior.
Deje que genere una imagen de estilo japonés, el estilo de pintura es muy adecuado y el procesamiento de luces y sombras es más natural.
En "WWDC", levantó el nuevo iPhone para mostrárselo a la gente, rodeado de reporteros y fanáticos (doge).
El de la izquierda es el estilo de tinta de Qi Baishi, mientras que el de la derecha es una caricatura.
Pero por el efecto, la entrepierna no se estira debido a las simples palabras rápidas, lo que también se confirma en el comunicado oficial.
Encontramos una foto rara de un caballo viejo que trabajaba como trabajador de reparación de automóviles en la Unión Soviética creada por Midjourney, y se la volvimos a dar de comer a MJ para que la convirtiera en una nueva.
Hay otra imagen complicada como el final, que también es generada por MJ en base a trabajos anteriores y luego alimentada a SDXL.
A la izquierda está el trabajo de SDXL, y a la derecha está la versión original de MJ, puedes compararla.
Por ejemplo, después de ingresar "un tigre está en la playa", se da accidentalmente una chica de estilo nacional.
Para los usuarios gratuitos, el tiempo se dedica principalmente a hacer cola, pero no esperará demasiado.
En 5,5 segundos, la cola se redujo de 160 a 99.
Específicamente, incluye eliminación de fondo, procesamiento de detalles, ampliación de fotogramas, etc.
Aquí elegimos la función de eliminación de fondo para mostrarlo, se puede ver que casi no hay fallas en los detalles de los bordes.
El pago mensual es de $9 por mes y el pago anual es equivalente a $7 (alrededor de 50 RMB) por mes, incluidas 1500 cuotas SDXL por día, y no hay necesidad de hacer cola.
Además de las cuentas Pro, hay versiones de API disponibles para desarrolladores (con acceso a Stability AI, Amazon, etc.).
** "Copa Máxima" en Modelo de Imagen Abierta**
En el último blog, Stability AI presenta más detalles técnicos de SDXL 1.0.
Primero, el modelo abre nuevos caminos tanto en escala como en arquitectura.
Utiliza de manera innovadora un modelo base + un modelo refinador.
Los tamaños de los parámetros de los dos son 3500 millones y 6600 millones respectivamente.
Emad Mostaque, fundador de Stability AI, dijo que una mayor cantidad de parámetros puede permitir que el modelo entienda más conceptos y le enseñe cosas más profundas.
Al mismo tiempo, también se realizó la mejora de RLHF en la versión SDXL 0.9.
Es por eso que SDXL 1.0 ahora admite indicaciones breves y puede distinguir entre el cuadrado rojo y un cuadrado rojo.
El modelo básico también se puede utilizar como módulo independiente.
La combinación de estos dos modelos puede generar imágenes de mejor calidad sin consumir más recursos informáticos.
Según la presentación oficial, SDXL 1.0 puede ejecutarse en una GPU de consumo con 8 GB de VRAM o en la nube.
Además, SDXL 1.0 también se ha mejorado en el ajuste fino y puede generar puntos de control o LoRA personalizados.
El equipo de Stability AI ahora también está creando una nueva generación de controles estructurados, diseñados y combinados específicos para tareas, con T2I/ControlNet específicamente para SDXL.
Sin embargo, estas funciones aún se encuentran en la etapa de prueba beta y puede prestar atención a las actualizaciones oficiales en el futuro.
Mostak dijo que ahora solo se necesitan de 5 a 10 imágenes para ajustar rápidamente el modelo.
También se puede ver a partir de los comentarios de los usuarios que SDXL 1.0 es más satisfactorio que Stable Diffusion.
Las pruebas internas comenzaron en junio, y hace un tiempo se lanzó la versión 0.9. En ese momento, se anunció que se lanzaría una versión abierta, la última versión 1.0, en julio. En la actualidad, los pesos de código relevantes se han publicado en GitHub.
Y la persona a cargo del aprendizaje automático de Stability AI dijo que, en comparación con SDXL 0.9, la versión 1.0 reduce la demanda de poder de cómputo.
Si te interesan los zapatos para niños, pruébalos~
Entrada de prueba:
GitHub:
Link de referencia: [1] [2] [3]