A Difusão Estável em Copo Super Grande está aqui de graça! "O modelo aberto do gráfico de Vincent mais forte", as palavras do prompt também são mais simples

巴比特_

2023-07-27 05:53:15

Fonte: Qubit See More

A versão mais forte do Stable Diffusion está aqui!

Agora mesmo, SDXL 1.0 foi lançado oficialmente, e você pode experimentá-lo online gratuitamente.

Em termos de efeito, se é um blockbuster da vida real:

Surreal Panda bebendo cerveja:

Ou quadrinhos cyberpunk, ambos são muito legais~

De acordo com o Stability AI, o SDXL 1.0 produz cores mais vivas e precisas, com aprimoramentos em contraste, luz e sombras, e pode produzir imagens de 1 megapixel (1024×1024).

Ele também oferece suporte à pós-edição de imagens geradas diretamente na página da web.

(Cheira a briga com Midjourney e Firefly)

Os internautas não podem deixar de experimentar ~

Comparado com a difusão estável básica, o SDXL 1.0 produz resultados mais precisos e realistas.

E o funcionário disse que as palavras prontas podem ser mais simples do que antes.

Isso ocorre porque os parâmetros do modelo básico do SDXL 1.0 atingiram 3,5 bilhões e a capacidade de compreensão é mais forte.

Comparado com a versão básica do Stable Diffusion, o número de parâmetros é de apenas cerca de 1 bilhão.

Como resultado, o SDXL 1.0 também se tornou um dos maiores modelos de imagem aberta atuais. O funcionário ainda disse diretamente que este é o melhor modelo de imagem aberta do mundo.

Não há muito a dizer, vamos começar~

Estampa Musk em porcelana azul e branca

O SDXL 1.0 é muito conveniente em operação, você pode inserir diretamente e também pode verificar os parâmetros de estilo e tamanho na parte inferior.

O padrão é gerar 4 imagens por vez. Se você não estiver satisfeito, pode clicar no "sinal de mais" abaixo para deixá-lo continuar a desenhar.

De acordo com a introdução oficial, agora que o SDXL 1.0 pode gerar obras-primas, não há necessidade de adicionar a palavra "obra-prima".

Deixe gerar uma imagem no estilo japonês, o estilo de pintura é muito adequado e o processamento de luz e sombra é mais natural.

Captura de tela de baixa resolução de anime dos anos 90 casal indo embora na rua à noite

Ou uma foto de paisagem? Também pode ser falso.

Até deixe Musk ficar parado em um pátio chinês, olhando para o céu...

Elon Musk num antigo palácio chinês

Ou você comprou a Apple?

No "WWDC", ele ergueu o novo iPhone para mostrar às pessoas, cercado por repórteres e fãs (doge).

Elon Musk lança novo iPhone na WWDC

Além das novidades de cebola desses cavalos velhos, o efeito das obras de estilo de pintura também é bom.

O da esquerda é o estilo de tinta de Qi Baishi, enquanto o da direita é uma caricatura.

左：Elon Musk fazendo um discurso, pintura a tinta, estilo Qi Baishi À direita: quadrinhos de Elon Musk

Além da pintura, você também pode colocar cavalos velhos em nosso Yuan Qinghua.

Almíscar Elon em forma de porcelana Yuan Dynasty Blue and White

As "velhas histórias de cavalos" mostradas acima são relativamente simples de usar.

Mas a partir do efeito, a virilha não é esticada por causa das palavras simples, o que também é confirmado pela declaração oficial.

Mas ainda queremos ver como seria se usássemos um mais complexo e refinado?

Encontramos uma foto rara de um cavalo velho trabalhando como mecânico de automóveis na União Soviética, criada por Midjourney, e a reenviamos para MJ para torná-la uma nova.

MJ gerou o seguinte, que usamos para testar o SDXL:

Elon Musk (这里MJ生成的是um homem) parado em uma sala de trabalho, no estilo da estética de maquinário industrial, deutscher werkbund, imagens uniformemente encenadas, soviético, índigo claro e bronze escuro, nova fotografia colorida americana, características faciais detalhadas

O estilo é exatamente como esperávamos e os detalhes não são ruins.

Há outra imagem complicada como o final, que também é gerado por MJ com base em trabalhos anteriores e depois enviado para SDXL.

elon musk comendo comida com pauzinhos, no estilo de peter coulson, processamento cruzado/processado, fotografia pinhole, erva trimpe, james tissot, transavanguardia, medição pontual

À esquerda está o trabalho do SDXL, e à direita está a versão original do MJ, você pode comparar.

As palavras prontas também suportam o chinês, mas parece que os resultados serão inclinados para o estilo nacional e a precisão também pode ser afetada.

Por exemplo, depois de inserir "um tigre está à beira-mar", uma garota de estilo nacional é dada acidentalmente.

Todo mundo já viu o efeito, então com que rapidez o SDXL está gerando imagens?

Para usuários gratuitos, o tempo é gasto principalmente na fila, mas não demora muito.

Em 5,5 segundos, a fila foi reduzida de 160 para 99.

Além de gerar imagens, o SDXL também oferece muitas funções de pós-edição.

Especificamente, inclui remoção de fundo, processamento de detalhes, ampliação de quadros, etc.

Essas funções já estão disponíveis na plataforma Clipdrop onde o SDXL está localizado, e o SDXL pode transferir as imagens geradas para o módulo correspondente com um clique.

Aqui escolhemos a função de remoção de fundo para mostrá-lo, percebe-se que quase não há falhas nos detalhes das bordas.

Atualmente, a cota de uso gratuito do SDXL ainda é relativamente alta. Após o login, cada conta pode gerar 400 cartões por dia (necessidade de fila).

O pagamento mensal é de $ 9 por mês e o pagamento anual é equivalente a $ 7 (cerca de 50 RMB) por mês, incluindo 1.500 cotas SDXL por dia, e não há necessidade de fila.

No entanto, os preços em diferentes regiões parecem ser diferentes, por exemplo, o pagamento anual na Argentina é de 742 pesos (cerca de 19,4 yuans ou 2,7 dólares americanos) por mês.

Além disso, como a versão paga é na verdade uma assinatura Pro da plataforma Clipdrop, outros recursos da plataforma também estão incluídos.

Além das contas Pro, existem versões de API disponíveis para desenvolvedores (com acesso a Stability AI, Amazon, etc.).

"Copo Máximo" no Modelo de Imagem Aberta

No blog mais recente, Stability AI apresenta mais detalhes técnicos do SDXL 1.0.

Primeiro, o modelo inova em escala e arquitetura.

Utiliza de forma inovadora um modelo base + um modelo refinador.

Os tamanhos dos parâmetros dos dois são 3,5 bilhões e 6,6 bilhões, respectivamente.

Isso também torna o SDXL 1.0 um dos maiores modelos gráficos abertos disponíveis atualmente.

Emad Mostaque, fundador da Stability AI, disse que um número maior de parâmetros pode permitir que o modelo entenda mais conceitos e ensine coisas mais profundas.

Ao mesmo tempo, o aprimoramento de RLHF também foi realizado na versão SDXL 0.9.

É por isso que o SDXL 1.0 agora oferece suporte a prompts curtos e pode distinguir entre o quadrado vermelho e um quadrado vermelho.

No processo de síntese específica, na primeira etapa, o modelo base gera ruído latente e, em seguida, o modelo refinado realiza a redução de ruído.

O modelo básico também pode ser utilizado como módulo independente.

A combinação desses dois modelos pode gerar imagens de melhor qualidade sem consumir mais recursos computacionais.

De acordo com a introdução oficial, o SDXL 1.0 pode ser executado em uma GPU de consumo com 8 GB de VRAM ou na nuvem.

Além disso, o SDXL 1.0 também foi aprimorado no ajuste fino e pode gerar LoRAs ou pontos de verificação personalizados.

A equipe Stability AI também está construindo uma nova geração de controles estruturados, estilizados e combinados para tarefas específicas, com T2I/ControlNet especificamente para SDXL.

No entanto, essas funções ainda estão em fase de teste beta e você pode ficar atento às atualizações oficiais no futuro.

Em resumo, os diagramas de Vincent são um processo iterativo gradual e o objetivo do SDXL 1.0 é facilitar esse processo.

Mostak disse que agora são necessárias apenas 5 a 10 fotos para ajustar rapidamente o modelo.

Também pode ser visto no feedback do usuário que o SDXL 1.0 é mais satisfatório do que o Stable Diffusion.

Na verdade, desde abril deste ano, a Stability AI lançou a primeira versão beta do SDXL.

Os testes internos começaram em junho, e a versão 0.9 foi lançada há algum tempo, quando foi anunciado que uma versão aberta, a última versão 1.0, seria lançada em julho. No momento, os pesos de código relevantes foram publicados no GitHub.

E o responsável pelo aprendizado de máquina Stability AI disse que, em comparação com o SDXL 0.9, a versão 1.0 reduz a demanda por poder de computação.

Se você está interessado em sapatos infantis, experimente-os ~

Entrada de teste:

GitHub:

Link de referência: [1] [2] [3]

Ver original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Recompensa
curtir
Comentário
Compartilhar

Comentário

0/400

Sem comentários

Tema
BTC Hits New High
74k Popularidade
ETH Breaks $3,000
28k Popularidade
VIP Exclusive Airdrop Carnival
9k Popularidade
4Pump.Fun Debuts on Gate
4k Popularidade
5Fed June Meeting Minutes
4k Popularidade
6Join Gate VIP to Win MacBook
29k Popularidade
7Trump Tariff Hikes
16k Popularidade
8Gate xStocks Trading Share
22k Popularidade
9HK Stablecoin Rules
12k Popularidade
10Truth Social Crypto ETF
2k Popularidade

Marcar

sitemap

A Difusão Estável em Copo Super Grande está aqui de graça! "O modelo aberto do gráfico de Vincent mais forte", as palavras do prompt também são mais simples

Estampa Musk em porcelana azul e branca

** "Copo Máximo" no Modelo de Imagem Aberta**

"Copo Máximo" no Modelo de Imagem Aberta