Em resposta ao desafio da OpenAI, Midjourney lançará uma atualização da versão V6 este ano

Fonte da imagem: gerada por Unbounded AI

Já se passou meio ano desde o lançamento do Midjourney v5. Quando será lançada a próxima versão principal v6? A resposta é: ainda este ano.

O CEO da Midjourney, David Holz, disse no evento de ontem que o salto do Midjourney v5 para a v6 será maior do que o salto da v4 para a v5. No entanto, Holz não deu uma data exata de lançamento, mas disse que será lançado em breve, mas com certeza será este ano.

Quanto às novidades que o Midjourney v6 trará, Holz prometeu trazer melhor compreensão do texto, ou seja, a geração da imagem ficará mais próxima da descrição do prompt, e melhor registro dos detalhes na redação do prompt, podendo também trazer renderização de texto Função.

Holz disse que "não é tão difícil". Mas ele também disse que ainda não viu uma boa renderização de texto e continua com a mente aberta para saber se e em que medida o recurso estará disponível.

OpenAI desafia Midjourney, e Midjourney quer usar V6 para lutar contra isso

A OpenAI lançou uma nova versão de seu grande modelo de geração de imagens DALL-E 3 na semana passada. DALL-E é um dos primeiros grandes modelos de IA generativa, anterior ao Midjourney. A versão DALL-E 3 foi significativamente melhorada em todos os aspectos. Muitas pessoas até acreditam que o DALL-E 3 representará uma ameaça direta ao Midjourney, e até ultrapassou o Midjourney em alguns aspectos. Especialmente depois que o DALL-E 3 foi combinado com o ChatGPT, sua compreensão de palavras e detalhes imediatos está superando o Midjourney.

Quando questionado sobre o lançamento do DALL-E 3 da OpenAI, Holz estava “muito otimista” de que Midjourney continuará a oferecer a mais alta qualidade de imagem. Uma primeira comparação entre o DALL-E 3 e o Midjourney v5 mostra que o DALL-E 3 não está muito à frente em termos de qualidade de imagem, mas segue melhor os prompts e pode renderizar texto.

Que novidades o Midjourney v6 trará?

3D e vídeo

Também no roteiro do Midjourney está a capacidade de criar imagens e vídeos 3D. Em relação aos gráficos 3D em particular, Holz está “muito otimista” de que as coisas irão mudar em breve.

Quando ele olhou para os videogames atuais, ele disse que ficou surpreso com o quão ruim era a qualidade gráfica e o quanto a IA generativa contribuiu para a qualidade. Holz disse no passado que espera que os videogames no futuro sejam gerados, em vez de renderizados. A função de imagem 3D será um grande benefício para os criadores de jogos VR e AR.

A Midjourney não planeja divulgar nenhuma informação específica ou demonstração sobre geração 3D este ano. O mesmo se aplica à geração de vídeo que a equipe da Midjourney está desenvolvendo, mas Holz disse que a geração de vídeo pode ser posterior ao 3D e ainda não estar pronta.

Maior resolução

Uma das maiores desvantagens do Midjourney no momento é que as imagens produzidas têm resolução bastante baixa. O tamanho de imagem padrão atual é 1.024 x 1.024 pixels. Outras proporções estão disponíveis, mas não melhoram a resolução de 72ppi. Por exemplo, uma imagem 16:9 só pode ter uma resolução de 1.456 x 816 pixels.

Essa resolução geralmente é adequada para publicação na Web, mas não é suficiente para impressões em tamanhos grandes. Portanto, o suporte a resoluções mais altas é uma necessidade urgente do usuário.

Outras atualizações

Novo estilo Niji

A equipe Midjourney também está desenvolvendo novos estilos de Niji. Este modelo bidimensional foi bem recebido pelos entusiastas bidimensionais depois que foi colocado online.O novo modelo Niji também deverá trazer muitas atualizações e melhorias.

Novo site

A versão web do Midjourney ainda está em desenvolvimento. A nova versão web será lançada em duas fases:

Etapa 1: Capacidade de visualizar, pesquisar suas próprias imagens, etc.

Fase 2: contará com criação de imagens e funcionalidade social

Mas Holz não forneceu um cronograma específico para quando ele estaria online.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)