Vamos colocar os maiores jogadores de arte de IA uns contra os outros e ver qual sai por cima. DALL-E, Midjourney ou difusão estável?

A inteligência artificial percorreu um longo caminho no campo da geração de imagens. Aplicativos generativos como DALL-E, Midjourney e Stable Diffusion tiveram um efeito profundo na maneira como interagimos com o conteúdo digital.

Neste artigo, compararemos cada aplicativo para ver qual é o melhor para gerar imagens com base em prompts de texto. Vamos começar!

DALL-E 2

DALL-E 2 tem uma interface simples que é fácil de entender e é fácil começar a gerar imagens sem precisar se inscrever em uma plataforma de terceiros. Basta acessar o site e inserir seu texto no campo Gerar caixa para criar uma imagem. O DALL-E 2 produzirá quatro versões do prompt, que você pode editar ou baixar.

Recurso de destaque

Um recurso de destaque do DALL-E 2 é a capacidade de criar, editar e fundir várias imagens. Depois de selecionar a imagem desejada e clicar em Editar, você poderá usar o

instagram viewer
Adicionar quadro de geração recurso para adicionar gerações de imagem adicionais à existente.

Depois de colocar o quadro, insira um novo prompt e o DALL-E 2 gerará um novo conjunto de imagens com a opção de fundir qualquer uma delas na imagem original.

Você pode usar qualquer um dos recursos de edição para criar a imagem com perfeição. Por exemplo, você pode usar o Apagar ferramenta para apagar os pixels existentes e, em seguida, insira o novo texto na caixa Gerar para preenchê-lo. Você pode fazer isso várias vezes para obter os resultados desejados.

Mas lembre-se de que toda vez que você clicar em Gerar, você usará créditos. E assim que sua cota for usada, você terá que comprar mais créditos para continuar.

Prós

  • Fácil de usar
  • Muita flexibilidade criativa
  • Nenhuma plataforma de terceiros necessária

Contras

  • imagens simplistas
  • Não é um alto grau de precisão
  • Só pode criar imagens quadradas

Nós cobrimos o noções básicas de DALL-E 2 se você nunca usou antes.

meio da jornada

meio da jornada é indiscutivelmente o gerador de texto para imagem AI para vencer. Com seu poderoso conjunto de recursos, ele é capaz de produzir imagens altamente artísticas e verossímeis que outros concorrentes de IA ainda não alcançaram consistentemente. Mas, ao contrário do DALL-E 2, você precisa criar uma conta Discord antes de começar a usá-la.

Mesmo com as camadas adicionais de complexidade e apesar do fato de você ter que digitar comandos como /imagine para gerar suas imagens, você logo perdoará Midjourney por causa da bela arte que você pode criar com poucas palavras.

Como no DALL-E 2, quatro versões são criadas e você pode selecionar uma ou mais delas para baixar ou criar variações. Mas há mais flexibilidade com proporções de imagem; você pode fazer qualquer proporção de sua preferência anexando cada imagem com --ar e então seguido pela razão, em nosso exemplo, 3:2.

A qualidade dos resultados é a magia inconfundível do Midjourney.

Recurso de destaque

Um dos recursos mais empolgantes e poderosos do Midjourney é a capacidade de fazer upload de suas próprias imagens e, em seguida, fazer com que o Midjourney crie prompts para elas que você pode usar para criar imagens completamente novas. Digitando /describe, você será solicitado a carregar uma de suas imagens.

Depois de carregado, o Midjourney oferecerá quatro prompts com sua própria interpretação do que está vendo.

Você pode usar esses prompts para criar um conjunto de imagens completamente diferente.

Com tanta flexibilidade criativa, Midjourney oferece possibilidades quase infinitas.

Prós

  • Imagens de alta qualidade
  • Os usuários podem programar proporções personalizadas
  • Muita flexibilidade para controlar os parâmetros da imagem

Contras

  • Mais complicado de usar
  • Requer que os usuários se inscrevam no Discord
  • O tempo de geração de imagem aumenta drasticamente depois que as horas rápidas se esgotam

Você pode crie cenários impressionantes para retratos usando Midjourney para destacar suas fotos.

Difusão estável

A Stable Diffusion representa o Velho Oeste das aplicações generativas de IA. Com muitos aplicativos baseados na web e opções de instalação disponíveis, não é fácil comparar Stable Diffusion com DALL-E 2 e Midjourney. Isso se deve principalmente à disparidade entre as versões web e os modelos de instalação em relação a opções e qualidade de saída. Em outras palavras, as versões do Stable Diffusion instalado geralmente oferecem resultados muito melhores e liberdade criativa.

Veremos o site oficial do Stable Diffusion, DreamStudio por Stability AI, e mostrar como começar a usar o aplicativo para dar uma ideia básica de suas habilidades.

O layout do Stable Diffusion no DreamStudio é mais confuso do que DALL-E 2 e Midjourney, mas ainda é fácil de usar. Os usuários de avaliação recebem 200 créditos gratuitos para criar prompts, que são inseridos no Incitar caixa. Mas, além disso, há também um Aviso negativo caixa onde você pode antecipar a difusão estável para deixar as coisas de fora.

Existem vários outros recursos essenciais no menu à esquerda a serem considerados que afetarão a imagem geral e o uso de crédito. Há um Estilo caixa de opções, Enviar Imagem, e Configurações (para relação e o número de imagens a serem geradas). No Avançado guia, há Prompt Força, Etapas de Geração, Semente, e Modelo.

Ao passar o mouse sobre cada uma dessas opções, há uma breve descrição de cada recurso. Mas para entender verdadeiramente o que cada um deles faz na prática, basta experimentá-los. Mas fique atento aos seus créditos porque este não é um sistema de um crédito para uma imagem.

Recurso de destaque

O Aviso negativo é provavelmente o recurso de destaque do Stable Diffusion do DreamStudio. Também é supostamente uma ferramenta tremenda em outras versões do Stable Diffusion que ajuda na qualidade geral da imagem. Nessas versões, digitar declarações negativas ajuda os algoritmos a produzir imagens mais precisas e de maior qualidade.

Quando os prompts negativos funcionam, eles funcionam bem. Mas você gastará créditos tentando aperfeiçoar a aparência que deseja em muitos casos.

Prós

  • Várias opções para versões web e instaladas
  • Mais liberdade criativa (você pode criar imagens sem censura em algumas versões)
  • Muitos controles para personalizar os parâmetros da imagem

Contras

  • Burns através de créditos em versões pagas
  • Curva de aprendizado íngreme
  • A qualidade da imagem é muito imprevisível, dependendo de qual versão você possui

Se precisar de ajuda para criar prompts, mostramos como usar o ChatGPT para criar imagens AI.

Qual é o melhor aplicativo?

Então, qual é o melhor aplicativo, DALL-E 2, Midjourney ou Stable Diffusion? É uma pergunta difícil porque os usuários terão expectativas diferentes e há diferentes versões desses aplicativos que tornam as comparações diretas irrealistas. No entanto, podemos avaliar cada um de nossos exemplos por essas categorias.

Classificação de qualidade de imagem

Midjourney produziu as imagens de melhor qualidade em nossos exemplos. Eles eram mais realistas e renderizados com mais beleza do que DALL-E 2 e Stable Diffusion.

Fácil de usar

Pronto para uso, o DALL-E 2 foi o mais fácil de usar. Não exigia o uso de um aplicativo de terceiros e o menu era direto e simplificado.

Recursos e capacidades

Midjourney supera seus concorrentes porque tem mais recursos e capacidades que produzem imagens de alta qualidade de forma mais consistente.

Velocidade

O DALL-E 2 produz imagens mais rapidamente (cerca de 12 segundos), superando a difusão estável por um segundo ou mais e o meio da jornada (no modo rápido) por uma margem maior.

Flexibilidade e Customização

A difusão estável está em uma classe própria para flexibilidade e personalização. Há um número crescente de versões que permitem aos usuários não apenas criar imagens que geralmente são censuradas, mas existem versões que até produzem imagens de alta qualidade modeladas diretamente do Midjourney imagens.

Midjourney e DALL-E 2 empatam em primeiro lugar no número de categorias que venceram, mas o vencedor geral teria que ir para Midjourney, com base apenas na qualidade da imagem.

À medida que a concorrência se intensifica, os usuários de conteúdo de IA são mais bem atendidos

O máximo que podemos oferecer é um instantâneo dos melhores desempenhos entre DALL-E 2, Midjourney e Stable Diffusion, a qualquer momento. O campo da tecnologia de inteligência artificial está em constante evolução, com inúmeros concorrentes entrando no mercado todos os dias. Isso é altamente benéfico para os usuários de aplicativos generativos de IA, pois promove a inovação e reduz os custos para todos nós acessarmos essas incríveis ferramentas criativas.