Os geradores de arte de IA têm uma má reputação por produzir representações imprecisas de mãos. Vamos colocar Midjourney v5 contra Dall-E 2 para ver qual se sai melhor.
Os geradores de arte AI continuam a impressionar, permitindo-nos criar praticamente qualquer coisa que possamos imaginar. No entanto, a tecnologia parece ter atingido uma parede de tijolos quando se trata de gerar mãos de aparência realista.
Aqui, analisamos dois dos principais aplicativos de arte generativa e os comparamos frente a frente - ou mão a mão - para ver qual pode gerar mãos melhores, Midjourney v5 ou Dall-E 2. Algum desses aplicativos domina as mãos? Vamos descobrir!
O problema da IA com as mãos
Desde que a arte gerada por IA se difundiu na internet, houve críticas em relação à qualidade das mãos desenhadas por IA. Apesar das atualizações recentes, conforme mostrado em nossas comparações lado a lado, os resultados não foram satisfatórios.
Ambos os contendores têm melhorado suas capacidades e a qualidade de seus resultados a cada iteração. A última atualização,
Versão 5 de Midjourney, tem mostrado um progresso impressionante. No entanto, o problema com as mãos desenhadas pela IA permanece sem solução e não pode ser ignorado.Comparação 1: Usando os Prompts "Hand" e "Hands"
Nossas comparações conterão exatamente os mesmos prompts para Dall-E 2 e Midjourney v5. Vamos projetar os prompts para serem específicos da mão, em vez de simplesmente criar pessoas para ver a aparência das mãos. Também estamos dando a cada aplicativo apenas uma chance (rolagem) para cada solicitação.
Mão
Vamos começar com o prompt mais básico e relevante: "mão".
Midjourney v5:
Dall-E 2:
Não começamos bem!
Midjourney tomou o caminho incomum de associar uma mão a situações bastante criativas. Em vez de focar apenas em uma mão, vemos um mago, luvas, um esqueleto e uma pequena estatueta. A imagem das luvas também está faltando um dedo.
Dall-E 2 adota a abordagem oposta e nos oferece apenas uma única mão contra um fundo simples. Mas, estranhamente, existem algumas posturas estranhas, principalmente com os polegares, que não parecem naturais ou confortáveis. Cada mão também é cortada em um dos lados das imagens.
Quem ganha esta rodada? Vamos entregá-lo a Dall-E 2 para precisão geral.
Mãos
Agora, vamos fazer o prompt plural, "hands", e ver o que os AIs fazem.
Midjourney v5:
Dall-E 2:
A tentativa de Midjourney de "mãos" acaba sendo melhor desta vez. Mas todas as quatro imagens são em preto e branco e faltam alguns dedos. Após uma inspeção mais detalhada, você também pode ver que alguns dos dígitos têm uma forma estranha ou se transformam uns nos outros.
Dall-E 2 continua a apresentar as mãos com um fundo liso. Não há dígitos faltando, mas as mãos são cortadas na terceira imagem e as outras versões parecem meio desajeitadas na composição e carecem de criatividade.
Vamos chamar essa comparação de empate. Dall-E 2 ganharia por precisão se esse fosse o único fator, mas Midjourney consegue criar alguns belas imagens em suas versões em preto e branco, mesmo que todas as quatro versões não sejam muito realista.
Você pode sempre use o Photoshop para corrigir sua arte Midjouney, incluindo as mãos.
Comparação 2: gestos manuais
Vamos comparar alguns gestos de mão que são quase universalmente reconhecidos.
Dedos cruzados
Primeiro, vamos tentar "dedos cruzados".
Midjourney v5:
Dall-E 2:
É seguro dizer que Midjourney estragou completamente esse prompt. Faltam-nos dedos e nenhuma das versões parece natural.
Tiro o chapéu mais uma vez para Dall-E 2 por acertar a contagem de dedos, mas essa é a única boa notícia. Cada versão parece que os dedos estão fazendo suas próprias poses de ioga em um jogo de Twister.
Não há vencedor nesta comparação.
Afirmativo
Em seguida, vamos com "polegar para cima".
Midjourney v5:
Dall-E 2:
Midjourney acerta a contagem de dedos enquanto trata cada prompt de maneira criativa. Observe a introdução de um estilo ilustrativo?
Dall-E 2 também ganha pontos por precisão, sem tentar balançar o barco com qualquer coisa criativa adicionada a cada resultado.
Não há um vencedor claro aqui.
Comparação 3: Mãos com Objetos
Agora, aumentaremos a complexidade solicitando que as mãos interajam com os objetos.
mão segurando bola de cristal
Vamos começar com um objeto aleatório, usando o comando "mão segurando uma bola de cristal".
Midjourney v5:
Dall-E 2:
À medida que aumentamos a complexidade, Midjourney começa a brilhar. Além de algumas representações que não parecem naturais, as mãos e as bolas de cristal estão lindas. Midjourney ainda leva tempo para criar reflexos no vidro que certamente contribuem para a criatividade geral.
Mas, pela primeira vez, vemos Dall-E 2 faltando um dígito em pelo menos uma das mãos, com a quarta mão parecendo simplesmente estranha. As bolas de cristal também não parecem tão impressionantes em comparação com as de Midjourney.
Midjourney consegue sua primeira vitória.
mão segurando a água
Vamos tentar algo ainda mais complexo com o prompt "mão segurando a água".
Midjourney v5:
Dall-E 2:
Midjourney só consegue rolar uma imagem com o número correto de dígitos. Embora lindamente renderizado, mais uma vez começamos a ver as falhas no departamento de credibilidade.
Dall-E 2 também luta para alcançar mãos naturais, mas faz um trabalho muito melhor. Ele muda a cor no fundo também para alguma variedade.
Vamos dar esta rodada para Dall-E 2.
Comparação 4: mãos de trabalho
Para esta comparação, criaremos prompts que tenham as mãos envolvidas nas atividades.
Mãos de moldar argila
Vamos ver como os modelos de IA se saem com "argila de moldagem manual".
Midjourney v5:
Dall-E 2:
Midjourney perdeu um dedo em duas imagens, mas tudo parece ótimo.
As imagens de Dall-E 2 parecem confusas e lotadas, recorrendo à adição de mãos de outra pessoa na metade das versões.
A borda vai para Midjourney.
Mãos pressionando a massa
Vamos tentar uma atividade semelhante, "mãos pressionando a massa".
Midjourney v5:
Dall-E 2:
As imagens de Midjourney ficam ótimas no geral. Mas, mais uma vez, metade deles tem dígitos faltando. Mas as imagens não podem ser criticadas por seu estilo artístico.
As versões de Dall-E 2 também não têm dedos na metade das interpretações e até adicionam um à última mão do conjunto.
Vamos chamar isso de empate.
Se você quiser experimentar essas comparações, mostramos a você como usar Midjourney para criar arte AI.
O que os resultados nos dizem?
É divertido fazer comparações e determinar um vencedor geral. E se tivéssemos que escolher, escolheríamos Midjourney v5. Embora Dall-E 2 criasse mãos com o número correto de dedos com mais frequência, foi Midjourney que criou imagens mais renderizadas artisticamente e atraentes.
Mas ambos os aplicativos têm um lugar no mercado para artistas que reaproveitam as imagens Dall-E 2 e Midjourney para seus trabalhos. Ambos são capazes de criar mãos que podem ser usadas como recortes ou em composições para uso artístico, editorial e comercial. É apenas uma questão de preferência pessoal.
A IA acabará por conquistar as mãos
Aplicativos de arte generativa como Dall-E 2 e Midjourney percorreram um longo caminho em sua capacidade de criar arte realista e fantástica. Eles ainda lutam para gerar mãos, mas, dada a aceleração da tecnologia generativa, só podemos esperar melhorias no futuro próximo.