Muitos de nós já ouvimos o nome DALL-E flutuando, mas você pode não ter certeza do que é. Resumindo, é um modelo generativo de IA que pode criar imagens que nunca existiram antes, tudo o que você precisa fazer é dizer o que deseja criar.
Quando a versão seguinte, chamada DALL-E 2, foi lançada, ela realmente ganhou fama. As imagens que ele podia produzir eram de alta qualidade e tão bem geradas que você dificilmente poderia dizer que uma máquina as havia feito.
Aqui está o que você precisa saber sobre o DALL-E e como ele funciona.
O que é DALL-E?
DALL-E é um modelo de IA generativo desenvolvido pela Open AI que pode gerar imagens e arte a partir de um prompt de texto. Em outras palavras, você pode escrever uma frase descrevendo exatamente o que deseja ver e o DALL-E pode criar essa imagem para você em questão de segundos.
O DALL-E foi lançado pela primeira vez em janeiro de 2021 e desde então foi atualizado significativamente em sua segunda versão chamada DALL-E 2. Foi um dos poucos geradores de arte de IA diferentes que se tornaram extremamente populares por sua capacidade de criar belas imagens e arte a partir do zero.
Como você só precisa escrever algumas palavras descritivas para gerar uma imagem, atrai muitos não-artistas que acham a ferramenta incrivelmente divertida e fácil de usar.
As imagens produzidas pelo DALL-E são tão convincentes que são facilmente confundidas com arte feita por um humano. Além de ter a capacidade de retratar objetos e paisagens do mundo ao nosso redor, ele pode renderizar essas imagens em um estilo específico, como arte digital, aquarela ou impressionismo.
DALL-E recebe o nome do artista Salvador Dalí e um robô chamado WALL-E de um filme de animação da Pixar. O nome de DALL-E certamente nos dá uma ideia de como a empresa pretendia combinar arte e tecnologia de IA.
Você pode descobrir tudo sobre como usar o Dall-E 2 para criar imagens AI em nosso guia detalhado, incluindo como obter acesso e como editar partes específicas da imagem.
Como funciona o DALL-E?
Existem algumas tecnologias diferentes por trás do DALL-E. Mas sem mergulhar na matemática complexa, vamos começar com como o DALL-E foi treinado em milhões de imagens da Internet.
As imagens usadas para treinamento vêm de conjuntos de dados que contêm um número enorme de imagens com legenda de texto. Como você pode imaginar, com dados suficientes, o modelo de IA pode aprender a reconhecer o que é um objeto e como ele pode parecer em uma imagem.
O conjunto de dados usado para treinar DALL-E não foi revelado, no entanto, você ainda pode descubra se suas imagens treinaram um modelo de IA e opte por sair.
O DALL-E também foi construído usando um modelo de linguagem chamado GPT-3, ou transformador pré-treinado generativo. Foi amplamente popularizado quando a Open AI lançou o ChatGPT, um chatbot de IA com o qual você pode conversar facilmente em linguagem humana natural. Essa tecnologia preenche a lacuna entre texto e imagem e ajuda a transformar as palavras que você digita em uma imagem na tela composta de pixels.
Outra parte central do DALL-E é o uso de um modelo de difusão. Este modelo pega uma imagem com ruído - pense em uma imagem altamente pixelada que não é reconhecível - e trabalha de trás para frente para produzir uma imagem clara que corresponda à descrição do texto que você inseriu.
O que você pode fazer com o DALL-E?
As pessoas estão usando o DALL-E para todo tipo de coisa. Você pode tentar ser um artista de IA, usá-lo para remixar uma obra de arte famosa ou pegar uma obra de arte original e estendê-la com as funções de edição do DALL-E.
Outpainting é um recurso do DALL-E que permite criar trabalhos ainda maiores, permitindo que você anexe painéis de imagem recém-gerados a uma obra de arte existente. Aprender como usar outpainting em Dall-E 2 para ver até onde você pode expandir suas imagens geradas por IA.
Crie imagens geradas por IA com DALL-E
O DALL-E é uma ferramenta de IA facilmente acessível que você pode usar para fazer arte ou gerar imagens, nenhuma das quais jamais existiu antes. Ele faz uso de avanços incríveis em aprendizado de máquina, incluindo GPT-3 e modelos de difusão. O conhecimento de DALL-E sobre o mundo humano, incluindo a história da arte, vem de milhões de imagens que provavelmente foram coletadas da Internet.
A combinação de várias novas tecnologias em IA generativa significa que você gosta de dar vida à sua imaginação usando apenas palavras para pintar uma imagem.