Como utilizar DALL-E 2: Exploração e Possibilidades

DALL-E 2 é um sistema de IA criado pela OpenAI que pode gerar imagens e modificações realistas a partir de descrições de texto. O nome “DALL-E” vem da combinação de “Salvador Dali” e “WALL-E”, referindo-se à criatividade surrealista e generativa do artista e do personagem robô. DALL-E 2 permite-lhe criar arte e imagens simplesmente utilizando descrições de texto, sem necessidade de talento artístico. A IA faz a geração de imagens por si.

Com o DALL-E 2, é possível gerar imagens completamente originais a partir de instruções de texto escritas por si. Também pode editar e manipular imagens e fotos existentes de forma criativa. O DALL-E 2 permite-lhe gerar arte estilizada em estilos históricos, artísticos e de fantasia. Pode produzir imagens para designs de logótipos, maquetas de produtos, design de interiores, paisagens, pessoas e muito mais.

Essencialmente, o DALL-E 2 dá-lhe o poder de visualizar praticamente tudo com imagens geradas por IA utilizando descrições simples do que pretende criar. Não é fixe?

DALL-E 2: Viagem pela sua evolução e contexto

O DALL-E 2 é o sucessor do DALL-E, um gerador de imagens de IA lançado anteriormente em 2021 pela OpenAI. Os investigadores da OpenAI têm estado a trabalhar no DALL-E 2 desde 2019. O projeto visa desenvolver uma IA que auxilie – em vez de substituir – a criatividade humana. Apesar do seu nome, o DALL-E 2 não é realmente inteligente no sentido humano. Limita-se a gerar imagens que correspondem estatisticamente ao conteúdo semântico dos “prompts” textuais fornecidos pelo utilizador.

Compreender o cérebro do DALL-E 2: o funcionamento da IA

O modelo de IA por detrás do DALL-E 2 contém dois componentes principais: um codificador de texto que representa a sua mensagem como um vector de alta dimensão e um descodificador de imagem que gera imagens com base nesse vector de texto.

O codificador de texto foi treinado em centenas de milhões de legendas escritas por humanos para aprender a representar uma descrição escrita.

O descodificador de imagem foi treinado comparando as suas imagens candidatas com as imagens originais correspondentes a uma legenda.

Quando o utilizador introduz uma mensagem, o codificador de texto do DALL-E 2 transforma-a num vector que o descodificador de imagem pode interpretar para produzir 3 imagens que correspondam à sua descrição. A IA utiliza padrões de difusão, uma técnica que transforma gradualmente o ruído em imagens realistas ao longo do tempo. Isso ajuda o DALL-E 2 a produzir resultados foto-realistas e de alta resolução.

Como começar a usar o DALL-E 2: Registo e primeiras criações

Registar-se e criar uma conta

Primeiro, é necessário registar-se numa conta OpenAI. Terá de fornecer detalhes básicos, como o seu nome, endereço de e-mail e criar uma palavra-passe.

Aqui está o link para se registar: https://openai.com/product/dall-e-2

A interface DALL-E 2 e os principais recursos

A interface DALL-E 2 é acessível através de um navegador. As principais características são:

  • Uma caixa de texto onde pode introduzir a descrição do seu texto.
  • Uma opção “Upload” para carregar imagens existentes que deseja modificar ou gerar variações.
  • Um botão “Generate” (Gerar) para produzir imagens com base no seu pedido de texto.
  • Depois de as imagens serem geradas, são-lhe mostradas 4 opções criadas pela IA. Pode então seleccionar uma para guardar ou gerar novas variações.
  • Uma funcionalidade “Editar” que lhe permite modificar as imagens geradas, eliminando partes e introduzindo um novo pedido.
  • Uma opção “Variações” para produzir imagens adicionais geradas com base na mesma pergunta.
  • Um botão “Guardar na colecção” para organizar as suas imagens em colecções para facilitar o acesso posterior.

Gerar as suas primeiras imagens

Depois de ter uma conta e aceder ao DALL-E 2, basta

  • Introduzir um texto curto, de 5 a 10 palavras, que descreva a imagem que pretende criar. (Deve usar apenas o inglês para as instruções)
  • Clicar no botão “Gerar”.
  • Aguarde cerca de 30 segundos enquanto a IA gera 4 imagens com base na sua pergunta.
  • Reveja as 4 opções e seleccione a que preferir.
  • Guarde a imagem numa colecção, se desejar

Comece com pedidos simples e directos para se familiarizar com o sistema. Depois, gradualmente, torne os seus comandos mais complexos e detalhados à medida que for ganhando experiência com o DALL-E 2.

Eis um exemplo com o comando “um cão branco a correr num campo

Assim, vemos o resultado, com o comando no topo e as 4 imagens abaixo.

Desenvolver uma solicitação eficaz: a arte de orientar o DALL-E 2

A anatomia de um prompt eficaz

O factor mais importante que determina a qualidade das imagens de DALL-E 2 é a mensagem. Os avisos eficazes são :

  • Detalhados: Incluem muitos adjectivos, objectos, estilos, contextos e características específicas.
  • Focados : Abordam um conceito ou uma cena única e concisa, em vez de várias ideias.
  • Específicos : Mencionar pormenores concretos que dêem à IA pistas literais para incorporar na imagem.
  • Estilizado : Incluir estilos artísticos, meios e períodos de tempo para permear a geração da imagem.
  • Experimental : Reformule, alargue e modifique as suas sugestões para gerar novas variações.
  • Apropriado : Evite conteúdo tendencioso, prejudicial ou ilegal que não esteja alinhado com os usos de DALL-E 2.
  • Usando adjetivos, objetos, estilos e outros detalhes

Para gerar imagens de alta qualidade, procure sugestões com :

  • mais de 5 adjectivos que descrevam características-chave (por exemplo, cor, forma, emoção, contexto, etc.)
  • mais de 3 objectos distintivos que sejam centrais à cena ou ao espectáculo
  • 1-2 estilos artísticos, meios ou períodos de tempo para ancorar a geração
  • 2+ contextos, locais ou ambientes onde a cena poderia ter lugar
  • Verbos e preposições adequados para ligar os diferentes elementos

Tente criar o seu guião invocando o máximo de pormenores visuais possível no seu guião. Quanto mais informações pormenorizadas fornecer, mais a imagem criada por DALL-E 2 corresponderá à sua visão.

Aqui está um exemplo de uma solicitação complexa para DALL-E 2:

“iphone feito de terracota de Harappa, Civilização do Vale do Indo, Paquistão; 2600-1900 a.C., luz de estúdio”

– Especifica um objecto central – um iPhone
– Menciona que o iPhone é feito de terracota, para dar um aspecto invulgar
– Situa o objecto num contexto cultural e geográfico específico – a Civilização do Vale do Indo em Harappa, Paquistão, cerca de 2600-1900 a.C.
– Fixa a geração num estilo e período históricos – o antigo Indo
– Menciona as condições de iluminação – luz de estúdio – para orientar a representação visual

Esta proposta utiliza várias das técnicas mencionadas:

– Fornece mais de 3 objectos distintivos: um iPhone, terracota, luz de estúdio
– Fixa a geração num estilo (‘terracota') e num período histórico (o Indo)
– Define o cenário num contexto específico: Harappa, Vale do Indo, 2600-1900 a.C.
– Utiliza verbos e preposições para ligar os elementos: ‘iPhone made of…from Harappa'

Os pontos fortes deste prompt são:

– O elevado nível de especificidade: o local, o período e o material são definidos com precisão
– O pormenor invulgar mas plausível: um iPhone de terracota da Idade do Bronze
– A coerência global: todos os elementos se combinam logicamente na cena descrita

Em resumo, esta mensagem bem estruturada e rica em pormenores deve produzir uma imagem muito específica e interessante, graças a todas as informações fornecidas ao modelo de IA. É um bom exemplo de como um comando complexo pode orientar eficazmente a criação de imagens com DALL-E 2.

Esse tipo de comando elaborado e com nuances é necessário para produzir imagens fotorrealistas e muito específicas com DALL-E 2. Quanto mais informações puder fornecer ao modelo de IA, maior a probabilidade de ele capturar e representar com precisão a cena que tem em mente.

Desafio de geração de imagens complexas: Dicas e técnicas

Para a geração de imagens ambiciosas, como :

  • Cenas complexas com vários objectos
  • Imagens existentes modificadas ou combinadas
  • Representações fotorrealistas de situações do mundo real

Experimente técnicas como :

  • Dividir o seu pedido em mais de 2 descrições mais curtas e simples para gerar imagens de referência
  • Editar/combinar as melhores gerações de referência usando as ferramentas de edição do DALL-E 2
  • Melhorar progressivamente o seu pedido através de várias gerações e modificações
  • Subcontratar subtarefas (por exemplo, gerar objectos individuais) e combinar os resultados

No caso de solicitações complexas, são frequentemente necessárias várias gerações e modificações iterativas para produzir imagens de alta qualidade que concretizem plenamente a sua visão. Seja paciente, experimente frequentemente e refine os seus prompts ao longo do tempo.

Geração de imagens estilizadas

Geração de renderizações artísticas

Para gerar representações artísticas, inclua palavras-chave estilísticas, tais como :

  • Pintura a óleo, aguarela, esboço a carvão, arte digital, pixel art
  • Impressionista, surrealista, expressionista abstracto, cubista, etc.
  • Mencionar um estilo artístico: “ao estilo de Van Gogh”, “ao estilo de Picasso”, etc.
  • Experimentar vários estilos: “Uma aguarela abstracta de estilo surrealista”.
  • Variar a complexidade: cenas simples → detalhadas funcionam melhor para cada estilo.
  • Produzir animações: Adicione “GIF” ou “animação”.
  • Experimenta ao extremo! Misture estilo renascentista com pixel art, anime com pontilhismo, etc.
  • Produzir imagens históricas e de época

Pode dar indicações de estilo na “época”, por exemplo:

  • Idade da Pedra
  • Antigo Egipto, Grécia, Roma
  • Idade Média
  • Renascença
  • Era vitoriana
  • Década de 1980, década de 1990

Pode imaginar acontecimentos, lugares ou objectos específicos:

  • Anacronismos: “Um banquete egípcio com iPhones”.
  • Menções a eventos: “A assinatura da Declaração de Independência”
  • Objectos, vestuário e arquitectura culturalmente apropriados.
  • Criação de imagens ilustradas

É perfeitamente possível especificar o objectivo da imagem:

  • Tutoriais
  • Diagramas de saúde e ciência
  • Mapas
  • Ilustrações de livros
  • Clipart
  • infografias

Utilizar :

  • “Um diagrama ilustrado…”
  • “Um diagrama que mostra…”
  • “Clipart de…”
  • “Um diagrama de etiquetas de…”

Edição e manipulação de imagens

Existem duas outras ferramentas interessantes para utilizar no Dall-2: a pintura para alterar uma parte da imagem e a pintura externa, que permite continuar e ampliar as imagens existentes de forma nova e interessante, mantendo a coerência do seu conteúdo e estilo.

Inpainting com DALL-E 2: A arte de apagar e preencher lacunas

O Inpainting usa as ferramentas de edição do DALL-E 2 para :

  • Remover objectos/pessoas indesejadas das fotografias
  • Eliminar painéis, cartazes ou elementos de distracção
  • Apagar partes danificadas/incompletas de imagens

Assim, pode

  1. adicionar uma imagem clicando em “Carregar”
  2. Seleccionar a ferramenta borracha
  3. Eliminar a secção não pretendida
  4. Introduzir uma mensagem que descreva o que pretende em vez disso
  5. Ajustar a pergunta de acordo com os resultados

Algumas sugestões:

  • Apague lentamente para refinar a sua selecção.
  • Forneça uma mensagem detalhada e específica.
  • Gerar várias imagens e comparar/combinar os resultados.

Outpainting with DALL-E 2: Expanda seu horizonte criativo

  • Fotos
  • Obras de arte
  • Gráficos

Você :

  1. Carregar uma imagem
  2. Seleccionar “Adicionar moldura generativa
  3. Escolhe onde queres ampliar a imagem
  4. Introduza uma mensagem sobre o que pretende, aqui coloquei “A cidade em segundo plano”

Penso que os resultados são muito bons com o Outpainting, é uma das opções mais interessantes em comparação com a concorrência.

Não se esqueça de especificar como expandir descrevendo :

  • Contexto adicional
  • Pormenores adicionais
  • Continuações de motivos/temas

Inspirar variações: Do design de produtos à arte gráfica

  1. Carregar uma imagem
  2. Remover o fundo (opcional)
  3. Introduzir um pedido que descreva as alterações pretendidas
  4. Seleccionar “Gerar variações
  5. Rever novas versões
  6. Seleccionar/combinar as melhores variações

Pode variar :

  • Ângulos
  • Estilos
  • Condições climatéricas
  • Personagens/temas

Outras aplicações e casos de utilização

Design gráfico e de produtos

O DALL-E 2 pode ser utilizado para design gráfico e de produtos, como a criação de maquetas de produtos, maquetas de embalagens e conceitos de design. As técnicas incluem o carregamento de imagens de produtos, a eliminação de fundos, a modificação de designs existentes e a combinação de elementos de vários designs. Pode gerar conceitos e variações para explorar diferentes possibilidades. Por exemplo, pode gerar maquetas de produtos “Produto de uma garrafa de água de vidro com tampa flip-top sobre uma mesa de madeira” ou conceitos de logótipo “Um logótipo 2d, simétrico e plano para uma empresa de cadeias de blocos que seja elegante e simples. Deve ser de cor preta e deve ser subtil.”

DALL-E 2 e arte conceptual: estimular a ideação

O DALL-E 2 é excelente na geração de arte conceptual e na ideação de possibilidades de design. Pode desenvolver conceitos para capas de livros, cartazes de filmes, designs de personagens, designs de veículos e muito mais. As boas técnicas envolvem o desenvolvimento iterativo de conceitos, a externalização de subtarefas como a criação de personagens individuais e a combinação de elementos de vários conceitos para incentivar a novidade. Por exemplo, pode gerar “desenhos de portões de cidades de fantasia ao estilo de World of Warcraft” ou “esboços de criaturas extraterrestres para um filme de ficção científica”

DALL-E 2 para educação: Imagens e diagramas para aprendizagem

DALL-E 2 pode produzir imagens e diagramas educacionais que são claros, simples e bem rotulados. As utilizações incluem a criação de equações matemáticas, diagramas científicos, ilustrações anatómicas, cenas históricas e linhas cronológicas. As boas técnicas envolvem centrar-se na clareza e simplicidade, rotular partes e componentes, incluir legendas para o contexto, gerar múltiplos para comparação e voltar a pedir para melhorar a qualidade. Por exemplo, pode gerar “um diagrama anatómico detalhado da mão humana com ossos e tendões identificados” ou “uma cronologia visual passo a passo da Revolução Americana com cenas legendadas”

Desenvolva seu talento artístico com DALL-E 2

Onde obter inspiração para suas criações com DALL-E 2

As fontes de inspiração para os textos e projetos do DALL-E 2 incluem:

  • Artigos da Wikipédia sobre os temas para os quais pretende criar imagens
  • Livros de história da arte sobre diferentes épocas ou estilos
  • Sites de inspiração de design com produtos, gráficos e visuais
  • Sites de fotografias isentas de direitos para obter ideias para conceitos fotográficos
  • Motores de pesquisa de imagens para inspiração visual geral
  • Pesquisar subreddits como r/Art, r/DesignPorn, para obter estímulos
  • Sites de redes sociais como o Pinterest e o Instagram ou o Twitter

A chave é expor-se continuamente a novas ideias, estilos e estímulos visuais que podem ser traduzidos em prompts e gerações de DALL-E 2.

Brainstorming eficaz: métodos para gerar ideias e projectos

As técnicas para encontrar novos textos e projetos para DALL-E 2 incluem:

  • Brainstorming por associação livre – Escreva tudo o que lhe vier à cabeça
  • Elaboração de listas – Anotar tópicos, estilos, atributos e características
  • Mapeamento mental – Organizar visualmente conceitos relacionados num mapa
  • Geração de perguntas – Perguntar a si próprio “quem?”, “o quê?”, “como?
  • Técnicas de perguntas compostas – Combinar várias ideias numa só pergunta
  • Pesquisa de conceitos interessantes – Leia artigos sobre os tópicos que pretende gerar
  • Passoa passo – Divida grandes projectos em sugestões simples que pode gerar individualmente e depois combinar

Não se preocupe se as suas primeiras tentativas com o DALL-E 2 parecerem um pouco desajeitadas ou banais. Como acontece com qualquer nova ferramenta criativa, é preciso tempo para se habituar a ela e desenvolver uma intuição sobre ela. Mas, com a prática regular, sentir-se-á cada vez mais à vontade para ter ideias originais e poderosas para explorar.

A inspiração nem sempre surge espontaneamente, por mais brilhante que seja! Tem de alimentar a sua imaginação expondo-se a novas fontes de ideias – lendo livros sobre temas inesperados, analisando imagens invulgares, olhando para o mundo à sua volta com novos olhos. E quando começares a procurar ideias para o DALL-E 2, experimenta diferentes técnicas para estimular a tua criatividade, como fazer listas de associações livres, combinar conceitos distantes ou modificar os prompts existentes.

Com o tempo e a prática, o desenvolvimento de sugestões e projectos criativos com DALL-E 2 tornar-se-á cada vez mais natural. Mas nunca se esqueça de continuar a alimentar a sua imaginação e a brincar com o próprio processo criativo. Esta é a melhor maneira de se tornar um utilizador inspirado e eficaz de DALL-E 2!

O DALL-E 2 é gratuito?

Infelizmente não, bem, não é bem assim, DALL-E 2 tem uma estrutura de preços baseada em créditos. Um número pré-determinado de créditos será dado aos novos utilizadores para criar, modificar ou variar fotos. Em contraste com a modificação e a variação, a geração resulta em quatro imagens por um crédito. Os créditos podem ser adicionados em incrementos de $15, ou podem ser recarregados mensalmente a uma taxa de $15 no segundo mês e $50 no primeiro.

CustoCréditosNúmero de imagens
Primeiro mêsGRÁTIS50200
Cada mês subsequenteGRATUITO1560
Pacotes de créditos adicionais15 $115460

Similar Posts

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *