1 pontos por GN⁺ 2023-11-28 | 1 comentários | Compartilhar no WhatsApp

Festa de transformação de imagens com DALL·E

  • O DALL·E oferece uma festa para transformação de imagens.
  • Entre os temas de imagem de que os usuários gostam estão "gnomos", "idosos siberianos" e "gatos estranhos".
  • É possível gerar imagens com base em um prompt inicial usando uma chave da API da OpenAI.

Configurações avançadas

  • Com configurações avançadas, como o número de iterações, o usuário pode ajustar o processo de geração de imagens.
  • Também é possível personalizar usando prompts de visão do GPT-4 para alterar o prompt base, deixá-lo mais divertido, mais estranho, mais criativo ou até transformar tudo em gatos.

Opinião do GN⁺

  • O ponto mais importante deste artigo é que, com o DALL·E, é possível gerar várias imagens e transformá-las da maneira que o usuário quiser.
  • Os recursos de geração de imagens criativos e personalizados oferecem uma experiência interessante para as pessoas e podem ser vistos como um exemplo do avanço da tecnologia e das possibilidades da inteligência artificial.

1 comentários

 
GN⁺ 2023-11-28
Comentários do Hacker News
  • Brincar com prompts e ver o que pode ser criado por meio de uma sequência de imagens é bastante divertido. Inspirado por uma postagem recente no Twitter, tentei uma configuração que aumenta a "intensidade" a cada prompt. Fiquei maravilhado ao ver um tema que começou com a sugestão de uma criança escalar de uma travessura comum de cabra para um horror cósmico apocalíptico. Link: dalle.party
  • Um prompt personalizado de que gostei bastante: considerar cuidadosamente cada detalhe da imagem para conceituá-la, incluindo estilo, cores e iluminação. Na etapa final, comprimir isso em um único parágrafo, usando as características mais marcantes e uma linguagem muito precisa para resumir a ideia. Link: dalle.party
  • Também é divertido brincar com conceitos contrastantes. Começa com um gato simples, evolui para um pepino descansando confortavelmente e, por fim, muda para um mundo oposto. Link: dalle.party
  • Isso lembra o jogo de festa "Telestrations". Os participantes se alternam entre desenhar e escrever o que viram, e é divertido ver o resultado tentando adivinhar qual será o próximo desenho. Seria bom ter um modo alternativo de visualização que mostrasse a imagem e o próximo prompt. Dá para ler o prompt e depois ver a imagem mudando para o modo mobile ou redimensionando a janela.
  • Eu esperava uma evolução técnica gradual, e não uma regressão técnica, mas na prática ele rapidamente se desvia para um território surrealista. Prompt inicial: "um híbrido entre uma locomotiva a vapor futurista e uma máquina voadora de Da Vinci". Resultado: dalle.party
  • Modelos de imagem-para-texto parecem não ter nenhuma noção do que uma foto realmente contém. Parece que fazem correspondência com padrões dos dados de treinamento. Isso faz com que, ao renderizar imagens a partir de texto, o modelo pareça "entender" o que quer, mas na direção oposta isso está longe de ser "compreensão".
  • Ainda não testei, mas suponho que isso seja semelhante a um jogo comercial chamado Scrawl. Os participantes passam folhas de papel adiante, transformando o texto do vizinho em desenho ou o contrário, e então passam novamente. Link: boardgamegeek.com
  • Quando experimentei com o prompt inicial "uma inteligência artificial desenhando a si mesma", o resultado mostrou de forma consistente um robô pintando em uma tela. As primeiras 4 são desenhos do robô, as 3 seguintes são galáxias, e as 2 últimas são paisagens. Link: dalle.party
  • É interessante ver que certos prompts e temas permanecem relativamente estáveis. Por exemplo, o exemplo do "gnomo" é estável, mas o exemplo de "um gato dando aula para um rato" rapidamente sai dos trilhos e entra em um território surrealista estranho.
  • Fico um pouco decepcionado porque os resultados têm bastante ruído, mas o conceito em si é atraente. Link: dalle.party