- Conecta o ChatGPT a um Visual Foundation Model para permitir o envio e recebimento de imagens durante a conversa
- O ChatGPT foi treinado com base em linguagem, então não consegue processar nem gerar imagens
- O VFM entende e processa imagens, mas só permite entrada e saída pontuais de uma única vez
- Ao conectar os dois, torna-se possível gerar imagens, modificar imagens geradas e remover ou alterar objetos específicos dentro de uma imagem enviada
- É possível enviar imagens junto com linguagem
- Colaboração entre modelos de IA em múltiplas etapas com perguntas visuais complexas ou comandos de edição
- Feedback sobre os resultados modificados, entre outros
1 comentários
Uma vez que a porteira se abriu, o avanço realmente está acontecendo muito rápido.