3 pontos por xguru 2023-05-31 | 3 comentários | Compartilhar no WhatsApp
  • Modelo geral de representação que abrange modalidades de visão, áudio e linguagem
  • Obtém excelentes resultados em tarefas integradas mesmo sem modelos pré-treinados
  • Com um forte Zero-shot Retrieval emergente, é possível alinhar modalidades que não foram pareadas nos dados de treinamento
  • Audio-to-Image, Audio+Text-to-Image, Audio+Image-to-Image

3 comentários

 
ninebow 2023-05-31

Opa, acho que é o mesmo que você postou na semana passada. +_+
https://pt.news.hada.io/topic?id=9249

 
xguru 2023-05-31

Ops, copiei a coisa errada, buá. Como isso também foi compartilhado no Slack, vou deixar assim mesmo.
(Como é importante, vamos considerar que vocês estão vendo duas vezes... buá buá)

 
ninebow 2023-05-31

Sim, obrigado! 🙇🏼‍♂️
(Acabei descobrindo graças a isso que o xguru publica diretamente! 🤣)