ONE-PEACE: modelo geral de representação para multimodalidade ilimitada

xguru · 2023-05-31T10:18:01+09:00

Modelo geral de representação que abrange modalidades de visão, áudio e linguagem Obtém excelentes resultados em tarefas integradas mesmo sem modelos pré-treinados Com um forte Zero-shot Retrieval emergente, é possível alinhar modalidades que não foram pareadas nos dados de treinamento Audio-to-Image, Audio+Text-to-Image, Audio+Image-to-Image

(github.com/OFA-Sys)

3 pontos por xguru 2023-05-31 | 3 comentários | Compartilhar no WhatsApp

Modelo geral de representação que abrange modalidades de visão, áudio e linguagem
Obtém excelentes resultados em tarefas integradas mesmo sem modelos pré-treinados
Com um forte Zero-shot Retrieval emergente, é possível alinhar modalidades que não foram pareadas nos dados de treinamento
Audio-to-Image, Audio+Text-to-Image, Audio+Image-to-Image

3 comentários

ninebow 2023-05-31

Opa, acho que é o mesmo que você postou na semana passada. +_+
https://pt.news.hada.io/topic?id=9249

xguru 2023-05-31

Ops, copiei a coisa errada, buá. Como isso também foi compartilhado no Slack, vou deixar assim mesmo.
(Como é importante, vamos considerar que vocês estão vendo duas vezes... buá buá)

ninebow 2023-05-31

Sim, obrigado! 🙇🏼‍♂️
(Acabei descobrindo graças a isso que o xguru publica diretamente! 🤣)

ONE-PEACE: modelo geral de representação para multimodalidade ilimitada

Leituras relacionadas

3 comentários