- Busca cenas específicas dentro de um vídeo usando a rede neural CLIP da OpenAI
→ Pesquisa imagens dentro do vídeo como "Road Works", "People crossing the street" e "Fire truck"
Modo de funcionamento
-
Baixar o vídeo do YouTube
-
Extrair cada frame
-
Codificar todos os frames com o CLIP
-
Codificar a busca em linguagem natural com o CLIP
-
Encontrar cenas específicas usando a busca em linguagem natural
- Pode ser executado diretamente como notebook no Google Colab
1 comentários
Nos comentários, há também uma busca de imagens do Unsplash feita com CLIP pelo mesmo desenvolvedor; isso também parece ser muito útil.
https://github.com/haltakov/natural-language-image-search
Google Colab: https://colab.research.google.com/github/haltakov/…
Ele encontra, entre 2 milhões de fotos enviadas ao Unsplash, a imagem com o conteúdo que você quiser.