- Segment Anything Model 2 é um modelo para resolver o problema de segmentação visual com prompts em imagens e vídeos
- Trata imagens como vídeos de um único quadro para expandir para vídeo
- Usa uma arquitetura Transformer simples com memória de streaming para processamento de vídeo em tempo real
- Foi criado um motor de dados que melhora o modelo e os dados por meio da interação do usuário para coletar o conjunto de dados SA-V
- Oferece desempenho robusto em diversas tarefas e domínios visuais
- O conjunto de dados Segment Anything Video (SA-V) também foi lançado
- Composto por 50.583 vídeos diversos e 642.036 máscaras de segmentação espaço-temporal de alta qualidade (Masklet)
- Licença CC by 4.0
2 comentários
Segment Anything Model (SAM): o modelo de IA da Meta que extrai qualquer objeto de imagens
SAM.cpp - implementação em C/C++ puro do Segment Anything Model da Meta
Comentários do Hacker News
Tenho interesse na melhoria de 6x no mIoU e na velocidade de processamento de imagens
A equipe do Segment Anything lançou o modelo SAM 2
Já lidei com o SAM 1 antes
Quero treinar um modelo para classificar frames de vídeo e encontrar frames específicos
Sou muito fã da função de perda do SAM
A demo web está muito bem feita
O primeiro modelo SAM foi o mais útil para mim
A demo de pesquisa não pode ser usada em Illinois e Texas
Há preocupação com uso militar
É um resultado impressionante