É uma explicação sobre uma caixa de ferramentas com várias demos
Segment Anything 2: gera recortes de vídeo e efeitos visuais divertidos com apenas alguns cliques
Seamless Translation: permite ouvir sua própria voz soando em outro idioma
Animated Drawings: transforma esboços feitos à mão em animações cheias de vida
Audiobox: cria histórias em áudio usando vozes e sons gerados por IA
Seamless Translation é um recurso bastante impressionante
Quando um usuário que fala inglês e espanhol gravou uma frase em inglês e ouviu a saída gerada em espanhol, ela soava quase igual ao seu próprio espanhol
No entanto, o espanhol do usuário inclui mais expressões típicas do castelhano
Fico curioso sobre o motivo de estar escrito Aidemos no título
Fico curioso sobre a direção da pesquisa em IA da Meta
Entendo os objetivos do Google e da MSFT, mas não sei bem qual é o objetivo final da Meta
A demo de Seamless Translation é excelente
A voz traduzida se parece com a voz original da própria pessoa
Se conseguirem implementar isso em tempo real, será algo impressionante
A Meta entende profundamente o impacto do GPT-3 e do ChatGPT
O modelo é o ponto de partida, e a UX construída sobre ele é o que demonstra inteligência
Isso se destaca especialmente nos modelos visuais
É interessante dizer que o SAM2 "consegue ver qualquer coisa"
É impressionante ver você clicar em uma bola de futebol e o modelo continuar rastreando-a suavemente no vídeo, mesmo quando ela fica encoberta
Nem todas as demos estão incluídas
Por exemplo, a demo do Meta Motivo está faltando (modelo de controle de humanoides)
Aparece a mensagem "Atualmente, o site não está disponível na sua região"
Fico me perguntando onde estão todos os links para os modelos
É interessante, mas eu gostaria que a Meta deixasse mais claro o que realmente quer
Provavelmente significa: "Por favor, forneça dados In the Wild para treinar ainda mais os modelos"
Tive uma experiência há alguns anos com tecnologia de estimativa de idade
O usuário fazia upload de uma imagem e, ao ajudar a alinhar 10% dos pontos de referência facial, o estimador era executado
Quando dava errado, ele pedia correções para melhorar
Ainda é legal, mas não causa grande impacto para mim em comparação com essa experiência anterior
1 comentários
Comentários do Hacker News
É uma explicação sobre uma caixa de ferramentas com várias demos
Seamless Translation é um recurso bastante impressionante
Fico curioso sobre o motivo de estar escrito Aidemos no título
Fico curioso sobre a direção da pesquisa em IA da Meta
A demo de Seamless Translation é excelente
A Meta entende profundamente o impacto do GPT-3 e do ChatGPT
Nem todas as demos estão incluídas
Aparece a mensagem "Atualmente, o site não está disponível na sua região"
Fico me perguntando onde estão todos os links para os modelos
É interessante, mas eu gostaria que a Meta deixasse mais claro o que realmente quer
Tive uma experiência há alguns anos com tecnologia de estimativa de idade