1 pontos por GN⁺ 2025-02-10 | 1 comentários | Compartilhar no WhatsApp

1 comentários

 
GN⁺ 2025-02-10
Comentários do Hacker News
  • É uma explicação sobre uma caixa de ferramentas com várias demos

    • Segment Anything 2: gera recortes de vídeo e efeitos visuais divertidos com apenas alguns cliques
    • Seamless Translation: permite ouvir sua própria voz soando em outro idioma
    • Animated Drawings: transforma esboços feitos à mão em animações cheias de vida
    • Audiobox: cria histórias em áudio usando vozes e sons gerados por IA
  • Seamless Translation é um recurso bastante impressionante

    • Quando um usuário que fala inglês e espanhol gravou uma frase em inglês e ouviu a saída gerada em espanhol, ela soava quase igual ao seu próprio espanhol
    • No entanto, o espanhol do usuário inclui mais expressões típicas do castelhano
  • Fico curioso sobre o motivo de estar escrito Aidemos no título

  • Fico curioso sobre a direção da pesquisa em IA da Meta

    • Entendo os objetivos do Google e da MSFT, mas não sei bem qual é o objetivo final da Meta
  • A demo de Seamless Translation é excelente

    • A voz traduzida se parece com a voz original da própria pessoa
    • Se conseguirem implementar isso em tempo real, será algo impressionante
  • A Meta entende profundamente o impacto do GPT-3 e do ChatGPT

    • O modelo é o ponto de partida, e a UX construída sobre ele é o que demonstra inteligência
    • Isso se destaca especialmente nos modelos visuais
    • É interessante dizer que o SAM2 "consegue ver qualquer coisa"
    • É impressionante ver você clicar em uma bola de futebol e o modelo continuar rastreando-a suavemente no vídeo, mesmo quando ela fica encoberta
  • Nem todas as demos estão incluídas

    • Por exemplo, a demo do Meta Motivo está faltando (modelo de controle de humanoides)
  • Aparece a mensagem "Atualmente, o site não está disponível na sua região"

  • Fico me perguntando onde estão todos os links para os modelos

  • É interessante, mas eu gostaria que a Meta deixasse mais claro o que realmente quer

    • Provavelmente significa: "Por favor, forneça dados In the Wild para treinar ainda mais os modelos"
  • Tive uma experiência há alguns anos com tecnologia de estimativa de idade

    • O usuário fazia upload de uma imagem e, ao ajudar a alinhar 10% dos pontos de referência facial, o estimador era executado
    • Quando dava errado, ele pedia correções para melhorar
    • Ainda é legal, mas não causa grande impacto para mim em comparação com essa experiência anterior