- Sora é um modelo de IA que cria cenas realistas e imaginativas a partir de instruções em texto
- É capaz de gerar vídeos de até 1 minuto, mantendo a qualidade visual e seguindo fielmente o prompt do usuário
- São apresentados exemplos de vídeos gerados a partir de vários prompts com cenários detalhados
- Todos os vídeos desta página foram produzidos diretamente pelo Sora e não foram editados de forma alguma
- No momento, o Sora está sendo disponibilizado a equipes de red team para avaliação de riscos e está recebendo feedback de artistas visuais, designers e cineastas
- A OpenAI quer compartilhar o andamento da pesquisa para receber feedback externo e mostrar ao público o futuro das capacidades da IA
Capacidades do Sora
- Pode gerar cenas complexas com vários personagens, movimentos específicos e detalhes precisos do tema e do plano de fundo
- Entende não apenas o prompt do usuário, mas também como as coisas existem no mundo físico
Segurança do Sora
- A OpenAI pretende adotar várias medidas de segurança antes de integrar o Sora aos produtos da empresa
- Isso inclui o desenvolvimento de ferramentas para detectar conteúdo enganoso e de classificadores capazes de identificar se um vídeo foi gerado pelo Sora
Tecnologia de pesquisa
- O Sora é um modelo de difusão que gera vídeos começando com um vídeo cheio de ruído e removendo esse ruído gradualmente
- Usa uma arquitetura Transformer semelhante à dos modelos GPT, oferecendo excelente escalabilidade
Opinião do GN⁺
- O Sora é uma tecnologia inovadora de IA que gera vídeos a partir de instruções em texto e oferece novas possibilidades para profissionais criativos
- Por meio de medidas de segurança e feedback, ele aprende sobre o uso no mundo real e desempenha um papel importante para tornar sistemas de IA gradualmente mais seguros
- Essa tecnologia parece ser um marco importante rumo à conquista da AGI (inteligência artificial geral) no futuro
6 comentários
Só dá para ficar realmente impressionado.
Vai levantar 7 trilhões...?
Se olhar por cima, fica difícil saber se é um vídeo real ou um vídeo feito por IA.
Uau... quero testar logo.
Esse tal de modelo de difusão seria algo no mesmo estilo do Stable Diffusion, certo?
Parece que o mercado de
stock photoestock videovai ficar complicado...A qualidade da geração é impressionante. Está evoluindo tão rápido assim?
Opiniões no Hacker News