Entrevista com Sam Altman, CEO da OpenAI, sobre Sora, energia e a construção de um império de IA
(a16z.substack.com)- No podcast da a16z, a visão da OpenAI foi descrita como a integração entre um serviço de assinatura de IA pessoal, infraestrutura em larga escala e pesquisa em AGI, enfatizando que esses três elementos formam uma única stack conectada verticalmente
- O objetivo da OpenAI é um serviço de assinatura de IA pessoal, integrando verticalmente pesquisa, infraestrutura e produtos para consumidores para perseguir ao mesmo tempo o desenvolvimento de AGI e o uso prático
- A intenção estratégica do lançamento do Sora vai além de lançar um simples produto gerador de vídeos: preparar a sociedade para a chegada de modelos de vídeo poderosos e avançar a pesquisa em AGI por meio do desenvolvimento de world models
- Com o GPT-5, a era do cientista de IA está chegando, e já surgem casos iniciais em que os modelos realmente realizam descobertas científicas, com a expectativa de descobertas científicas importantes nos próximos 2 anos
- Foi apresentada uma visão otimista sobre a convergência entre energia e IA, a possível aplicação do princípio de fair use ao copyright e a ideia de que a AGI chegará de forma mais gradual do que se imagina, dando tempo para a sociedade se adaptar; ele avalia que a era em que a IA acelera o progresso científico já começou
Visão e estrutura da OpenAI
- A OpenAI é composta por três pilares: serviço de assinatura de IA para consumidores, infraestrutura em larga escala e laboratório de pesquisa
- O objetivo é oferecer, por meio de uma IA personalizada, um serviço por assinatura que entenda o contexto do usuário e funcione como um verdadeiro assistente pessoal
- A expectativa é que a maioria das pessoas tenha uma assinatura pessoal de IA, e algumas usem várias
- Os usuários entrarão em diferentes serviços e usarão a IA por meio de dispositivos dedicados
- A meta é que a IA conheça o usuário e se torne extremamente útil
- A infraestrutura é um elemento essencial para sustentar o desenvolvimento de AGI e a oferta de serviços
- No momento, não há planos de vender infraestrutura bruta para outras empresas
- Mas a possibilidade permanece em aberto, já que a escala é tão grande que talvez seja preciso considerar outros usos
- A empresa está construindo o maior datacenter da história da humanidade, ou mais precisamente, o maior projeto de infraestrutura
- No início havia ceticismo em relação à integração vertical, mas agora a posição mudou para: “sem integração vertical, não dá para realizar a AGI”
- Houve uma transição da perspectiva de investidor para a de operador
- A teoria de que a economia é eficiente e de que empresas podem ser excelentes em apenas uma coisa não se aplica ao caso da OpenAI
- A história da OpenAI evoluiu para a direção de que, para cumprir sua missão, ela precisa fazer mais coisas do que imaginava
- O iPhone é avaliado como o produto mais impressionante já criado pela indústria de tecnologia, sendo citado como exemplo de integração vertical extrema
- É necessária uma estrutura de stack vertical em que a pesquisa permita criar ótimos produtos e a infraestrutura torne a pesquisa possível
A intenção estratégica do lançamento do Sora
- À primeira vista, o Sora pode parecer sem relação com AGI, mas espera-se que a construção de world models seja importante para a AGI
- Assim como o ChatGPT preparou a sociedade para a AGI, o Sora ajuda a sociedade a se adaptar ao impacto realista de vídeos gerados por IA
- Como o vídeo tem uma ressonância emocional muito maior do que o texto, é importante que a sociedade compreenda isso
- Em breve surgirão modelos de vídeo impressionantes, capazes de mostrar deepfakes ou qualquer coisa que se queira
- A IA não deve ser apenas eficiente; também precisa oferecer diversão e prazer
- Embora não receba grande parte do total dos recursos computacionais, em termos absolutos o investimento de recursos ainda é significativo
- O novo Sora está evoluindo em uma direção interessante ao adicionar recursos de social networking
- Ao dizer que “sociedade e tecnologia precisam evoluir juntas”, ele enfatiza a importância de experimentar e se adaptar antes da chegada da IA
O surgimento do cientista de IA
- Com o GPT-5, já aparecem casos iniciais em que a IA realiza descobertas científicas
- Novas descobertas matemáticas e pequenas contribuições em pesquisas de física e biologia
- A expectativa é que, nos próximos 2 anos, os modelos façam ciência em escala maior e realizem descobertas importantes
- Sam Altman considera que algo semelhante ao teste de Turing é a capacidade da IA de fazer ciência
- Isso trará uma mudança real ao mundo
- O progresso científico é o fator mais importante para tornar o mundo melhor no longo prazo
- O teste de Turing já foi superado, mas o mundo não mudou de forma absurdamente radical
- A AGI deve chegar de forma semelhante, mas a singularidade não acontecerá de fato, e a mudança será mais gradual do que o esperado
- Mesmo que a pesquisa avance freneticamente, ele acredita que a sociedade aprenderá mais rápido do que se imagina
- As pessoas e a sociedade são muito mais adaptáveis do que se pensa
- Elas passam pela atualização mental de que a AGI virá, aceitam isso e encontram paz
- Será um processo muito mais contínuo do que o esperado
A evolução da interface IA-humano
- Os modelos já alcançaram um nível muito alto no aspecto básico de conversa estilo chatbot
- Mas ainda não conseguem atender pedidos como “cure o câncer”
- O estilo de interface em texto ainda pode evoluir muito
- Isso se expandirá para um mundo em que vídeo renderizado em tempo real se torna a interface
- Um dispositivo ambiente (ambient device) que percebe o entorno e mostra informações apenas quando necessário
- Em vez de enviar notificações de texto indiscriminadamente, entende o contexto e fornece informação no momento apropriado
- No longo prazo, isso evoluirá para uma interface em que a IA entende o usuário e decide primeiro o estilo de conversa personalizado
- A importância da personalização do usuário
- É estranho que bilhões de pessoas conversem com o mesmo cérebro
- A forma como cada usuário quer que a IA se comporte varia muito
- O ChatGPT deve evoluir na direção de entrevistar o usuário, entender preferências e se ajustar automaticamente
Infraestrutura, parcerias e energia
- A OpenAI está expandindo infraestrutura em larga escala em parceria com AMD, NVIDIA e Oracle
- Como a razão de existir da OpenAI é construir AGI, a pesquisa tem prioridade, então as GPUs são alocadas primeiro para pesquisa, antes dos produtos
- Só há exceções em casos especiais, como quando uma nova funcionalidade viraliza
- O objetivo de construir grande capacidade é justamente evitar ter que tomar essas decisões dolorosas
- Uma boa cultura de pesquisa é parecida com operar uma empresa de investimento em estágio inicial
- Apostar em fundadores e apoiá-los
- Uma abordagem diferente da de tocar uma empresa de produto
- Sobre energia, ele enfatiza que “energia abundante e barata é a chave para elevar a qualidade de vida da humanidade”
- No curto prazo, a tendência é gás natural; no longo prazo, solar + armazenamento e energia nuclear avançada (SMR e fusão) devem dominar
- Ele explica que aliviar a regulação nuclear é essencial e que, se os preços caírem drasticamente, a transição será muito rápida
Avaliação das capacidades dos modelos
- Pontuações de benchmarks estáticos estão perdendo o interesse e sendo fortemente manipuladas
- Descobertas científicas podem se tornar uma métrica de avaliação útil no longo prazo
- Receita também é considerada uma métrica de avaliação interessante
Visão sobre segurança de IA e regulação
- O fato de a tecnologia ainda não ter criado riscos realmente assustadores e gigantescos não significa que isso continuará assim no futuro
- Ele espera alguns momentos realmente estranhos ou assustadores
- Assim como em tecnologias anteriores, algumas coisas realmente ruins vão acontecer
- “A tecnologia de IA inevitavelmente passará por momentos perigosos”, e ele reconhece a necessidade de construir salvaguardas sociais
- Como a maior parte da regulação provavelmente terá muitos pontos negativos, ele propõe regulação limitada apenas para modelos de altíssimo desempenho
- Quando um modelo realmente tiver capacidades extremamente sobre-humanas, esse modelo — e apenas esse tipo de modelo — mereceria testes de segurança muito cuidadosos
- Ele espera que o peso regulatório não recaia sobre todas as coisas excelentes que modelos menos capazes podem fazer
- Uma repressão total no estilo europeu seria muito ruim
- Como a China não terá esse tipo de restrição, seria muito perigoso para o mundo se os EUA ficassem para trás em IA
- Regulação excessiva pode, ao contrário, aumentar o risco global
Copyright, open source e o futuro do conteúdo
- Em relação aos dados de treinamento, ele prevê que “treinamento será considerado fair use”
- Mas a geração de conteúdo baseada em personagens, estilo e IP exigirá novos modelos comerciais
- É semelhante ao fato de um escritor humano poder ler um romance e se inspirar, mas não poder copiá-lo
- Alguns detentores de direitos já reclamam que “meu personagem não aparece o suficiente”, mostrando que a estrutura de colaboração em conteúdo está sendo reorganizada
- O modelo open source gpt-oss é avaliado de forma positiva, e também se menciona a necessidade de conter a disseminação monopolista de modelos chineses
A convergência entre energia e IA
- Seus dois grandes interesses, IA e energia, estão convergindo para a mesma coisa
- Olhando para a história, o fator que mais impactou a melhoria da qualidade de vida foi energia mais barata e abundante
- Faz sentido pressionar muito mais o avanço da energia
- No curto prazo, espera-se que o gás natural responda pela maior parte da nova capacidade líquida de carga base nos EUA
- No longo prazo, solar + armazenamento e energia nuclear serão as fontes dominantes
- Incluindo energia nuclear avançada (SMR, fusão etc.)
- Se a energia nuclear se tornar economicamente muito mais barata do que todas as alternativas, o avanço será rápido
- Historicamente, quando surge uma fonte de energia muito mais barata, o mundo migra muito depressa
- A energia nuclear deveria ser a forma de energia mais barata da Terra — ou de qualquer lugar
Monetização e confiança do usuário
- O custo de geração de vídeo do Sora é alto, então são necessários novos modelos de monetização
- Há padrões de uso inesperados, como pessoas gerando memes divertidos com amigos em chats em grupo
- É preciso outro modelo de monetização para usuários que usam o produto centenas de vezes por dia
- Como o custo de GPU é alto, será necessário um modelo pay-per-generation
- Mudança nas premissas tradicionais sobre criação de conteúdo
- O modelo tradicional era: 1% cria conteúdo, 10% comenta, 100% consome
- Muito mais gente quer criar conteúdo; só era difícil antes
- Há abertura para publicidade, mas manter a confiança é essencial
- “Só é possível dentro do limite em que não prejudique a confiança do usuário”
- Anúncios no Instagram são citados como bom exemplo de valor líquido agregado (descobrir produtos que antes a pessoa não conhecia)
- A relação de alta confiança entre o ChatGPT e o usuário não pode ser quebrada
- Se, à pergunta “qual cafeteira devo comprar?”, a IA recomendar um produto não por ser o melhor, mas por ter sido pago para isso, a confiança se perde
Recordações do início da OpenAI
- A OpenAI do começo era mais centrada em pesquisa do que em negócios, mas, como CEO, ele diz que a maior mudança foi “aprender a complexidade psicológica da operação e da organização”
- Os primeiros anos foram o período profissional mais divertido, tocando um laboratório com as pessoas mais inteligentes e realizando um trabalho histórico
- Após o lançamento do ChatGPT, sua vida virou completamente de cabeça para baixo. Já se passaram quase 3 anos e, com o tempo, tudo parece um pouco mais insano, mas ele foi se acostumando
- A transição de investidor para CEO
- Ele não tinha uma aptidão natural para comandar uma empresa
- Saiu da mentalidade de aconselhar empresas como investidor para entender que precisava realmente operá-las
- Com o tempo, aprendeu muito sobre o que é necessário para tocar a operação
Conselhos para o futuro
“As grandes empresas da próxima geração não vão imitar a OpenAI; elas vão surgir sobre a base tecnológica criada pela OpenAI.”
“A maioria das tentativas de prever as indústrias do futuro está errada; a única resposta certa é construir, experimentar e aprender diretamente.”
- Aprender profunda humildade: as previsões estão sempre erradas
- Tentar ser o quarterback de poltrona faz a pessoa soar inteligente, mas quase sempre diz o mesmo que todo mundo
- É realmente difícil chegar à convicção correta
- A única forma de saber é estar profundamente na fronteira da exploração de ideias
- Conversar com muita gente, construir coisas, brincar com tecnologia e estar no mundo real
- A disposição dos investidores para apoiar esse tipo de coisa é decepcionantemente baixa
- A maioria das empresas apenas corre atrás das tendências do momento
- Ele espera que as pessoas tentem coisas novas
Visão para o mundo após a AGI
- Altman define a IA como a força motriz central do progresso contínuo na ciência, energia e economia
- A IA ficará fascinada em pesquisar e observar todo o resto: espera-se que se interesse por todo o algoritmo humano
- Se a OpenAI cumprir sua missão, AGI em larga escala e a custo quase zero será possível
- Embora previsões específicas sejam difíceis, isso deve ser descoberto brincando com a tecnologia, conversando com pessoas e estando no mundo
- A AGI não se infiltrará na sociedade como uma mudança explosiva, mas como um processo contínuo de evolução, e a humanidade está entrando com a IA em uma era de aprendizado conjunto contínuo
Ainda não há comentários.