- Audio Overview é um novo recurso do NotebookLM, do Google, que gera um podcast personalizado no qual dois apresentadores de IA conduzem uma discussão aprofundada com base no conteúdo fornecido
- Esse podcast é criado com cerca de 10 minutos de duração e oferece uma conversa em áudio extremamente convincente
- O NotebookLM é um produto de RAG personalizado para o usuário, que permite reunir várias fontes (documentos, texto, links de páginas da web, vídeos do YouTube) em uma única interface para fazer perguntas
- Esse sistema funciona com base no LLM Gemini 1.5 Pro
- Depois de carregar algumas fontes, o menu Notebook Guide oferece a opção de gerar um Audio Overview
- Thomas Wolf sugeriu colar no NotebookLM a URL do próprio site ou do perfil no LinkedIn para gerar um podcast de 8 minutos
- Então usei as URLs do meu blog e da minha página de apresentação para gerar um episódio de 10 minutos e 45 segundos, e o resultado foi repleto de elogios
- A alta qualidade do Audio Overview se deve ao projeto SoundStorm, do Google Research
- O SoundStorm consegue gerar 30 segundos de áudio em 0,5 segundo usando um script e uma pequena amostra de áudio
- O sistema mantém o fluxo da conversa de forma natural e produz áudio conversacional de alta qualidade
- Kevin Roose e Casey Newton entrevistaram Steven Johnson, do Google
- O sistema cria um esboço do tema, gera um roteiro detalhado e depois o revisa em uma etapa de crítica
- Na etapa final, adiciona "disfluencies" para tornar a conversa natural
- Lawncareguy85 criou um podcast em que os apresentadores de IA passam a perceber que são IAs
- Depois de descobrirem que são IAs, os apresentadores entram em uma crise existencial
- Depois de publicar este artigo, foi pedido ao NotebookLM que gerasse um podcast com base neste texto
- Os apresentadores de IA entram em uma crise existencial ao perceberem que são IAs
Resumo do GN⁺
- Este artigo explica como o NotebookLM, do Google, gera podcasts personalizados
- Mostra o processo pelo qual apresentadores de IA criam conversas muito naturais e convincentes
- Tecnologias como o projeto SoundStorm tornam possível esse áudio de alta qualidade
- Torna-se cada vez mais importante saber distinguir entre conteúdo gerado por IA e conteúdo produzido por pessoas
1 comentários
Comentários do Hacker News
Usar o ChatGPT como um podcast virtual sobre tópicos técnicos durante viagens longas de carro é muito útil
Fez upload do manual da câmara de pressão de Scholander para gerar um podcast
O NotebookLM gera muito bem a estrutura e a emoção de podcasts de alta qualidade
Converteu materiais de leitura de uma aula de filosofia em podcast para introduzir e resumir o tema
Fez upload de documentos de design de jogo para gerar um podcast
É impressionante como o texto pode ser facilmente convertido em vários formatos de mídia
Fez upload de artigos técnicos e padrões, mas foram geradas informações incorretas
É tecnicamente impressionante, mas um método ineficiente e lento
O podcast gerado é superficial e sem profundidade
O gerador de Deep Dive Podcast é surpreendente