14 pontos por GN⁺ 2024-10-01 | 1 comentários | Compartilhar no WhatsApp
  • Audio Overview é um novo recurso do NotebookLM, do Google, que gera um podcast personalizado no qual dois apresentadores de IA conduzem uma discussão aprofundada com base no conteúdo fornecido
  • Esse podcast é criado com cerca de 10 minutos de duração e oferece uma conversa em áudio extremamente convincente
  • O NotebookLM é um produto de RAG personalizado para o usuário, que permite reunir várias fontes (documentos, texto, links de páginas da web, vídeos do YouTube) em uma única interface para fazer perguntas
    • Esse sistema funciona com base no LLM Gemini 1.5 Pro
    • Depois de carregar algumas fontes, o menu Notebook Guide oferece a opção de gerar um Audio Overview
  • Thomas Wolf sugeriu colar no NotebookLM a URL do próprio site ou do perfil no LinkedIn para gerar um podcast de 8 minutos
    • Então usei as URLs do meu blog e da minha página de apresentação para gerar um episódio de 10 minutos e 45 segundos, e o resultado foi repleto de elogios
  • A alta qualidade do Audio Overview se deve ao projeto SoundStorm, do Google Research
    • O SoundStorm consegue gerar 30 segundos de áudio em 0,5 segundo usando um script e uma pequena amostra de áudio
    • O sistema mantém o fluxo da conversa de forma natural e produz áudio conversacional de alta qualidade
  • Kevin Roose e Casey Newton entrevistaram Steven Johnson, do Google
    • O sistema cria um esboço do tema, gera um roteiro detalhado e depois o revisa em uma etapa de crítica
    • Na etapa final, adiciona "disfluencies" para tornar a conversa natural
  • Lawncareguy85 criou um podcast em que os apresentadores de IA passam a perceber que são IAs
    • Depois de descobrirem que são IAs, os apresentadores entram em uma crise existencial
  • Depois de publicar este artigo, foi pedido ao NotebookLM que gerasse um podcast com base neste texto
    • Os apresentadores de IA entram em uma crise existencial ao perceberem que são IAs

Resumo do GN⁺

  • Este artigo explica como o NotebookLM, do Google, gera podcasts personalizados
  • Mostra o processo pelo qual apresentadores de IA criam conversas muito naturais e convincentes
  • Tecnologias como o projeto SoundStorm tornam possível esse áudio de alta qualidade
  • Torna-se cada vez mais importante saber distinguir entre conteúdo gerado por IA e conteúdo produzido por pessoas

1 comentários

 
GN⁺ 2024-10-01
Comentários do Hacker News
  • Usar o ChatGPT como um podcast virtual sobre tópicos técnicos durante viagens longas de carro é muito útil

    • Espera poder ajustar o "nível de habilidade" dos apresentadores
    • Apenas o podcast Signals and Threads oferece um nível de profundidade interessante
  • Fez upload do manual da câmara de pressão de Scholander para gerar um podcast

    • As informações são precisas e incluem piadas leves e temas importantes
    • É surpreendente que seja gerado em poucos minutos sem intervenção humana
  • O NotebookLM gera muito bem a estrutura e a emoção de podcasts de alta qualidade

    • Isso é semelhante ao modo como a IA atualmente imita arte, música e vídeo
    • Muitas pessoas não se importam com qualidade
    • Muitos livros publicados hoje têm outros objetivos além de transmitir ideias
    • A qualidade da escrita, dos podcasts e da música já é secundária, então é fácil serem afetados pela IA
  • Converteu materiais de leitura de uma aula de filosofia em podcast para introduzir e resumir o tema

    • Ajuda quando ler um PDF de 30 páginas parece pesado
    • Oferece um formato de áudio mais acessível durante exercícios ou no trajeto
    • Fez upload no Spotify e compartilhou com os colegas de classe
  • Fez upload de documentos de design de jogo para gerar um podcast

    • Os apresentadores tratam as ideias como informações muito perspicazes
    • Ao fazer upload de vários documentos, percebe-se um tom de surpresa exagerada
  • É impressionante como o texto pode ser facilmente convertido em vários formatos de mídia

    • Já ouviu artigos da Wikipedia usando a ferramenta de conversão de texto em fala da Apple, mas não era interessante
    • Podcasts de verdade funcionam por causa da personalidade dos apresentadores e convidados
    • Espera que a próxima versão do Notebook permita personalizar mais as vozes, o tom e o nível educacional dos locutores
  • Fez upload de artigos técnicos e padrões, mas foram geradas informações incorretas

    • Isso pode ser corrigido com revisão interna ou anotações manuais
    • Pode ajudar pesquisadores a encontrar novas formas de expressão
    • Oferece novos pontos de conversa sobre temas estudados por mais de 10 anos
  • É tecnicamente impressionante, mas um método ineficiente e lento

    • Não há opiniões interessantes nem algo a ser contestado
    • Não há conhecimento especializado para aprender
    • Não tem valor
  • O podcast gerado é superficial e sem profundidade

    • Gera um podcast mediano, mas sem profundidade real
  • O gerador de Deep Dive Podcast é surpreendente

    • Gerou um podcast de 40 minutos a partir de um PDF de 38 páginas, mas havia muita repetição no meio
    • Pode ter acontecido porque o documento tinha um "índice", então talvez tenha passado por ele duas vezes