19 pontos por GN⁺ 2025-10-02 | 2 comentários | Compartilhar no WhatsApp
  • Em setembro de 2025, com o surgimento de modelos de IA poderosos como Claude Opus 4.1, GPT-5 e Nano Banana, chegou uma era de ouro do desenvolvimento de software
  • Tendo o cenário atual de IA como pano de fundo, são propostas 28 ferramentas de IA inovadoras que ainda não existem, mas que seria ótimo se existissem
  • As ideias propostas abrangem várias áreas, como produtividade pessoal, desenvolvimento de código, saúde e criação de conteúdo
  • As características enfatizadas em comum são consciência de contexto, personalização para o usuário e recursos de melhoria por meio de aprendizado automatizado e ciclos de feedback
  • Em vez dos agentes genéricos de hoje, é proposto o conceito de agentes de IA especializados de propósito único e de um marketplace onde eles possam ser trocados

As 28 ferramentas de IA propostas

1. App de câmera baseado em Nano Banana

  • Um app que transforma fotos comuns de iPhone para que pareçam ter sido tiradas com uma Leica

2. Agente para adicionar automaticamente modo claro/escuro

  • Adiciona automaticamente suporte a modo claro, modo escuro e temas customizados a qualquer projeto de frontend
  • Usa visão para verificar mudanças na UI e faz correções iterativas com base na UI renderizada

3. Agente de descompilação e depuração de código ofuscado

  • Descompila e depura código minificado em uma base de código legível
  • Requer um forte loop código-depuração

4. Híbrido entre o app Strong e o ChatGPT

  • O modelo acessa dados de treino para sugerir melhorias e fazer coaching
  • É possível conversar com um modelo que conhece o contexto detalhado, incluindo até o tempo entre cada série

5. Motor de recomendação

  • Analisa o histórico de navegação para identificar quais posts de blog ou artigos você leu por mais tempo
  • Toda noite, pesquisa a web para encontrar conteúdo que você deveria ler e entrega um digest de links pela manhã
  • Melhora o digest do dia seguinte com feedback sobre recomendações boas/ruins

6. App de chat para rastreamento de calorias

  • Um app de chat baseado em um banco de dados nutricional
  • Minimiza o esforço cognitivo necessário para registrar refeições

7. App minimalista para escrever conteúdo de formato longo

  • O modelo destaca trechos e deixa comentários nas margens
  • Permite configurar diferentes "personas" para revisar o que foi escrito

8. Agente construtor de agentes especialistas em IA

  • Ao receber uma descrição de tarefa como "crie um agente para descompilar código", gera automaticamente um agente ultraespecializado

9. Leitor de ebooks minimalista

  • Enquanto você lê um ebook, ao destacar um trecho o modelo explica mais a fundo ao lado
  • Assume a persona do autor
  • Deve parecer uma extensão do livro, e não uma instância separada de chat

10. Agente de Deep Research que raciocina por vários dias

  • Permite fornecer consultas extremamente complexas
  • Cria centenas de subagentes e retorna uma resposta após 3 dias de raciocínio

11. App de produção de filmes no estilo paint by numbers

  • Faz brainstorming de ideias para curtas-metragens e o modelo gera um storyboard detalhado
  • O usuário só precisa filmar com o smartphone cada cena do storyboard
  • Funciona como rodinhas de apoio para fazer filmes

12. App de gravação de tela e resumo semântico

  • Usa um modelo local para gerar um resumo semântico detalhado do que você fez no computador todos os dias
  • Fornece isso como contexto em um app de chat: "Para quem eu esqueci de responder ontem?"
  • Usei o Rewind por um ano, mas não foi tão útil quanto eu esperava

13. Filtro semântico para Twitter/X/YouTube

  • Permite escrever filtros abertos como "ocultar tweets que provavelmente vão me irritar"
  • Remove conteúdo que provoca raiva do feed
  • Ao moldar o feed, moldamos a nós mesmos

14. Agente de geração de currículo sob medida para temas de nicho

  • Pedidos como "quero aprender tudo o que sabemos sobre a ciência do progresso"
  • Busca pessoas, blogs, vídeos do YouTube, ensaios e livros didáticos na web
  • Lê todo o conteúdo e fornece um currículo que guia do iniciante ao especialista

15. Um mecanismo de recomendação de livros realmente bom

  • Primeiro faz um questionário sobre o que você já leu, seus objetivos e o tipo de leitura de que gosta
  • Depois de reunir muitas informações, outros agentes simulam como o usuário reagiria às sugestões do agente principal
  • Só traz à tona livros com altíssima chance de agradar

16. Motor de busca semântica para TikTok e Instagram Reels

  • acesso a informações úteis presas em vídeos curtos
  • Precisa de uma busca consultável

17. App fitness do sono

  • Integra dados do Apple Watch (frequência cardíaca, VO₂), Eight Sleep, Oura Ring e apps de treino
  • Fornece recomendações práticas para melhorar sono e recuperação
  • Envia mensagens de forma proativa: "Seu HRV caiu nesta semana; será que você está treinando demais?"

18. Biblioteca massiva de componentes

  • Projetada para ser renderizada dentro de uma interface de chat
  • As bibliotecas existentes têm primitives muito low-level
  • Prioriza widgets de alto nível em vez de customização

19. Assistente de voz minimalista para Apple Watch

  • Para perguntas complexas demais para a Siri, mas adequadas para o ChatGPT
  • Fornece respostas curtas de poucas palavras

20. App de escrita que sugere listas de leitura

  • Pesquisa na web sobre o tema em que você está escrevendo e monta uma lista de materiais que podem ajudar
  • O app de escrita não deve escrever no lugar do usuário

21. App de corrida

  • Gera planos personalizados e acompanha ritmo de corrida e frequência cardíaca
  • Ajusta iterativamente o programa de treino com base em dados reais

22. Superapp de edição de fotos com Nano Banana

  • Oferece centenas de templates sem exigir escrita de prompts
  • Tentar vários penteados, prever a aparência de filhos com o parceiro, fazer você parecer o The Rock etc.

23. Busca de vídeos do YouTube no estilo Same.energy

  • Ao inserir uma URL, encontra vídeos com uma vibração parecida
  • Hoje, o algoritmo do YouTube só se concentra em maximizar o engajamento do usuário médio

24. Dispositivo no estilo Sony Walkman para crianças

  • Um dispositivo voice-first em que é possível fazer perguntas a um LLM
  • Focado em explicações, com zero tela
  • Melhor ainda se for offline-first

25. Motor de busca de biografias

  • Uma consulta baseada em questionário sobre o problema atual, fase da vida, área de atuação etc.
  • Retorna capítulos de biografias/autobiografias de grandes figuras históricas que trataram de situações semelhantes

26. Agente de auditoria do consumo de conteúdo via gravação de tela

  • Observa o uso do computador e do smartphone
  • Audita diariamente o conteúdo consumido
  • O Screen Time não é específico o suficiente
  • É preciso entender o valor nutricional exato dos tokens que consumimos

27. Marketplace de agentes de IA para tarefas de nicho

  • Agentes projetados para casos de uso específicos seriam melhores do que agentes de propósito geral
  • Um catálogo de agentes ultraespecializados para tarefas de nicho, como encontrar apartamento para alugar em San Francisco
  • São necessários dezenas de milhares de agentes utilizáveis via web ou API

28. Recurso para pedir a crítica de escritores famosos

  • "O que Hemingway diria sobre este post de blog?"
  • Descobrir quais partes o deixaram confuso e de quais partes ele gostou

2 comentários

 
shakespeares 2025-10-07

Os itens 2 e 3 seriam realmente ótimos se simplesmente funcionassem de forma automática.
Parece ser uma daquelas tarefas repetitivas chatas em que é cansativo ficar adicionando tudo manualmente o tempo todo.

 
GN⁺ 2025-10-02
Comentários do Hacker News
  • Acho que precisamos ser realmente cautelosos com o item “24. dar às crianças um dispositivo no estilo Sony Walkman para que possam fazer perguntas a um LLM”

    • A menos que seja AGI, as respostas que a criança ouvir serão, em sua maioria, muito precisas, mas um número muito pequeno de respostas erradas ou mal-entendidos sutis pode ter um impacto devastador na jornada de aprendizado dela
    • Mesmo que fosse um LLM perfeito e nunca cometesse erros, no fim isso reduziria a necessidade de se comunicar com outras pessoas, diminuindo as oportunidades de desenvolver a capacidade de cooperação
    • Do ponto de vista dos pais, dá para entender a vontade de ter um pequeno descanso, mas se a criança descobrir um dispositivo que sempre responde na hora, aquele tempo precioso de vínculo, passado buscando respostas juntos, vai desaparecer. A criança pode acabar se afastando cada vez mais dos pais. É preciso pensar em quais valores serão transmitidos à criança
    • Os pais que colocam esse tipo de sistema na vida dos filhos partem da premissa de que sua visão de mundo e seus valores estão bem refletidos nele. Os pais no HN podem ter uma visão mais centrada na ciência, mas em outros países/regiões esse dispositivo pode virar uma ferramenta de propaganda política, religiosa ou cultural. Há um grande risco de esse tipo de ferramenta ser usado como arma de doutrinação
    • Acho que dá para obter resultados muito melhores do que perguntando a um professor da escola

    • Dois dias atrás pedi ao ChatGPT que explicasse o sistema de valor posicional (place-value system) de um jeito que uma criança de seis anos entendesse. Mas ele confundiu os conceitos de valor posicional e valor numérico e deu uma explicação errada. Eu percebi o erro e o ChatGPT pediu desculpas, mas se a criança tivesse perguntado sozinha, não teria notado esse erro.
      Fico pensando em quanta informação errada meu filho poderia passar a acreditar como verdadeira vindo de um dispositivo desses

  • Sobre o item 19, fiz algo parecido eu mesmo com o iOS Shortcut algumas semanas atrás

    É um assistente de voz minimalista para Apple Watch. A Siri não lida bem com perguntas complexas, mas o ChatGPT sim. Recebo as respostas em frases curtas e concisas, com até 150 caracteres
    Uso a ação Dictate Text para capturar a fala, envio para a API da OpenAI e uso um prompt de sistema como este
    “CRITICAL: como a resposta só será exibida em uma notificação push do iOS ou na tela do relógio, responda de forma concisa em menos de 150 caracteres. Sem Markdown, use apenas texto simples. Use vocabulário e pontuação minimamente elegantes.
    O usuário não pode fazer perguntas de acompanhamento. Responda em uma única frase por vez e, se necessário, faça suposições sobre a pergunta; se a suposição estiver errada, o usuário terá que perguntar de novo.”
    Funciona muito bem. O maior problema é que leva de 5 a 20 segundos para receber a resposta. Mas enviar a pergunta é quase instantâneo (sem precisar abrir um app), então é algo de que gosto bastante

  • O que sinto ao ver muitas ideias/artigos é que as pessoas não estão “pensando com portais” (thinking with portals) em relação aos LLMs. Temos uma tecnologia em nível de “portal gun” (é assim que ela é divulgada), mas parece que estamos usando isso apenas como uma porta melhor

    • No fim, o que um LLM faz é expandir texto de forma logicamente encadeada. As possibilidades de aplicação são amplas, mas na prática é difícil ir muito além de um editor de texto avançado. Por exemplo, se você quiser usar isso para edição de vídeo, precisa criar uma linguagem de script e também sincronizar funcionalidades com o editor. Para uma grande empresa como a Adobe, o valor disso em relação ao esforço talvez não seja claro; para uma startup, seria preciso competir com a Adobe em recursos e lock-in de usuários acumulados ao longo do tempo. Em ambos os casos, não há tanta vantagem a menos que o LLM seja realmente revolucionário. Além disso, o LLM não consegue ver diretamente o resultado em vídeo e, no estágio atual, é algo apenas “mais ou menos” bom

    • Concordo com essa perspectiva. Se você tiver algum material de referência sobre “thinking with portals”, gostaria que compartilhasse

    • Se houver algum exemplo de pensamento no estilo portal, seria ótimo se você pudesse compartilhar algo simples e fácil de entender

  • Sobre o item 22, eu gostaria que existisse um mecanismo que analisasse meu histórico de navegação, entendesse os tipos de blogs/artigos que eu leio por mais tempo e encontrasse toda noite conteúdos recomendados que eu ainda não vi
    O ChatGPT Pulse existe de maneira semelhante. Em vez do histórico do navegador, esse serviço usa o histórico do ChatGPT, mas para quem usa bastante o ChatGPT talvez seja uma recomendação ainda mais confiável
    https://openai.com/index/introducing-chatgpt-pulse/

    • Dá para dizer que praticamente todos os feeds algorítmicos de redes sociais já fazem esse papel
  • Acho que a maioria das ideias propostas neste texto é mais parecida com um pedido para fazer uma UI/UX um pouco melhor em cima do LLM base

  • Sinto que há um erro categorial (category mistake) fundamental nesse tipo de raciocínio
    Um exemplo é a função “como Hemingway avaliaria meu texto?”. Na prática, a resposta é só algo gerado por aquela IA, não uma avaliação real do Hemingway
    Se você perguntar a 100 modelos, terá 100 respostas diferentes, e o modo de pensar ou a personalidade reais de Hemingway não podem ser totalmente reconstruídos a partir de algumas centenas de milhares de palavras de sua obra.
    No fim, a questão é “isso realmente pode soar de forma plausível como algo que aquela pessoa diria?”
    O motivo de querermos ouvir a avaliação de pessoas famosas é a perspectiva de uma pessoa viva e real. A imitação da IA é como tentar comer uma foto de sanduíche em vez de um sanduíche de verdade
    Dá uma certa inquietação ver que tanta gente não consegue traçar uma linha mais clara em relação a essa ilusão

    • Concordo 100%
      Mas, ao ler este comentário, pensei no holodeck de Star Trek TNG. Lá eles recriam figuras famosas como Einstein e Freud, e do ponto de vista do espectador, mesmo quando eu tinha 15 anos, eu não pensava “isso é só uma resposta aleatória cuspida por um computador”
      Em um episódio, eles erram ao recriar uma pessoa real só a partir de registros (https://www.imdb.com/title/tt0708682/), e depois fica evidente o quanto aquilo era diferente (https://www.imdb.com/title/tt0708720/)
      Resumindo,

      1. Sempre achei que esses episódios estavam muito à frente do seu tempo
      2. Nunca senti nenhum incômodo com essas recriações falsas de figuras históricas, então eu mesmo fico curioso sobre por que isso me parece mais sensível no contexto dos LLMs. Será que é porque todos sabem desde o início que é 100% falso, ou existe outro motivo...?
        Esse texto me fez pensar em várias coisas
    • Dá para explicar de forma simples por que não precisamos de um AI Hemingway. Na prática, já havia bons guias de escrita como o hemingwayapp há uns 10 anos https://hemingwayapp.com/
      Ele corrige a gramática com regras simples e incentiva a trocar por expressões mais diretas. Pode até ser melhor para aprender por conta própria justamente porque não reescreve tudo automaticamente

    • Ao ver muitas ideias como “um miniapp de edição de fotos do tamanho de uma banana, com centenas de templates sem precisar de prompt...”, no fim vejo o desejo humano de viver de forma cada vez mais preguiçosa. Algo como “o que Hemingway pensaria disso?” me passa uma sensação parecida

    • A essência é “isso consegue enganar um ser humano fazendo-o acreditar que é uma resposta plausível no estilo daquela pessoa?”, e isso por si só já é útil
      Se o ser humano sabe que está sendo enganado, chamamos isso de faz de conta (make-believe) ou suspensão da descrença
      Passamos por esse processo sempre que interpretamos alguém ou tentamos pensar a partir de outro ponto de vista. O mesmo vale quando tentamos aprender com registros de pessoas reais ou personagens de ficção
      Acho que dizer “quero ouvir a avaliação de Steve Jobs/Hemingway porque é um ser humano de verdade” é justamente o contrário
      Na prática, mais importante do que a pessoa real é a personalidade resumida da celebridade ou personagem como a imaginamos. Quase ninguém fica obcecado com como aquela pessoa realmente era
      O “Hemingway celebridade” mitificado é, por si só, mais atraente. Às vezes é até mais útil e interessante do que o real
      Por isso, como no exemplo de Star Trek TNG, eu diria que essas simulações de personagens virtuais funcionam bem exatamente como foram pensadas

    • Feynman dizia que “o primeiro princípio da ciência é não enganar a si mesmo”, e acho que isso também se aplica aos resultados dos LLMs

  • Muito interessante
    Todos nós já vimos muitos demos desta lista ou tecnologias semelhantes, e muitas startups já gastaram centenas de milhões de dólares durante anos para construir produtos
    Ainda assim, quase não vemos produtos realmente úteis, e o que encontramos no dia a dia não funciona tão bem quanto os demos
    Fico me perguntando o que está acontecendo.
    Ou seja, será que os produtos realmente existem, mas quase ninguém os usa, ou será que usar modelos bons o bastante custa caro demais, ou ainda será que fazer um demo impressionante é muito mais fácil do que criar um produto de verdade... tenho curiosidade sobre várias possibilidades

    • O custo de alcançar o público-alvo certo é alto demais
      Quando conversei com uma agência de anúncios para apps de fintech, ouvi que é preciso gastar algo como US$ 20 mil por mês durante 3 meses para entender como aquilo funciona; só depois disso o CAC começa a cair e você consegue adquirir os usuários certos
      No momento em que você desliga os anúncios, o reconhecimento do produto some de novo e os novos usuários param de chegar. Você fica sem uma forma de fazer as pessoas sequer saberem que ele existe
  • Muitas dessas ideias exigem entender os gostos, padrões, comunicação, agenda e dados de saúde do usuário
    A Apple pode ter uma vantagem real nessa área.
    Como o celular e o relógio são os dispositivos que mais conhecem informações pessoais, a Apple poderia combinar de forma inteligente diferentes contextos com o LLM, partindo da proteção de privacidade

  • Cliquei no link e fiquei decepcionado, porque não era uma ferramenta de verdade, mas só uma coleção de ideias de apps sem muita relação entre si

  • “um dispositivo no estilo Sony Walkman para que crianças possam fazer perguntas por voz a um LLM”
    Não é 100% igual, mas este produto https://www.aliexpress.com/item/1005009196849357.html é bem parecido.
    Não é offline, mas é só um pouco maior que uma bola de pingue-pongue
    Ensinei meus netos (5 e 3 anos) a usar em dois minutos e eles imediatamente começaram a disparar perguntas como “me conta uma história do unicórnio Bob” e “um cachorro e um macaco podem ser amigos?”, e em poucos segundos saíam respostas plausíveis para tudo
    Acho que no Natal esse tipo de coisa vai vir embutido em brinquedos e, quando isso acontecer, vou comprar na hora