A "carruagem sem cavalos" da era da IA
(koomen.dev)- Criar software com IA é divertido e produtivo, mas a maioria dos apps de IA é ineficiente, como uma "carruagem sem cavalos (horseless carriage)" que apenas imita o jeito antigo de fazer as coisas
- O assistente de e-mail com IA do Gmail produz resultados formais demais e não consegue oferecer uma experiência personalizada ao usuário
- Apps de IA realmente úteis deveriam permitir que o usuário editasse o System Prompt para criar agentes personalizados
- O app ideal da era da IA não deveria imitar programas existentes, mas sim ser um software nativo de IA que reduz tarefas repetitivas e melhora de verdade a produtividade por meio da automação
- O verdadeiro potencial da IA está em automatizar o trabalho do dia a dia, ajudando as pessoas a se concentrarem no que é importante e criativo
Por que criar software com IA é mais divertido do que usar apps feitos com IA
- Recentemente percebi algo interessante: usar IA para criar software por conta própria é mais divertido e produtivo do que usar a maioria dos apps baseados em IA
- Quando uso IA como ferramenta de desenvolvimento, quase sempre tenho a sensação de conseguir construir rapidamente qualquer coisa que eu consiga imaginar
- Já muitos apps de IA apenas têm recursos de IA por cima, mas na prática são pouco úteis ou até atrapalham
A ‘carruagem sem cavalos’ da era da IA
- Hoje, muitos apps de IA basicamente seguem exatamente o mesmo design de software de antigamente
- Com isso, modelos poderosos como LLMs acabam presos numa estrutura que os limita sem necessidade
- O autor chama isso de "carruagens sem cavalos (horseless carriages)" da era da IA
- Uma analogia com a história dos primeiros carros, cujos designs copiavam a forma das carruagens e, por isso, eram ineficientes
Um exemplo de app de IA mal projetado: o assistente de IA do Gmail
- O Gmail lançou recentemente um recurso que usa o modelo Gemini para gerar rascunhos de e-mail
- No exemplo, o usuário (o autor) pede um rascunho de e-mail para enviar ao chefe
Prompt: pedir um rascunho de e-mail para o chefe
- O rascunho gerado pelo Gemini é gramaticalmente perfeito, mas não se parece em nada com a forma como o autor realmente escreveria
- Estilo real do autor: "hey garry, my daughter woke up with the flu so I won't make it in today"
- O resultado do Gemini é formal demais e pouco natural
- No fim, isso leva mais tempo do que simplesmente escrever o e-mail direto
- O autor descreve a experiência como "gerenciar um funcionário com baixo desempenho"
- É bem provável que milhões de usuários do Gmail tenham tido uma experiência parecida, e por isso possam concluir, de forma equivocada, que a IA ainda não sabe escrever e-mails direito
- Mas o problema não está no modelo Gemini em si, e sim na forma como o app foi projetado pela equipe do Gmail
Um exemplo de assistente de e-mail melhor
- Se o Gmail tivesse criado o assistente de e-mail de uma forma como a abaixo, ele seria muito mais útil na prática
Exemplo de agente de leitura de e-mails
-
Essa demo não funciona escrevendo e-mails, e sim lendo e processando e-mails
-
Ferramentas usadas:
labelEmail(label, color, priority): define um rótulo no e-mailarchiveEmail(): arquiva o e-maildraftReply(body): cria um rascunho de resposta
-
Os e-mails da caixa de entrada são organizados assim:
- TechCrunch Weekly
- Gustaf Alströmer - founder intro?
- HackerNews Digest
- The Verge Updates
- Garry Tan - reschedule
- e mais 12 ao todo
-
Cada e-mail é classificado e priorizado automaticamente, e alguns recebem rascunhos automáticos de resposta ou são arquivados automaticamente
-
Cada e-mail é tratado individualmente de acordo com o System Prompt definido pelo usuário
-
O usuário pode editar o próprio System Prompt para refletir sua lógica pessoal de rotulagem
Esse método é muito mais poderoso, intuitivo e produtivo — então por que a equipe do Gmail não projetou algo assim?
- O núcleo do problema: "um tom típico e uniforme"
- Um dos maiores problemas do design do Gmail é justamente esse estilo genérico, sem personalidade
AI Slop: saídas formais e estranhas
- O rascunho de e-mail gerado pelo Gemini no Gmail é excessivamente prolixo, formal e totalmente diferente do estilo do autor
- Esse tipo de resultado pode até parecer um e-mail de phishing
- A maioria dos usuários de LLM já passou por isso e, para evitar, acaba usando naturalmente a estratégia conhecida como prompt hacking
- Exemplo de prompt:
"let my boss garry know that my daughter woke up with the flu and that I won't be able to come in to the office today. Use no more than one line for the entire email body. Make it friendly but really concise. Don't worry about punctuation or capitalization. Sign off with “Pete” or “pete” and not “Best Regards, Pete” and certainly not “Love, Pete”"
- Exemplo de prompt:
- A qualidade do resultado melhora, mas o prompt fica longo demais, e ter de repetir esse processo toda vez é ineficiente
- A solução simples para esse problema: dar ao usuário permissão para editar o System Prompt
A diferença entre System Prompt e User Prompt
- Um LLM é, em essência, um sistema que prevê a próxima palavra com base nas palavras fornecidas no prompt
- Toda entrada e saída é composta de texto
- Para simplificar, o texto fala apenas de interfaces centradas em texto, embora na prática voz e vídeo também possam ser entradas e saídas
- OpenAI, Anthropic e outras adotaram uma estrutura que separa o prompt em System Prompt e User Prompt para simplificar isso
- System Prompt: define a personalidade do agente e seu modo de agir (equivalente à função)
- User Prompt: pedido ou pergunta específica do usuário (equivalente ao valor de entrada)
- Resposta do modelo: valor de saída
Exemplo:
- User Prompt: "Let my boss Garry know that my daughter woke up with the flu this morning and that I won't be able to come in to the office today."
- System Prompt estimado do Gmail:
- "You are a helpful email-writing assistant responsible for writing emails on behalf of a Gmail user. Follow the user’s instructions and use a formal, businessy tone and correct punctuation so that it’s obvious the user is smart and serious."
- O problema é que o Gmail não revela esse System Prompt nem permite que o usuário o edite
O System Prompt personalizado de Pete
-
Se o Gmail desse ao usuário o direito de escrever seu próprio prompt, em vez de usar um System Prompt uniforme, ele poderia ser algo assim:
You're Pete, a 43 year old husband, father, programmer, and YC Partner.
You're very busy and so is everyone you correspond with, so you do your best to keep your emails as short as possible and to the point. You avoid all unnecessary words and you often omit punctuation or leave misspellings unaddressed because it's not a big deal and you'd rather save the time. You prefer one-line emails.
Do your best to be kind, and don't be so informal that it comes across as rude. -
Ao gerar um e-mail com base nesse System Prompt, o GPT poderia produzir algo como:
Garry, my daughter has the flu. I can't come in today.
-
O resultado é curto, pessoal e alinhado ao estilo real do usuário
-
A maior vantagem é que esse System Prompt pode ser reutilizado, aplicando o mesmo estilo a todos os e-mails seguintes
A diversão e o potencial de escrever prompts personalizados
- A experiência de ensinar um LLM a pensar como eu e ver o resultado imediatamente é muito intuitiva e prazerosa
- O autor recomenda que cada pessoa experimente escrever um "System Prompt só seu" para definir o próprio estilo
- Exemplos de User Prompt:
"Let my wife know I'll be home from work late and will miss dinner"
"Write an email to comcast customer service explaining that they accidentally double billed you last month."
- Exemplos de User Prompt:
- Se o resultado sair bom, isso significa que a explicação foi suficiente; se não, basta complementar o conteúdo e iterar
- Isso pode até ser mais fácil do que ensinar um ser humano, graças a um ciclo de feedback mais rápido e mais honesto
Por que a maioria dos apps de IA não expõe o System Prompt?
- Em abril de 2025, a maioria dos apps de IA esconde deliberadamente o System Prompt
- O autor vê isso como tirar do usuário seu poder e sua individualidade, e defende que, para obter melhores resultados e uma experiência melhor, o System Prompt precisa ser aberto ao usuário
Horseless Carriages: aplicar uma tecnologia nova com mentalidade antiga
- Quando surge uma nova tecnologia, as primeiras ferramentas frequentemente copiam o molde das formas antigas e acabam fracassando
- “Horseless Carriage” se refere aos primeiros carros que mantinham o design das carruagens puxadas por cavalos
- Exemplo: o projeto da carruagem a vapor de Trevithick em 1803
- Na época, esse design parecia inovador, mas hoje é claro que sua estrutura básica não servia bem para automóveis
- Na época, as pessoas podiam experimentar essas carruagens e pensar que “cavalos são melhores do que motores” — o que parecia razoável antes do surgimento do automóvel moderno
- O autor diz que os apps de IA de hoje estão numa situação parecida
- Exemplo: recursos como o Gemini no Gmail, em que a IA foi encaixada num UX antiquado
- O raciocínio antigo ficava em algo como “vamos trocar o cavalo por um motor”
- Hoje, muitos apps de IA fazem algo semelhante ao apenas adicionar recursos de IA a apps já existentes
Old World Thinking: os limites do design tradicional de software
- Antes, só existiam duas formas de usar computadores:
- Programando diretamente
- Usando programas feitos por outras pessoas
- Como programar é difícil, a maioria escolhia a segunda opção
- Com isso, a indústria de software cresceu separando com clareza o papel do desenvolvedor e o do usuário
- Desenvolvedor: decide o comportamento geral do software
- Usuário: fornece entradas específicas
- A divisão entre System Prompt e User Prompt nos LLMs reproduz exatamente essa estrutura
- System Prompt = papel do desenvolvedor
- User Prompt = papel do usuário
- Mas e-mail é uma área profundamente pessoal, e se a IA vai escrever em nome do usuário, ela precisa refletir o estilo daquela pessoa
- Na estrutura antiga, a personalização era difícil a menos que o usuário programasse o software por conta própria
- Já na era dos LLMs, o usuário pode escrever o próprio System Prompt
- Ou seja, vivemos numa era em que é possível projetar o comportamento da IA sem programar
Devolvam ao usuário o que é do usuário
- A tese do autor: quando um LLM age em meu nome, sou eu quem deve ensinar como ele deve agir por meio do System Prompt
- Claro, nem todo usuário quer escrever um prompt do zero
- O Gmail poderia gerar um System Prompt padrão com base no histórico de e-mails do usuário
- O importante é mostrar esse prompt ao usuário e permitir que ele o edite
- “E quem não sabe escrever prompts?” → no começo pode ser difícil, mas a maioria aprende rápido
- O sucesso do ChatGPT prova isso
- E em áreas como contabilidade ou direito, que não são agentes pessoais?
- Faz sentido que o System Prompt seja escrito por especialistas do domínio, mas esses próprios especialistas também vão querer ajustá-lo ao seu contexto
- Exemplo: a equipe contábil da YC usa processos, regras e combinações de software específicos da YC
- Um agente de IA genérico para contabilidade seria completamente inútil na YC
- Quase toda equipe contábil tem sua própria forma de trabalhar, por isso prefere ferramentas genéricas como Excel
- Conclusão: na maioria dos apps de IA, o System Prompt deveria ser escrito e mantido pelo próprio usuário
Apps de IA não deveriam ser agentes prontos (agents), mas sim ferramentas para que o usuário crie seu próprio agente (agent builders)
Devolvam ao desenvolvedor o que é do desenvolvedor
- Então o que cabe aos desenvolvedores fazer?
- Projetar uma UI de criador de agentes especializada em domínios específicos, como e-mail ou escrituração contábil
- Oferecer templates e assistentes de geração de prompts para que o usuário não precise começar do zero
- Fornecer uma interface de ciclo de feedback para que o usuário veja e corrija o resultado do agente
- Os desenvolvedores também fornecem ferramentas do agente (agent tools)
- Envio de rascunhos de e-mail, envio automático, busca de e-mails, integração com APIs externas etc.
- Essas ferramentas servem para controlar o alcance das ações do agente e sua segurança
- Restringir comportamentos por meio de ferramentas escritas em código é muito mais seguro e claro do que tentar impor limites só com prompt de texto
No futuro, a preocupação com prompt injection pode virar motivo de piada
→ Criar fronteiras dentro de uma estrutura textual é sinal de uma abstração frágil
→ É preciso encarar o sistema inteiro como espaço do usuário e controlá-lo com ferramentas e UI robustas
O verdadeiro valor de um agente que "lê" e-mails
- Como já foi dito, até um System Prompt melhor não economiza tanto tempo na hora de escrever e-mails do zero
- Isso acontece porque os e-mails do autor já são naturalmente muito curtos e diretos
- Ou seja, o tamanho do prompt do usuário ≒ tamanho do corpo do e-mail
- Depois de experimentar várias vezes, o autor concluiu que IA generativa é muito melhor em transformar texto do que em gerar texto do zero
- Por isso, o verdadeiro objetivo de usar LLMs não está em "escrever" e-mails, mas em "ler e processar" e-mails
Demo de agente de leitura de e-mails (baseado em gpt-4o-mini)
- Ferramentas disponíveis:
labelEmail(label, color, priority): define rótulos de e-mailarchiveEmail(): arquiva automaticamente o e-maildraftReply(body): gera automaticamente um rascunho de resposta
- Esse agente lê cada e-mail e:
- filtra bem o spam
- rotula conforme a importância
- resume ou cria rascunhos de resposta
- arquiva automaticamente mensagens desnecessárias
- E, com mais algumas ferramentas, ele poderia até:
- cancelar assinaturas
- registrar compromissos na agenda
- pagar contas automaticamente
- É exatamente isso que um cliente de e-mail nativo de IA deveria fazer:
→ automatizar tarefas repetitivas e entediantes para economizar o tempo do usuário- Alguns clientes de e-mail, como Superhuman e Zero, já estão sendo desenvolvidos nessa direção
O que significa software nativo de IA
- O verdadeiro killer app da IA é fazer o computador assumir o trabalho que eu não quero fazer
- O motivo de o autor ter incluído uma demo neste texto é mostrar que os LLMs já conseguem executar esse tipo de tarefa bem o suficiente na prática
- O problema não está no desempenho da IA, mas sim no design do app
O que a equipe do Gmail criou foi um "app de e-mail com IA"
→ não uma ferramenta de automação para o usuário, mas uma IA forçada para dentro de uma interface pensada para humanos
- Em contraste, um app nativo de IA deveria ser assim:
- maximizar a alavancagem do usuário em um domínio específico
- Ex.: um cliente de e-mail com IA deve minimizar o tempo gasto com e-mail
- Ex.: um software contábil com IA deve minimizar o tempo gasto com contabilidade
Expectativas para a era da IA
- Todo trabalho repetitivo e tedioso será feito por agentes
- O usuário poderá se concentrar no que realmente importa
- Será possível fazer mais do que se faz bem e do que se gosta
É por isso que o autor está animado com o futuro da IA
Ferramentas melhores, melhor uso do tempo, produtividade maior
2 comentários
Claro que os desenvolvedores que criam as funcionalidades também devem saber disso, mas enquanto houver jailbreak, não é algo simples.
Mesmo que você trave a alteração do system prompt, ainda dá para fazer jailbreak; então abrir a possibilidade de mudar o system prompt é praticamente impossível.
E também podem acabar usando isso para um propósito diferente da função original, e de forma barata.
Opiniões no Hacker News
Abordo com cautela o uso de modelos de linguagem para redigir mensagens pessoais. Isso carece da especificidade da experiência ou do conhecimento individual
Sinto que 90% dos recursos de IA são inúteis e caros
O Gemini age como um assistente pessoal e envia e-mails em nome do usuário
É desagradável se comunicar com pessoas que não se importam com gramática e ortografia
O widget interativo conectado a um LLM foi divertido
Muita gente acha que a IA escreve em um estilo previsível, mas na prática não é assim
Foi bom ver a demonstração interativa acontecendo em tempo real
A IA não consegue saber o que o usuário quer, e as pessoas têm dificuldade de expressar claramente seus objetivos
Os recursos de IA mais úteis passam despercebidos
Não entendo a ideia de a IA escrever mensagens no lugar da pessoa