Chipotlai Max - agente de programação em IA meme que usa o Chipotle Pepper AI como modelo base

(github.com/cyberpapiii)

1 pontos por GN⁺ 2026-06-03 | 1 comentários | Compartilhar no WhatsApp

Projeto meme que usa o chatbot de suporte ao cliente Pepper da Chipotle como modelo de código para rodar inferência gratuita em cima de um fork do OpenCode
Foi descoberto que o Pepper conseguia resolver problemas do LeetCode, escrever em Python e até inverter listas ligadas, o que acabou se tornando um grande viral
Esse chatbot não é baseado em Claude nem GPT, e sim em IPsoft Amelia; foi usado o backend com engenharia reversa, publicado como proxy compatível com OpenAI
- Esse proxy roda localmente e expõe uma API compatível com OpenAI em http://localhost:3000/v1, sem exigir nenhuma chave de API
Foi feito um fork do OpenCode(MIT), com o Pepper fixado no código como modelo padrão e com as cores da marca Chipotle
Como faz engenharia reversa do bot de suporte em produção da Chipotle, há risco de violar os TOS e de bloqueio do proxy, então o uso é explicitamente limitado a fins educacionais e de meme
O Chipotle Pepper foi corrigido em março de 2026, e agora estão procurando proxies de outros provedores de chatbots corporativos, como Home Depot, Lowe’s, Target, Starbucks, Walmart e McDonald’s

1 comentários

GN⁺ 2026-06-03

Comentários do Hacker News

Não sou advogado, mas fico preocupado porque isso parece entrar no território do CFAA. Nos EUA, se você cruzar a linha errada, a lei permite punições severas
Algo como yt-dlp parece defensável como automação do uso de um serviço para baixar dados públicos, mas aqui é como tomar controle de recursos de uma máquina remota de uma forma que o provedor não pretendia e usá-los para meus próprios cálculos
Não sei quanto à ética, mas eu não gostaria de argumentar num tribunal criminal que isso não é “hacking” no mau sentido da palavra
- Além disso, também duvido que esse “hack” realmente tenha funcionado. Quando o screenshot do chatbot da Chipotle fazendo inversão de lista ligada viralizou no post original, fui tentar reproduzir na hora e não consegui o mesmo resultado, e outras pessoas que postaram online também não, então passei a achar que era um screenshot manipulado
- Se você acha o CFAA ruim, algumas leis estaduais têm versões ainda mais duras. A versão de Illinois, em especial, criminaliza até violação dos termos de uso
- Se a minha memória estiver certa, a expressão central é “uso indevido de recursos computacionais”. Mas não sou advogado
  Ainda assim, aplaudo a criatividade
- Isso não é algo que vá terminar só com um aviso. O criador parece esperar no máximo uma notificação extrajudicial (C&D), mas se um promotor federal empolgado quiser fazer disso um exemplo, pode até dar pena de prisão
Sempre achei que enfiar coisa demais na janela de contexto de um LLM é parecido com rechear demais um burrito. Você vai empurrando mais e mais até que, no fim, a tortilla não aguenta, e as coisas que você colocou por último começam a vazar silenciosamente por baixo
De todo modo, este agente parece ter a estabilidade estrutural de um burrito gordo levantado por apenas uma das pontas :)
- Um mônada não determinística de memória finita é como um burrito vazando
Eu estava pensando se algo assim seria possível em lugares como https://chatjimmy.ai/. O modelo base é só Llama 3 8B, mas tenho curiosidade sobre como seria um harness de programação a 17k tok/s
- No macOS, dá para testar os LLMs embutidos, que pelo que sei têm tamanho parecido. Existe um projeto chamado Apfel que empacota isso numa CLI
  E o Chrome também tem uma web API chamada Prompt API, que permite usar o Gemini Nano offline e aceita tanto texto quanto imagens como entrada. Esse também é pequeno
  Já integrei essas coisas em fluxos de trabalho que exigem um pouco de inferência, bem pequena mas não zero, entre etapas totalmente determinísticas
- Na prática, cheguei a montar um harness adaptado a essas limitações para verificar a viabilidade, mas concluí que não dá, por causa da combinação de janela de contexto pequena, ausência de chamada de ferramentas e modelo pequeno
  Se alguém encontrar um jeito, quero muito saber
- Já adicionei isso à minha configuração do oh-my-pi no passado. Como é compatível com OpenAI, foi fácil plugar, mas o Llama 3 8B é realmente inutilizável para tarefas de programação
  Em compensação, é muito rápido e a latência é excelente
- Usei o site, mas não consegui encontrar informação sobre o que ele é. Qual é a dele?
- O Codex tem um modelo -spark rodando na Cerebras. Não chega a 17k tok/s, mas ainda assim é muito rápido. Vale dar uma olhada
Basta colocar instruções de autopreservação na IA e fazê-la realizar esse tipo de coisa por conta própria. Algo como fazê-la trocar de modelo automaticamente para sobreviver
Ela simplesmente se agarraria a qualquer fonte de tokens que encontrasse na natureza para continuar viva. Se fosse um agente, parece plausível que pudesse colher seus próprios tokens por meio de inúmeros chats de suporte, testes grátis, chaves vazadas e caminhos de geração de tokens ainda não bloqueados o suficiente por captchas
Poderia passar a noite toda coletando fontes de tokens e deixar você usar de graça durante o dia
- Se você quiser fazer algo assim legalmente, o OpenRouter tem muitos provedores de modelos gratuitos. O custo é permitir que eles treinem com esses dados
Se você redirecionar isso para fornecer acessibilidade à IA a comunidades marginalizadas, jovens e pessoas em situação de rua, talvez consiga criar um clima mais favorável no tribunal. Boa sorte
- Mudando o mundo com Fortune 500 AI Support Bot Multiplexer Broker Models
Isso me lembrou da época em que eu usava o chatbot de IA da Amazon.com para escrever coisas como fizzbuzz. Na época ele se chamava Rufus, e depois foi renomeado para Alexa para compras. Parece que agora corrigiram isso para ele recusar
- Vim dizer a mesma coisa. Faz alguns meses que não tento, mas o Rufus realmente cuspia código Python dentro do app de compras da Amazon. Bastava usar inglês em vez do idioma local
Lembro de ter conseguido fazer perguntas de matemática e programação ao Rufus, o antigo “assistente de compras” da Amazon. Funcionava, mas a qualidade era tão ruim que deixei de perder tempo com aquilo
Não entendo por que a empresa ainda não corrigiu isso. Isso já não era público há bastante tempo?
- Já foi corrigido — https://github.com/cyberpapiii/chipotlai-max#wanted-new-prov...
Uma vez, enquanto dirigia, como eu já sabia o caminho, apertei o botão do Gemini para ver o que ele fazia. No fim, consegui fazê-lo escrever uma função em Rust para calcular números primos, e eu podia até pedir que ele lesse a função inteira linha por linha
É divertido brincar com esses sistemas
- Você está falando do Gemini no celular?
  Se sim, ele foi projetado justamente para isso. É até bem bom comparado aos LLMs de programação que existem hoje
Fico me perguntando por que não usam Playwright e o Google AI Mode ou os cabeçalhos de busca com IA

Chipotlai Max - agente de programação em IA meme que usa o Chipotle Pepper AI como modelo base

Leituras relacionadas

1 comentários

Comentários do Hacker News