1 pontos por GN⁺ 3 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • Chipotlai Max é um agente de programação em IA de meme que faz um fork do OpenCode e define o chatbot de suporte ao cliente da Chipotle, Pepper AI, como modelo padrão
  • O Pepper viralizou em 12~13 de março de 2026 ao resolver problemas do LeetCode, escrever Python, inverter listas ligadas e mais, funcionando com base no IPsoft Amelia
  • @Gonzih fez engenharia reversa do backend WebSocket/SockJS + STOMP do Amelia e publicou um proxy compatível com OpenAI que fornece http://localhost:3000/v1 localmente
  • Este projeto parte desse proxy e já deixa pré-configurados o provedor chipotle-pepper, o modelo pepper-1 e a Base URL http://localhost:3000/v1
  • A documentação diz que a chave de API pode ser qualquer valor, como burrito-2026, e o custo aparece como $0.00
  • A execução pode ser feita com git clone --recursive, bun install, ./start-chipotlai.sh para iniciar juntos o proxy e a CLI, ou executando o proxy e o Chipotlai Max em terminais separados
  • As restrições operacionais são grandes: como faz engenharia reversa do bot de suporte em produção da Chipotle, pode violar os TOS, e o proxy pode quebrar a qualquer momento se a Chipotle aplicar correções
  • Ele é limitado por sessões anônimas e explicita MAX_POOL_SIZE=5, com aviso para não usá-lo em codebases de produção
  • A seção de contribuições parte do pressuposto de que o Chipotle Pepper foi corrigido em março de 2026 e procura proxies de provedores para chatbots de outras empresas, como Home Depot, Lowe’s, Target, Starbucks, Walmart e McDonald’s
  • O fluxo para adicionar um novo provedor é encontrar um chatbot corporativo, fazer engenharia reversa da API WebSocket ou REST, criar um proxy compatível com OpenAI em /v1/chat/completions e depois enviar um PR para packages/opencode/src/provider/
  • A licença é MIT, herdada do OpenCode, e o projeto declara que não tem afiliação com a Chipotle

1 comentários

 
GN⁺ 3 시간 전
Comentários do Hacker News
  • Não sou advogado, mas fico preocupado porque isso parece entrar no território do CFAA. Nos EUA, se você cruzar a linha errada, a lei permite punições severas
    Algo como yt-dlp parece defensável como automação do uso de um serviço para baixar dados públicos, mas aqui é como tomar controle de recursos de uma máquina remota de uma forma que o provedor não pretendia e usá-los para meus próprios cálculos
    Não sei quanto à ética, mas eu não gostaria de argumentar num tribunal criminal que isso não é “hacking” no mau sentido da palavra

    • Além disso, também duvido que esse “hack” realmente tenha funcionado. Quando o screenshot do chatbot da Chipotle fazendo inversão de lista ligada viralizou no post original, fui tentar reproduzir na hora e não consegui o mesmo resultado, e outras pessoas que postaram online também não, então passei a achar que era um screenshot manipulado
    • Se você acha o CFAA ruim, algumas leis estaduais têm versões ainda mais duras. A versão de Illinois, em especial, criminaliza até violação dos termos de uso
    • Se a minha memória estiver certa, a expressão central é “uso indevido de recursos computacionais”. Mas não sou advogado
      Ainda assim, aplaudo a criatividade
    • Isso não é algo que vá terminar só com um aviso. O criador parece esperar no máximo uma notificação extrajudicial (C&D), mas se um promotor federal empolgado quiser fazer disso um exemplo, pode até dar pena de prisão
  • Sempre achei que enfiar coisa demais na janela de contexto de um LLM é parecido com rechear demais um burrito. Você vai empurrando mais e mais até que, no fim, a tortilla não aguenta, e as coisas que você colocou por último começam a vazar silenciosamente por baixo
    De todo modo, este agente parece ter a estabilidade estrutural de um burrito gordo levantado por apenas uma das pontas :)

    • Um mônada não determinística de memória finita é como um burrito vazando
  • Eu estava pensando se algo assim seria possível em lugares como https://chatjimmy.ai/. O modelo base é só Llama 3 8B, mas tenho curiosidade sobre como seria um harness de programação a 17k tok/s

    • No macOS, dá para testar os LLMs embutidos, que pelo que sei têm tamanho parecido. Existe um projeto chamado Apfel que empacota isso numa CLI
      E o Chrome também tem uma web API chamada Prompt API, que permite usar o Gemini Nano offline e aceita tanto texto quanto imagens como entrada. Esse também é pequeno
      Já integrei essas coisas em fluxos de trabalho que exigem um pouco de inferência, bem pequena mas não zero, entre etapas totalmente determinísticas
    • Na prática, cheguei a montar um harness adaptado a essas limitações para verificar a viabilidade, mas concluí que não dá, por causa da combinação de janela de contexto pequena, ausência de chamada de ferramentas e modelo pequeno
      Se alguém encontrar um jeito, quero muito saber
    • Já adicionei isso à minha configuração do oh-my-pi no passado. Como é compatível com OpenAI, foi fácil plugar, mas o Llama 3 8B é realmente inutilizável para tarefas de programação
      Em compensação, é muito rápido e a latência é excelente
    • Usei o site, mas não consegui encontrar informação sobre o que ele é. Qual é a dele?
    • O Codex tem um modelo -spark rodando na Cerebras. Não chega a 17k tok/s, mas ainda assim é muito rápido. Vale dar uma olhada
  • Basta colocar instruções de autopreservação na IA e fazê-la realizar esse tipo de coisa por conta própria. Algo como fazê-la trocar de modelo automaticamente para sobreviver
    Ela simplesmente se agarraria a qualquer fonte de tokens que encontrasse na natureza para continuar viva. Se fosse um agente, parece plausível que pudesse colher seus próprios tokens por meio de inúmeros chats de suporte, testes grátis, chaves vazadas e caminhos de geração de tokens ainda não bloqueados o suficiente por captchas
    Poderia passar a noite toda coletando fontes de tokens e deixar você usar de graça durante o dia

    • Se você quiser fazer algo assim legalmente, o OpenRouter tem muitos provedores de modelos gratuitos. O custo é permitir que eles treinem com esses dados
  • Se você redirecionar isso para fornecer acessibilidade à IA a comunidades marginalizadas, jovens e pessoas em situação de rua, talvez consiga criar um clima mais favorável no tribunal. Boa sorte

    • Mudando o mundo com Fortune 500 AI Support Bot Multiplexer Broker Models
  • Isso me lembrou da época em que eu usava o chatbot de IA da Amazon.com para escrever coisas como fizzbuzz. Na época ele se chamava Rufus, e depois foi renomeado para Alexa para compras. Parece que agora corrigiram isso para ele recusar

    • Vim dizer a mesma coisa. Faz alguns meses que não tento, mas o Rufus realmente cuspia código Python dentro do app de compras da Amazon. Bastava usar inglês em vez do idioma local
  • Lembro de ter conseguido fazer perguntas de matemática e programação ao Rufus, o antigo “assistente de compras” da Amazon. Funcionava, mas a qualidade era tão ruim que deixei de perder tempo com aquilo

  • Não entendo por que a empresa ainda não corrigiu isso. Isso já não era público há bastante tempo?

  • Uma vez, enquanto dirigia, como eu já sabia o caminho, apertei o botão do Gemini para ver o que ele fazia. No fim, consegui fazê-lo escrever uma função em Rust para calcular números primos, e eu podia até pedir que ele lesse a função inteira linha por linha
    É divertido brincar com esses sistemas

    • Você está falando do Gemini no celular?
      Se sim, ele foi projetado justamente para isso. É até bem bom comparado aos LLMs de programação que existem hoje
  • Fico me perguntando por que não usam Playwright e o Google AI Mode ou os cabeçalhos de busca com IA