1 pontos por GN⁺ 4 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • À medida que as empresas migram de pilotos com um único modelo para sistemas de produção multimodelo, cresce a necessidade de uma camada de roteamento e gateway
  • A OpenRouter atua como a camada entre agentes e provedores de modelos, responsável por roteamento, confiabilidade, otimização de custos e compliance
  • Nos últimos 6 meses, o volume semanal processado cresceu de 5 trilhões de tokens para 25 trilhões de tokens e, nesse ritmo, a empresa espera ultrapassar 1 quatrilhão de tokens processados neste ano
  • Atualmente, dá suporte a mais de 8 milhões de desenvolvedores criando para mais de 400 modelos, sustentando a transição da IA para apps e agentes em produção
  • Os recursos serão usados para expandir a infraestrutura, reforçar funcionalidades corporativas e investir em roteamento inteligente, construindo a camada fundamental da era da IA multimodelo

Série B de US$ 113 milhões

Indicadores de crescimento e escala de uso

  • O volume semanal processado pela OpenRouter aumentou de 5 trilhões de tokens para 25 trilhões de tokens nos últimos 6 meses
  • Nesse ritmo, o volume processado neste ano deve chegar a mais de 1 quatrilhão de tokens
  • A OpenRouter atende mais de 8 milhões de desenvolvedores criando para mais de 400 modelos
  • Com a IA saindo da fase experimental para apps e agentes em produção, cresce a demanda por infraestrutura capaz de operar com estabilidade entre provedores, modalidades e casos de uso

Transição para produção multimodelo

  • À medida que as organizações migram de pilotos com um único modelo para sistemas de produção multimodelo, torna-se necessária uma camada de roteamento e gateway para lidar com a complexidade
  • A OpenRouter atua como a camada entre agentes e provedores de modelos, responsável por roteamento, confiabilidade, otimização de custos e compliance
  • A composição dos investidores nesta rodada é centrada em empresas de infraestrutura e plataforma, mostrando que essa camada está se consolidando como um componente importante da stack de IA

Principais recursos

  • Inferência multimodal

  • Controles corporativos

  • Roteamento inteligente

    • Oferece failover em nível de provedor, otimização de custo e latência, e roteamento sensível à qualidade que vai além do simples balanceamento de carga

Próximos passos

  • Os recursos desta rodada serão usados para expandir a infraestrutura, fortalecer funcionalidades corporativas e continuar investindo em roteamento inteligente
  • A OpenRouter planeja continuar expandindo a camada de infraestrutura da era da IA multimodelo, ajudando a encontrar o modelo e o provedor adequados para cada solicitação

1 comentários

 
GN⁺ 4 시간 전
Opiniões do Hacker News
  • Demorei bastante para adotar o OpenRouter. No começo eu não entendia por que colocar mais um proxy na frente do LLM, mas na prática ele agrega bastante valor

    1. É a forma com menos atrito de dar suporte e testar todos os modelos
    2. Oferece limite de gastos. Se você vai conectar isso a um serviço público, um limite rígido é muito útil para evitar que alguém abuse e gere uma conta de US$ 1 milhão da noite para o dia
    3. O ranking também é interessante como sinal de quais modelos estão populares, embora tenha falhas. Há a limitação de que a maioria dos usuários de OpenAI/Anthropic não passa pelo OpenRouter, e é difícil distinguir se muitos usuários mudaram ou se foi apenas um grande cliente que mudou
      Em um cenário em que o custo de API está ficando relevante em várias empresas, um serviço como o OpenRouter, que permite medir gastos e experimentar/trocar de provedor com facilidade, parece valioso
    • Outra coisa boa é que eles divulgam o status de cache por hora para todas as combinações de modelo/provedor. Com base nisso, fui investigar a lista de níveis dos provedores e descobri que boa parte das hospedagens de terceiros baseadas em open source simplesmente está no fundo do poço https://dirac.run/posts/cache-hit-rates-agents
    • Pelo menos para mim, a maior redução de atrito é o pagamento unificado, que evita processos burocráticos extras em ambientes corporativos. Conversão/abstração de API costuma criar mais problemas do que resolve
      Eu preferiria que o pagamento fosse unificado, mas que ainda permitisse usar diretamente a API do provedor, ou por meio de algum tipo de proxy de “HTTP bruto”. Existem muitos gateways de API unificada, mas ainda não vi um produto que apenas acrescente pagamento/autenticação na frente da API nativa do provedor
    • Você sabia que, ao colocar dinheiro na conta da OpenAI, ele expira depois de 1 ano? Quando isso aconteceu comigo de verdade, o saldo simplesmente sumiu como se fosse crédito promocional, sem reembolso nem aviso, o que foi extremamente irritante
      O OpenRouter é bom porque coloca uma barreira entre provedores e usuários, quando esses provedores originalmente deveriam se comportar como um utilitário. Dá a sensação de que, se deixada sozinha, a OpenAI passaria a agir como operadora de telecom
    • Bons pontos. Experimentação fácil ajuda no desenvolvimento, mas, conforme a escala cresce, eu recomendaria com cautela migrar para a API primária por questão de preço
      O OpenRouter também é um bom lugar para encontrar acesso gratuito a LLMs, mas há um porém. É preciso assumir que entrada e saída vão parar no banco de dados de treinamento de alguém. Se você pode pagar, deveria usar modelos pagos com proteção de privacidade, mas os modelos gratuitos foram excelentes para estudo e experimentação. Especialmente para jovens aprendizes sem cartão de crédito ou dinheiro, é ótimo para aprender programação com API e LLMs
    • No momento, ele está quebrando o cache no DeepSeek V4, e no V4 o cache é um recurso central de preço
      https://news.ycombinator.com/item?id=48319827
  • Sou cofundador e COO da OpenRouter. Muita gente pergunta por que levantamos investimento
    Antes de tudo, a OpenRouter continua sendo uma empresa guiada e controlada pelos fundadores, e pretendemos durar bastante enquanto construímos um bom produto para builders do mundo todo. No fim das contas, somos gente que gosta de construir e mexer nas coisas, e queremos criar aquilo que nós mesmos gostaríamos de usar ao construir algo com IA
    Sobre a captação, acreditamos que uma empresa forte precisa ter um balanço patrimonial sólido. Lidamos com despesas em grande escala e temos compromissos significativos de gastos em todo o ecossistema. Garantir caixa suficiente para aguentar o que quer que aconteça daqui para frente é uma redução de risco responsável e torna a empresa muito resiliente
    Isso também sinaliza para grandes clientes e parceiros fornecedores que estaremos aqui por muito tempo, prestando serviço e pagando as contas. Não precisamos de capital de risco para continuar escalando e, na verdade, o negócio é saudável, mas ninguém quer levantar US$ 100 milhões quando realmente estiver precisando deles
    Também é uma boa validação, para funcionários atuais e futuros, de que o valor que estamos construindo juntos é real. Também levamos a sério a obrigação de gerar retorno para investidores; não estamos apenas maximizando valuation, e temos o privilégio de poder escolher com quem trabalhar. Acho que esse ponto não é muito discutido no ecossistema de startups, mas é importante

    • Em que a OpenRouter pretende gastar os US$ 100 milhões? Você disse que isso “torna a empresa muito resiliente” e que é “uma boa validação para os funcionários”, mas parece que deve haver coisas mais interessantes para fazer com US$ 100 milhões
    • Gosto do produto. O pagamento/autenticação unificados resolvem uma grande dor, então obrigado
      Mais do que o investimento, tenho curiosidade sobre a estratégia de longo prazo. Onde você vê a OpenRouter em 3 a 5 anos, e quais apostas de produto mais empolgam vocês hoje? Com esta rodada, vocês pretendem expandir também para áreas adjacentes?
    • É possível manter o pagamento unificado e ainda ter acesso bruto às APIs dos provedores? A API unificada é excelente quando funciona bem, mas em casos de uso incomuns ou com novos recursos de API ela frequentemente traz incômodo
    • Para mim, o maior recurso ausente é a distinção de provedores sem retenção de dados e a capacidade de avaliar se um modelo atende às regras que eu definir. Hoje não há como ocultar provedores que não estejam em conformidade com regras de ZDR
    • Usei o OpenRouter por pouco tempo. Testei o produto há cerca de 1 ano, mas não consegui obter saída estruturada dos modelos Gemini do Google por meio do OpenRouter
  • Do ponto de vista de quem usa bastante o OpenRouter, embora eu tenha escrito sem querer um post promocional relacionado alguns dias atrás https://news.ycombinator.com/item?id=48317294, ele é com certeza a melhor forma de testar modelos novos sem precisar lidar com as APIs diferentes de cada provedor, um problema que vem se repetindo cada vez mais hoje em dia.
    Dito isso, não entendo muito bem quem roda todo o backbone de agentes em cima do OpenRouter com modelos caros como Claude Opus. Nesse nível de custo, a taxa de 5% já fica significativamente relevante, então é melhor usar a API original do provedor. Ainda assim, claramente há gente usando, e isso é receita pura.

    • Parece melhor implementar esse tipo de coisa com uma biblioteca open source para a qual os provedores forneçam patches de suporte. Não entendo por que uma empresa precisa fazer o papel de proxy, em vez de eu simplesmente rodar uma camada fina e relativamente simples na minha própria máquina.
      Mesmo como um programador de sistemas meio idiota que trabalha por dentro com IA, eu entendo que existe muito software aparentemente desnecessário que vende um pouco de conveniência por dinheiro. O OpenRouter é só mais um desses? Fico curioso se eles hospedam os modelos diretamente ou se apenas centralizam o faturamento de vários provedores.
    • Hoje há muito gasto burro de tokens. Também existe uma dinâmica de maximizar o uso de tokens. Por causa desse clima de medo de ficar para trás, o custo econômico dos tokens não está sendo avaliado com cuidado. Mas as pessoas estão começando a perceber isso, e esse tipo de gasto não é sustentável, então vai recuar.
    • O tempo de atividade pode ser melhor. Afinal, ele vai rotear por Anthropic, Amazon Bedrock, AWS Claude Platform, Google Vertex Europe ou Google Vertex.
    • Pagar 5% a mais por pagamento unificado e limites de uso está ok. Simplesmente fica mais fácil.
    • Conveniência tem seu ágio.
  • O “Open” de OpenRouter significa a mesma coisa que o “Open” de OpenAI? Não consegui encontrar nenhum repositório nem código hospedado. Eu tinha achado que era uma ferramenta open source e self-hostable com um produto em nuvem acoplado, mas parece existir só a segunda parte.

    • Eu também achei que fosse open source, mas fui conferir e não é. Dizem que o “Open” vem do fato de ele rotear para modelos abertos de terceiros. Será que isso é só mais uma camada meia-boca em estilo VC?
    • O Open de OpenRouter é o mesmo Open de OpenSea. O fundador é o mesmo. Cada um que tire suas próprias conclusões.
    • Sinceramente, qualquer um conseguiria fazer algo como o OpenRouter em algumas madrugadas usando Claude Code.
      É só um proxy.
    • Open aqui significa uma camada única de API que permite trocar o modelo por baixo.
  • Enquanto houver muita experimentação no espaço de LLMs e o “modelo popular do momento” continuar mudando entre vários laboratórios de fronteira, acho que o OpenRouter vai continuar muito popular.
    Quando a situação começar a se estabilizar, há uma boa chance de os modelos de fronteira e os modelos open source convergirem. Aí a utilidade do OpenRouter vai diminuir. Quando você quer testar 20 modelos de 10 laboratórios, o overhead de 5% vale muito a pena; mas, se você só precisa de 5 modelos de 2 provedores e consegue ajustar as opções da API de cada um para ficar mais barato, isso fica bem mais difícil de aceitar.

  • Uma das coisas que o OpenRouter facilita é o gerenciamento de chaves de API. Seria bom se outros provedores também permitissem isso, ou ao menos tornassem mais fácil, com recursos como emissão de novas chaves, expiração por chave e limites por chave.
    Isso tem muitos usos, como quando você compartilha externamente recursos de IA/assistência. Dá para permitir o uso desses recursos e ao mesmo tempo limitar os danos caso a chave seja compartilhada ou usada para outra finalidade, além de reduzir a necessidade de passar por procedimentos de contorno mais frágeis, como guardrails.

  • Será que realmente precisa de dinheiro de VC para colocar um proxy na frente de outras APIs? Em que exatamente isso vai ser gasto? Marketing? Já é conhecido, então o que mais querem divulgar?
    Infraestrutura? Precisa de tanta infraestrutura assim para fazer proxy de requisições? É só pagar a Cloudflare.
    Querem contratar mais engenheiros? Mas vocês não são justamente os melhores vendedores desse óleo de cobra de que engenheiros não são mais necessários?
    Então, para onde vai esse US$ 100 milhões?

    • Eles captam porque podem captar. Isso funciona como prova social, convencendo os clientes de que estão criando algum valor mais profundo. Na prática, isso provavelmente vai ser usado para desenvolver canais e se preparar para, no futuro, transformar os clientes e os dados confiados por eles em produto.
    • Esta resposta do cofundador da OpenRouter parece relevante: https://news.ycombinator.com/item?id=48340940
  • Uma boa funcionalidade do OpenRouter que ainda não vi mencionarem aqui é o meta-modelo do OpenRouter. Ele roteia automaticamente o prompt para um modelo com desempenho adequado.
    Assim, você não precisa mandar tudo para o Opus e economiza bastante dinheiro, e quando pergunta algo mais complexo ele automaticamente manda para o Opus, evitando resultados ruins.

  • “Nos últimos 6 meses, o volume semanal processado pelo OpenRouter aumentou de 5 trilhões de tokens para 25 trilhões de tokens.”
    Uau, isso dá mais de 41 milhões de tokens por segundo. Para uma equipe pequena de apenas 48 a 50 pessoas no total, a escala é enorme.

    • Supondo que esse seja o custo de tokens upstream, e considerando também o multiplicador de tokens processados por consulta, no máximo isso talvez represente só alguns milhares de requisições por segundo. Continua impressionante, mas para uma startup de 50 pessoas gastando alguns milhões de dólares por mês, mais ou menos parece isso mesmo.
      Se um provedor de e-mail recebesse alguns milhares de mensagens por segundo, e ainda por cima as enviasse upstream para detecção de spam, isso pareceria igualmente impressionante? Nesse caso, a contagem de tokens poderia ser ainda maior, mas, certo ou errado, no HN provavelmente reagiriam com indiferença.
      Por um lado, isso mostra o quanto o setor avançou em escala hoje em dia; por outro, mostra o quanto os dados e o processamento explodiram mesmo em requisições nominalmente simples. Ainda assim, a equipe claramente é muito boa, e é um resultado digno de elogio.
    • Para ter uma noção, se considerar 4 bytes por token, isso dá cerca de 164 MB/s de tráfego. Vendo assim, parece um pouco menos avassalador.
  • Seria interessante ver a planilha financeira desse negócio. Em geral, investidores de Série B esperam quase 10x de retorno. Será que o OpenRouter consegue justificar uma avaliação de US$ 1,1 bilhão? Para um papel de “gerenciamento”/intermediação, parece realmente alto. Claro, é IA, mas já tenho idade suficiente para lembrar da época em que toda empresa pontocom recebia valuation de US$ 1 bilhão.

    • Se ele acabar roteando facilmente a maior parte dos tokens do mundo, dá para justificar. E se em algum momento os 5% passarem a ser pagos pelos provedores e o OpenRouter capturar uma fatia maior de infraestrutura/roteamento? Há muitas maneiras de virar uma empresa de US$ 10 bilhões.
    • Como sempre, no longo prazo o produto serão os dados dos usuários.