- Os modelos de fronteira da OpenAI e o Codex agora estão oficialmente disponíveis na AWS, permitindo que milhões de clientes da AWS criem com a OpenAI na plataforma onde já operam seus negócios
- As empresas podem colocar IA de fronteira em produção por meio de seus fluxos de trabalho existentes de segurança, conformidade, compras, faturamento e governança, reduzindo o atrito desde a avaliação até a implantação real
- OpenAI models on Amazon Bedrock permite criar aplicações de IA usando controles nativos de segurança e governança da AWS
- Codex on Amazon Bedrock leva para o ambiente AWS o agente de engenharia de software da OpenAI, usado por mais de 5 milhões de pessoas por semana, para apoiar escrita de código, revisão, depuração e modernização
- No futuro, a oferta será expandida com o Daybreak para clientes da AWS, incorporando revisão segura de código, modelagem de ameaças, verificação de patches, análise de risco de dependências, detecção e orientação de melhorias ao loop diário de desenvolvimento
Colocando a OpenAI em produção na AWS
- Os modelos de fronteira da OpenAI e o Codex estão em disponibilidade geral na AWS
- Clientes da AWS podem usar os recursos da OpenAI pela plataforma AWS onde já operam seus negócios
- Barreiras importantes para empresas, como segurança, conformidade, compras, faturamento e processos de governança, podem ser tratadas dentro dos fluxos de trabalho existentes
- As organizações podem reduzir barreiras operacionais e passar mais rapidamente da etapa de avaliação para a implantação real
Forma de oferta e plano de expansão
- OpenAI models on Amazon Bedrock permite criar aplicações de IA usando controles nativos de segurança e governança da AWS
- Codex on Amazon Bedrock é oferecido como um agente de engenharia de software que ajuda equipes com escrita de código, revisão, depuração e modernização no ambiente AWS onde já constroem e implantam
- As duas ofertas podem ser usadas nas regiões AWS Commercial e GovCloud
- A OpenAI e a AWS planejam continuar expandindo os recursos da OpenAI oferecidos via AWS para que as equipes avancem da avaliação para a produção com menos atrito e mais confiança
- O Daybreak, que será oferecido futuramente, inclui modelos cibernéticos e o Codex Security, e foi projetado para ajudar defensores cibernéticos a identificar riscos mais cedo, responder mais rapidamente e tornar o software mais resiliente
1 comentários
Comentários do Hacker News
Sempre que vejo alguém perguntando por que você confia em AWS, Azure, GCP etc. e por que paga esse prêmio, penso que essa pessoa nunca trabalhou em um ambiente enterprise
A grande empresa onde trabalho tem contratos de clientes com governança de dados rigorosa, além de exigências internas de governança. Usar um fornecedor que não só foi aprovado por segurança da informação, mas também está explicitamente definido nos contratos dos clientes como processador de dados, é a forma de evitar demissão e processo
Em casa, brincando com meu próprio código e meus próprios dados, posso fazer o que quiser, mas com dados da empresa e dos clientes, isso jamais. É pelo mesmo motivo que não usamos qualquer modelo frontier da moda. Projetos paralelos e startups têm restrições e considerações totalmente diferentes
Ler as letras miúdas é bem interessante. A responsabilidade por perda de dados em geral fica com o cliente, pedidos de SLA exigem evidências específicas, e a reparação aceita costuma ser crédito de uso futuro exatamente do produto em que você perdeu os dados
Mesmo assim, os termos da AWS são até bem razoáveis em comparação com lugares como o GCP. O SLA do GCP parece servir principalmente para que o time de compras enterprise diga: “tem SLA, então fizemos a diligência e não vou ser demitido por escolher isso”. Por outro lado, o GCP pode dizer: “você aceitou a reparação proposta quando assinou o contrato, então se processar a gente, vamos mostrar essa cláusula. Obrigado por confiar”. [0]
[0] https://docs.cloud.google.com/storage/docs/storage-classes
Armazenamento padrão multi-região ou dual-region tem SLA de disponibilidade de 99,95%; o padrão regional, 99,9%; e Nearline, Coldline e Archive regionais podem cair para 99,0%. Os créditos são de 10%, 25% ou 50% do valor mensal cobrado pela camada de serviço afetada, com teto mensal agregado de 50%, e se aplicam a uso futuro. O Google também diz que, se o cliente não pedir o crédito em até 30 dias, considera-se que ele abriu mão
A AWS também pode ser hackeada, mas eles se preocuparam em reduzir um pouco essa probabilidade e em facilitar rastrear quais clientes foram afetados. Por exemplo, se você mergulhar nos logs da AWS, só de deixar tudo ligado já fica registrado um volume enorme de informação, o suficiente para refazer quem fez o quê em permissões ou ambientes. Imagino que o acesso de funcionários da AWS também fique bem registrado. No passado, para vincular um funcionário da AWS à minha conta, eu precisava passar por vários procedimentos
Fiquei chocado ao descobrir o quão difícil é usar uma única licença do GitHub Copilot no Azure. Mesmo sendo ambos produtos da Microsoft, a TI teve de descobrir como configurar o GitHub Enterprise, conectá-lo à assinatura do Azure e fazer todo tipo de trabalho
Se você já usou modelos de codificação com IA em um ambiente de grande empresa, sabe que muitas implantações enterprise na prática exigem o uso do AWS Bedrock. O motivo é simples
Nós não trabalhamos nos EUA e temos exigências fortes de que os dados fiquem dentro do nosso país, e o Bedrock oferece esse controle
Se essa for a direção, fico curioso sobre como a IA continuará crescendo no futuro. Supondo que a maior parte dos dados valiosos esteja por trás desses firewalls, os dados públicos já devem ter sido colhidos, e talvez tenha havido treinamento em dados obtidos ilegalmente. Essa parte é uma área cinzenta
No fim, isso vira um ecossistema fechado sem entrada externa?
Se você está se perguntando por que alguém pagaria mais caro por essas APIs via AWS em vez de usar direto, é porque em algumas empresas conseguir aprovação de novo fornecedor é quase impossível. Se a empresa já tem contrato com a AWS, então precisa usar o que a AWS oferece
Dependendo do contrato com o cliente, talvez você também precise notificar o cliente sobre o novo fornecedor, o que pode disparar uma nova revisão de segurança. Agora, se for só adicionar mais um modelo no Bedrock? Muito mais fácil
É uma grande notícia para a OpenAI. Existe um número maior do que se imagina de empresas que adotaram Claude só porque podia ser usado na AWS, e agora há concorrência séria
É um bom movimento para a OpenAI e algo com que a Anthropic deveria se preocupar. Por causa da dependência de AWS e das exigências de segurança, por um bom tempo o Bedrock foi a única forma de eu usar modelos base
Eles talvez não gostem de perder a vantagem de pioneirismo, mas imagino que esperassem isso há muito tempo
Boa notícia para a concorrência
O Claude Code continua deixando de fora novos recursos para quem usa via Amazon Bedrock. Por exemplo, modo automático, plano Ultra e Claude for Chrome. Com mais concorrência, talvez eles repensem a estratégia
Há algum tempo venho mantendo um emulador de api.anthropic.com que encaminha as requisições “por baixo dos panos” para o Amazon Bedrock. Funciona bem, e agora até dá para usar imediatamente recursos exclusivos do provedor primário
A Anthropic provavelmente deveria fazer o IPO logo. O enorme salto de receita foi, na prática, resultado do fracasso do lançamento do Gemini e do fato de a OpenAI estar presa ao Azure e de mãos atadas
Os modelos da Anthropic eram literalmente a única API serverless realmente prática disponível na AWS, isto é, os modelos do Bedrock. A família Qwen 3.5/3.6 nem chegou a ser lançada recentemente. Com a tendência de foco em eficiência de tokens e retorno sobre investimento, quero muito ver como a Anthropic vai fechar o terceiro trimestre
Os laboratórios frontier oferecem aos hyperscalers builds congeladas de modelos apenas para serving, sem coleta de dados. Para a maioria das empresas que quer usar LLMs frontier enquanto armazena dados sensíveis, isso é uma pré-condição
Isso é ruim para o Azure. Era o escolhido, mas não conseguiu acompanhar a demanda
Quando a OpenAI saiu do acordo de exclusividade dizendo que o Azure não era confiável, já dava para saber que o próximo destino seria a AWS