Thoughtworks Technology Radar, Volume 33 é lançado

(thoughtworks.com)

15 pontos por GN⁺ 2025-11-07 | Ainda não há comentários. | Compartilhar no WhatsApp

Visualiza e explica as tendências mais recentes nas áreas de técnicas/ferramentas/plataformas/linguagens de programação e frameworks em quatro estágios: Adopt (recomendado para adoção), Trial (uso experimental), Assess (avaliação) e Hold (cautela)
4 temas principais: orquestração de infraestrutura para IA, ascensão de agentes baseados em MCP, fluxos de trabalho de codificação com IA e surgimento de antipadrões de IA

Introdução de orquestração de infraestrutura para IA

As cargas de trabalho de IA estão levando as organizações a exigir orquestração de grandes frotas de GPUs para treinamento e inferência
- Com o aumento de modelos grandes que ultrapassam o limite de capacidade de HBM (80 GB) de uma única GPU, treinamento distribuído e inferência multi-GPU tornaram-se essenciais
- Equipes de plataforma constroem pipelines complexos de múltiplos estágios e ajustam continuamente throughput e latência
- Fazem telemetria remota da frota com Nvidia DCGM Exporter e posicionam jobs onde a largura de banda de interconexão é maior com escalonamento com reconhecimento de topologia
Kubernetes é a base central para gerenciar cargas de trabalho de IA em larga escala, mas plataformas alternativas como microVM (Firecracker) e Uncloud também estão ganhando atenção
- Estão evoluindo estratégias de posicionamento que consideram comunicação rápida entre links de GPU, como gerenciamento de filas e cotas com Kueue, topology-aware scheduling e gang scheduling
- Posicionamento de jobs multi-GPU dentro de “ilhas” contíguas de datacenter (rack ou pod) com links rápidos entre GPUs, como NVLink/NVSwitch, e RDMA
As recentes melhorias de API com reconhecimento de multi-GPU e NUMA no Kubernetes fortalecem essas capacidades, aumentando a largura de banda entre dispositivos, reduzindo tail latency e elevando a taxa de utilização efetiva
- Com o aumento da demanda por fluxos de trabalho de codificação com IA e a ascensão de agentes aprimorados por MCP, espera-se inovação acelerada em infraestrutura de IA
- A orquestração com reconhecimento de GPU está se tornando um requisito básico, e a topologia agora emerge como uma consideração de primeira classe no escalonamento

Ascensão de agentes baseados em MCP

A ascensão simultânea de MCP e dos agentes, junto com a expansão do ecossistema de protocolos e ferramentas construído em torno deles, é um tema central desta Radar
- O MCP está se consolidando como o protocolo de integração definitivo para viabilizar agentes e sua operação eficiente e semiautônoma
Quase todos os principais vendors estão adicionando suporte a MCP, e fluxos de trabalho centrados em agentes estão crescendo rapidamente
Observa-se inovação contínua nos fluxos de trabalho com agentes, e a engenharia de contexto emerge como fator-chave para otimizar o comportamento do modelo e a eficiência no uso de recursos
- Novos protocolos como A2A (Agent-to-Agent) e AG-UI reduzem a complexidade de construir apps colaborativos com múltiplos agentes
- Tecnologias como AGENTS.md, Anchoring coding agents e Context7 MCP server estão sendo adotadas em fluxos reais de desenvolvimento
Pela própria natureza do ecossistema de IA, novas inovações explodem a cada edição da Radar
— da última vez foi RAG; desta vez são os fluxos de trabalho com agentes e a constelação crescente de ferramentas, técnicas e plataformas que os sustentam
- E alguns antipadrões de IA dignos de atenção também estão surgindo

Fluxos de trabalho de codificação com IA

A IA está transformando a forma como software é construído e mantido, sendo um tema dominante nas discussões recentes
- Do uso de IA para compreender codebases legados ao GenAI para engenharia forward, ela está sendo incorporada estrategicamente em toda a cadeia de valor do software
- As equipes estão aprendendo a fornecer conhecimento de forma mais eficaz aos agentes de codificação
As equipes estão experimentando novas práticas, como definir instruções personalizadas por meio de arquivos AGENTS.md e integrar com servidores MCP como Context7 para buscar documentação atualizada de dependências
- Cresce a percepção de que a IA deve ampliar não apenas contribuidores individuais, mas a equipe inteira
- Instruções compartilhadas curadas e comandos personalizados estão surgindo para garantir uma disseminação mais equitativa do conhecimento
O ambiente de ferramentas está evoluindo intensamente:
- Designers usam UX Pilot e AI Design Reviewer, enquanto desenvolvedores usam v0 e Bolt para criar protótipos rapidamente por meio de prototipação self-service de UI
- Segue o debate sobre o alcance do desenvolvimento orientado por especificação, seu nível de granularidade e seu potencial como fonte única de verdade para entrega incremental
- Mesmo com o entusiasmo, a complacência em relação ao código gerado por IA continua sendo uma preocupação comum, lembrando que a IA pode acelerar a engenharia, mas o julgamento humano segue indispensável

Surgimento de novos antipadrões de IA

À medida que a adoção de IA acelera em toda a indústria, antipadrões emergentes também vêm à tona junto com práticas eficazes
- Embora se reconheça a utilidade clara de conceitos como prototipação self-service descartável de UI com GenAI, também se reconhece o potencial de levar organizações ao antipadrão de Shadow IT acelerado por IA
- Com o destaque dado ao MCP (Model Context Protocol), muitas equipes estão caindo no antipadrão de conversão ingênua de API para MCP
A eficácia de soluções Text-to-SQL ficou aquém das expectativas iniciais, e a complacência em relação ao código gerado por IA continua sendo uma preocupação relevante
- Mesmo dentro de práticas emergentes como desenvolvimento orientado por especificação, existe o risco de regressão para antipadrões tradicionais de engenharia de software
  — especialmente a especificação excessiva antecipada e o viés por lançamentos big bang
Como a GenAI está evoluindo em velocidade e escala sem precedentes, espera-se que novos antipadrões surjam rapidamente
- As equipes precisam se manter alertas a padrões que parecem eficazes no início, mas que com o tempo degradam desempenho, retardam feedback, prejudicam a adaptabilidade ou tornam a responsabilização mais nebulosa

ThoughtWorks Technology Radar Volume 33

[Techniques]

Adopt

1. Continuous compliance

Prática que garante que o processo de desenvolvimento de software e a tecnologia atendam continuamente a padrões regulatórios e de segurança por meio de automação
Integração de ferramentas policy-as-code como Open Policy Agent e geração de SBOM no pipeline de CD para detectar e resolver problemas de conformidade em estágios iniciais de acordo com as diretrizes SLSA
Ao codificar regras e boas práticas, é possível aplicar padrões de forma consistente em toda a equipe sem criar gargalos
Com o aumento do risco de complacência em relação ao código gerado por IA, embutir conformidade no processo de desenvolvimento é mais importante do que nunca

2. Curated shared instructions for software teams

Para equipes que usam IA ativamente na entrega de software, o movimento é sair do prompting individual e avançar para instruções curadas
A forma mais intuitiva de implementar isso é commitar arquivos de instruções como AGENTS.md diretamente no repositório do projeto
A maioria das ferramentas de codificação com IA, como Cursor, Windsurf e Claude Code, oferece suporte ao compartilhamento de instruções por meio de comandos slash personalizados ou workflows
Assim que os prompts são melhorados, toda a equipe se beneficia, garantindo acesso consistente às melhores instruções de IA

3. Pre-commit hooks

Os Git hooks existem há muito tempo, mas continuam subutilizados
Com a ascensão da codificação assistida por IA e da codificação com agentes, cresce o risco de commitar segredos ou código problemático por engano
Há muitos mecanismos de validação de código, como continuous integration, mas hooks de pre-commit são uma proteção simples e eficaz que mais equipes deveriam adotar
O ideal é mantê-los enxutos e focados nos riscos que são capturados com mais eficácia nessa etapa do workflow, como secret scanning

4. Uso de GenAI para entender codebases legados

O uso de GenAI para compreender codebases legados acelera significativamente o entendimento de sistemas complexos em larga escala
Ferramentas como Cursor, Claude Code, Copilot, Windsurf, Aider, Cody, Swimm, Unblocked, PocketFlow-Tutorial-Codebase-Knowledge ajudam a explicitar regras de negócio, resumir lógica e identificar dependências
Quando usado em conjunto com frameworks abertos e prompting direto para LLMs, o tempo necessário para entender codebases legados é reduzido de forma drástica
O esforço de configuração de abordagens avançadas como GraphRAG varia especialmente conforme o tamanho e a complexidade do codebase analisado, mas o impacto na produtividade é consistente e substancial

Trial

5. AGENTS.md

Um formato comum para fornecer instruções a agentes de codificação com IA que trabalham em um projeto
Essencialmente, é um arquivo README para agentes, sem campos obrigatórios nem formato além de Markdown
Depende da capacidade dos agentes de codificação baseados em LLM de interpretar instruções escritas e legíveis por humanos
É comum incluir dicas de uso de ferramentas no ambiente de desenvolvimento, instruções de teste e práticas preferidas para gerenciamento de commits

6. IA para migrações de código

Migrações de código assumem várias formas, desde reescrita de linguagem até upgrades de dependências ou frameworks, e muitas vezes exigem meses de trabalho manual
Equipes de upgrade de versão do framework .NET estão experimentando o uso de IA para encurtar o processo
No passado, eram usadas ferramentas determinísticas de refatoração baseadas em regras, como OpenRewrite; usar apenas IA tende a ser caro e a conversa pode facilmente se perder
Em vez de delegar o upgrade inteiro, o processo é decomposto em etapas menores e verificáveis, como análise de erros de compilação, geração de diff de migração e validação iterativa de testes
Casos da indústria, como a migração em larga escala de int32 para int64 do Google, também refletem uma tendência semelhante

7. Delta Lake liquid clustering

Uma tecnologia para tabelas Delta Lake que funciona como alternativa a particionamento e Z-ordering
Historicamente, a otimização do desempenho de leitura de tabelas Delta exigia definir partições e chaves de Z-order no momento da criação da tabela, com base em padrões de consulta esperados
O liquid clustering usa um algoritmo baseado em árvore para agrupar dados com base em chaves especificadas
Pode ser alterado gradualmente sem reescrever todos os dados, oferecendo mais flexibilidade para atender a diferentes padrões de consulta
O Databricks Runtime for Delta Lake oferece suporte a liquid clustering automático por meio da análise de workloads de consulta anteriores, identificação de colunas ideais e clustering dos dados de acordo com isso

8. Prototipagem de UI self-service com GenAI

Ferramentas como Claude Code, Figma Make, Miro AI, v0 permitem que gerentes de produto gerem diretamente protótipos interativos e testáveis por usuários a partir de prompts de texto
Em vez de criar wireframes manualmente, as equipes conseguem gerar artefatos funcionais em HTML, CSS e JS em poucos minutos
Esses protótipos "descartáveis" trocam refinamento por aprendizado rápido, sendo ideais para validação inicial durante design sprints
Maior fidelidade pode levar a foco equivocado em detalhes ou a expectativas irreais sobre o esforço de produção, tornando essencial um enquadramento claro e o gerenciamento de expectativas

9. Saída estruturada de LLMs

Prática de restringir LLMs para que gerem respostas em formatos predefinidos, como JSON ou classes específicas de programação
Converte o texto geralmente imprevisível dos LLMs em contratos de dados determinísticos e legíveis por máquina, algo essencial para construir aplicações confiáveis de nível de produção
As abordagens variam desde formatação simples baseada em prompt e saídas estruturadas nativas do modelo até métodos mais robustos de constrained decoding com ferramentas como Outlines e Instructor
Tem sido usado com sucesso para extrair dados complexos e não estruturados de vários tipos de documentos e convertê-los em JSON estruturado para lógica de negócio downstream

10. TCR (Test && Commit || Revert)

Um workflow de programação derivado do desenvolvimento orientado a testes que incentiva etapas muito pequenas e contínuas por meio de regras simples
Após cada mudança, se os testes passarem, as alterações são commitadas; se falharem, as alterações são revertidas
A implementação é simples, exigindo apenas a definição de scripts que automatizem esse ciclo dentro do codebase
Introduzido pela primeira vez no artigo oficial de Kent Beck, o TCR reforça práticas positivas de codificação como YAGNI e KISS

Assess

11. Testes de UI com IA

No Radar anterior, os testes de UI baseados em IA eram voltados principalmente para testes exploratórios, e foi mencionado que a não determinismo dos LLMs poderia causar instabilidade
Com a ascensão do MCP, frameworks importantes de teste de UI como Playwright e Selenium passaram a adotar seus próprios servidores MCP (playwright-mcp, mcp-selenium)
Ao oferecer automação confiável de navegador por meio de tecnologias nativas, assistentes de codificação podem gerar testes de UI confiáveis em Playwright ou Selenium
Há entusiasmo com desenvolvimentos como Playwright Agents nas releases mais recentes do Playwright, com expectativa pelo surgimento de orientações mais práticas e experiências de campo

12. Ancorando agentes de código a uma aplicação de referência

No passado, sinalizamos o padrão de tailored service templates, que ajuda organizações que adotam microsserviços a iniciar novos serviços e integrá-los sem atrito à infraestrutura existente
Com o tempo, à medida que surgem novas dependências, frameworks e padrões de arquitetura, tende a aumentar o desvio de código entre esses templates e os serviços existentes
Na era dos agentes de código, estamos experimentando anchoring coding agents to a reference application para manter boas práticas e consistência arquitetural
Um servidor Model Context Protocol (MCP) expõe tanto o código do template de referência quanto os diffs de commits, permitindo que os agentes detectem desvios e proponham correções

13. Engenharia de contexto

Projeto e otimização sistemáticos das informações fornecidas ao LLM durante a inferência para gerar, de forma confiável, a saída desejada
Inclui estruturação, seleção e ordenação de elementos de contexto como prompts, dados recuperados, memória, instruções e sinais do ambiente
Diferentemente de prompt engineering, que foca apenas na formulação do prompt, context engineering considera a composição completa do contexto
Hoje, engenheiros usam várias técnicas distintas que podem ser agrupadas em três áreas: Context setup, Context management for long-horizon tasks, Dynamic information retrieval

14. GenAI para forward engineering

Técnica emergente para modernizar sistemas legados por meio de descrições de codebases legados geradas por AI
Introduz uma etapa explícita focada no que o código legado faz (a especificação), ocultando deliberadamente como ele é implementado hoje
Relaciona-se com spec-driven development, mas é aplicada especificamente à modernização de legados
Seguindo o loop reverse-engineering → design/solutioning → forward-engineering, tanto humanos quanto agentes de AI podem raciocinar em um nível mais alto antes de se comprometer com a implementação

15. GraphQL como padrão de acesso a dados para LLMs

Abordagem emergente para criar uma camada uniforme de acesso a dados, amigável ao modelo, para aprimorar context engineering
Permite expor dados estruturados e consultáveis sem conceder ao modelo acesso direto ao banco de dados
Ao contrário de APIs REST, que exigem novos endpoints ou filtros para cada caso de uso, GraphQL permite que o modelo recupere apenas os dados necessários
Um schema GraphQL bem definido fornece metadados que o LLM pode usar para raciocinar sobre entidades e relacionamentos disponíveis

16. Fluxos de conhecimento acima de estoques de conhecimento

Recebemos com frequência a pergunta “como melhorar a forma como as equipes compartilham informação entre si”
O conceito de knowledge flows and knowledge stocks, uma perspectiva emprestada do pensamento sistêmico, é valioso
Ele incentiva a ver o conhecimento organizacional como um sistema — os estoques representam o conhecimento acumulado e os fluxos representam como o conhecimento se move e evolui pela organização
Aumentar o fluxo de conhecimento externo para dentro da organização tende a impulsionar a inovação, e estabelecer communities of practice é uma forma comprovada de melhorar esse fluxo

17. LLM como juiz

O uso de LLM como juiz para avaliar a saída de outros sistemas (geralmente geradores baseados em LLM) chamou atenção por seu potencial de oferecer avaliação automatizada e escalável em AI generativa
Este blip foi movido de Trial para Assess para refletir complexidades e riscos recentemente reconhecidos
As avaliações são vulneráveis a position bias, verbosity bias e baixa robustez, e um problema ainda mais sério é scaling contamination
Para lidar com essas falhas, estão sendo exploradas técnicas aprimoradas, como LLMs as a jury (uso de vários modelos para obter consenso) ou raciocínio chain-of-thought durante a avaliação

18. Recuperação de informação on-device

Técnica que permite que busca, reconhecimento de contexto e retrieval-augmented generation (RAG) sejam executados inteiramente no dispositivo do usuário (móvel, desktop ou edge)
Prioriza privacidade e eficiência computacional, combinando bancos de dados locais leves com modelos otimizados para inferência on-device
Uma implementação promissora combina sqlite-vec (uma extensão do SQLite que oferece busca vetorial dentro do banco de dados embarcado) com EmbeddingGemma (um modelo de embeddings de 300 milhões de parâmetros baseado na arquitetura Gemma 3)
Recomendado para avaliação em aplicações local-first e outros casos de uso em que soberania de dados, baixa latência e privacidade são críticas

19. SAIF

SAIF (Secure AI Framework) é um framework desenvolvido pelo Google para oferecer orientação prática no gerenciamento de riscos de segurança em AI
Trata sistematicamente ameaças comuns, como envenenamento de dados e prompt injection, por meio de mapas de risco claros, análise de componentes e estratégias práticas de mitigação
Seu foco nos riscos em evolução da construção de sistemas agentes é especialmente oportuno e valioso
Fornece um playbook conciso e acionável que pode ser usado para fortalecer práticas de segurança no uso de LLMs e em aplicações baseadas em AI

20. Service mesh sem sidecar

À medida que persistem o custo e a complexidade operacional dos service meshes baseados em sidecar, há entusiasmo com o surgimento de opções sem sidecar, como o Istio ambient mode
O ambient mode introduz uma arquitetura em camadas que separa responsabilidades entre dois componentes principais: um proxy L4 por nó (ztunnel) e um proxy L7 por namespace (Waypoint proxy)
O ztunnel garante que o tráfego L3 e L4 seja transmitido de forma eficiente e segura, obtendo certificados para todas as identidades do nó e tratando o redirecionamento de tráfego com workloads compatíveis com ambient
O Waypoints proxy é um componente opcional do ambient mode que habilita recursos mais avançados do Istio, como gerenciamento de tráfego, segurança e observabilidade

21. Small language models

Ao longo de vários volumes do Technology Radar, foi observado o progresso contínuo dos small language models (SLMs)
Com o aumento do interesse na construção de soluções com agentes, cresce a evidência de que SLMs podem impulsionar a IA de agentes com eficiência
A maioria dos fluxos de trabalho de agentes atuais se concentra em tarefas estreitas e repetitivas que não exigem raciocínio avançado, o que os torna adequados para SLMs
A evolução contínua de SLMs como Phi-3, SmolLM2 e DeepSeek oferece capacidade suficiente para essas tarefas

22. Spec-driven development

Uma abordagem emergente para fluxos de trabalho de codificação assistidos por IA, cuja definição do termo ainda está em evolução
Em geral, refere-se a um fluxo de trabalho que começa com especificações estruturadas de funcionalidades e depois as decompõe, ao longo de várias etapas, em partes menores, soluções e tarefas
O Kiro da Amazon guia o usuário por três etapas do fluxo de trabalho: requisitos, design e geração de tarefas
O spec-kit do GitHub segue um processo semelhante de três etapas, mas adiciona uma orquestração mais rica, prompts configuráveis e uma "constitution" que define princípios imutáveis a serem sempre seguidos

23. Team of coding agents

Técnica em que o desenvolvedor orquestra vários agentes de codificação com IA, cada um com um papel específico, como architect, back-end specialist e tester
Ferramentas como Claude Code, Roo Code e Kilo Code oferecem suporte a subagentes e a múltiplos modos de operação
Com base no princípio já comprovado de que atribuir papéis e personas específicos a LLMs melhora a qualidade da saída, coordenar vários agentes especializados produz resultados melhores do que depender de um único agente genérico
Indica uma transição para pipelines de desenvolvimento assistido por IA orquestrados e em múltiplas etapas

24. Topology-aware scheduling

GPUs e LPUs já não são dispositivos independentes, mas redes de aceleradores fortemente acopladas, cujo desempenho depende da disposição e da topologia
Em sistemas em escala de rack como o NVL72 da NVIDIA, 72 GPUs compartilham mais de 13 TB de VRAM e operam como um único acelerador, mas quando a carga de trabalho cruza switch islands, operações coletivas passam a ser um gargalo
A arquitetura da Groq, com agendamento em software em tempo de compilação, pressupõe movimentação determinística de dados, e o agendamento aleatório quebra essas suposições e a previsibilidade
Agendadores ingênuos que ignoram a topologia frequentemente distribuem cargas de trabalho multi-GPU de forma arbitrária, causando piora no tempo por etapa e na eficiência

25. Toxic flow analysis for AI

A piada recorrente de que o S de MCP significa "security" esconde um problema bastante real
Quando agentes se comunicam entre si por chamadas de ferramentas ou APIs, podem rapidamente encontrar o que é conhecido como lethal trifecta: acesso a dados pessoais, exposição a conteúdo não confiável e capacidade de comunicação externa
Um agente com essas três capacidades é altamente vulnerável, e como LLMs tendem a seguir instruções presentes na entrada, conteúdo de fontes não confiáveis com instruções para exfiltrar dados pode facilmente levar a vazamento de dados
A toxic flow analysis examina o grafo de fluxos de um sistema de agentes para identificar caminhos de dados potencialmente inseguros que merecem investigação adicional

Hold

26. AI-accelerated shadow IT

A IA reduz a barreira para que não programadores construam e integrem software por conta própria, em vez de esperar pelo departamento de TI
Embora haja entusiasmo com o potencial que isso libera, há atenção aos primeiros sinais de AI-accelerated shadow IT
Plataformas no-code de automação de fluxos de trabalho agora oferecem integração com APIs de IA, como OpenAI ou Anthropic, criando a tentação de usar IA como fita adesiva para conectar integrações que antes eram impossíveis
Ao mesmo tempo, assistentes de codificação com IA estão se tornando mais agentivos, permitindo que não programadores com treinamento básico criem aplicações utilitárias internas

27. Capacity-driven development

Um elemento central do sucesso das práticas modernas de desenvolvimento de software é manter o foco no fluxo de trabalho
Equipes stream-aligned concentram-se em um único fluxo de valor, como a jornada do usuário ou um produto, para entregar valor de ponta a ponta com eficiência
No entanto, foi observada uma tendência preocupante em direção ao capacity-driven development, em que equipes alinhadas dessa forma assumem funcionalidades de outros produtos ou fluxos quando têm capacidade ociosa
No curto prazo isso pode parecer eficiente, mas é uma otimização local adequada apenas para lidar com picos de demanda e, se normalizada, aumenta a carga cognitiva e a dívida técnica

28. Complacency with AI-generated code

À medida que assistentes e agentes de codificação com IA ganham destaque, aumentam os dados e estudos que reforçam as preocupações com complacency with AI-generated code
Há evidências suficientes de que essas ferramentas podem acelerar o desenvolvimento, mas pesquisas mostram que a qualidade do código pode se deteriorar com o tempo
Na pesquisa de 2024 da GitClear, código duplicado e code churn aumentaram mais do que o esperado, enquanto a atividade de refatoração no histórico de commits diminuiu
A pesquisa da Microsoft com trabalhadores do conhecimento mostra que a confiança impulsionada por IA frequentemente surge às custas do pensamento crítico

29. Naive API-to-MCP conversion

Organizações demonstram grande interesse em converter de forma fluida e direta APIs internas para o Model Context Protocol (MCP), para que agentes de IA possam interagir com sistemas existentes
Há um número crescente de ferramentas como MCP link e FastAPI-MCP que buscam apoiar essa conversão
Há oposição a essa naive API-to-MCP conversion, porque APIs normalmente são projetadas para desenvolvedores humanos e consistem em operações atômicas granulares que, quando encadeadas por IA, podem levar a uso excessivo de tokens, poluição de contexto e piora no desempenho do agente
Essas APIs com frequência expõem dados sensíveis ou permitem ações destrutivas, especialmente no caso de APIs internas

30. Equipes de engenharia de dados independentes

Organizar uma equipe separada de engenharia de dados que desenvolve e é proprietária de pipelines e produtos de dados, à parte do domínio de negócio que fornece os fluxos ordenados, é um antipadrão que leva a ineficiências e resultados de negócio fracos
Essa estrutura repete erros do passado ao separar capacidades de DevOps, testes ou implantação, gerando silos de conhecimento, gargalos e desperdício de esforço
Sem colaboração próxima, engenheiros de dados frequentemente não têm o contexto de negócio e de domínio necessário para projetar produtos de dados significativos, limitando tanto a adoção quanto o valor
Em vez disso, equipes de plataforma de dados devem se concentrar na manutenção da infraestrutura compartilhada, enquanto equipes de negócio multifuncionais constroem e são proprietárias de seus próprios data products de acordo com os princípios de data mesh

31. Text to SQL

Text to SQL usa LLMs para traduzir linguagem natural em SQL executável, mas a confiabilidade muitas vezes fica aquém das expectativas
Este blip foi movido para Hold para desaconselhar o uso em fluxos de trabalho não supervisionados — por exemplo, quando a saída fica oculta ou consultas geradas automaticamente por usuários são convertidas dinamicamente
Nesses casos, os LLMs frequentemente alucinam devido à compreensão limitada do esquema ou do domínio, criando risco de recuperação incorreta de dados ou modificação não intencional de dados
Para agentic business intelligence, evite acesso direto ao banco de dados e use, em vez disso, uma camada semântica de abstração de dados gerenciada, como Cube ou dbt's semantic layer

[Platforms]

Adopt

32. Arm na nuvem

Instâncias de computação Arm na nuvem vêm ganhando popularidade nos últimos anos por sua eficiência de custo e energética em comparação com instâncias tradicionais baseadas em x86
Grandes provedores de nuvem, incluindo AWS, Azure e GCP, agora oferecem opções Arm robustas
Muitas equipes migraram com sucesso workloads como microsserviços, bancos de dados open source e até computação de alto desempenho para Arm com mudanças mínimas no código e apenas alguns ajustes em scripts de build
Ferramentas modernas como multi-arch Docker images simplificam o build e a implantação tanto em ambientes Arm quanto x86

Trial

33. Apache Paimon

Apache Paimon é um formato open source de data lake projetado para viabilizar a lakehouse architecture
Integra-se de forma fluida com engines de processamento como Flink e Spark, oferecendo suporte tanto a tarefas de streaming quanto de batch
Uma vantagem-chave da arquitetura do Paimon é a fusão entre formatos padrão de data lake e a estrutura LSM (log-structured merge tree)
Essa combinação resolve desafios tradicionais dos data lakes relacionados a atualizações de alto desempenho e leituras de baixa latência

34. DataDog LLM Observability

Datadog LLM Observability fornece rastreamento, monitoramento e diagnóstico de ponta a ponta para workflows de aplicações com grandes modelos de linguagem e agentes
Mapeia cada prompt, chamada de ferramenta e etapa intermediária em spans e traces, rastreia latência, uso de tokens, erros e métricas de qualidade, e integra-se ao amplo conjunto de produtos de APM e observabilidade da Datadog
Organizações que já usam Datadog e estão familiarizadas com sua estrutura de custos podem considerar os recursos de visibilidade para LLM uma forma intuitiva de obter visibilidade sobre workloads de IA, desde que consigam instrumentar esses workloads
Configurar e usar a instrumentação de LLM exige cuidado e uma compreensão sólida do workload e da implementação, sendo recomendada colaboração próxima entre engenheiros de dados e equipe de operações durante a implantação

35. Delta Sharing

Delta Sharing é um padrão aberto e protocolo para compartilhamento seguro de dados entre plataformas, desenvolvido pela Databricks e pela Linux Foundation
É independente de nuvem e permite que organizações compartilhem dados ao vivo entre provedores de nuvem e ambientes on-premises sem copiar ou replicar os dados
Usando uma API REST simples, emite URLs pré-assinadas de curta duração para que destinatários possam consultar grandes conjuntos de dados com ferramentas como pandas, Spark ou Power BI
Oferece suporte ao compartilhamento de tabelas de dados, views, modelos de IA e notebooks, além de fornecer governança centralizada forte e auditoria

36. Dovetail

A plataforma Dovetail aborda o desafio persistente de gerenciar dados de pesquisa qualitativa dispersos
Fornece um repositório centralizado para entrevistas com usuários, transcrições e insights, transformando dados brutos em ativos estruturados e analisáveis
É especialmente útil em workflows de product discovery para criar rastreabilidade de evidências, conectando diretamente citações de clientes e temas sintetizados a hipóteses de produto e ROI esperado
Ao fazer isso, o Dovetail fortalece o papel dos dados qualitativos na tomada de decisão de produto

37. Langdock

Langdock é uma plataforma para que organizações desenvolvam e executem agentes de IA generativa e workflows para operações internas
Oferece um ambiente integrado com assistente interno de chat, uma camada de API para se conectar a vários LLMs e ferramentas para criar workflows de agentes integrados a sistemas como Slack, Confluence e Google Drive
A plataforma enfatiza soberania de dados ao oferecer opções on-premises e hospedagem na UE com padrões de conformidade empresarial
Organizações que implantam o Langdock ainda devem dar atenção cuidadosa à governança de dados e usar técnicas como toxic flow analysis para evitar a lethal trifecta

38. LangSmith

LangSmith é a plataforma hospedada da equipe do LangChain para fornecer visibilidade, rastreamento e avaliação de aplicações com LLM
Captura traces detalhados de chains, ferramentas e prompts para que equipes possam depurar e medir o comportamento do modelo, acompanhar regressões de desempenho e gerenciar conjuntos de dados de avaliação
O LangSmith é uma plataforma SaaS proprietária com suporte limitado a workflows non-LangChain, sendo mais atraente para equipes que já investiram nesse ecossistema
O suporte integrado para avaliação de prompts e experimentação é particularmente mais refinado do que alternativas open source como Langfuse

39. Model Context Protocol (MCP)

Model Context Protocol (MCP) é um padrão aberto que define como aplicações e agentes de LLM se integram a fontes de dados e ferramentas externas
O MCP se diferencia do protocolo Agent2Agent (A2A), que gerencia a comunicação entre agentes com foco em contexto e acesso a ferramentas
Desde o último blip, a adoção do MCP disparou, com grandes empresas como JetBrains (IntelliJ) e Apple entrando no ecossistema junto com frameworks emergentes como FastMCP
O padrão de prévia MCP Registry agora também oferece suporte à descoberta de ferramentas públicas e proprietárias

40. n8n

n8n é uma plataforma de automação de workflows com licença fair-code, semelhante ao Zapier ou Make (antigo Integromat), mas criada para desenvolvedores que querem opções de self-hosting, extensibilidade e controle por código
Oferece uma abordagem visual e low-code para criação de workflows em comparação com o Apache Airflow, ao mesmo tempo em que suporta código customizado em JavaScript ou Python
O principal caso de uso é integrar vários serviços em workflows automatizados, mas também pode conectar LLMs a fontes de dados, memória e ferramentas configuráveis
Muitas equipes usam o n8n para prototipar rapidamente workflows de agentes acionados por aplicações de chat ou webhooks, muitas vezes aproveitando os recursos de import e export para gerar workflows com ajuda de IA

41. OpenThread

OpenThread é uma implementação open source do protocolo de rede Thread desenvolvida pelo Google
Suporta todos os principais recursos da especificação Thread, incluindo camadas de rede como IPv6, 6LoWPAN e LR-WPAN, além de recursos de rede mesh em que dispositivos podem atuar como nós e border routers
O OpenThread roda em uma ampla variedade de plataformas de hardware, usando uma camada de abstração flexível e hooks de integração que permitem aos fornecedores integrar seus próprios recursos de rádio e criptografia
Esse protocolo maduro é amplamente usado em produtos comerciais e, pela experiência deles, é confiável para construir diversas soluções de IoT, de dispositivos de baixo consumo movidos a bateria a grandes redes mesh de sensores

Assess

42. AG-UI Protocol

AG-UI é um protocolo e biblioteca abertos projetados para padronizar interfaces de usuário ricas e a comunicação entre agentes
Foca em agentes voltados diretamente ao usuário e generaliza para qualquer frontend e backend por meio de integrações de middleware e cliente
O protocolo define uma forma consistente de agentes de backend se comunicarem com aplicações de frontend, permitindo colaboração em tempo real com estado persistente entre IA e usuários humanos
Suporta vários protocolos de transporte, incluindo SSE e WebSockets, e fornece tipos de eventos padronizados que representam diferentes estados da execução do agente

43. Agent-to-Agent (A2A) Protocol

Agent2Agent (A2A) é um protocolo que define um padrão para comunicação e interação entre agentes em workflows complexos com múltiplos agentes
Usa Agent Cards para descrever elementos centrais da comunicação entre agentes, incluindo especificações para descoberta de capacidades e transporte, além de esquemas de segurança
O A2A complementa o Model Context Protocol (MCP) ao focar na comunicação entre agentes sem expor detalhes internos, como estado, memória ou componentes internos do agente
O protocolo promove boas práticas como uma abordagem assíncrona por padrão para tarefas de longa duração, respostas em streaming para atualizações graduais e transporte seguro com HTTPS, autenticação e autorização

44. Amazon S3 Vectors

Amazon S3 Vectors expande o armazenamento de objetos do S3 com recursos nativos de vetores, oferecendo armazenamento vetorial integrado e busca por similaridade
Integra-se de forma fluida ao ecossistema AWS, incluindo Amazon Bedrock e OpenSearch, e oferece recursos adicionais como filtragem por metadados e governança via IAM
Ainda está em prévia e tem limitações, mas sua proposta de valor é atraente — essa abordagem de armazenamento vetorial acessível e com bom custo-benefício pode viabilizar diversas aplicações envolvendo grandes volumes de dados, nas quais baixa latência não seja a principal preocupação

45. Ardoq

Ardoq é uma plataforma de arquitetura corporativa (EA) que permite às organizações construir, gerenciar e ampliar uma base de conhecimento de arquitetura para planejar o futuro com mais eficácia
Diferentemente da documentação estática tradicional, que tende a sofrer drift e ficar em silos, a abordagem orientada a dados da Ardoq cria um grafo de conhecimento dinâmico que importa informações de sistemas existentes e se mantém atualizado à medida que o ambiente evolui
Um recurso especialmente útil é o Ardoq Scenarios, que permite modelar e definir visualmente estados futuros hipotéticos usando uma abordagem de branching e merge semelhante à do Git
Organizações que buscam uma transformação arquitetural deveriam avaliar plataformas dedicadas de EA como a Ardoq pelo potencial de simplificar e acelerar esse processo

46. CloudNativePG

CloudNativePG é um Kubernetes Operator que simplifica hospedar e gerenciar clusters PostgreSQL de alta disponibilidade no Kubernetes
Executar serviços com estado, como PostgreSQL, no Kubernetes pode ser complexo, pois exige conhecimento profundo tanto de Kubernetes quanto de replicação do PostgreSQL
O CloudNativePG abstrai boa parte dessa complexidade ao tratar um cluster PostgreSQL inteiro como um único recurso declarativo configurável
Oferece uma arquitetura primary/standby fluida com replicação por streaming nativa e já inclui recursos de alta disponibilidade, como self-healing, failover automático promovendo a réplica mais sincronizada e recriação automática de réplicas com falha

47. Coder

Coder é uma plataforma para provisionar rapidamente ambientes de programação padronizados, em linha com a prática já descrita de development environments in the cloud
Em comparação com ferramentas semelhantes como Gitpod (agora renomeado para Ona) e GitHub Codespaces, o Coder oferece maior controle sobre a customização das workstations via Terraform
As workstations são hospedadas na própria infraestrutura da organização, em sua nuvem ou data center, e não nos servidores do fornecedor
Essa abordagem oferece mais flexibilidade, incluindo a capacidade de executar agentes de codificação com IA e acessar sistemas internos da organização

48. Graft

Graft é um mecanismo de armazenamento transacional que possibilita sincronização de dados forte, consistente e eficiente em ambientes de borda e distribuídos
Usa lazy replication para sincronizar dados apenas quando necessário, partial replication para minimizar o consumo de banda e serializable snapshot isolation para garantir a integridade dos dados
Embora o Radar tenha mencionado Electric para casos de uso semelhantes, o Graft se destaca por transformar o object storage em um sistema transacional que suporta atualizações consistentes em nível de página sem impor um formato de dados
É adequado para impulsionar aplicações móveis local-first, gerenciar sincronização complexa entre plataformas e servir como espinha dorsal de réplicas stateless em sistemas serverless ou embarcados

49. groundcover

groundcover é uma plataforma cloud-native de observabilidade que unifica logs, traces, métricas e eventos do Kubernetes em uma única interface
Usa eBPF para capturar dados granulares de observabilidade com instrumentação zero-code, sem inserir agentes ou SDKs no código da aplicação
O sensor eBPF do groundcover é executado em um nó dedicado de cada cluster monitorado, operando de forma independente das aplicações observadas
Os principais recursos incluem observabilidade profunda em nível de kernel, arquitetura bring-your-own-cloud (BYOC) para privacidade dos dados e um modelo de precificação independente do volume de dados, mantendo os custos previsíveis

50. Karmada

Karmada ("Kubernetes Armada") é uma plataforma para orquestrar workloads em múltiplos clusters Kubernetes, nuvens e data centers
Muitas equipes atualmente implantam em vários clusters combinando ferramentas GitOps como Flux ou ArgoCD com scripts customizados, então uma solução específica para esse propósito é bem-vinda
O Karmada usa APIs nativas do Kubernetes, eliminando a necessidade de modificar aplicações já construídas para ambientes cloud-native
Oferece recursos avançados de agendamento para gerenciamento multicloud, alta disponibilidade, recuperação de desastres e agendamento de tráfego

51. OpenFeature

À medida que o negócio escala, o gerenciamento de feature flags frequentemente se torna cada vez mais complexo, e as equipes passam a precisar de uma camada de abstração que vá além do feature toggle mais simples
OpenFeature fornece essa camada por meio de uma especificação de API independente de fornecedor e orientada pela comunidade, que padroniza como feature flags são definidas e consumidas
A CLI oferece amplo suporte a vários esquemas de definição, desde configurações básicas com variáveis de ambiente ou configuração em memória até plataformas mais maduras como ConfigCat ou LaunchDarkly
No entanto, permanece uma observação importante: as equipes devem gerenciar separadamente e com disciplina as diferentes categorias de flags para evitar proliferação de flags, complexidade na aplicação e excesso de overhead de testes

52. Oxide

Construir e operar infraestrutura privada é algo complexo, e esse é um dos principais motivos pelos quais a nuvem pública é a opção padrão para a maioria das organizações
Mas, para quem precisa disso, a Oxide oferece uma alternativa que monta e integra hardware e software desde o início
Fornece racks pré-montados com computação, rede e armazenamento executando software de sistema totalmente integrado
As equipes podem gerenciar recursos pela API de IaaS da Oxide usando Terraform e outras ferramentas de automação — o que a Oxide chama de infraestrutura elástica on-premises

53. Restate

Restate é uma plataforma de execução durável projetada para resolver desafios complexos de sistemas distribuídos na construção de aplicações stateful e tolerantes a falhas
Por meio de journaling de execução, registra cada etapa para garantir tolerância a falhas, recuperação confiável e comunicação exatamente uma vez entre serviços
A principal vantagem arquitetural da plataforma é separar a lógica da aplicação em três tipos de serviços duráveis: Basic Services para funções stateless, Virtual Objects para modelar entidades stateful concorrentes e Workflows para orquestrar processos complexos com várias etapas
Estamos avaliando o Restate com cuidado em um sistema de seguros de grande escala e, até agora, estamos muito satisfeitos com o desempenho

54. SkyPilot

SkyPilot é uma plataforma open source para executar e escalar workloads de IA on-premises ou na nuvem
Desenvolvido pelo Sky Computing Lab da UC Berkeley, o SkyPilot atua como um broker inteligente, encontrando e provisionando automaticamente as GPUs mais baratas e disponíveis entre os principais provedores de nuvem e clusters Kubernetes, frequentemente reduzindo os custos de computação
Para equipes de infraestrutura, ele simplifica a execução de IA no Kubernetes ao oferecer recursos como a facilidade de uso do Slurm, robustez cloud-native, acesso SSH direto aos pods, gang scheduling e suporte a múltiplos clusters
Suporta expansão fluida de workloads de treinamento ou inferência

55. StarRocks

StarRocks é um banco de dados analítico que redefine a business intelligence em tempo real ao combinar a velocidade dos sistemas OLAP tradicionais com a flexibilidade dos data lakehouses modernos
Alcança latência de consulta abaixo de um segundo em larga escala por meio de um engine de execução otimizado com SIMD, armazenamento colunar e um sofisticado otimizador baseado em custo
Essa arquitetura de alto desempenho permite que usuários executem análises complexas diretamente em formatos de dados abertos como Apache Iceberg, sem pré-cálculo nem cópia de dados
Existem muitas plataformas nesse espaço, mas vemos o StarRocks como um forte candidato a solução econômica para cenários que exigem simultaneamente concorrência extrema e atualização consistente dos dados mais recentes

56. Uncloud

Uncloud é uma ferramenta leve de orquestração e clustering de contêineres que permite aos desenvolvedores levar aplicações Docker Compose para produção
Oferece uma experiência simples, semelhante à nuvem, sem o overhead operacional do Kubernetes
Alcança escalabilidade entre máquinas e deploys sem downtime ao configurar automaticamente uma rede mesh segura com WireGuard para comunicação e usar o proxy reverso Caddy para HTTPS automático e balanceamento de carga
A principal vantagem arquitetural do Uncloud é seu design totalmente distribuído, eliminando a necessidade de um plano de controle central e garantindo que as operações do cluster continuem funcionais mesmo quando máquinas individuais ficam offline

[Tools]

Adopt

57. ClickHouse

ClickHouse é um banco de dados OLAP distribuído, colunar e open source para análises em tempo real
Amadureceu como um engine altamente performático e escalável, capaz de lidar com análise de dados em grande escala
Views materializadas incrementais, engine de consulta eficiente e forte compressão de dados o tornam ideal para consultas interativas
O suporte nativo a funções de agregação aproximada permite equilibrar precisão e desempenho, algo especialmente útil para análises de alta cardinalidade

58. NeMo Guardrails

NeMo Guardrails é um toolkit open source da NVIDIA para adicionar facilmente mecanismos programáveis de segurança e controle a aplicações conversacionais baseadas em LLM
Define e aplica regras de comportamento para garantir que as saídas sejam seguras, relevantes ao tema e compatíveis com conformidade regulatória
Os desenvolvedores usam a linguagem específica de domínio Colang para criar fluxos conversacionais flexíveis, gerenciar conversas e aplicar caminhos predefinidos e procedimentos operacionais
O NeMo Guardrails oferece uma API assíncrona em primeiro lugar para desempenho e suporte a guardrails para segurança de conteúdo, segurança, além de controle de entradas e saídas

59. pnpm

Desde o último Radar, continuamos recebendo feedback positivo das equipes sobre o pnpm
O pnpm é um gerenciador de pacotes para Node.js que oferece ganhos significativos de desempenho em relação às alternativas, tanto em velocidade quanto em eficiência de espaço em disco
Ele oferece suporte a otimizações incrementais em nível de arquivo, que melhoram ainda mais o desempenho ao criar hard links de pacotes duplicados das pastas node_modules de vários projetos para um único local no disco
O pnpm se tornou a escolha padrão para gerenciamento de pacotes em Node.js, já que fornece um ciclo de feedback muito mais rápido com problemas mínimos de compatibilidade

60. Pydantic

Pydantic é uma biblioteca Python que usa type hints padrão para definir modelos de dados e impor esquemas de dados em tempo de execução
Originalmente, as anotações de tipo foram adicionadas ao Python para análise estática, mas sua diversidade crescente levou a usos mais amplos, incluindo validação em tempo de execução
Construído sobre um núcleo rápido em Rust, oferece validação, parsing e serialização de dados de forma eficiente
Tornou-se essencial em aplicações de LLM e normalmente é usado com a técnica de structured output from LLMs para lidar com a natureza imprevisível dos LLMs

Trial

61. AI Design Reviewer

AI Design Reviewer é um plugin do Figma para realizar auditorias de design ou avaliações heurísticas e coletar feedback acionável sobre designs existentes ou novos
As auditorias abrangem críticas de UX, inconsistências de UI, lacunas de acessibilidade, qualidade de conteúdo e cenários de edge case
Além de identificar problemas, oferece recomendações sensíveis ao domínio que ajudam as equipes a construir um vocabulário de design compartilhado e a lógica por trás das escolhas de design
As equipes usaram o AI Design Reviewer para analisar designs legados — identificando experiências positivas a serem mantidas e experiências negativas a serem resolvidas, ajudando a definir metas de UX para o redesign

62. Barman

Barman (Backup and Recovery Manager) é uma ferramenta open source para gerenciar backup e recuperação de desastres de servidores PostgreSQL
Simplifica a criação de backups físicos por vários métodos, organiza-os com um catálogo abrangente e dá suporte a todo o processo de recuperação de desastres ao restaurar backups em servidores ativos com capacidade de recuperação pontual
Descobrimos que o Barman é robusto e fácil de usar, e ficamos profundamente impressionados com a velocidade das operações de recuperação pontual durante atividades de migração
Também é competente em backups agendados e tem capacidade para lidar com configurações complexas e mistas de agendamento e retenção

63. Claude Code

O Claude Code, da Anthropic, é uma ferramenta de codificação com IA agentic que oferece uma interface em linguagem natural e um modelo de execução por agentes para planejar e implementar fluxos de trabalho complexos em múltiplas etapas
Embora tenha sido lançado há menos de um ano, já foi amplamente adotado por desenvolvedores dentro e fora da Thoughtworks, e foi colocado em Trial
Agentes de codificação baseados em console, como o Codex CLI da OpenAI, o Gemini CLI do Google e o open source OpenCode, foram lançados, e assistentes baseados em IDE como Cursor, Windsurf e GitHub Copilot agora incluem modo agente
Vimos equipes usá-lo não apenas para escrever e modificar código, mas também como um agente de IA de uso geral para gerenciar especificações, stories, configuração, infraestrutura e documentação

64. Cleanlab

No paradigma de IA centrada em dados, melhorar a qualidade do dataset frequentemente traz ganhos de desempenho maiores do que ajustar o próprio modelo
Cleanlab é uma biblioteca Python open source projetada para resolver esse problema, identificando automaticamente problemas comuns de dados como rotulagem incorreta, outliers e duplicatas em datasets de texto, imagem, dados tabulares e áudio
Construído com base nos princípios de confident learning, o Cleanlab usa probabilidades de previsão do modelo para estimar ruído nos rótulos e quantificar a qualidade dos dados
Essa abordagem independente de modelo permite que desenvolvedores diagnostiquem e corrijam erros no dataset e depois retreinem modelos para obter mais robustez e precisão

65. Context7

Context7 é um servidor MCP que resolve imprecisões em código gerado por IA
Enquanto os LLMs dependem de dados de treinamento desatualizados, o Context7 garante a geração de código preciso, atualizado e específico por versão para as bibliotecas e frameworks usados no projeto
Ele busca documentação atualizada e exemplos de código funcionais diretamente dos repositórios-fonte dos frameworks e os injeta na janela de contexto do LLM no momento do prompting
Em nossa experiência, o Context7 reduz significativamente alucinações de código e a dependência de dados de treinamento desatualizados

66. Data Contract CLI

Data Contract CLI é uma ferramenta de linha de comando open source projetada para trabalhar com a especificação Data Contract
Ela permite criar e editar contratos de dados e, mais importante, validar dados em relação ao contrato, algo essencial para garantir a integridade e a qualidade dos produtos de dados
A CLI oferece amplo suporte a várias definições de esquema (Avro, SQL DDL, Open Data Contract Standard etc.) e pode comparar diferentes versões de contrato para detectar imediatamente mudanças que causem breaking changes
Descobrimos que ela é especialmente útil, em especial no espaço de data mesh, para operacionalizar a governança de contratos entre produtos de dados por meio de integração com CI/CD

67. Databricks Assistant

Databricks Assistant é uma ferramenta conversacional com IA integrada diretamente à plataforma Databricks, atuando como um pair programmer contextual para profissionais de dados
Diferentemente de assistentes de programação de uso geral, ele se beneficia de um entendimento nativo do ambiente Databricks e do contexto dos dados, incluindo metadados do Unity Catalog
O Assistant vai além da geração de snippets de código: ele pode escrever consultas complexas em SQL e Python com múltiplas etapas, diagnosticar erros e fornecer explicações detalhadas e específicas do workspace
Para organizações que já investiram no ecossistema Databricks, ele pode acelerar a produtividade e reduzir a barreira de entrada para tarefas de dados complexas

68. Hoppscotch

Hoppscotch é uma ferramenta open source leve para desenvolvimento, depuração, testes e compartilhamento de APIs
Suporta vários protocolos, incluindo HTTP, GraphQL e WebSocket, e oferece clientes multiplataforma para ambientes web, desktop e CLI
Embora o espaço de ferramentas de API esteja lotado de alternativas como Postman, Insomnia e Bruno, o Hoppscotch se destaca por sua pegada leve e design favorável à privacidade
Ele dispensa analytics, usa armazenamento local-first e oferece suporte a self-hosting, sendo uma escolha forte para organizações que buscam uma forma intuitiva de compartilhar scripts de API mantendo forte privacidade de dados

69. NVIDIA DCGM Exporter

NVIDIA DCGM Exporter é uma ferramenta open source que ajuda equipes a monitorar treinamento distribuído em GPU em larga escala
Ela converte a telemetria proprietária do NVIDIA Data Center GPU Manager (DCGM) em um formato aberto compatível com sistemas de monitoramento padrão
Expõe métricas críticas em tempo real, tanto das GPUs quanto dos servidores host, como utilização de GPU, temperatura, energia e contagem de erros ECC
Essa visibilidade é essencial para organizações que fazem fine-tuning de LLMs customizados ou executam cargas de treinamento longas e intensivas em GPU

70. RelationalAI

Quando grandes volumes de dados variados são trazidos para o Snowflake, as relações únicas e regras implícitas nesses dados podem se tornar obscuras
Construído como um Snowflake Native App, o RelationalAI permite que equipes capturem conceitos significativos, definam entidades centrais de negócio e criem modelos sofisticados que incorporam lógica complexa diretamente sobre tabelas do Snowflake
Com um poderoso Graph Reasoner, os usuários podem gerar, analisar e visualizar grafos de conhecimento relacionais com base nesses modelos
Para organizações que gerenciam conjuntos de dados grandes e em rápida mudança, construir grafos de conhecimento pode ser essencial para monitoramento proativo e para gerar insights mais ricos e acionáveis

71. UX Pilot

UX Pilot é uma ferramenta de IA que oferece suporte a várias etapas do processo de design de UX, do wireframing ao design visual de alta fidelidade e revisão
Aceita entrada de texto ou imagem e pode gerar automaticamente telas, fluxos e layouts
O recurso Autoflow gera transições de fluxo de usuário, e o Deep Design produz saídas mais ricas e detalhadas
O UX Pilot também inclui um plugin para Figma que exporta os designs gerados para refinamento dentro de ferramentas de design padrão

72. v0

O v0 evoluiu desde a última vez em que foi apresentado no Radar
Agora inclui um modo de design que permite a gerentes de produto criar e ajustar protótipos de UI self-service com mais facilidade
A versão mais recente introduz seu próprio modelo, com uma grande janela de contexto e recursos multimodais, permitindo que o v0 gere e refine UIs a partir de entradas textuais e visuais
Outro acréscimo notável é o modo agente, no qual o sistema pode decompor tarefas mais complexas e selecionar o modelo apropriado para cada uma delas

Assess

73. Augment Code

Augment Code é um assistente de codificação com IA que oferece suporte com profunda percepção de contexto em codebases de grande escala
Destaca-se por meio de context engineering avançado, que permite atualizações rápidas do índice de código e buscas ágeis, mesmo quando o código muda com frequência
O Augment oferece suporte a modelos como Claude Sonnet 4 e 4.5 e GPT-5, integra-se com GitHub, Jira e Confluence, e suporta Model Context Protocol (MCP) para interoperabilidade com ferramentas externas
Fornece orientação passo a passo para mudanças complexas em codebases, de refatorações e upgrades de dependências a atualizações de schema

74. Azure AI Document Intelligence

Azure AI Document Intelligence (anteriormente Form Recognizer) extrai texto, tabelas e pares chave-valor de documentos não estruturados e os converte em dados estruturados
Usa modelos de deep learning pré-treinados para interpretar layout e significado, e permite treinar modelos personalizados para formatos especiais por meio de uma interface no-code
Uma das equipes relatou que o ADI reduziu significativamente a entrada manual de dados, melhorou a precisão dos dados e acelerou os relatórios, levando a decisões mais rápidas orientadas por dados
Assim como Amazon Textract e Google Document AI, oferece processamento de documentos de nível enterprise com forte compreensão de layout

75. Docling

Docling é uma biblioteca open source em Python e TypeScript para processamento avançado de documentos de dados não estruturados
Resolve o frequentemente negligenciado problema da “última milha” de converter documentos reais como PDF e PowerPoint em formatos limpos e legíveis por máquina
Diferentemente de extratores tradicionais, o Docling usa uma abordagem baseada em visão computacional para interpretar o layout do documento e a estrutura semântica, tornando a saída especialmente valiosa para pipelines de retrieval-augmented generation (RAG)
Converte documentos complexos em formatos estruturados como JSON ou Markdown, dando suporte a técnicas como structured output from LLMs

76. E2B

E2B é uma ferramenta open source para executar código gerado por IA em sandboxes seguras e isoladas na nuvem
Agentes podem usar essas sandboxes, construídas sobre microVMs Firecracker, para executar código com segurança, analisar dados, conduzir pesquisas ou operar máquinas virtuais
Isso permite criar e implantar agentes de IA de nível enterprise com controle total do ambiente de execução e segurança

77. Helix editor

Houve uma espécie de renascimento de editores de texto simples tentando substituir o favorito da linha de comando, o Vim
O Helix é um dos concorrentes nesse espaço lotado, junto com Neovim e, mais recentemente, Kakoune
Descrevendo-se de forma um tanto brincalhona como um editor de texto pós-moderno, o Helix oferece múltiplos cursores, suporte a Tree-sitter e suporte integrado a Language Server Protocol (LSP), o que inicialmente chamou nossa atenção
Está em desenvolvimento ativo com um sistema de plugins em andamento e, no geral, é um editor modal leve que parece familiar para usuários de Vim, ao mesmo tempo em que adiciona algumas conveniências modernas

78. Kueue

Kueue é um controlador nativo do Kubernetes para filas de jobs que gerenciam cotas e consumo de recursos
Fornece uma API para lidar com workloads do Kubernetes com diferentes prioridades e exigências de recursos, funcionando como um gerenciador em nível de job que decide quando admitir ou remover jobs
Projetado para gestão eficiente de recursos, priorização de jobs e agendamento avançado, o Kueue ajuda a otimizar a execução de workloads em ambientes Kubernetes, especialmente workloads de ML que usam ferramentas como Kubeflow
Em vez de substituir o cluster-autoscaler e o kube-scheduler, trabalha em conjunto com eles e foca na admissão de jobs com base em ordem, cota, prioridade e percepção de topologia

79. MCPScan.ai

MCPScan.ai é um scanner de segurança para servidores Model Context Protocol (MCP) que opera em dois modos: scan e proxy
No modo scan, analisa configurações e descrições de ferramentas para detectar vulnerabilidades conhecidas, como prompt injection, tool poisoning e toxic flows
No modo proxy, o MCPScan.ai atua como uma ponte entre o sistema de agentes e o servidor MCP, monitorando continuamente o tráfego em tempo de execução
Esse modo também aplica regras de segurança e guardrails personalizados, incluindo validação de chamadas de ferramentas, detecção de PII e restrições de fluxo de dados

80. oRPC

oRPC (OpenAPI Remote Procedure Call) oferece APIs type-safe de ponta a ponta em TypeScript, em total conformidade com a especificação OpenAPI
Pode simplificar a integração e a documentação ao gerar automaticamente a especificação OpenAPI completa
Enquanto alternativas como tRPC e ElysiaJS frequentemente exigem a adoção de novos frameworks para obter segurança de tipos, o oRPC se integra sem atritos a frameworks Node.js já existentes, incluindo Express, Fastify, Hono e Next.js
Essa flexibilidade o torna uma excelente escolha para equipes que querem adotar segurança de tipos de ponta a ponta em APIs existentes sem refatorações disruptivas

81. Power user for dbt

Power user for dbt é uma extensão para Visual Studio Code que se integra diretamente tanto a ambientes dbt quanto dbt Cloud
Como o dbt continua sendo uma das nossas ferramentas favoritas, qualquer melhoria de usabilidade é uma adição bem-vinda ao ecossistema
Antes, os desenvolvedores dependiam de várias ferramentas fora da IDE para validar código SQL ou inspecionar a linhagem dos modelos
Com essa extensão, esses recursos agora ficam embutidos no VS Code, oferecendo autocompletar de código, resultados de consulta em tempo real e linhagem visual de modelos e colunas

82. Serena

Serena é um poderoso toolkit de programação que oferece a agentes de codificação como Claude Code recursos semelhantes aos de uma IDE para busca e edição semântica de código
Ao operar no nível de símbolos e compreender a estrutura relacional do código, o Serena melhora significativamente a eficiência de tokens
Em vez de ler arquivos inteiros ou depender de substituições grosseiras de strings, agentes de codificação podem usar ferramentas precisas do Serena, como find_symbol, find_referencing_symbols e insert_after_symbol, para localizar e editar código
Em projetos pequenos, o impacto pode ser modesto, mas, à medida que a base de código cresce, essa eficiência se torna muito valiosa

83. SweetPad

A extensão SweetPad permite que desenvolvedores usem VS Code ou Cursor durante todo o ciclo de vida de desenvolvimento de aplicações Swift para plataformas Apple
Ela integra ferramentas essenciais como xcodebuild, xcode-build-server e swift-format, eliminando a necessidade de alternar constantemente para o Xcode
Os desenvolvedores podem gerenciar simuladores e fazer deploy em dispositivos, além de compilar, executar e depurar aplicações Swift para iOS, macOS e watchOS diretamente da IDE, sem abrir o Xcode

84. Tape/Z (Tools for Assembly Program Exploration for Z/OS)

Tape/Z (Tools for Assembly Program Exploration for Z/OS) é um toolkit em evolução para análise de código HLASM (High-Level Assembler) de mainframe
Foi desenvolvido por Thoughtworkers e oferece recursos como parsing, construção de grafos de fluxo de controle, rastreamento de dependências e visualização de fluxogramas
Há muito tempo mencionamos a escassez de ferramentas abertas e orientadas pela comunidade no espaço de mainframe, onde a maioria das opções é proprietária ou vinculada a ecossistemas de fornecedores
O Tape/Z ajuda a preencher essa lacuna ao oferecer recursos de análise acessíveis e scriptáveis

[Languages and Frameworks]

Adopt

85. Fastify

Continuamos tendo experiências positivas com Fastify — um framework web rápido, sem imposições e de baixo overhead para Node.js
Ele oferece todos os recursos essenciais de um framework web minimalista, incluindo parsing, validação e serialização, além de um sistema robusto de plugins e forte suporte da comunidade
As equipes não viram desvantagens significativas ao usar Fastify em comparação com alternativas como Express.js e também obtiveram ganhos de desempenho mensuráveis, tornando-o uma escolha atraente para desenvolvimento web minimalista em Node.js

86. LangGraph

LangGraph é um framework de orquestração para construir aplicações multiagente com estado usando LLMs
Ele fornece primitivas de baixo nível, como nós e arestas, além de recursos embutidos que dão aos desenvolvedores controle granular sobre fluxos de trabalho de agentes, gerenciamento de memória e persistência de estado
Isso significa que desenvolvedores podem começar com grafos simples e pré-construídos e depois escalar para arquiteturas de agentes complexas e em evolução
Com suporte a padrões de resiliência como streaming, gerenciamento avançado de contexto, fallback de modelos e tratamento de erros de ferramentas, o LangGraph permite construir aplicações de agentes robustas e prontas para produção

87. vLLM

vLLM é um motor de inferência para LLMs de alta vazão e eficiência de memória, que pode ser executado na nuvem ou on-premises
Suporta múltiplas arquiteturas de modelos e modelos open source populares
Equipes implantaram workers dockerized do vLLM em plataformas de GPU como NVIDIA DGX e Intel HPC para hospedar modelos como Llama 3.1 (8B e 70B), Mistral 7B e Llama-SQL para assistência de programação a desenvolvedores, busca de conhecimento e interação com bancos de dados em linguagem natural
O vLLM é compatível com o padrão do OpenAI SDK, permitindo model serving consistente

Trial

88. Crossplane

Desde sua última aparição no Radar, a adoção do Crossplane continuou crescendo, especialmente para ampliar clusters Kubernetes
No trabalho, descobrimos que o Crossplane se destaca em casos de uso específicos, e não como uma ferramenta de infraestrutura como código (IaC) de propósito geral
A observação anterior continua válida: o Crossplane funciona melhor como companheiro de workloads implantados dentro do Kubernetes e não como substituto completo de ferramentas como Terraform
Equipes que apostaram tudo no Crossplane como solução principal de IaC frequentemente enfrentaram dificuldades, mas equipes que o usaram de forma pragmática — para casos de uso customizados e direcionados — viram resultados fortes

89. DeepEval

DeepEval é um framework de avaliação open source, baseado em Python, para avaliar o desempenho de LLMs
Pode ser usado para avaliar retrieval-augmented generation (RAG) e outras aplicações construídas com LlamaIndex ou LangChain, além de linhas de base e benchmarks de modelos
O DeepEval avalia precisão, relevância e consistência para oferecer avaliações mais confiáveis em cenários reais, indo além de pontuações de simples correspondência de palavras
Inclui métricas como detecção de alucinação, relevância de respostas e otimização de hiperparâmetros, além de oferecer suporte ao GEval para criar métricas customizadas por caso de uso

90. FastMCP

O Model Context Protocol (MCP) está se consolidando rapidamente como um padrão para fornecer contexto e ferramentas a aplicações com LLM
No entanto, implementar servidores MCP normalmente envolve uma quantidade significativa de boilerplate para configuração, tratamento do protocolo e gerenciamento de erros
O FastMCP é um framework Python que simplifica esse processo ao abstrair a complexidade do protocolo e permitir que desenvolvedores definam recursos e ferramentas MCP por meio de decorators Python intuitivos
Essa abstração permite que as equipes foquem na lógica de negócio, resultando em implementações MCP mais limpas e fáceis de manter

91. LiteLLM

O LiteLLM é um SDK que oferece integração fluida com vários provedores de LLM por meio de um formato padronizado da API da OpenAI
Ele oferece suporte a uma ampla gama de provedores e modelos, fornecendo uma interface unificada para conclusão de texto, embeddings e geração de imagens
Ao abstrair as diferenças entre APIs específicas de cada provedor, o LiteLLM simplifica a integração e roteia automaticamente as requisições para o endpoint de modelo correto
Também inclui recursos prontos para produção, como guardrails, cache, logging, rate limiting e balanceamento de carga, por meio de um framework de proxy

92. MLForecast

O MLForecast é um framework e biblioteca Python para previsão de séries temporais que aplica modelos de machine learning a conjuntos de dados em larga escala
Ele simplifica o processo, normalmente complexo, de engenharia de atributos automatizada, incluindo lags, estatísticas móveis e recursos baseados em data
É uma das poucas bibliotecas com suporte nativo a frameworks de computação distribuída como Spark e Dask, garantindo escalabilidade
Também oferece suporte a previsão probabilística usando métodos como conformal prediction, fornecendo uma medida quantitativa da incerteza das previsões

93. Nuxt

O Nuxt é um meta-framework opinativo construído sobre o Vue.js para criar aplicações web full stack, frequentemente conhecido como o “Next.js para Vue.js”
Assim como seu equivalente no ecossistema React, o Nuxt oferece recursos amigáveis para SEO, como pré-renderização, server-side rendering (SSR) e gerenciamento de metadados
O Nuxt conta com o apoio da Vercel, a mesma empresa por trás do Next.js, além de uma comunidade forte e um ecossistema de módulos oficiais e de terceiros
Esses módulos simplificam a integração de recursos como processamento de imagens, sitemap e Tailwind CSS

94. Phoenix

Continuamos tendo experiências positivas com o Phoenix — um framework web MVC server-side escrito em Elixir
O Phoenix se baseia no aprendizado de desenvolvimento rápido de aplicações e experiência do desenvolvedor do Ruby on Rails, ao mesmo tempo em que evolui dentro do paradigma de programação funcional
Neste volume, destacamos o lançamento do Phoenix LiveView 1.0
O LiveView é uma solução de HTML-over-the-wire, semelhante a HTMX ou Hotwire, que permite aos desenvolvedores criar experiências de usuário ricas e em tempo real com HTML totalmente renderizado no servidor

95. Presidio

O Presidio é um SDK de proteção de dados para identificar e anonimizar dados sensíveis em texto estruturado e não estruturado
Ele usa named entity recognition, expressões regulares e lógica baseada em regras para detectar informações de identificação pessoal (PII), como números de cartão de crédito, nomes e localizações
O Presidio oferece suporte a reconhecedores de entidades customizados e pipelines de anonimização, permitindo que organizações o adaptem às suas próprias exigências de privacidade e conformidade
As equipes usam o Presidio ao integrá-lo com LLMs em ambientes corporativos com controles rígidos de compartilhamento de dados

96. Pydantic AI

O Pydantic AI continua se provando um framework open source confiável e bem suportado para construir agentes de GenAI em produção
Construído sobre a base confiável do Pydantic, ele oferece forte segurança de tipos, visibilidade de primeira classe via OpenTelemetry e ferramentas de avaliação integradas
O lançamento da versão 1.0 em 4 de setembro de 2025 marca um importante marco de maturidade
Desde então, ele tem se mostrado confiável e amplamente adotado por sua simplicidade e facilidade de manutenção, juntando-se a outros frameworks populares de agentes como LangChain e LangGraph

97. Tauri

O Tauri é um framework para criar aplicações desktop de alto desempenho usando uma única base de código de UI web
Diferentemente de wrappers web tradicionais como Electron, o Tauri é construído com base em Rust e aproveita a webview nativa do sistema operacional para oferecer binários menores e segurança mais forte
Avaliamos o Tauri pela primeira vez há alguns anos, e desde então ele se expandiu além do desktop com suporte a iOS e Android
A versão mais recente traz um modelo mais flexível de permissões e escopos, substituindo a lista anterior de permissões, além de uma camada aprimorada de comunicação entre processos (IPC) que oferece suporte à transferência de dados brutos e melhora o desempenho

Assess

98. Agent Development Kit (ADK)

O Agent Development Kit (ADK) é um framework para desenvolvimento e implantação de agentes de IA que aplica disciplinas modernas de engenharia de software, em vez de depender apenas de prompting
Ele introduz abstrações familiares, como classes, métodos, padrões de workflow e suporte a CLI
Em comparação com frameworks como LangGraph ou CrewAI, o ponto forte do ADK é a integração profunda com a infraestrutura de IA do Google, oferecendo grounding, acesso a dados e monitoramento prontos para uso corporativo
Foi projetado para interoperabilidade e oferece suporte ao A2A protocol para wrappers de ferramentas e comunicação entre agentes

99. Agno

O Agno é um framework para construir, executar e gerenciar sistemas multiagente
Ele oferece flexibilidade para criar agentes totalmente autônomos ou workflows controlados e baseados em etapas, incluindo suporte nativo a human-in-the-loop, gerenciamento de sessão, memória e conhecimento
Valorizamos seu foco em eficiência, com tempos de inicialização de agentes impressionantes e baixo consumo de memória
O Agno vem com seu próprio runtime, o AgentOS, uma aplicação FastAPI com um plano de controle unificado para testes, monitoramento e gerenciamento simplificados de sistemas de agentes

100. assistant-ui

O assistant-ui é uma biblioteca open source em TypeScript e React para interfaces de chat com IA
Ela lida com as partes complexas da implementação de uma UI de chat, como streaming, gerenciamento de estado e recursos comuns de UX para edição de mensagens e troca de branches, ao mesmo tempo em que permite que desenvolvedores criem seus próprios componentes usando primitives do Radix
Oferece suporte à integração com runtimes populares, incluindo Vercel AI SDK e LangGraph, além de fornecer soluções de runtime customizáveis para casos de uso complexos
Construímos com sucesso uma interface de chat simples com assistant-ui e ficamos satisfeitos com o resultado

101. AutoRound

O AutoRound da Intel é um algoritmo avançado de quantização para comprimir grandes modelos de IA, como LLMs e vision language models (VLMs), minimizando a perda de precisão
Usa otimização por sign-gradient descent para reduzir o tamanho do modelo a larguras de bits ultrabaixas (2–4 bits) e aplica larguras de bits mistas entre as camadas para eficiência ideal
Esse processo de quantização também é muito rápido: é possível quantizar um modelo de 7 bilhões de parâmetros em poucos minutos em uma única GPU
O AutoRound integra-se a mecanismos de inferência populares, como vLLM e Transformers, tornando-se uma opção atraente para quantização de modelos

102. Browser Use

Browser Use é uma biblioteca Python open source que permite a agentes baseados em LLM operar navegadores web e interagir com aplicações web
Pode navegar, inserir dados e extrair texto, além de gerenciar várias abas para coordenar tarefas entre aplicações
A biblioteca é especialmente útil quando agentes de IA precisam acessar, manipular ou recuperar informações de conteúdo web
Suporta vários LLMs e usa Playwright para combinar compreensão visual com extração da estrutura HTML, proporcionando interações web mais ricas

103. DeepSpeed

DeepSpeed é uma biblioteca Python que otimiza deep learning distribuído tanto para treinamento quanto para inferência
Para treinamento, integra técnicas como Zero Redundancy Optimizer (ZeRO) e paralelismo 3D para escalar modelos com eficiência em milhares de GPUs
Para inferência, combina paralelismo de tensor, pipeline, especialistas e ZeRO com kernels customizados e otimizações de comunicação para minimizar a latência
O DeepSpeed impulsiona alguns dos maiores modelos de linguagem do mundo, incluindo Megatron-Turing NLG (530B) e BLOOM (176B)

104. Drizzle

Drizzle é um ORM leve para TypeScript
Diferentemente do Prisma ORM, oferece aos desenvolvedores tanto uma API simples semelhante a SQL quanto uma interface de consultas em estilo ORM mais tradicional
Também suporta extração de schema a partir de bancos de dados existentes, permitindo tanto abordagens database-first quanto code-first
O Drizzle foi projetado com ambientes serverless em mente, tem tamanho de bundle pequeno e suporte a prepared statements

105. Java post-quantum cryptography

Computadores quânticos continuam avançando rapidamente, e ofertas SaaS como AWS Braket agora fornecem acesso a algoritmos quânticos em várias arquiteturas
Desde março, o Java 24 introduziu Java post-quantum cryptography, adicionando suporte a algoritmos de criptografia pós-quântica como ML-KEM e ML-DSA
O .Net 10 também ampliou o suporte
O conselho é simples: se você está construindo software nessas linguagens, comece agora a adotar algoritmos quantum-safe para preparar seus sistemas para o futuro

106. kagent

Kagent é um framework open source para executar IA agente dentro de clusters Kubernetes
Permite que agentes baseados em LLM planejem e executem tarefas operacionais, como diagnosticar problemas, modificar configurações e interagir com ferramentas de observabilidade, por meio de APIs nativas do Kubernetes e integração com Model Context Protocol (MCP)
O objetivo é combinar gerenciamento declarativo com raciocínio autônomo para levar “AgentOps” à infraestrutura cloud native
Como projeto Sandbox da CNCF, o Kagent deve ser adotado com cautela, especialmente considerando os riscos de conceder capacidades de gestão operacional a LLMs, e técnicas como toxic flow analysis podem ser particularmente valiosas para avaliar e mitigar esses riscos

107. LangExtract

LangExtract é uma biblioteca Python que usa LLMs para extrair informações estruturadas de texto não estruturado com base em instruções personalizadas
Processa materiais específicos de domínio, como notas clínicas e relatórios, para identificar e organizar detalhes essenciais, mantendo cada ponto de dado extraído rastreável até a fonte
As entidades extraídas podem ser exportadas como arquivos .jsonl (um formato padrão para dados de modelos de linguagem) e visualizadas por meio de uma interface HTML interativa para revisão de contexto
A equipe avaliou o LangExtract para extrair entidades a fim de preencher grafos de conhecimento de domínio e constatou que ele é eficaz em transformar documentos complexos em representações estruturadas e legíveis por máquina

108. Langflow

Langflow é uma plataforma open source low-code para criar e visualizar workflows de LLM
Construída sobre o LangChain, ela permite que desenvolvedores encadeiem prompts, ferramentas, bancos de dados vetoriais e componentes de memória por meio de uma interface drag-and-drop, ao mesmo tempo em que oferece suporte a código Python customizado para lógica avançada
É especialmente útil para prototipar aplicações de agentes sem escrever todo o código de backend
No entanto, o Langflow ainda é relativamente novo e tem algumas arestas para uso em produção, e as cautelas gerais sobre plataformas low-code também se aplicam aqui

109. LMCache

LMCache é uma solução de cache chave-valor (KV) que acelera a infraestrutura de serving de LLMs
Atua como uma camada de cache especializada em todo o pool de mecanismos de inferência de LLM, armazenando entradas de cache KV pré-computadas para textos que provavelmente serão processados várias vezes, como histórico de chat ou coleções de documentos
Ao manter esses valores em disco, descarrega da GPU os cálculos de prefill, reduzindo o time-to-first-token (TTFT) e cortando custos de inferência em workloads exigentes, como pipelines RAG, aplicações de chat multi-turno e sistemas de agentes
É possível integrar o LMCache a servidores de inferência importantes, como vLLM ou NVIDIA Dynamo, e vale a pena avaliar seu impacto na configuração

110. Mem0

Mem0 é uma camada de memória projetada para agentes de IA
Abordagens ingênuas frequentemente armazenam todo o histórico de chat em um banco de dados e o reutilizam em conversas futuras, o que leva a uso excessivo de tokens
O Mem0 substitui isso por uma arquitetura mais sofisticada que separa a memória em recordação de curto prazo e uma camada inteligente de longo prazo que extrai e armazena apenas fatos e relações relevantes
A arquitetura combina um vector store para similaridade semântica com um grafo de conhecimento para compreender dados temporais e relacionais

111. Open Security Control Assessment Language (OSCAL)

Open Security Controls Assessment Language (OSCAL) é um formato aberto e legível por máquina para troca de informações, projetado para aumentar a automação em conformidade regulatória e gestão de riscos e ajudar equipes a se afastarem de abordagens manuais baseadas em texto
Liderado pelo Instituto Nacional de Padrões e Tecnologia dos Estados Unidos (NIST), o OSCAL fornece representações padronizadas em XML, JSON e YAML para expressar controles de segurança relacionados a frameworks do setor como SOC 2 e PCI, além de frameworks governamentais como o FedRAMP dos EUA, o Cybersecurity Control Catalogue de Singapura e o Information Security Manual da Austrália
Embora o OSCAL ainda não tenha sido amplamente adotado fora do setor público e seu ecossistema ainda esteja amadurecendo, há entusiasmo com seu potencial para simplificar avaliações de segurança, reduzir a dependência de planilhas e exercícios de checklist e viabilizar conformidade automatizada quando integrado a plataformas de compliance-as-code e continuous compliance

112. OpenInference

OpenInference é um conjunto de convenções e plugins projetado para observar aplicações de IA, complementando o OpenTelemetry
Fornece instrumentação padronizada para frameworks e bibliotecas de machine learning, ajudando desenvolvedores a rastrear chamadas de LLM junto com o contexto ao redor, como recuperação em vector stores ou chamadas de ferramentas externas para APIs e mecanismos de busca
Os spans podem ser exportados para qualquer coletor compatível com OTEL, garantindo alinhamento com pipelines de telemetria já existentes
Anteriormente, demos um blip na plataforma de visibilidade para LLM amplamente usada Langfuse, e o OpenInference SDK pode registrar traces no Langfuse e em outras plataformas de visibilidade compatíveis com OpenTelemetry

113. Valibot

Valibot é uma biblioteca de validação de schema para TypeScript
Assim como outras bibliotecas populares de validação em TypeScript, como Zod e Ajv, ela oferece inferência de tipos, mas seu design modular é o diferencial
Essa arquitetura permite que bundlers façam tree shaking e code splitting de forma eficaz, incluindo apenas as funções de validação realmente usadas
O Valibot pode reduzir o tamanho do bundle em até 95% em comparação com o Zod em cenários ideais, o que o torna uma escolha atraente para validação de schema em ambientes em que o tamanho do bundle é importante, como validação no lado do cliente ou funções serverless

114. Vercel AI SDK

Vercel AI SDK é um toolkit full-stack open source para criar aplicações e agentes com IA no ecossistema TypeScript
É composto por dois componentes principais: o AI SDK Core padroniza chamadas de LLM de forma independente de modelo, com suporte a geração de texto, geração de objetos estruturados e chamadas de ferramentas
O AI SDK UI, de forma semelhante ao assistant-ui, simplifica o desenvolvimento de frontend em React, Vue, Next.js e Svelte com streaming, gerenciamento de estado e atualizações de UI em tempo real
Para equipes que já trabalham dentro do ecossistema TypeScript e Next.js, o Vercel AI SDK oferece uma forma rápida e fluida de criar aplicações de IA com experiências ricas no lado do cliente

Thoughtworks Technology Radar, Volume 33 é lançado

Introdução de orquestração de infraestrutura para IA

Ascensão de agentes baseados em MCP

Fluxos de trabalho de codificação com IA

Surgimento de novos antipadrões de IA

ThoughtWorks Technology Radar Volume 33

[Techniques]

Adopt

Trial

Assess

Hold

[Platforms]

Adopt

Trial

Assess

[Tools]

Adopt

Trial

Assess

[Languages and Frameworks]

Adopt

Trial

Assess

Leituras relacionadas

Ainda não há comentários.